گوگل در مورد محتوای تکراری “سیاهچاله” ناشی از صفحات خطا هشدار می دهد
پادکست “Search Off the Record” گوگل اخیراً یک مشکل SEO را برجسته کرده است که می تواند صفحات وب را از نتایج جستجو محو کند.
در آخرین قسمت، عضو تیم جستجوی گوگل، آلن اسکات، درباره “سیاهچاله های غارتگرانه” که از گروه بندی صفحات خطای مشابه تشکیل شده اند صحبت کرد.
سیستم Google میتواند بهطور تصادفی صفحات خطا را که شبیه هم هستند، دستهبندی کند و باعث شود صفحات معمولی در این گروهها قرار بگیرند.
این بدان معناست که گوگل ممکن است دوباره این صفحات را نخزد، که می تواند منجر به حذف فهرست آنها شود، حتی پس از رفع خطاها.
این پادکست توضیح داد که چگونه این اتفاق می افتد، تأثیر آن بر ترافیک جستجو و چگونه صاحبان وب سایت می توانند از گم شدن صفحات خود جلوگیری کنند.
چگونه گوگل با محتوای تکراری برخورد می کند
برای درک سیاهچاله های محتوا، ابتدا باید بدانید که گوگل چگونه محتوای تکراری را مدیریت می کند.
اسکات توضیح می دهد که این اتفاق در دو مرحله رخ می دهد:
- خوشه بندی: گوگل صفحاتی را که محتوای یکسان یا بسیار مشابه دارند گروه بندی می کند.
- متعارف سازی: سپس گوگل بهترین URL را از هر گروه انتخاب می کند.
پس از خوشه بندی، گوگل خزیدن مجدد این صفحات را متوقف می کند. این باعث صرفه جویی در منابع و جلوگیری از نمایه سازی غیر ضروری محتوای تکراری می شود.
چگونه صفحات خطا سیاهچاله ها را ایجاد می کنند
مشکل سیاهچاله زمانی اتفاق میافتد که صفحات خطا با هم گروهبندی شوند، زیرا محتوای مشابهی دارند، مانند پیامهای عمومی «صفحه یافت نشد». صفحات معمولی با خطاهای گاه به گاه یا قطع موقت می توانند در این خوشه های خطا گیر کنند.
سیستم تکثیر از خزیدن مجدد صفحات در یک خوشه جلوگیری می کند. این امر باعث میشود صفحاتی که اشتباهاً گروهبندی شدهاند، از «سیاهچاله» فرار کنند، حتی پس از رفع خطاهای اولیه. در نتیجه، این صفحات می توانند از فهرست خارج شوند، که منجر به از دست دادن ترافیک جستجوی ارگانیک می شود.
اسکات توضیح داد:
«فقط چیزهایی که بسیار به سمت بالای خوشه هستند احتمالاً به بیرون برمیگردند. جایی که این موضوع واقعاً من را نگران میکند، سایتهایی با خطاهای گذرا است… اگر آنها نتوانند واکشی شوند، ممکن است رندر شما را خراب کنند، در این صورت ما به صفحه شما نگاه میکنیم و فکر میکنیم که خراب است.»
چگونه از سیاهچاله جلوگیری کنیم
برای جلوگیری از مشکلات سیاهچاله های محتوای تکراری، اسکات توصیه های زیر را به اشتراک گذاشت:
- از کدهای وضعیت HTTP مناسب استفاده کنید: برای صفحات خطا، از کدهای وضعیت مناسب (مانند 404، 403 و 503) به جای وضعیت OK 200 استفاده کنید. فقط صفحاتی که با 200 OK علامت گذاری شده اند می توانند با هم گروه بندی شوند.
- محتوای منحصر به فرد برای صفحات خطای سفارشی ایجاد کنید: اگر صفحات خطای سفارشی دارید که از وضعیت OK 200 استفاده می کنند (که در برنامه های تک صفحه ای رایج است)، مطمئن شوید که این صفحات حاوی محتوای خاصی برای جلوگیری از گروه بندی هستند. به عنوان مثال، کد خطا و نام را در متن وارد کنید.
- احتیاط با برچسب های Noindex: از برچسب های noindex در صفحات خطا استفاده نکنید مگر اینکه بخواهید برای همیشه از نتایج جستجو حذف شوند. این تگ به شدت نشان می دهد که شما بیشتر از استفاده از کدهای وضعیت خطا، می خواهید صفحات حذف شوند.
پیروی از این نکات می تواند به اطمینان حاصل شود که صفحات معمولی به طور تصادفی با صفحات خطا مخلوط نمی شوند و آنها را در فهرست گوگل نگه می دارد.
بررسی منظم پوشش خزیدن و نمایه سازی سایت شما می تواند به رفع زودهنگام مشکلات تکراری کمک کند.
به طور خلاصه
پادکست “Search Off the Record” گوگل یک مشکل بالقوه SEO را که در آن صفحات خطا را می توان به عنوان محتوای تکراری دید، برجسته کرد. این می تواند باعث شود صفحات معمولی با خطا گروه بندی شوند و از فهرست گوگل حذف شوند، حتی اگر خطاها برطرف شوند.
برای جلوگیری از مشکلات محتوای تکراری، صاحبان وب سایت باید:
- از کدهای وضعیت HTTP صحیح برای صفحات خطا استفاده کنید.
- اطمینان حاصل کنید که صفحات خطای سفارشی دارای محتوای منحصر به فرد هستند.
- پوشش خزیدن و نمایه سازی سایت خود را نظارت کنید.
همانطور که توسط تیم جستجوی گوگل تاکید شده است، پیروی از بهترین شیوه های فنی سئو برای حفظ عملکرد جستجوی قوی ضروری است.
گفتگوی کامل را در ویدیوی زیر بشنوید:
تصویر ویژه: Nazarii_Neshcherenskyi/Shutterstock