گوگل از حدود 40 سیگنال برای تعیین URL های متعارف استفاده می کند
در یکی از قسمتهای اخیر پادکست Google Search Off the Record، آلن اسکات از تیم «Dups» توضیح داد که چگونه Google تصمیم میگیرد در صورت وجود صفحات تکراری، کدام URL را به عنوان URL اصلی در نظر بگیرد.
او فاش کرد که گوگل به حدود 40 سیگنال مختلف نگاه می کند تا URL اصلی را از گروهی از صفحات مشابه انتخاب کند.
حدود 40 سیگنال برای انتخاب URL متعارف
محتوای تکراری یک مشکل رایج برای موتورهای جستجو است زیرا بسیاری از وب سایت ها دارای چندین صفحه با محتوای یکسان یا مشابه هستند.
برای حل این مشکل، گوگل از فرآیندی به نام canonicalization استفاده می کند. این فرآیند به گوگل اجازه می دهد تا یک URL را به عنوان نسخه اصلی برای فهرست بندی و نمایش در نتایج جستجو انتخاب کند.
گوگل اهمیت استفاده از سیگنال هایی مانند تگ های rel=”canonical”، نقشه های سایت و تغییر مسیرهای 301 را برای متعارف سازی مورد بحث قرار داده است. با این حال، تعداد سیگنال های درگیر در این فرآیند بیش از آن چیزی است که انتظار دارید.
اسکات در طول پادکست فاش کرد:
من مطمئن نیستم که عدد دقیق در حال حاضر چقدر است زیرا بالا و پایین میرود، اما گمان میکنم جایی در همسایگی 40 باشد.
برخی از سیگنال های شناخته شده ذکر شده عبارتند از:
- تگ های rel=”canonical”.
- 301 تغییر مسیر
- HTTPS در مقابل HTTP
- نقشه های سایت
- لینک سازی داخلی
- طول URL
وزن و اهمیت هر سیگنال ممکن است متفاوت باشد، و برخی از سیگنالها، مانند برچسبهای rel=”canonical” میتوانند بر فرآیند خوشهبندی و متعارفسازی تاثیر بگذارند.
سیگنال های متعادل کننده
با وجود سیگنالهای زیاد، آلن به چالشها در تعیین URL متعارف در هنگام تداخل سیگنالها اذعان داشت.
وی بیان کرد:
«اگر سیگنالهای شما با یکدیگر تضاد داشته باشند، اتفاقی که قرار است بیفتد این است که سیستم شروع به بازگشت به سیگنالهای کمتر خواهد کرد.»
این بدان معناست که در حالی که سیگنالهای قوی مانند تگهای rel=”canonical” و تغییر مسیرهای 301 بسیار مهم هستند، زمانی که این سیگنالها نامشخص یا متناقض باشند، عوامل دیگری میتوانند وارد عمل شوند.
در نتیجه، فرآیند متعارف سازی گوگل شامل یک عمل متعادل کننده ظریف برای تعیین مناسب ترین URL متعارف است.
بهترین روش ها برای متعارف سازی
سیگنالهای پاک به Google کمک میکنند URL معمولی ترجیحی را شناسایی کند.
بهترین شیوه ها عبارتند از:
- از تگ های rel=”canonical” به درستی استفاده کنید.
- 301 تغییر مسیر را برای محتوای جابجا شده دائمی اجرا کنید.
- مطمئن شوید که نسخههای HTTPS صفحات قابل دسترسی و پیوند هستند.
- نقشه های سایت را با URL های متعارف ترجیحی ارسال کنید.
- پیوندهای داخلی را ثابت نگه دارید.
این سیگنالها به گوگل کمک میکنند تا URLهای متعارف صحیح را پیدا کند و خزیدن، نمایهسازی و دید جستجوی سایت شما را بهبود بخشد.
اشتباهات برای جلوگیری از
در اینجا چند اشتباه رایج وجود دارد که باید مراقب آنها باشید.
1. برچسب های متعارف نادرست یا متضاد:
- اشاره به غیر موجود یا 404 صفحه
- چندین تگ متعارف با URL های مختلف در یک صفحه
- به طور کامل به یک دامنه متفاوت اشاره می کند
رفع کنید: تگ های متعارف را دوبار بررسی کنید، فقط از یک در هر صفحه استفاده کنید و از URL های مطلق استفاده کنید.
2. زنجیره یا حلقه متعارف
هنگامی که صفحه A به صفحه B به عنوان متعارف اشاره می کند، اما صفحه B به A یا صفحه دیگری اشاره می کند و یک حلقه ایجاد می کند.
رفع کنید: اطمینان حاصل کنید که URL های متعارف همیشه به نسخه نهایی و ترجیحی صفحه اشاره می کنند.
3. استفاده از تگ های noindex و canonical با هم
ارسال سیگنال های ترکیبی به موتورهای جستجو Noindex به این معنی است که صفحه را به هیچ وجه ایندکس نکنید و canonicalها را نامربوط کنید.
رفع کنید: از تگ های متعارف برای ادغام و از noindex برای حذف استفاده کنید.
4. متعارف به تغییر مسیر یا بدون فهرست صفحات
اشاره به صفحات متعارف به صفحات تغییر مسیر داده شده یا بدون فهرست موتورهای جستجو را سردرگم می کند.
رفع کنید: URL های متعارف باید دارای وضعیت 200 و قابل نمایه سازی باشند.
5. نادیده گرفتن حساسیت به حروف کوچک و بزرگ
حروف ناهماهنگ URL می تواند باعث مشکلات محتوای تکراری شود.
رفع کنید: URL و حروف برچسب متعارف را ثابت نگه دارید.
6. نادیده گرفتن صفحه بندی و پارامترها
محتوای صفحهبندیشده و URLهای با پارامترهای سنگین در صورت استفاده نادرست میتوانند باعث تکرار شوند.
رفع کنید: از تگ های متعارفی که به صفحه اول اشاره می کنند یا «مشاهده همه» را برای صفحه بندی استفاده کنید و پارامترها را ثابت نگه دارید.
خوراکی های کلیدی
بعید است لیست کامل بیش از 40 سیگنال مورد استفاده برای تعیین URL های متعارف در دسترس عموم قرار گیرد.
با این حال، این هنوز یک بحث روشنگر بود که ارزش برجسته کردن را داشت.
در اینجا نکات کلیدی آورده شده است:
- گوگل تقریباً از 40 سیگنال مختلف برای تعیین URL های متعارف استفاده می کند که تگ های rel=”canonical” و 301 تغییر مسیر یکی از قوی ترین نشانگرها هستند.
- وقتی سیگنالها در تضاد هستند، گوگل برای تصمیمگیری به سیگنالهای ثانویه بازمیگردد
- اجرای واضح و مداوم سیگنالهای متعارف (برچسبها، تغییر مسیرها، نقشههای سایت، پیوندهای داخلی) بسیار مهم است.
- اشتباهات رایج مانند زنجیرههای متعارف، سیگنالهای ترکیبی یا پیادهسازیهای نادرست میتوانند موتورهای جستجو را گیج کنند.
گفتگوی کامل را در ویدیوی زیر بشنوید:
تصویر ویژه: chatiyanon/Shutterstock