نشت عوامل رتبه بندی جستجوی Yandex: بینش


جامعه بازاریابی جستجو در تلاش است تا مخزن لو رفته Yandex را که حاوی فایل هایی است که فاکتورهای رتبه بندی جستجو را فهرست می کند، درک کند.

برخی ممکن است به دنبال سرنخ‌های عملی SEO باشند، اما احتمالاً این ارزش واقعی نیست.

توافق کلی این است که برای به دست آوردن یک درک کلی از نحوه کار موتورهای جستجو مفید خواهد بود.

چیزهای زیادی برای یادگیری وجود دارد

رایان جونز (@RyanJones) معتقد است که این نشت یک معامله بزرگ است.

او در حال حاضر برخی از مدل‌های یادگیری ماشین Yandex را بارگیری کرد روی دستگاه خودش برای آزمایش

رایان متقاعد شده است که چیزهای زیادی برای یادگیری وجود دارد، اما این کار بسیار بیشتر از بررسی فهرستی از عوامل رتبه‌بندی نیاز دارد.

رایان توضیح می دهد:

«در حالی که Yandex گوگل نیست، از نظر شباهت چیزهای زیادی می توانیم از این بیاموزیم.

Yandex از بسیاری از فناوری های اختراع شده گوگل استفاده می کند. آنها رتبه صفحه را با نام ارجاع می دهند، از Map Reduce و BERT و بسیاری موارد دیگر نیز استفاده می کنند.

بدیهی است که عوامل متفاوت خواهند بود و وزن های اعمال شده برای آنها نیز متفاوت خواهد بود، اما روش های علوم کامپیوتر نحوه تجزیه و تحلیل ارتباط متن و پیوند متن و انجام محاسبات در موتورهای جستجو بسیار مشابه خواهد بود.

من فکر می‌کنم که می‌توانیم بینش زیادی از فاکتورهای رتبه‌بندی به‌دست آوریم، اما فقط نگاه کردن به فهرست فاش شده کافی نیست.

وقتی به وزن‌های پیش‌فرض اعمال‌شده (قبل از ML) نگاه می‌کنید، وزن‌های منفی وجود دارد که سئوکاران آن را مثبت فرض می‌کنند یا برعکس.

همچنین فاکتورهای رتبه بندی بسیار بیشتری در کد نسبت به آنچه در لیست فاکتورهای رتبه بندی شناور ذکر شده است، محاسبه شده است.

به نظر می‌رسد این فهرست فقط فاکتورهای ثابت است و نحوه محاسبه ارتباط پرس و جو یا بسیاری از فاکتورهای پویا را که به مجموعه نتایج آن پرس‌وجو مربوط می‌شوند، در نظر نمی‌گیرد.

بیش از 200 عامل رتبه بندی

معمولاً، بر اساس نشت، تکرار می‌شود که Yandex از 1923 فاکتور رتبه‌بندی استفاده می‌کند (برخی کمتر می‌گویند).

کریستوف سمپر (نمایه لینکدین)، بنیانگذار ابزارهای تحقیق لینک، می گوید که دوستان به او گفته اند که فاکتورهای رتبه بندی بسیار بیشتری وجود دارد.

کریستف به اشتراک گذاشت:

“دوستان دیده اند:

  • 275 عامل شخصی سازی
  • 220 فاکتور «طراوت وب».
  • 3186 فاکتور جستجوی تصویر
  • 2314 فاکتور جستجوی ویدیو

چیزهای بیشتری برای نقشه برداری وجود دارد.

احتمالاً شگفت‌انگیزترین چیز برای بسیاری این است که Yandex صدها فاکتور برای پیوندها دارد.”

نکته این است که بسیار بیشتر از بیش از 200 فاکتور رتبه‌بندی گوگل است که ادعا می‌کرد.

و حتی جان مولر از گوگل گفت که گوگل از 200+ فاکتور رتبه بندی فاصله گرفته است.

بنابراین شاید این به صنعت جستجو کمک کند تا از تفکر الگوریتم گوگل در آن عبارات دور شود.

هیچ کس کل الگوریتم گوگل را نمی داند؟

آنچه در مورد نشت داده ها قابل توجه است این است که فاکتورهای رتبه بندی به روشی ساده جمع آوری و سازماندهی شده اند.

نشت این ایده این است که الگوریتم گوگل به شدت محافظت می شود و هیچ کس، حتی در گوگل، کل الگوریتم را نمی داند.

آیا ممکن است صفحه گسترده ای در گوگل با بیش از هزار فاکتور رتبه بندی وجود داشته باشد؟

کریستوف سمپر این ایده را زیر سوال می برد که هیچ کس الگوریتم گوگل را نمی داند.

کریستوف به ژورنال موتور جستجو نظر داد:

«شخصی در لینکدین گفت که نمی‌توانست تصور کند گوگل فاکتورهای رتبه‌بندی را به همین شکل «مستند» کند.

اما اینگونه است که یک سیستم پیچیده مانند آن باید ساخته شود. این درز از یک خودی بسیار معتبر است.

گوگل کدی دارد که ممکن است فاش شود.

این بیانیه که اغلب تکرار می‌شود مبنی بر اینکه حتی کارمندان گوگل از فاکتورهای رتبه‌بندی نمی‌دانند، همیشه برای فردی فنی مثل من پوچ به نظر می‌رسید.

تعداد افرادی که تمام جزئیات را دارند بسیار کم خواهد بود.

اما باید در کد وجود داشته باشد، زیرا کد چیزی است که موتور جستجو را اجرا می کند.

کدام بخش از Yandex شبیه گوگل است؟

فایل‌های Yandex لو رفته نگاهی اجمالی به نحوه کار موتورهای جستجو می‌کنند.

داده‌ها نحوه عملکرد Google را نشان نمی‌دهند. اما این فرصتی را برای مشاهده بخشی از نحوه رتبه بندی نتایج جستجو توسط یک موتور جستجو (Yandex) ارائه می دهد.

آنچه در داده ها وجود دارد نباید با آنچه ممکن است Google استفاده کند اشتباه گرفته شود.

با این وجود، شباهت های جالبی بین این دو موتور جستجو وجود دارد.

MatrixNet RankBrain نیست

یکی از بینش‌های جالبی که برخی به دنبال آن هستند، مربوط به شبکه عصبی Yandex به نام MatrixNet است.

MatrixNet یک فناوری قدیمی است که در سال 2009 معرفی شد (لینک archive.org به اطلاعیه).

برخلاف آنچه برخی ادعا می کنند، MatrixNet نسخه Yandex RankBrain گوگل نیست.

Google RankBrain یک الگوریتم محدود است که بر درک 15٪ از جستجوهایی که گوگل قبلاً ندیده است متمرکز است.

مقاله ای در بلومبرگ RankBrain را در سال 2015 فاش کرد. این مقاله بیان می کند که RankBrain در آن سال، شش سال پس از معرفی Yandex MatrixNet به الگوریتم گوگل اضافه شد (عکس فوری مقاله Archive.org).

مقاله بلومبرگ هدف محدود RankBrain را شرح می دهد:

«اگر RankBrain کلمه یا عبارتی را ببیند که با آن آشنا نیست، دستگاه می‌تواند حدس بزند که چه کلمات یا عباراتی ممکن است معنای مشابهی داشته باشند و نتیجه را بر اساس آن فیلتر کند و آن را در مدیریت جستجوی قبلاً دیده نشده مؤثرتر کند. پرس و جوها.»

از طرف دیگر MatrixNet یک الگوریتم یادگیری ماشینی است که کارهای زیادی را انجام می دهد.

یکی از کارهایی که انجام می دهد این است که یک عبارت جستجو را طبقه بندی می کند و سپس الگوریتم های رتبه بندی مناسب را برای آن جستجو اعمال می کند.

این بخشی از آن چیزی است که در اعلامیه زبان انگلیسی سال 2016 الگوریتم سال 2009 آمده است:

MatrixNet اجازه می دهد تا فرمول رتبه بندی بسیار طولانی و پیچیده ای را ایجاد کند که تعداد زیادی از عوامل مختلف و ترکیب آنها را در نظر می گیرد.

یکی دیگر از ویژگی های مهم MatrixNet این است که اجازه می دهد فرمول رتبه بندی را برای یک کلاس خاص از جستجوهای جستجو سفارشی کنید.

اتفاقاً، تغییر الگوریتم رتبه‌بندی برای مثلاً جستجوهای موسیقی، کیفیت رتبه‌بندی انواع دیگر جستجوها را تضعیف نمی‌کند.

یک الگوریتم رتبه بندی مانند ماشین آلات پیچیده با ده ها دکمه، سوئیچ، اهرم و سنج است. معمولاً، هر چرخش منفرد هر سوئیچ در یک مکانیسم منجر به تغییر کلی در کل ماشین می شود.

با این حال، MatrixNet اجازه می‌دهد تا پارامترهای خاصی را برای کلاس‌های خاص پرس‌و‌جوها بدون ایجاد تغییرات اساسی در کل سیستم تنظیم کنید.

علاوه بر این، MatrixNet می تواند به طور خودکار حساسیت را برای محدوده خاصی از عوامل رتبه بندی انتخاب کند.

MatrixNet خیلی بیشتر از RankBrain انجام می دهد، واضح است که آنها یکسان نیستند.

اما نکته جالب در مورد MatrixNet این است که چگونه فاکتورهای رتبه بندی پویا هستند، زیرا پرس و جوهای جستجو را طبقه بندی می کند و فاکتورهای مختلفی را برای آنها اعمال می کند.

MatrixNet در برخی از اسناد فاکتور رتبه‌بندی ارجاع داده شده است، بنابراین مهم است که MatrixNet را در زمینه مناسب قرار دهید تا فاکتورهای رتبه‌بندی در نور مناسب دیده شوند و معنادارتر شوند.

ممکن است خواندن اطلاعات بیشتر در مورد الگوریتم Yandex مفید باشد تا به نشت Yandex کمک کند.

خواندن: الگوریتم های هوش مصنوعی و یادگیری ماشین Yandex

برخی از عوامل Yandex با شیوه های SEO مطابقت دارند

دومینیک وودمن (@dom_woodman) مشاهدات جالبی در مورد نشت دارد.

برخی از فاکتورهای رتبه بندی فاش شده با برخی از روش های سئو مانند تغییر متن لنگر همزمان است:

الکس بوراکس (@alex_buraks) یک مگا موضوع توییتر در مورد موضوعی منتشر کرده است که بازتابی از شیوه های سئو دارد.

یکی از عوامل برجسته الکس مربوط به بهینه سازی پیوندهای داخلی به منظور به حداقل رساندن عمق خزیدن برای صفحات مهم است.

جان مولر گوگل مدت‌هاست که ناشران را تشویق می‌کند که مطمئن شوند صفحات مهم به‌طور برجسته به آن‌ها پیوند داده شده‌اند.

مولر از دفن صفحات مهم در عمق معماری سایت جلوگیری می کند.

جان مولر در سال 2020 به اشتراک گذاشت:

«بنابراین آنچه اتفاق خواهد افتاد این است که، ما می‌بینیم که صفحه اصلی واقعاً مهم است، چیزهایی که از صفحه اصلی پیوند داده می‌شوند نیز عموماً بسیار مهم هستند.

و سپس… با دور شدن از صفحه اصلی، فکر خواهیم کرد که احتمالاً این موضوع کمتر مهم است.

نزدیک نگه داشتن صفحات مهم به صفحات اصلی که بازدیدکنندگان سایت از آن وارد می شوند مهم است.

بنابراین اگر لینک‌ها به صفحه اصلی اشاره می‌کنند، صفحاتی که از صفحه اصلی لینک شده‌اند مهم‌تر دیده می‌شوند.

جان مولر نگفت که عمق خزیدن یک عامل رتبه بندی است. او به سادگی گفت که به گوگل سیگنال می دهد که کدام صفحات مهم هستند.

قانون Yandex که توسط الکس ذکر شده است از عمق خزیدن از صفحه اصلی به عنوان قانون رتبه بندی استفاده می کند.

منطقی است که صفحه اصلی را به عنوان نقطه شروع اهمیت در نظر بگیریم و سپس هر چه بیشتر از آن در عمق سایت کلیک کنیم، اهمیت کمتری را محاسبه کنیم.

مقالات تحقیقاتی گوگل نیز وجود دارد که ایده های مشابهی دارند (مدل موج سوار معقول، مدل موج سوار تصادفی)، که احتمال اینکه یک موج سوار تصادفی ممکن است در یک صفحه وب مشخص به سادگی با دنبال کردن پیوندها به پایان برسد را محاسبه می کند.

الکس عاملی را پیدا کرد که صفحات اصلی مهم را اولویت بندی می کند:

قانون سرانگشتی برای سئو مدتهاست که محتوای مهم را بیش از چند کلیک از صفحه اصلی (یا از صفحات داخلی که لینک های ورودی را جذب می کنند) دور نگه نمی دارد.

به روز رسانی Yandex Vega… به تخصص و اقتدار مرتبط است؟

Yandex موتور جستجوی خود را در سال 2019 با به روز رسانی به نام Vega به روز کرد.

به روز رسانی Yandex Vega دارای شبکه های عصبی است که با کارشناسان موضوع آموزش دیده اند.

هدف این به روز رسانی 2019 معرفی نتایج جستجو با صفحات خبره و معتبر بود.

اما بازاریابان جستجویی که در حال بررسی اسناد هستند، هنوز چیزی که با مواردی مانند بیوگرافی نویسنده مرتبط باشد، پیدا نکرده اند، که برخی معتقدند مربوط به تخصص و اعتباری است که گوگل به دنبال آن است.

رایان جونز در توییتی نوشت:

یاد بگیر، یاد بگیر، یاد بگیر

ما در روزهای اولیه افشای اطلاعات هستیم و من گمان می‌کنم که به درک بیشتر از نحوه عملکرد موتورهای جستجو منجر شود.


تصویر ویژه: Shutterstock/san4ezz





منبع

مطالب مرتبط