رسوب Googler مشاهده سیستم های رتبه بندی Google را ارائه می دهد


شهادت رد شده مهندس Google که به صورت آنلاین توسط وزارت دادگستری ایالات متحده منتشر شده است ، نگاهی به سیستم های رتبه بندی Google ارائه می دهد و ایده ای در مورد نمرات کیفیت Google ارائه می دهد و یک سیگنال محبوبیت مرموز را معرفی می کند که از داده های Chrome استفاده می کند.

این سند دیدگاه سطح بالایی و بسیار کلی در مورد رتبه بندی سیگنال ها ارائه می دهد ، و این حس را ارائه می دهد که الگوریتم ها چه کاری انجام می دهند اما مشخصات آن نیست.

سیگنال های دست ساز

به عنوان مثال ، این کار با بخشی در مورد “دستکاری دست” سیگنال ها شروع می شود که روند کلی گرفتن داده ها از رأی دهندگان با کیفیت ، کلیک و غیره را توصیف می کند و از فرمول های ریاضی و آماری برای تولید نمره رتبه بندی از سه نوع سیگنال استفاده می کند. دست ساز به معنای الگوریتم های مقیاس پذیر است که توسط مهندسان جستجو تنظیم می شوند. این بدان معنا نیست که آنها به صورت دستی وب سایت ها را رتبه بندی می کنند.

سیگنال های ABC Google

سند DOJ سه نوع سیگنال را که به عنوان سیگنال ABC گفته می شود ، لیست می کند و مطابق با موارد زیر است:

  • A – لنگرها (صفحات پیوند به صفحات هدف) ،
  • B – Body (شرایط جستجوی جستجو در سند) ،
  • C – کلیک (زمان ساکنان کاربر قبل از بازگشت به SERP)

بیانیه در مورد سیگنال های ABC ، ​​تعمیم یک بخش از روند رتبه بندی است. نتایج جستجوی رتبه بندی به مراتب پیچیده تر است و شامل صدها هزاران الگوریتم اضافی در هر مرحله از فرآیند رتبه بندی ، از فهرست بندی ، تجزیه و تحلیل پیوند ، فرآیندهای ضد اسپم ، شخصی سازی ، رتبه بندی مجدد و سایر فرآیندها است. به عنوان مثال ، لیز رید به عنوان بخشی از الگوریتم رتبه بندی ، در مورد سیستم های موضوعی اصلی بحث کرده است و مارتین اسپلیت حاشیه نویسی را به عنوان بخشی از درک صفحات وب مورد بحث قرار داده است.

این همان چیزی است که سند در مورد سیگنال های ABC می گوید:

سیگنال های ABC مؤلفه های اصلی موضعی (یا نمره پایه) هستند ، که تعیین گوگل در مورد چگونگی مرتبط بودن این سند با پرس و جو است.

T* (موضعی) به طور موثری این سه سیگنال را به روشی نسبتاً دست ساز ترکیب می کند. Google برای قضاوت در مورد اهمیت سند بر اساس شرایط پرس و جو استفاده می کند. “

این سند ایده ای از پیچیدگی صفحات وب را ارائه می دهد:

“توسعه رتبه بندی (به ویژه موضعی) شامل حل بسیاری از مشکلات پیچیده ریاضی است. برای موضع گیری ، ممکن است تیمی از مهندسان وجود داشته باشند که به طور مداوم روی این مشکلات سخت در یک پروژه معین کار می کنند.

دلیل اینکه اکثریت قریب به اتفاق سیگنال ها دست ساز هستند این است که اگر چیزی شکسته شود گوگل می داند چه چیزی را اصلاح کند. گوگل می خواهد که سیگنال های آنها کاملاً شفاف باشد تا بتوانند آنها را شلیک کنند و بر روی آنها بهبود یابد. “

این سند رویکرد دست ساز خود را با رویکرد خودکار مایکروسافت مقایسه می کند و می گوید وقتی چیزی در بینگ شکسته می شود ، عیب یابی از آن با رویکرد Google بسیار دشوارتر است.

تعامل بین کیفیت صفحه و ارتباط

نکته جالبی که توسط مهندس جستجو نشان داده شده است این است که کیفیت صفحه مستقل از پرس و جو است. اگر یک صفحه از کیفیت بالا و قابل اعتماد مشخص شود ، در تمام سؤالات مربوطه قابل اعتماد است که منظور از کلمه استاتیک است ، برای هر پرس و جو به صورت پویا محاسبه نمی شود. با این حال ، سیگنال های مرتبط با ارتباط در پرس و جو وجود دارد که می تواند برای محاسبه رتبه بندی نهایی استفاده شود ، که نشان می دهد چگونه ارتباط نقش تعیین کننده ای در تعیین رتبه بندی می کند.

این همان چیزی است که آنها گفتند:

“کیفیت
به طور کلی استاتیک در چندین نمایش داده شده و به یک پرس و جو خاص وصل نشده است.

با این حال ، در برخی موارد سیگنال با کیفیت علاوه بر سیگنال استاتیک ، اطلاعات مربوط به پرس و جو را نیز در بر می گیرد. به عنوان مثال ، یک سایت ممکن است دارای کیفیت بالا اما اطلاعات کلی باشد ، بنابراین یک پرس و جو به عنوان جستجوی اطلاعات بسیار باریک/فنی ممکن است برای هدایت به یک سایت با کیفیت که فنی تر است استفاده شود.

س* (کیفیت صفحه (یعنی مفهوم اعتماد به نفس)) بسیار مهم است. اگر رقبا سیاهههای مربوط را می بینند ، آنها مفهوم “اقتدار” برای یک سایت معین دارند.

نمره کیفیت حتی امروز بسیار مهم است. کیفیت صفحه چیزی است که مردم از بیشترین شکایت دارند … “

هوش مصنوعی باعث شکایت علیه گوگل می شود

مهندس اظهار می دارد که مردم از کیفیت شکایت می کنند ، اما همچنین می گوید که هوش مصنوعی با بدتر شدن اوضاع ، اوضاع را تشدید می کند.

او در مورد کیفیت صفحه می گوید:

وی گفت: “امروزه مردم هنوز از کیفیت شکایت دارند و هوش مصنوعی آن را بدتر می کند.

این کار بسیار زیاد بوده و همچنان می تواند به راحتی مهندسی شود زیرا Q تا حد زیادی ایستا است و بیشتر به جای پرس و جو با سایت مرتبط است. “

edeeprank – راهی برای درک رتبه های LLM

Googler سیگنال های رتبه بندی دیگر ، از جمله یکی به نام Edeeprank را که یک سیستم مبتنی بر LLM است که از BERT استفاده می کند ، لیست می کند که یک مدل مرتبط با زبان است.

او توضیح می دهد:

“Edeeprank یک سیستم LLM است که از ترانسفورماتورها استفاده می کند. اساساً ، Edeeprank سعی می کند سیگنال های مبتنی بر LLM را بگیرد و آنها را به مؤلفه ها تجزیه کند تا آنها را شفاف تر کند.”

به نظر می رسد که این بخش در مورد تجزیه سیگنال های LLM به مؤلفه ها ، مرجع ساخت سیگنال های رتبه بندی مبتنی بر LLM شفاف تر است تا مهندسان جستجو بتوانند درک کنند که چرا LLM در حال رتبه بندی چیزی است.

PageRank به الگوریتم های رتبه بندی فاصله مرتبط است

PageRank نوآوری رتبه بندی اصلی Google است و از آن زمان به روز شده است. من شش سال پیش در مورد این نوع الگوریتم نوشتم. الگوریتم های فاصله از راه دور فاصله از وب سایت های معتبر را برای یک موضوع معین (به نام سایت های بذر) به سایر وب سایت ها در همان موضوع محاسبه می کنند. این الگوریتم ها با مجموعه بذر از سایت های معتبر در یک موضوع خاص شروع می شوند و سایت هایی که از سایت بذر مربوطه دور هستند ، مشخص می شوند که قابل اعتماد کمتری هستند. سایت هایی که به مجموعه بذر نزدیکتر هستند ، احتمالاً معتبرتر و قابل اعتماد تر هستند.

این همان چیزی است که گوگلر در مورد PageRank گفت:

“PageRank. این یک سیگنال واحد است که مربوط به فاصله از یک منبع خوب شناخته شده است ، و از آن به عنوان ورودی به نمره کیفیت استفاده می شود.”

در مورد این نوع الگوریتم رتبه بندی پیوند بخوانید: الگوریتم های رتبه بندی فاصله از راه دور

سیگنال محبوبیت مبتنی بر کروم رمزنگاری

سیگنال دیگری وجود دارد که نام آن رد شده است که مربوط به محبوبیت است.

در اینجا توضیحات رمزنگاری وجود دارد:

“[redacted] (محبوبیت) سیگنال که از داده های Chrome استفاده می کند. “

ادعای قابل قبول می تواند مطرح شود که این امر تأیید می کند که نشت API Chrome در مورد عوامل رتبه بندی واقعی است. با این حال ، بسیاری از SEO ها ، خودم ، معتقدند که این API ها ابزارهای توسعه دهنده ای هستند که توسط Chrome برای نشان دادن معیارهای عملکردی مانند Web Vitals در رابط Chrome Dev Tools استفاده می شود.

من گمان می کنم که این یک اشاره به یک سیگنال محبوبیت است که ممکن است از آن آگاهی نداشته باشیم.

مهندس Google به نشت دیگری از اسناد اشاره می کند که به “مؤلفه های سیستم رتبه بندی Google” واقعی اشاره می کند اما اطلاعات کافی برای مهندسی معکوس الگوریتم ندارند.

آنها توضیح می دهند:

وی گفت: “نشتی از اسناد Google وجود داشت که جزء خاصی از سیستم رتبه بندی Google را نامگذاری کرده است ، اما اسناد به مشخصات منحنی ها و آستانه ها نمی روند.

به عنوان مثال
اسناد به تنهایی جزئیات کافی را برای تشخیص آن به شما نمی دهند ، اما داده ها به احتمال زیاد انجام می شود. “

پیشخدمت

این سند تازه منتشر شده خلاصه ای از بخش دادگستری ایالات متحده از یک مهندس گوگل است که خلاصه ای از بخش هایی از سیستم های رتبه بندی جستجوی Google را ارائه می دهد. این بحث در مورد طراحی سیگنال دست ساز ، نقش نمرات کیفیت صفحه استاتیک و یک سیگنال محبوبیت مرموز حاصل از داده های کروم بحث می کند.

این نگاهی نادر به چگونگی سیگنال هایی مانند موضعی ، اعتماد به نفس ، رفتار کلیک و شفافیت مبتنی بر LLM مهندسی می کند و دیدگاه متفاوتی در مورد چگونگی رتبه بندی Google وب سایت ها ارائه می دهد.

تصویر برجسته توسط Shutterstock/fran_kie



منبع

مطالب مرتبط