Google در محافظت از سیگنال متن لنگر در برابر نفوذ هرزنامه سایت


در یک جلسه ساعت اداری سئوی گوگل، دوی نگوین از تیم کیفیت جستجوی گوگل به سوالی در مورد لینک ها در سایت های هرزنامه و اینکه اعتماد چه ارتباطی با آن دارد، پاسخ داد.

جالب بود که چگونه کارمند گوگل گفت که از سیگنال متن لنگر محافظت می کند. این چیزی نیست که معمولاً مورد بحث قرار می گیرد.

ایجاد اعتماد با گوگل برای بسیاری از ناشران و سئوکاران یک نکته مهم است.

این ایده وجود دارد که “اعتماد” به ایندکس شدن و رتبه بندی مناسب سایت کمک می کند.

همچنین مشخص است که معیار «اعتماد» وجود ندارد، که گاهی برخی از جامعه جستجو را گیج می کند.

اگر الگوریتم چیزی را اندازه گیری نمی کند، چگونه می تواند اعتماد کند؟

کارمندان گوگل واقعاً به این سؤال پاسخ نمی‌دهند، اما پتنت‌ها و مقاله‌های تحقیقاتی وجود دارند که ایده‌ای را ارائه می‌دهند.

گوگل به لینک های سایت های اسپم اعتماد ندارد

فردی که سوالی را به ساعات کاری دفتر سئو ارسال کرده بود، پرسید:

“اگر دامنه ای جریمه شود، آیا روی لینک هایی که از آن خارج می شوند تاثیر می گذارد؟”

کارمند گوگل، دوی نگوین، پاسخ داد:

«من فرض می‌کنم منظور شما از «مجاز کردن» این است که دامنه توسط الگوریتم‌های هرزنامه یا اقدامات دستی ما کاهش یافته است.

به طور کلی، بله، ما به لینک های سایت هایی که می دانیم اسپم هستند، اعتماد نداریم.

این به ما کمک می کند تا کیفیت سیگنال های لنگر خود را حفظ کنیم.”

اعتماد و پیوندها

گوگل در مورد اعتماد صحبت می کند و واضح است که آنها در مورد اعتماد الگوریتم های خود به چیزی یا عدم اعتماد به چیزی صحبت می کنند.

در این مورد، در مورد عدم شمارش لینک‌هایی که در سایت‌های هرزنامه هستند، نیست، به‌ویژه، در مورد عدم شمارش سیگنال متن لنگر است.

جامعه سئو در مورد “ایجاد اعتماد” صحبت می کند، اما در این مورد، واقعاً در مورد ایجاد اسپم نیست.

گوگل چگونه یک سایت را اسپم تشخیص می دهد؟

هر سایتی جریمه نمی شود یا یک اقدام دستی دریافت نمی کند. برخی از سایت‌ها حتی فهرست‌بندی نمی‌شوند و این وظیفه Spam Brain Google است، یک پلتفرم هوش مصنوعی که صفحات وب را در نقاط مختلف، از زمان خزیدن، تجزیه و تحلیل می‌کند.

پلت فرم مغز اسپم به صورت زیر عمل می کند:

  • نمایه سازی دروازه بان
    Spam Brain سایت ها را در زمان خزیدن مسدود می کند، از جمله محتوایی که از طریق کنسول جستجو و نقشه سایت کشف شده است.
  • هرزنامه های فهرست شده را شکار می کند
    Spam Brain همچنین هرزنامه‌هایی را که در نقطه‌ای که سایت‌ها برای رتبه‌بندی در نظر گرفته می‌شوند ایندکس می‌شوند، می‌گیرد.

روشی که پلتفرم Spam Brain کار می کند این است که هوش مصنوعی را با دانشی که گوگل در مورد هرزنامه دارد آموزش می دهد.

گوگل در مورد نحوه عملکرد مغز اسپم اظهار نظر کرد:

با ترکیب دانش عمیق خود از هرزنامه با هوش مصنوعی، سال گذشته توانستیم هوش مصنوعی مبارزه با هرزنامه خودمان را بسازیم که به طور باورنکردنی در گرفتن گرایش های هرزنامه شناخته شده و جدید موثر است.

ما نمی دانیم چه”دانش اسپمگوگل در مورد آن صحبت می کند، اما پتنت ها و مقالات تحقیقاتی مختلفی در مورد آن وجود دارد.

کسانی که می‌خواهند در مورد این موضوع غواصی عمیقی داشته باشند، ممکن است مقاله‌ای را که من در مورد مفهوم الگوریتم‌های رتبه‌بندی فاصله لینک، روشی برای رتبه‌بندی لینک‌ها نوشته‌ام، مطالعه کنند.

من همچنین یک مقاله جامع در مورد چندین مقاله تحقیقاتی منتشر کردم که الگوریتم های مرتبط با پیوند را توصیف می کند که ممکن است الگوریتم پنگوئن را توصیف کند.

اگرچه بسیاری از پتنت ها و مقالات تحقیقاتی در ده یا چند سال گذشته هستند، اما از آن زمان واقعاً هیچ چیز دیگری توسط موتورهای جستجو و محققان دانشگاه منتشر نشده است.

اهمیت آن پتنت‌ها و مقالات تحقیقاتی در این است که این امکان وجود دارد که بتوانند آن را به شکلی متفاوت در الگوریتم گوگل قرار دهند، مانند آموزش و هوش مصنوعی مانند Spam Brain.

حق ثبت اختراع مورد بحث در مقاله رتبه بندی فاصله پیوند، نحوه تخصیص امتیاز رتبه بندی صفحات را بر اساس فاصله بین مجموعه ای از “سایت های اولیه” قابل اعتماد و صفحاتی که آنها به آنها پیوند می دهند، توصیف می کند. سایت‌های seed مانند نقاط شروعی هستند برای محاسبه اینکه چه سایت‌هایی عادی هستند و چه سایت‌هایی نیستند (یعنی هرزنامه).

شهود این است که هر چه یک سایت از یک سایت seed دورتر باشد، احتمال دارد که سایت هرزنامه در نظر گرفته شود. این بخش در مورد تعیین هرزنامه از طریق فاصله پیوند در مقالات تحقیقاتی ذکر شده در مقاله پنگوئن که قبلاً به آن اشاره کردم بحث شده است.

ثبت اختراع، (ایجاد رتبه بندی برای صفحات با استفاده از فاصله ها در یک نمودار پیوند وب) توضیح می دهد:

سپس سیستم بر اساس ویژگی‌های پیوندها و ویژگی‌های صفحات پیوست شده به پیوندها، طول‌هایی را به پیوندها اختصاص می‌دهد.

این سیستم در مرحله بعد کوتاه‌ترین فاصله را از مجموعه صفحات اولیه تا هر صفحه در مجموعه صفحات بر اساس طول پیوندهای بین صفحات محاسبه می‌کند.

در مرحله بعد، سیستم یک امتیاز رتبه بندی برای هر صفحه در مجموعه صفحات بر اساس کمترین فاصله محاسبه شده تعیین می کند.

کاهش نمودار پیوند

همان پتنت همچنین به چیزی که به عنوان نمودار پیوند کاهش یافته شناخته می شود اشاره می کند.

اما این فقط یک پتنت نیست که در مورد نمودارهای پیوند کاهش یافته بحث می کند. نمودارهای پیوند کاهش یافته خارج از گوگل نیز مورد تحقیق قرار گرفتند.

نمودار پیوند مانند نقشه ای از اینترنت است که با نقشه برداری با پیوندها ایجاد می شود.

در یک نمودار پیوند کاهش یافته، لینک های با کیفیت پایین و سایت های مرتبط حذف می شوند.

آنچه باقی می ماند چیزی است که به آن نمودار پیوند کاهش یافته می گویند.

در اینجا یک نقل قول از حق ثبت اختراع گوگل ذکر شده در بالا آمده است:

یک پیوند-گراف کاهش یافته

توجه داشته باشید که پیوندهای شرکت‌کننده در k کوتاه‌ترین مسیرها از دانه‌ها به صفحات، یک زیرگراف را تشکیل می‌دهند که شامل تمام پیوندهایی است که از دانه‌ها رتبه‌بندی شده‌اند.

اگرچه این نمودار فرعی پیوندهای بسیار کمتری نسبت به گراف پیوند اصلی دارد، اما k کوتاه ترین مسیرها از دانه ها به هر صفحه در این زیرگراف، طول مسیرهای نمودار اصلی را دارند.

علاوه بر این، جریان رتبه‌بندی به هر صفحه را می‌توان به نزدیک‌ترین k دانه از طریق مسیرهای این زیرگراف برگرداند.

گوگل به لینک های سایت های جریمه شده اعتماد ندارد

این یک چیز بدیهی است که گوگل به لینک های وب سایت های جریمه شده اعتماد نمی کند.

اما گاهی اوقات فرد نمی داند که آیا سایتی توسط Spam Brain جریمه شده یا به عنوان اسپم علامت گذاری شده است.

قبل از تلاش برای دریافت لینک از یک سایت، تحقیق در مورد اینکه آیا یک سایت ممکن است قابل اعتماد نباشد ایده خوبی است.

به نظر من، معیارهای شخص ثالث نباید برای تصمیم گیری های تجاری مانند این استفاده شود، زیرا محاسبات مورد استفاده برای تولید امتیاز پنهان هستند.

اگر سایتی قبلاً به سایت‌های احتمالاً هرزنامه‌ای پیوند می‌دهد که خودشان پیوندهای ورودی از پیوندهای پولی احتمالی مانند PBN (شبکه‌های وبلاگ خصوصی) دارند، احتمالاً یک سایت اسپم است.

تصویر برجسته توسط Shutterstock/Krakenimages.com

ساعت اداری SEO را تماشا کنید:





منبع

مطالب مرتبط