گزارش وب اسپم گوگل نقش SpamBrain را توضیح می دهد


گزارش سالانه وب‌اسپم گوگل که سال 2022 را پوشش می‌دهد، تمام راه‌هایی را که سیستم ضد هرزنامه SpamBrain آن‌ها در گرفتن اشکال مختلف هرزنامه ماهرتر شده است، نشان می‌دهد. در حالی که این گزارش عمدتاً در مورد گزارش میزان هرزنامه بیشتری در مقایسه با سال قبل است، نکات مربوط به نحوه عملکرد SpamBrain به همان اندازه مهم به نظر می رسید.

Google SpamBrain Platform

SpamBrain نامی است که گوگل به سیستم یادگیری ماشینی خود داده است که گوگل آن را پلتفرمی می نامد که از طریق آن الگوریتم هایی را راه اندازی می کند که اشکال مختلف محتوای ناخواسته را شناسایی می کند.

یادگیری ماشینی شکلی از هوش مصنوعی است که از داده ها برای یادگیری مهارت روزافزون در کاری که برای تکمیل آن طراحی شده است استفاده می کند.

اطلاعات زیادی در مورد SpamBrain وجود ندارد، به جز این که یک پلتفرم یادگیری ماشینی است و در طرح‌های Google برای جلوگیری از رتبه‌بندی هرزنامه‌ها «مرکزی» است.

گزارش وب اسپم گوگل به این نکته در مورد SpamBrain اشاره می کند:

ما همچنین SpamBrain را به‌عنوان یک پلتفرم قوی و همه‌کاره بهبود دادیم و راه‌حل‌های متعددی را برای بهبود پوشش انواع مختلف سوءاستفاده ارائه کردیم.»

بهبود SpamBrain

گزارش Webspam اشاره کرد که بهبود سیستم منجر به جذب 500٪ سایت های هرزنامه بیشتر از سال قبل شده است.

آموزش اضافی منجر به افزایش ده برابری در توانایی SpamBrain برای شناسایی وب سایت های هک شده شد.

پیوند تشخیص هرزنامه

این گزارش خاطرنشان کرد که آموزش ویژه هرزنامه لینک منجر به جذب پنجاه برابر بیشتر سایت‌هایی شد که در مقایسه با سال قبل هرزنامه ایجاد می‌کنند و توانایی SpamBrain در یادگیری را به عنوان کلید موفقیت آن ذکر کرد.

“به لطف قابلیت یادگیری SpamBrain، ما 50 برابر بیشتر سایت های هرزنامه لینک را در مقایسه با به روز رسانی هرزنامه لینک قبلی شناسایی کردیم.”

نمایه سازی دروازه بان

یک واقعیت جالب در مورد SpamBrain این است که چگونه هرزنامه ها را در زمان خزیدن شناسایی می کند.

اگر یک صفحه خزیده شده به عنوان هرزنامه تشخیص داده شود، بلافاصله مسدود می شود و از ورود آن به فهرست جستجوی Google جلوگیری می کند و باعث صرفه جویی در منابع از هدر رفتن در خزیدن صفحات وب ناخواسته می شود.

مسدود کردن هرزنامه در زمان خزیدن، قابلیتی است که در سال 2021 اعلام شد، که اشاره کرد که نمایه سازی نه تنها هنگام خزیدن هرزنامه مسدود می شود، بلکه زمانی که سعی می کند از طریق کنسول جستجو و نقشه های سایت وارد شود، مسدود می شود.

آنها در سال 2021 نوشتند:

ما سیستم‌هایی داریم که می‌توانند هنگام خزیدن در صفحات یا محتوای دیگر، هرزنامه را شناسایی کنند. خزیدن زمانی است که سیستم های خودکار ما از محتوا بازدید می کنند و آن را برای درج در فهرستی که برای ارائه نتایج جستجو استفاده می کنیم در نظر می گیرند. برخی از محتوای شناسایی شده به عنوان هرزنامه به فهرست اضافه نمی شود.

این سیستم‌ها همچنین برای محتوایی که از طریق نقشه‌های سایت و کنسول جستجو کشف می‌کنیم، کار می‌کنند.

به عنوان مثال، کنسول جستجو دارای ویژگی درخواست ایندکس است تا سازندگان بتوانند ما را در مورد صفحات جدیدی که باید به سرعت اضافه شوند مطلع کنند. ما مشاهده کردیم که هرزنامه‌ها به سایت‌های آسیب‌پذیر هک می‌کردند، وانمود می‌کردند که مالک این سایت‌ها هستند، خودشان را در کنسول جستجو تأیید می‌کردند و از این ابزار برای درخواست از Google برای خزیدن و فهرست‌بندی بسیاری از صفحات هرزنامه‌ای که ایجاد کرده‌اند استفاده می‌کردند.

با استفاده از هوش مصنوعی، ما توانستیم تأییدیه های مشکوک را مشخص کنیم و از ورود URL های هرزنامه به این طریق به فهرست ما جلوگیری کنیم.

بنابراین منصفانه است که بگوییم یکی از بسیاری از کارکردهای SpamBrain این است که مانند یک دروازه بان عمل کند، قبل از اینکه هرزنامه ها فرصتی برای ورود به فهرست گوگل پیدا کنند، آنها را مسدود می کند.

حفاظت از کلاهبرداری اکنون چند زبانه است

چیز جدیدی برای SpamBrain این است که سیستم شناسایی کلاهبرداری اکنون چند زبانه است و در مقایسه با سال قبل 50٪ کلیک روی سایت های کلاهبرداری را کاهش می دهد.

در مورد محتوای هرزنامه چطور؟

گزارش امسال بر روی یافتن هرزنامه لینک ها، شناسایی سایت های هک شده و بهبود در تشخیص هرزنامه در زمان خزیدن تمرکز داشت.

چیزی که ذکر نشده بود، ارتباطی با شناسایی محتوای هرزنامه داشت.

آیا این به این دلیل است که بخش محتوا توسط الگوریتم محتوای مفید مدیریت می شود و نه SpamBrain؟

گزارش وب اسپم گوگل را بخوانید:

نحوه مبارزه با هرزنامه در جستجوی Google در سال 2022

تصویر برجسته توسط Shutterstock/Asier Romero





منبع

مطالب مرتبط