Google Search Central APAC 2025: همه چیز از روز 2


روز دوم Google Search Central Live APAC 2025 با یک کراوات کوتاه شروع به کار کرد – در غواصی عمیق روز قبل ، قبل از حرکت به طور کامل به سمت نمایه سازی.

Cherry Prommawin با پیاده روی ما از طریق نحوه Google Parses HTML باز شد و مراحل اصلی در فهرست بندی را برجسته می کند:

  1. تجزیه HTML
  2. اجرای و اجرای جاوا اسکریپت
  3. تکذیب
  4. استخراج ویژگی
  5. استخراج سیگنال

این موضوع را برای بقیه روز تنظیم کرده است.

گیلاس خاطرنشان کرد که Google ابتدا HTML خام را به DOM عادی می کند ، سپس به دنبال عناصر هدر و ناوبری است و تعیین می کند که کدام بخش محتوای اصلی را در خود جای داده است. در طی این فرآیند ، عناصری مانند REL = canonical ، Hreflang ، پیوندها و لنگرها و برچسب های متا راوبوت را نیز استخراج می کند.

“بین وب سایت های پاسخگو در مقابل وب سایت های پویا/تطبیقی اولویت وجود ندارد. Google سعی نمی کند این موضوع را تشخیص دهد و وزن ترجیحی ندارد.”
توری

پیوندها برای ساختار وب هم برای کشف و هم برای رتبه بندی اصلی هستند:

“پیوندها هنوز بخش مهمی از اینترنت هستند و برای کشف صفحات جدید و تعیین ساختار سایت استفاده می شوند و ما از آنها برای رتبه بندی استفاده می کنیم.”
توری

کنترل فهرست بندی با قوانین روبات

گری ایلیز توضیح داد که در آن Robots.txt و Robots – برچسب های میتا در جریان قرار می گیرند:

  • robots.txt کنترل آنچه خزنده ها می توانند واکشی کنند.
  • برچسب های روبات متا نحوه استفاده از داده های واکشی را در پایین دست کنترل کنید.

وی چندین دستورالعمل کمتر شناخته شده را برجسته کرد:

  • هیچ کدام – معادل آن noindex,nofollow ترکیب شده در یک قانون واحد. آیا این فایده ای برای این دارد؟ در حالی که از نظر عملکردی یکسان است ، استفاده از یک دستورالعمل به جای دو ممکن است مدیریت برچسب را ساده کند.
  • ناچیز کردن – در صورت تنظیم ، Chrome دیگر پیشنهاد ترجمه صفحه را ارائه نمی دهد.
  • NoimageIndex – همچنین در مورد دارایی های ویدیویی اعمال می شود.
  • پس از آن در دسترس نیست – علیرغم معرفی توسط مهندسان که از آن زمان به بعد حرکت کرده اند ، هنوز هم کار می کند. این می تواند برای استهلاک پست های وبلاگ حساس به زمان ، مانند معاملات محدود و تبلیغات محدود ، مفید باشد ، بنابراین آنها در ویژگی های هوش مصنوعی Google باقی نمی مانند و خطر گمراه کننده کاربران یا آسیب رساندن به درک برند را به خطر می اندازند.

درک آنچه در یک صفحه است

گاری Illyes تأکید کرد که محتوای اصلی ، همانطور که توسط دستورالعمل های کیفیت Google تعریف شده است ، مهمترین عنصر در خزیدن و نمایه سازی است. این ممکن است متن ، تصاویر ، فیلم ها یا ویژگی های غنی مانند ماشین حساب باشد.

وی نشان داد که چگونه تغییر یک موضوع به حوزه اصلی محتوای می تواند رتبه بندی را افزایش دهد.

در یک مثال ، انتقال اشارات به “هوگو 7” از یک نوار کناری به محتوای مرکزی (اصلی) منجر به افزایش قابل اندازه گیری در دید شد.

“اگر می خواهید برای موارد خاصی رتبه بندی کنید ، آن کلمات و موضوعات را در مکان های مهم قرار دهید (در صفحه)
گری ایلیز

نشانه گذاری برای جستجو

شما نمی توانید HTML خام را در یک فهرست قابل جستجو در مقیاس قرار دهید. Google آن را به “نشانه ها” ، کلمات یا عبارات جداگانه تقسیم می کند و مواردی را که در فهرست آن قرار دارد ذخیره می کند. اولین سیستم تقسیم بندی HTML به دفتر مهندسی توکیو در سال 2001 گوگل باز می گردد ، و همین روشهای نشانه گذاری از محصولات هوش مصنوعی آنها استفاده می کند ، زیرا “چرا چرخ را دوباره اختراع می کند.”

هنگامی که محتوای اصلی نازک یا کم ارزش است ، آنچه Google به عنوان “404 نرم” برچسب می زند ، با حاشیه نویسی محور پرچم گذاری می شود تا نشان دهد که این کمبود در قلب صفحه است ، نه فقط در یک بخش محیطی.

رسیدگی به تکثیر وب

تصویر از نویسنده ، ژوئیه 2025

Cherry Prommawin توضیحات را در سه حوزه تمرکز توضیح داد:

  1. خوشه – با استفاده از تغییر مسیر ، شباهت محتوا و rel = canonical به گروه های کپی گروهی.
  2. بررسی محتوا – چک هایی که بویلر را نادیده می گیرند و بسیاری از صفحات خامه ای نرم را می گیرند. توجه داشته باشید که خطاهای نرم می توانند یک خوشه کامل را کاهش دهند.
  3. بومی سازی – هنگامی که صفحات فقط با محلی (به عنوان مثال از طریق Geo – Rirections) متفاوت هستند ، Hreflang بدون مجازات آنها را به آنها می رساند.

او در تضاد دائمی در مقابل تغییر مسیر موقت است: هر دو در خزیدن و خوشه بندی نقش دارند ، اما فقط تأثیرگذاری مجدد دائمی را تحت تأثیر قرار می دهد که URL به عنوان متعارف خوشه انتخاب می شود.

Google در هنگام انتخاب URL نماینده ، در اولویت اول ، تجربه کاربری دوم و سیگنال های صاحب سایت (مانند REL = canonical) سوم قرار دارد.

ژئوتارشی

Geotargeting به شما امکان می دهد تا به Google سیگنال دهید که محتوای شما در کدام کشور یا منطقه مورد توجه قرار گیرد ، و متفاوت از هدف قرار دادن زبان ساده است. Cherry Prommawin تأکید کرد که شما نیازی به پنهان کردن محتوای تکراری در سایت های خاص کشور ندارید ، Hreflang این گزینه ها را برای شما انجام می دهد.

تصویر از نویسنده ، ژوئیه 2025

اگر محتوای تکراری را در چندین URL های منطقه ای بدون بومی سازی ارائه می دهید ، خطر ایجاد اشتباه هر دو خزنده و کاربران را دارید. برای ژئوتارج به طور مؤثر ، اطمینان حاصل کنید که هر نسخه دارای محتوای بی نظیر و بومی شده متناسب با مخاطبان خاص خود است.

سیگنال های اصلی ژئوتارشینگ Google استفاده می کنند:

  1. دامنه سطح بالا – سطح بالا (CCTLD) – دامنه هایی مانند .sg یا .au کشور هدف را نشان می دهد.
  2. حاشیه نویسی Hreflang – استفاده کنید برچسب ها ، هدرهای HTTP یا ورودی های نقشه سایت برای اعلام زبان و جایگزین های منطقه ای.
  3. موقعیت سرور – آدرس IP یا محل میزبانی سرور شما می تواند به عنوان یک اشاره جغرافیایی عمل کند.
  4. سیگنال های محلی اضافی، مانند زبان و ارز در صفحه ، پیوندها از سایر وب سایت های منطقه ای و سیگنال های مشخصات تجاری محلی شما ، همه منطقه هدف شما را تقویت می کنند.

با ترکیب این سیگنال ها با محتوای واقعاً بومی سازی شده ، به Google کمک می کنید تا نسخه مناسب سایت خود را به کاربران مناسب ارائه دهد – و از مشکلات خوشه های کپی ناخواسته کپی جلوگیری کنید.

داده ها و رسانه های ساخت یافته

گری ایلیز مرحله استخراج ویژگی را معرفی کرد ، که پس از deduplication اجرا می شود و از نظر محاسباتی گران است. این کار با HTML شروع می شود ، سپس نمایه سازی رسانه های جداگانه و ناهمزمان برای تصاویر و فیلم ها را آغاز می کند.

اگر HTML شما در فهرست قرار دارد اما رسانه شما نیست ، این بدان معنی است که خط لوله رسانه هنوز کار می کند.

جلسات در این آهنگ شامل:

  • داده های ساختاری با ویلیام پرابوو
  • با استفاده از تصاویر با یان هوانگ
  • جذب کاربران با فیلم با ویلیام پرابوو

پرسش و پاسخ در طرحواره

نشانه گذاری طرحواره می تواند به Google کمک کند تا روابط بین اشخاص را درک کرده و ویژگی های LLM را فعال کند. اما طرحواره بیش از حد یا زائد فقط به نفع صفحه اضافه می کند و هیچ مزایای رتبه دیگری ندارد.

و از طرحواره به عنوان بخشی از روند رتبه بندی استفاده نمی شود.

محاسبه سیگنال ها

در حین استخراج سیگنال ، همچنین بخشی از نمایه سازی ، گوگل ترکیبی از:

  • سیگنال های غیرمستقیم (پیوندها ، ذکر شده توسط سایر صفحات)
  • سیگنال های مستقیم (کلمات و مکان های روی صفحه)
تصویر از نویسنده ، ژوئیه 2025

گری تأیید کرد که گوگل هنوز هم از PageRank در داخل استفاده می کند. این الگوریتم دقیق از کاغذ سفید 1996 نیست ، اما همین نام را دارد.

هل دادن

سیستم های Google هر روز حدود 40 میلیارد صفحه اسپم را شناسایی می کنند ، که از طریق “اسپمبرن” مبتنی بر LLM خود تغذیه می شوند.

تصویر از نویسنده ، ژوئیه 2025

علاوه بر این ، گری تأکید کرد که EEAT یک سیگنال نمایه سازی یا رتبه بندی نیست. این یک اصل توضیحی است ، نه یک متریک محاسبه شده.

تصمیم گیری در مورد فهرست بندی

انتخاب شاخص به کیفیت پایین می آید ، که به عنوان ترکیبی از اعتماد و ابزار برای کاربران نهایی تعریف شده است. صفحات برای سیگنال های منفی واضح از فهرست حذف می شوند:

  • noindex راهنما
  • محتوای منقضی شده یا زمان محدود
  • 404s نرم و لغزش از طریق نسخه های تکراری
  • هرزنامه خالص یا نقض سیاست

اگر صفحه ای خزیده شده اما نمایه نشده است ، راه حل بهبود کیفیت محتوا است. پیوند داخلی می تواند کمک کند ، اما تنها در حالی که صفحه را واقعاً مفیدتر می کند – هدف Google پاداش پیشرفت های متمرکز کاربر است ، نه دستکاری سیگنال.

Google اهمیتی نمی دهد که تصاویر شما تولید شده باشند

تصاویر تولید شده AI در گردش کار ، آموزش و طراحی طراحی شده است. این تصاویر توسط مدل های یادگیری عمیق که در مجموعه های عظیم عکس آموزش دیده اند ، تولید می شود.

در طول جلسه ، هوانگ اظهار داشت که گوگل اهمیتی نمی دهد که آیا تصاویر شما توسط AI یا انسان تولید می شود ، تا زمانی که آنها به طور دقیق و مؤثر اطلاعات را منتقل کنند یا داستانی را که شما قصد دارید بگویید.

تا زمانی که تصاویر قابل درک باشند ، منشأ هوش مصنوعی آنها بی ربط است. هدف اصلی برقراری ارتباط مؤثر با مخاطبان شماست.

هوانگ نمونه ای از تصویر هوش مصنوعی مورد استفاده تیم Google را در روز اول کنفرانس برجسته کرد که در بازرسی نزدیک ، برخی از خطاهای بصری را دارد ، اما به عنوان یک “PROP” ، وظیفه آن نمایانگر یک جدول زمانی بود و محتوای اصلی اسلاید نبود ، بنابراین این خطاها اهمیتی ندارند.

تصویر از نویسنده ، ژوئیه 2025

ما می توانیم یک رویکرد مشابه برای استفاده از تصاویر تولید شده توسط AI اتخاذ کنیم. اگر تصویر پیام را منتقل کند و محتوای اصلی صفحه نباشد ، موضوعات جزئی منجر به مجازات نمی شود و به طور کلی از تصاویر تولید شده AI استفاده نمی کند.

تصاویر باید برای شناسایی اشتباهات آشکار ، تحت یک بررسی سریع انسانی قرار بگیرند ، که می تواند از خطاهای تولید جلوگیری کند. نظارت مداوم برای حفظ اعتماد به تصاویر و محافظت از یکپارچگی برند شما ضروری است.

Google Trends API اعلام کرد

سرانجام ، دانیل ویزبرگ و هاداس ژاکوبی از API جدید Google Trends (Alpha) رونمایی کردند. ویژگی های اصلی API جدید شامل موارد زیر خواهد بود:

  • داده های مورد علاقه جستجو به طور مداوم مقیاس بندی شده که هنگام تغییر نمایش داده ها ، مجدداً ارزیابی نمی شوند.
  • یک پنجره نورد پنج ساله ، برای مقایسه های فصلی و تاریخی تا 48 ساعت پیش به روز شده است.
  • تجمع زمان انعطاف پذیر (هفتگی ، ماهانه ، سالانه).
  • تجزیه منطقه و زیر منطقه.

این دنیای تجزیه و تحلیل روند برنامه ای را با معیارهای قابل اعتماد و قابل مقایسه با گذشت زمان باز می کند.

که روز دوم را به پایان می رساند. فردا ، ما پوشش روز آخر سه را در Google Search Central Live ، با اخبار و بینش های بیشتر ، پوشش داده ایم.

منابع بیشتر:


تصویر برجسته: دن تیلور/نمک. آژانس



منبع

مطالب مرتبط