Google تأیید می کند که از چیزی شبیه به Muvera استفاده می کند
گری ایلیز گوگل در طول جستجوی اخیر Central Live Deep Dive در آسیا در مورد اینکه آیا آنها از بازیابی چند وکتور جدید از طریق رمزگذاری های ثابت (MUVARA) استفاده می کنند ، پاسخ داد و همچنین اگر آنها از مدل های پایه نمودار استفاده می کنند.
موورا
Google به تازگی Muvera را در یک پست وبلاگ و یک مقاله تحقیقاتی اعلام کرده است: روشی که با تبدیل جستجوی پیچیده چند بردار به جستجوی سریع تک بردگر ، بازیابی را بهبود می بخشد. این مجموعه مجموعه های تعبیه شده را در بردارهای ثابت بعدی که از نزدیک شباهت اصلی آنها را نزدیک می کنند ، فشرده می کند. این امر به شما امکان می دهد تا از روشهای جستجوی تک بردگر بهینه شده استفاده کنید تا به سرعت نامزدهای خوبی پیدا کنید ، سپس آنها را با استفاده از شباهت دقیق چند بردار دوباره رتبه بندی کنید. در مقایسه با سیستم های قدیمی تر مانند Plaid ، Muvera سریعتر است ، کاندیداهای کمتری را بازیابی می کند و هنوز هم به یاد می آورد ، و آن را به یک راه حل عملی برای بازیابی در مقیاس بزرگ تبدیل می کند.
نکات کلیدی در مورد Muvera عبارتند از:
- Muvera مجموعه های چند بردار را با استفاده از رمزگذاری های ابعادی ثابت (FDE) ، که بازنمایی های تک بردار از مجموعه های چند بردار هستند ، به بردارهای ثابت تبدیل می کند.
- این FDE ها (رمزگذاری های بعدی ثابت) با مقایسه های چند جانبی اصلی به اندازه کافی از نزدیک برای پشتیبانی از بازیابی دقیق مطابقت دارند.
- بازیابی Muvera از MIPS (حداکثر جستجوی محصول داخلی) ، یک تکنیک جستجوی مستقر در بازیابی استفاده می کند و استقرار در مقیاس را آسان تر می کند.
- Reranking: پس از استفاده سریع جستجوی تک بردگر (MIPS) برای به سرعت محدود کردن به احتمال زیاد مسابقات ، Muvera آنها را با استفاده از شباهت Chamfer ، یک روش مقایسه چند وکتور دقیق تر ، دوباره رتبه بندی می کند. این مرحله پایانی دقت کامل بازیابی چند جانبی را بازیابی می کند ، بنابراین شما هم سرعت و هم با دقت دریافت می کنید.
- Muvera قادر است بیشتر از اسناد دقیقاً مرتبط با زمان پردازش پایین تر از پایه بازیابی پیشرفته (PLAID) که با آن مقایسه شده است ، پیدا کند.
گوگل تأیید می کند که آنها از Muvera استفاده می کنند
خوزه مانوئل مورگال (پروفایل LinkedIn) سؤال خود را به گری ایلیس گوگل مرتبط کرد و پاسخ وی این بود که به شوخی بپرسید که موورا چیست و سپس وی تأیید کرد که آنها از نسخه ای از آن استفاده می کنند:
اینگونه است که سوال و پاسخ توسط خوزه شرح داده شده است:
وی گفت: “مقاله ای در Google Research در مورد Muvera منتشر شده است و یک مقاله مرتبط وجود دارد. آیا در حال حاضر در جستجوی تولید است؟
پاسخ او این بود که از من بپرسید که موورا ها ها چه بود و سپس اظهار داشت که آنها از چیزی شبیه به مورورا استفاده می کنند اما آنها مانند آن نامگذاری نمی کنند. “
آیا Google از مدل های بنیاد نمودار (GFMS) استفاده می کند؟
گوگل اخیراً اعلامیه وبلاگ را در مورد دستیابی به موفقیت AI به نام مدل بنیاد گراف منتشر کرده است.
Google’s Graph Foundation Model (GFM) نوعی هوش مصنوعی است که با تبدیل آنها به نمودارها ، از پایگاه داده های رابطه ای یاد می گیرد ، جایی که ردیف ها به گره تبدیل می شوند و اتصالات بین جداول به لبه تبدیل می شود.
بر خلاف مدل های قدیمی تر (مدل های یادگیری ماشین و شبکه های عصبی نمودار (GNN)) که فقط روی یک مجموعه داده کار می کنند ، GFMS می تواند پایگاه داده های جدید را با ساختارها و ویژگی های مختلف بدون بازآفرینی روی داده های جدید اداره کند. GFM ها از یک مدل بزرگ AI برای یادگیری چگونگی ارتباط نقاط داده در جداول استفاده می کنند. این امر به GFM اجازه می دهد تا الگویی را پیدا کنند که مدل های معمولی از دست می دهند ، و در کارهایی مانند تشخیص هرزنامه در سیستم های مقیاس Google بسیار بهتر عمل می کنند. GFM ها یک قدم بزرگ به جلو هستند زیرا آنها انعطاف پذیری مدل پایه را به داده های ساخت یافته پیچیده می بخشند.
مدل های بنیاد نمودار نشان دهنده یک دستاورد قابل توجه است زیرا پیشرفت آنها افزایشی نیست. آنها یک بهبود نظم از نظر عکسبرداری هستند و با دقت عملکرد 3 برابر تا 40 برابر با دقت متوسط.
خوزه بعد از ایلیز پرسید که آیا گوگل از مدل های بنیاد گراف استفاده می کند و گری دوباره به شوخی اعلام کرد که نمی داند خوزه در مورد چه چیزی صحبت می کند.
او سوال و پاسخ را مرتبط کرد:
وی گفت: “مقاله ای در Google Research در مورد مدل های بنیاد گراف برای داده ها منتشر شده است ، این بار مقاله ای در ارتباط با آن وجود ندارد. آیا در حال حاضر در جستجوی تولید است؟
پاسخ او مانند گذشته بود و از من پرسید که چه مدلهای بنیاد نمودار برای داده ها چیست و او فکر می کرد که در حال تولید نیست. او نمی دانست زیرا کاغذ مرتبط نیست و از طرف دیگر ، او به من اظهار داشت که او آنچه را که در وبلاگ تحقیقات Google منتشر شده است کنترل نمی کند. “
گری اظهار داشت که در حال حاضر مدل بنیاد گراف در جستجو استفاده نشده است. در این مرحله ، این بهترین اطلاعاتی است که ما داریم.
آیا GFM برای استقرار مقیاس آماده است؟
اعلامیه رسمی مدل بنیاد نمودار می گوید که در یک کار داخلی ، تشخیص اسپم در تبلیغات آزمایش شده است ، که به شدت نشان می دهد که از سیستم ها و داده های داخلی واقعی استفاده شده است ، نه فقط معیارها یا شبیه سازی های دانشگاهی.
در اینجا آنچه در اعلامیه Google در مورد آن است:
“فعالیت در مقیاس Google به معنای پردازش نمودارهای میلیاردها گره و لبه است که در آن محیط JAX و زیرساخت های مقیاس پذیر TPU ما به ویژه می درخشد. چنین حجم داده ها برای آموزش مدلهای عمومی قابل آموزش است ، بنابراین ما GFM خود را در چندین کار طبقه بندی داخلی مانند تشخیص اسپم در بین تبلیغات ، که شامل ده ها جداول ارتباطات بزرگ و مرتبط است ، بررسی کردیم. جداول ، و بنابراین زمینه ای که ممکن است برای پیش بینی های دقیق مفید باشد.
پیشخدمت
گری ایلیز گوگل تأیید کرد که نوعی Muvera در Google در حال استفاده است. به نظر می رسید که پاسخ او در مورد GFM به عنوان یک نظر بیان شده است ، بنابراین تا حدودی کمتر مشخص است ، زیرا به عنوان گری که می گوید فکر می کند در تولید نیست ، مرتبط است.
تصویر برجسته توسط Shutterstock/KrakenImages.com