ابزار رایگان تجزیه و تحلیل تصویر هوش مصنوعی گوگل


گوگل یک ابزار طبقه بندی تصاویر هوش مصنوعی ارائه می دهد که تصاویر را تجزیه و تحلیل می کند تا محتوا را طبقه بندی کند و به آنها برچسب اختصاص دهد.

این ابزار به عنوان نمایشی از Google Vision در نظر گرفته شده است، که می‌تواند طبقه‌بندی تصاویر را به صورت خودکار مقیاس‌بندی کند، اما می‌تواند به عنوان یک ابزار مستقل برای مشاهده اینکه چگونه یک الگوریتم تشخیص تصویر تصاویر شما را مشاهده می‌کند و به چه چیزی مرتبط هستند، استفاده می‌شود.

حتی اگر از Google Vision API برای مقیاس‌بندی تشخیص و طبقه‌بندی تصاویر استفاده نمی‌کنید، این ابزار نمای جالبی از توانایی الگوریتم‌های مرتبط با تصویر Google ارائه می‌دهد که آپلود تصاویر برای مشاهده نحوه طبقه‌بندی الگوریتم Google’s Vision آن‌ها را جالب می‌کند. .

این ابزار الگوریتم های هوش مصنوعی و یادگیری ماشین گوگل را برای درک تصاویر نشان می دهد.

این بخشی از مجموعه Google’s Cloud Vision API است که مدل‌های یادگیری ماشین بینایی را برای برنامه‌ها و وب‌سایت‌ها ارائه می‌دهد.

آیا ابزار Cloud Vision الگوریتم گوگل را منعکس می کند؟

این فقط یک مدل یادگیری ماشینی است و نه یک الگوریتم رتبه بندی.

بنابراین، استفاده از این ابزار و انتظار اینکه چیزی در مورد الگوریتم رتبه‌بندی تصاویر گوگل منعکس کند، غیرواقعی است.

با این حال، این یک ابزار عالی برای درک اینکه چگونه الگوریتم‌های هوش مصنوعی و یادگیری ماشین گوگل می‌توانند تصاویر را درک کنند، است و بینشی آموزشی در مورد اینکه چگونه الگوریتم‌های مرتبط با بینایی امروزی پیشرفته هستند ارائه می‌دهد.

اطلاعات ارائه شده توسط این ابزار می تواند برای درک اینکه چگونه یک ماشین ممکن است بفهمد یک تصویر در مورد چیست و احتمالاً ایده ای در مورد میزان دقیق تناسب آن تصویر با موضوع کلی یک صفحه وب ارائه می دهد استفاده شود.

چرا ابزار طبقه بندی تصویر مفید است؟

تصاویر می‌توانند نقش مهمی در نمایان شدن جستجو و CTR از راه‌های مختلف نمایش محتوای صفحه وب در سراسر Google ایفا کنند.

بازدیدکنندگان بالقوه سایت که در حال تحقیق در مورد یک موضوع هستند از تصاویر برای پیمایش به محتوای مناسب استفاده می کنند.

بنابراین، استفاده از تصاویر جذابی که برای جست‌وجوها مرتبط هستند، در زمینه‌های خاصی می‌تواند برای انتقال سریع ارتباط صفحه وب با آنچه که شخص جستجو می‌کند، مفید باشد.

ابزار Google Vision راهی برای درک اینکه چگونه یک الگوریتم ممکن است یک تصویر را بر اساس آنچه در تصویر است مشاهده و طبقه بندی کند، ارائه می دهد.

دستورالعمل های گوگل برای سئوی تصویر توصیه می کند:

عکس‌های باکیفیت بیشتر از تصاویر تار و نامشخص برای کاربران جذابیت دارند. همچنین، تصاویر شارپ در تصویر کوچک نتیجه برای کاربران جذاب‌تر است و احتمال دریافت ترافیک از کاربران را افزایش می‌دهد.

اگر ابزار Vision در شناسایی تصویر مربوط به آن مشکل داشته باشد، ممکن است سیگنالی باشد که بازدیدکنندگان احتمالی سایت نیز ممکن است مشکلات مشابهی داشته باشند و تصمیم بگیرند از سایت بازدید نکنند.

ابزار تصویر گوگل چیست؟

این ابزار راهی برای نمایش API Cloud Vision گوگل است.

Cloud Vision API سرویسی است که به برنامه‌ها و وب‌سایت‌ها اجازه می‌دهد به ابزار یادگیری ماشین متصل شوند و خدمات تجزیه و تحلیل تصویر را ارائه دهند که می‌تواند مقیاس‌پذیر باشد.

خود ابزار مستقل به شما امکان می دهد یک تصویر را آپلود کنید و به شما می گوید که الگوریتم یادگیری ماشین گوگل چگونه آن را تفسیر می کند.

صفحه Google’s Cloud Vision نحوه استفاده از این سرویس را به شرح زیر توضیح می دهد:

Cloud Vision به توسعه دهندگان این امکان را می دهد که به راحتی ویژگی های تشخیص بینایی را در برنامه ها ادغام کنند، از جمله برچسب گذاری تصویر، تشخیص چهره و نقطه عطف، تشخیص نوری کاراکتر (OCR)، و برچسب گذاری محتوای صریح.

این پنج روشی است که ابزار تجزیه و تحلیل تصویر گوگل تصاویر آپلود شده را طبقه بندی می کند:

  1. چهره ها.
  2. اشیاء.
  3. برچسب ها.
  4. خواص.
  5. جستجوی امن.

چهره ها

برگه “چهره ها” تحلیلی از احساسات بیان شده توسط تصویر ارائه می دهد.

دقت این نتیجه نسبتاً دقیق است.

تصویر زیر فردی است که به عنوان گیج توصیف شده است، اما این واقعا یک احساس نیست.

هوش مصنوعی احساسات بیان شده در صورت را شگفت زده و با امتیاز اطمینان 96 درصد توصیف می کند.

هوش مصنوعی تصویر گوگلتصویر ترکیبی ایجاد شده توسط نویسنده، ژوئیه 2022. تصاویری که از Google Cloud Vision API و Shutterstock/Cast Of Thousands تهیه شده‌اند

اشیاء

تب “اشیاء” نشان می دهد که چه اشیایی در تصویر هستند، مانند عینک، شخص و غیره.

این ابزار به طور دقیق اسب ها و افراد را شناسایی می کند.

اسکرین شات ابزار Google Visionتصویر ترکیبی ایجاد شده توسط نویسنده، ژوئیه 2022. تصاویر از Google Cloud Vision API و Shutterstock/Lukas Gojda گرفته شده است

برچسب ها

برگه «برچسب‌ها» جزئیات تصویری را که گوگل تشخیص می‌دهد، مانند گوش‌ها و دهان، اما جنبه‌های مفهومی مانند پرتره و عکاسی را نشان می‌دهد.

این به ویژه جالب است زیرا نشان می دهد که هوش مصنوعی تصویر گوگل تا چه حد می تواند آنچه را در یک تصویر است درک کند.

اسکرین شات از هوش مصنوعی گوگل ویژن که اشیاء درون عکس آپلود شده را شناسایی می کندتصویر ترکیبی ایجاد شده توسط نویسنده، ژوئیه 2022. تصاویر از Google Cloud Vision API و Shutterstock/Lukas Gojda گرفته شده است

آیا گوگل از آن به عنوان بخشی از الگوریتم رتبه بندی استفاده می کند؟ این چیزی است که شناخته شده نیست.

خواص

خواص رنگ های استفاده شده در تصویر هستند.

اسکرین شات ابزار Google Vision که رنگ های غالب یک تصویر را شناسایی می کنداسکرین شات از Google Cloud Vision API، جولای ۲۰۲۲

در ظاهر، نکته این ابزار واضح نیست و ممکن است به نظر برسد که تا حدودی بدون کاربرد است.

اما در واقعیت، رنگ های یک تصویر می تواند بسیار مهم باشد، به خصوص برای یک تصویر برجسته.

تصاویری که دارای طیف بسیار گسترده ای از رنگ ها هستند می توانند نشانه ای از یک تصویر بد انتخاب شده با اندازه متورم باشند که باید به آن توجه کرد.

یک دیدگاه مفید دیگر در مورد تصاویر و رنگ این است که تصاویر با طیف رنگی تیره تر منجر به فایل های تصویری بزرگتر می شوند.

از نظر سئو، بخش Property ممکن است برای شناسایی تصاویر در کل وب سایت مفید باشد که می توان آنها را با تصاویری که اندازه کمتری دارند جایگزین کرد.

همچنین، محدوده‌های رنگی برای تصاویر برجسته که بی‌صدا هستند یا حتی در مقیاس خاکستری ممکن است مورد توجه قرار گیرند، زیرا تصاویر برجسته که فاقد رنگ‌های زنده هستند، در رسانه‌های اجتماعی، Google Discover و Google News ظاهر نمی‌شوند.

به عنوان مثال، تصاویر برجسته که واضح هستند را می توان به راحتی اسکن کرد و احتمالاً در نتایج جستجو یا در Google Discover نشان داده می شود نرخ کلیک (CTR) بالاتری دریافت می کند، زیرا آنها بهتر از تصاویری که بی صدا هستند و محو می شوند به چشم می گویند. به پس زمینه

متغیرهای زیادی وجود دارند که می توانند بر عملکرد CTR تصاویر تأثیر بگذارند، اما این روشی را برای افزایش مقیاس فرآیند ممیزی تصاویر کل وب سایت فراهم می کند.

eBay مطالعه ای روی تصاویر محصول و CTR انجام داد و متوجه شد که تصاویر با رنگ های پس زمینه روشن تر، CTR بالاتری دارند.

محققان eBay خاطرنشان کردند:

در این مقاله متوجه می‌شویم که ویژگی‌های تصویر محصول می‌تواند بر رفتار جستجوی کاربر تأثیر بگذارد.

ما دریافتیم که برخی از ویژگی‌های تصویر با CTR در موتور جستجوی محصول همبستگی دارند و این ویژگی‌ها می‌توانند به مدل‌سازی نرخ کلیک برای برنامه‌های جستجوی خرید کمک کنند.

این مطالعه می‌تواند به فروشندگان انگیزه دهد تا تصاویر بهتری را برای محصولاتی که می‌فروشند ارائه دهند.

به طور حکایتی، استفاده از رنگ‌های زنده برای تصاویر برجسته ممکن است برای افزایش CTR برای سایت‌هایی که به ترافیک Google Discover و Google News وابسته هستند مفید باشد.

بدیهی است که عوامل زیادی بر CTR از Google Discover و Google News تأثیر می‌گذارند. اما تصویری که از بقیه متمایز است ممکن است مفید باشد.

بنابراین به همین دلیل، استفاده از ابزار Vision برای درک رنگ‌های مورد استفاده می‌تواند برای ممیزی مقیاس‌بندی شده تصاویر مفید باشد.

جستجوی امن

جستجوی ایمن نشان می دهد که چگونه تصویر برای محتوای ناامن رتبه بندی می شود. توضیحات تصاویر بالقوه ناامن به شرح زیر است:

  • بالغ.
  • کلاهبرداری
  • پزشکی.
  • خشونت
  • نژادپرستانه

جستجوی گوگل دارای فیلترهایی است که یک صفحه وب را از نظر محتوای ناامن یا نامناسب ارزیابی می کند.

بنابراین، به همین دلیل، بخش جستجوی ایمن ابزار بسیار مهم است زیرا، اگر یک تصویر به طور ناخواسته فیلتر جستجوی ایمن را راه‌اندازی کند، ممکن است صفحه وب برای بازدیدکنندگان بالقوه سایت که به دنبال محتوای صفحه وب هستند رتبه‌بندی نشود.

تجزیه و تحلیل جستجوی ایمن Google Visionاسکرین شات از Google Cloud Vision API، جولای ۲۰۲۲

اسکرین شات بالا ارزیابی عکس اسب های مسابقه در مسیر مسابقه را نشان می دهد. این ابزار به دقت تشخیص می دهد که هیچ محتوای پزشکی یا بزرگسالی در تصویر وجود ندارد.

متن: تشخیص کاراکتر نوری (OCR)

Google Vision توانایی قابل توجهی در خواندن متنی دارد که در عکس است.

ابزار Vision قادر به خواندن دقیق متن در تصویر زیر است:

اسکرین شات ابزار Vision که متن را با دقت می خواندتصویر ترکیبی ایجاد شده توسط نویسنده، ژوئیه 2022. تصاویر از Google Cloud Vision API و Shutterstock/Melissa King منبع گرفته شده است

همانطور که در بالا مشاهده می شود، گوگل توانایی (از طریق تشخیص کاراکتر نوری، با نام OCR) برای خواندن کلمات در تصاویر.

با این حال، این نشانه ای نیست که گوگل از OCR برای اهداف رتبه بندی جستجو استفاده می کند.

واقعیت این است که گوگل استفاده از کلمات در اطراف تصاویر را برای کمک به درک اینکه یک تصویر در مورد چیست توصیه می کند و ممکن است حتی برای تصاویری که متن درون آنها وجود دارد، گوگل همچنان به کلمات اطراف تصویر وابسته است تا بفهمد تصویر چیست. مربوط است و مربوط به.

دستورالعمل‌های گوگل در مورد سئوی تصویر به طور مکرر بر استفاده از کلمات برای ارائه زمینه تصاویر تاکید می‌کند.

“با افزودن زمینه بیشتر در اطراف تصاویر، نتایج می توانند بسیار مفیدتر شوند، که می تواند منجر به ترافیک با کیفیت بالاتر به سایت شما شود.

… در صورت امکان، تصاویر را نزدیک متن مربوطه قرار دهید.

گوگل اطلاعات مربوط به موضوع تصویر را از محتوای صفحه استخراج می کند…

گوگل از متن جایگزین همراه با الگوریتم های بینایی کامپیوتر و محتویات صفحه برای درک موضوع تصویر استفاده می کند.

از مستندات گوگل بسیار واضح است که گوگل برای درک اینکه تصویر در مورد چیست به بافت متن اطراف تصاویر وابسته است.

بردن

ابزار Vision AI گوگل راهی برای آزمایش درایو Vision AI گوگل ارائه می دهد تا یک ناشر بتواند از طریق یک API به آن متصل شود و از آن برای مقیاس بندی طبقه بندی تصاویر و استخراج داده ها برای استفاده در سایت استفاده کند.

اما، همچنین بینشی در مورد اینکه الگوریتم‌های برچسب‌گذاری تصویر، حاشیه‌نویسی و تشخیص نوری کاراکترها تا چه اندازه به وجود آمده‌اند، ارائه می‌کند.

تصویری را در اینجا آپلود کنید تا ببینید چگونه طبقه‌بندی می‌شود و آیا ماشینی آن را به همان شکلی که شما می‌بیند آن را می‌بیند.

منابع بیشتر:


تصویر برجسته توسط Maksim Shmeljov/Shutterstock





منبع

مطالب مرتبط