رفتن به مطلب

یک بازی جالب با هوش مصنوعی گوگل برای سنجش توانایی تشخیص موقعیت عکس ها


Mohammad Aref

ارسال های توصیه شده

اگر عکسی داشته باشیم که در آن ساختمان مشهوری مشخص باشد، تعیین موقعیت عکس کاری ندارد، البته اگر معلومات عمومی خوب باشد. اما اگر در عکس مکان مشهوری نیفتاده باشد، تعیین موقعیت عکس خیلی سخت می‌شود. در این صورت باید شما به معلومات و هوش و دانش خود متکی شوید، تا بتوانید حدس‌های خوبی بزنید. مثلا باید بتوانید با توجه به نوع معماری، آب و هوا و پوشش گیاهی منطقه و نوع تزئین ساختمان‌ها، حدس‌هایی بزنید.

 

 

خب، این می‌تواند بازی خوبی باشد. اما حالا تصور کنید که یک سیستم کامپیوتری هوشمند را هم وارد این بازی کنید و با یک الگوریتم هوش مصنوعی بازی کنیم.

 

تصور کنید شما برنده می‌شوید یا هوش مصنوعی؟!

 

راست‌اش ما انتظار نداریم، هنوز هم هوش مصنوعی بتواند در بعضی از کارها به نیروی پردازش مغز ما نزدیک شده باشد.

 

اما توبیاس ویاند – یک متخصص در زمینه دید کامپیوتری در گوگلل- این روند را تغییر داده است. او پروژه‌ای را رهبری کرده است تا با مکانیسم یادگیری ژرف، ماشین‌ها هم قادر به زدن حدس‌های اینچنینی بشوند.

 

برای این کار ویاند و تیم‌اش، کل دنیا را به شبکه‌‌ای متشکل از ۲۶ هزار مربع تقسیم کردند. البته اندازه این مربع‌ها بر اساس عکس‌هایی که از هر مربع به صورت دیتای خام در دسترس بود، متفاوت بود. بنابراین شهرهای بزرگ که از آنها عکس‌های زیادی در دسترس، بود، مربع‌های کوچکی بودند و مناطق دورافتاده، مربع‌های بزرگ و البته بعضی از جاها مثل اقیانوس‌های اصلا شامل این مکانیسم مربع‌سازی نمی‌شدند.

 

k4kqkrswxsxumwp32i0t.jpg

در مرحله بعد یک پایگاه داده از عکس‌های حائی موقعیت جغرافیایی تشکیل شد. حجم داده‌ها خیلی بزرگ بود و به ۱۲۶ میلیون عکس می‌رسید.

 

ویاند از ۹۲ میلیون عدد از این عکس‌ها برای آموزش یک شیکه عصبی قدرتمند استفاده کرد. این شبکه عصبی کامپیوتری باید می‌توانست تنها با خود عکس‌ها، و نه هیچ داده جانبی دیگر و یا برچسبی روی عکس‌ها، موقعیت عکس‌ها را حدس بزند و بگوید که عکس احتمالا در کدام مربع گرفته شده است.

 

آنها سپس با ۳۴ میلیون عکس باقیمانده اقدام به معتبرسازی یا validation عکس‌ها کردند.

 

سرانجام نوبت به مرحله آزمایش رسید. آنها برای آزمایش از ۲٫۳ میلیون عکس فلیکر که تگ موقعیتی هم داشتند استفاده کردند، البته به الگوریتم‌ اصلا اطلاعاتی در مورد این تگ‌ها داده نمی‌شد.

 

این الگوریتم هوش مصنوعی که موسوم به PlaNet است، توانست در ۳٫۶ درصد موارد، با دقتی در حد فاصله یک خیابان متوجه موقعیت عکس بشود! در ۱۰٫۱ درصد موارد، شهر محل گرفته شدن عکس را صحیح تشخیص داد و در ۲۸٫۴ درصد توانست کشور و نیز در ۴۸ درصد موارد، قاره را به طرز صحیحی مشخص کند.

 

خب، این بسیار عالی و باورنکردنی است.

 

برای مقایسه با توانایی انسان‌های، ویاند، ۱۰ آدم خبره که به سفرهای زیادی رفته بودند، را انتخاب کرد. بعدش یک گیم آنلاین درست کرد که در آن عکس‌هایی تصادفی از سرویس خیابان گوگل یا Street View نشان داده می‌شود. در این گیم هر شخص باید بعد از دیدن هر عکس، یک نقطه حدسی را روی نقشه کره زمین مشخص می‌کرد تا مشخص شود که حدس‌اش چقدر نزدیک به واقعیت است. در این گیم فاصله نقطه حدس با نقطه واقعی، به کیلومتر نشان داده می‌شد و بر این اساس، به کاربر امتیاز داده می‌شد.

 

wb5jv6gzqxj2d8bax34p.jpg

سرانجام مسابقه بین انسان‌ها و کامپیوتر صورت گرفت، مشخص شد که میزان متوسط الگوریتم PlaNet از آدم‌ها بسیار بهتر است. به طور متوسط الگوریتم ۱۱۳۱ کیلومتر خطا داشت، در صورتی که انسان‌های با تجربه ۲۳۲۰ کیلومتر خطا داشتند.

 

و البته این در شرایطی بود که الگوریتم از سرنخ‌هایی که مان انسان‌ها استفاده می‌کنیم، استفاده نمی‌کرد، مثلا به پوشش گیاهی و نوع معماری توجهی نمی‌کرد!

 

اما چرا با این وجود، هوش مصنوعی بهتر از انسان‌ها عمل کرده بود؟!

 

چون این الگوریتم از هر انسانی، اطلاعات خام بیشتری داشت. مگر ما انسان‌ها در تمام طول عمر خود می‌توانیم به چند جا برویم و چند منظره در حافظه خود ثبت کنیم؟!

 

خب، در انتها پیشنهاد می‌کنم که برای اینکه خودتان محکی بخورید به سایت بازی آنلاینی که در موردش برایتان نوشتم بروید و توانایی خودتان در حدس موقعیت جغرافیایی عکس‌ها را بسنجید:

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

 

منبع: 1پزشک

  • Like 2
لینک به دیدگاه
×
×
  • اضافه کردن...