رفتن به مطلب

این هوش مصنوعی از خطاهایش می‌آموزد


Mohammad Aref

ارسال های توصیه شده

محققان موسسه OpenAI طی ماه‌های اخیر بر ایجاد هوش مصنوعی متمرکز بوده‌اند که می‌تواند بهتر از دیگر انواع این فناوری بیاموزد و این الگوریتم اکنون از توانایی آموزش دادن صحبت کردن به خود برخوردار است.

w7ojphlsfpn16kbac2xt.jpg

 

اکنون محققان در این موسسه موفق شده‌اند این سیستم را به گونه‌ای ارتقا دهند که بتواند مانند انسان‌ها از خطاهای خودش بیاموزد. این توانایی مدیون الگوریتم منبع بازی به نام HER (مخفف شناخت تکرار تجربه) است که محققان به تازگی آن را ایجاد کرده‌اند و همانطور که از نامش مشخص است، به سیستم امکان می‌دهد خطاهای خود را بازبینی کرده و از آنها برای انجام درست وظیفه جدید درس بگیرد. از این رو هوش مصنوعی خطاهای خود را به عنوان موفقیت درنظر می‌گیرد.

 

به بیانی دیگر، هر تلاش خطایی که این سیستم هوش مصنوعی در مسیر انجام یک دستور انجام می‌دهد، به هدفی دیگر تبدیل می‌شود، هدفی ناخواسته و مجازی. درست مانند اولین تجربه یادگیری دوچرخه‌سواری که در آن فرد ابتدا در حفظ تعادل دچار مشکل می‌شود. هر بار زمین افتادن فرد را به هدفش که حفظ تعادل است نزدیک‌تر می‌سازد زیرا بشر به این شکل و با استفاده از خطاهایش می‌آموزد.

 

با استفاده از HER، این سیستم هوش مصنوعی نیز قصد دارد به شیوه‌ای مشابه کارهای جدید را یادبگیرد. این تکنیک به تدریج جایگزین سیستم پاداشی خواهد شد که در مدل‌های یادگیری تقویت یادگیری مورد استفاده قرار می‌گیرند. برای اینکه یک هوش مصنوعی به خودش درس بدهد، باید از سیستم پاداشی استفاده کند،‌ سیستمی که متناسب با رسیدن یا نرسیدن هوش مصنوعی به هدفش به آن جایزه می‌دهد.

 

این مدل کامل نیست و برخلاف آن سیستم HER حتی زمانی که هوش مصنوعی دچار خطا می‌شود نیز به او پاداش می‌دهد. به این شکل سیستم با سرعت و کیفیت بالاتری یاد می‌گیرد. به گفته محققان استفاده از سیستم جدید یادگیری به آن معنی نیست که یاد دادن کارهای ویژه به هوش مصنوعی ساده‌تر از گذشته‌است. حقیقت یادگیری با استفاده از HER در روبات‌های واقعی هنوز فرایند پیچیده‌ای است زیرا به دریایی از نمونه‌ها نیاز دارد.

 

منبع: بیگ بنگ

لینک به دیدگاه
×
×
  • اضافه کردن...