Mohammad Aref 120452 اشتراک گذاری ارسال شده در 15 اسفند، ۱۳۹۶ محققان موسسه OpenAI طی ماههای اخیر بر ایجاد هوش مصنوعی متمرکز بودهاند که میتواند بهتر از دیگر انواع این فناوری بیاموزد و این الگوریتم اکنون از توانایی آموزش دادن صحبت کردن به خود برخوردار است. اکنون محققان در این موسسه موفق شدهاند این سیستم را به گونهای ارتقا دهند که بتواند مانند انسانها از خطاهای خودش بیاموزد. این توانایی مدیون الگوریتم منبع بازی به نام HER (مخفف شناخت تکرار تجربه) است که محققان به تازگی آن را ایجاد کردهاند و همانطور که از نامش مشخص است، به سیستم امکان میدهد خطاهای خود را بازبینی کرده و از آنها برای انجام درست وظیفه جدید درس بگیرد. از این رو هوش مصنوعی خطاهای خود را به عنوان موفقیت درنظر میگیرد. به بیانی دیگر، هر تلاش خطایی که این سیستم هوش مصنوعی در مسیر انجام یک دستور انجام میدهد، به هدفی دیگر تبدیل میشود، هدفی ناخواسته و مجازی. درست مانند اولین تجربه یادگیری دوچرخهسواری که در آن فرد ابتدا در حفظ تعادل دچار مشکل میشود. هر بار زمین افتادن فرد را به هدفش که حفظ تعادل است نزدیکتر میسازد زیرا بشر به این شکل و با استفاده از خطاهایش میآموزد. با استفاده از HER، این سیستم هوش مصنوعی نیز قصد دارد به شیوهای مشابه کارهای جدید را یادبگیرد. این تکنیک به تدریج جایگزین سیستم پاداشی خواهد شد که در مدلهای یادگیری تقویت یادگیری مورد استفاده قرار میگیرند. برای اینکه یک هوش مصنوعی به خودش درس بدهد، باید از سیستم پاداشی استفاده کند، سیستمی که متناسب با رسیدن یا نرسیدن هوش مصنوعی به هدفش به آن جایزه میدهد. این مدل کامل نیست و برخلاف آن سیستم HER حتی زمانی که هوش مصنوعی دچار خطا میشود نیز به او پاداش میدهد. به این شکل سیستم با سرعت و کیفیت بالاتری یاد میگیرد. به گفته محققان استفاده از سیستم جدید یادگیری به آن معنی نیست که یاد دادن کارهای ویژه به هوش مصنوعی سادهتر از گذشتهاست. حقیقت یادگیری با استفاده از HER در روباتهای واقعی هنوز فرایند پیچیدهای است زیرا به دریایی از نمونهها نیاز دارد. منبع: بیگ بنگ لینک به دیدگاه
ارسال های توصیه شده