رفتن به مطلب

ربات ها چگونه خواندن و فکر کردن را یاد می گیرند؟


Yamna 1

ارسال های توصیه شده

هميشه درباره ي اين صحبت مي کنيم که رايانه ها ما را درک مي کنند. از گوگل مي خواهيم تا نتيجه ي يک جستجو را به ما نمايش داده و يا از دستيار هوشمند کورتانا مي خواهيم کاري را برايمان انجام دهد. اما «درک کردن» مفهومي بسيار پيچيده است؛ مخصوصاً زماني که آن را براي رايانه ها به کار مي بريم.

يکي از شاخه هاي زبان شناسي محاسباتي که پردازش طبيعي زبان (nlp) ناميده مي شود، در حال کار روي اين مشکل است. اين که رايانه ها چگونه ياد مي گيرند که مسائل را «بفهمند». اين حوزه در حال حاضر از جذابيت زيادي برخوردار بوده و زماني که براي اولين بار بدانيد چگونه کار مي کند، خواهيد ديد که تقريبا در تمام حوزه هاي رايانه اي اثر گذار است.

توجه داشته باشيد که اين مقاله حاوي چند مثال کوچک از واکنش يک رايانه به گفتار است، مثل زماني که از دستيار هوشمند سيري چيزي مي خواهيد. تبديل يک گفتار واضح به فرمتي که توسط رايانه قابل فهم باشد، تشخيص گفتار ناميده مي شود. موضوعي که nlp چندان علاقه اي به آن ندارد (حداقل در بحث ما!).

nlp تنها موقع خواندن متن وارد ماجرا مي شود. هر دو فرآيند براي بسياري از اپليکيشن ها ضروري است، اما بايد بدانيد که اين دو مسئله بسيار متفاوت از هم هستند.

تعريف فهميدن يا ادراک رايانه ايقبل از اين که بدانيم يک رايانه چگونه به يک زبان طبيعي پاسخ مي دهد، نياز داريم تا تعريف چند چيز را بدانيم. اول از همه، بايد تعريف مشخصي از زبان طبيعي داشته باشيم. هر زباني که به طور رايج توسط مردم استفاده مي شود در اين دسته قرار مي گيرد. زبان هايي چون کلينگون، اسپرانتو و يا زبان هاي برنامه نويسي جزوي از اين دسته نيستند.

شما از زبان طبيعي به هنگام گفتگو با يکي از دوستان تان استفاده مي کنيد. همچنين ممکن است از آن براي صحبت با دستيار ديجيتال شخصي خود استفاده نماييد. بنابراين منظورمان از واژه ي درک و فهم چيست؟ توضيحش کمي مشکل است. تا به حال فکر کرده ايد که منظور از «فهميدن» يک جمله دقيقا چيست؟

احتمالاً در پاسخ مي گوييد اين بدان معناست که در لحظه، محتواي مشخصي از پيام شنيده شده را در ذهن داشته باشيد. اما منظور از «درک» يک مفهوم ممکن است اين باشد که مي توانيد آن مفهوم را براي اعمال ديگر نيز به کار ببريد. تعاريف فرهنگ لغات از اين کلمه مبهم هستند و هيچ پاسخ دقيقي براي آن وجود ندارد؛ موضوعي که قرن ها مورد بحث فلاسفه و انديشمندان مختلف بوده است.

اما براي تعريف ادراک رايانه اي، ما مي گوييم فهميدن و ادراک توانايي استخراج دقيق معاني از يک زبان طبيعي است. به همين منظور يک رايانه نياز دارد تا عيناً يک جريان گفتاري را پردازش کند، آن جريان را به واحد هاي معنادار تبديل کرده و قادر باشد به شکل مفيد به اين مفاهيم پاسخ دهد.

بديهي است که اين توضيحات کمي برايتان مبهم باشند؛ با اين حال بهترين تعريفي است که در اين مطلب محدود مي توانيم ارائه دهيم. اگر يک رايانه بتواند شبيه به انسان عمل کرده، مفيد باشد و بتواند به يک جريان ورودي از زبان هاي طبيعي پاسخ مناسب دهد، مي گوييم اين رايانه قادر به درک کردن و فهميدن است. تعريفي که در ادامه از آن استفاده خواهيم کرد.

يک مشکل پيچيدهفهم زبان هاي طبيعي در قالب عاميانه و محاوره اي براي يک رايانه بسيار مشکل است. به عنوان مثال بايد به سيري جمله اي مشابه «siri, give me directions to punch pizza» را بگوييد. اين در حالي است که يک فرد عادي اين جمله را به صورت «siri, punch pizza route, please» بيان مي نمايد.

در مثال اول سيري ممکن است کلمات کليدي مثل «give me directions» را از جمله ي شما جدا کرده و سپس فرماني را اجرا کند که مربوط به جستجوي عبارت «punch pizza» است.

اما در جمله ي دوم سيري اقدام به جدا کردن «route» به عنوان يک کلمه ي کليدي کرده و پس از آن مي داند که «punch pizza» جايي است که در واقع مي خواهيم به آن برويم و از توجه به کلمه ي «please» خودداري مي کند.

يک هوش مصنوعي ايميل را تصور کنيد که آن ها را خوانده و پس از آن تصميم مي گيرد که آيا ايميل هاي دريافتي حاوي محتواي اسپم مي شوند يا خير. يا يکي ديگر از آن ها را در نظر بگيريد که با مانيتور کردن پست هاي يک شبکه ي اجتماعي ميزان علاقه مندي به يک کمپاني خاص را مي سنجد.

در همين خصوص نويسنده ي اين مطلب، آقاي دن آلبرايت مي گويد يک بار روي پروژه اي کار مي کرده که در آن موظف بودند به يک رايانه آموزش دهند تا نسخه هاي پزشکي (که داراي انواع مختلف بودند) را خوانده و از آن ها اطلاعات جمع آوري نمايد.

اين بدان معنا بود که سيستم مي بايست با مخفف ها، ترکيبات عجيب، غلط هاي املايي گاه و بي گاه و طيف گسترده اي از انواع تفاوت هاي ديگر در نسخه مواجه شده و آن ها را درک مي کرد؛ وظيفه ي بسيار پيچيده اي که گاهاً ممکن است براي يک انسان هم دشوار باشد چه برسد به يک ماشين.

تنظيم يک الگودر اين پروژه ي تيمي آلبرايت موظف بود به رايانه آموزش دهد تا کلمات خاص و روابط بين کلمات را تشخيص دهد. اولين مرحله ي اين فرآيند، به شناساندن اطلاعات موجود در هر نسخه به رايانه مربوط مي شد. بنابراين آن ها به تفسير نسخه ها پرداختند.

نتيجه نهايي چيزي نبود جز ايجاد تعداد زيادي نهاده و رابطه. به عنوان مثال جمله ي «ms. green’s headache was treated with ibuprofen» فقط بخش کوچکي از اين نسخه ها بود. ms. green به عنوان يک شخص حقيقي، headache به عنوان يک علامت و نشانه و ibuprofen به عنوان دارو برچسب گذاري شده بودند.

پس از آن ms. green به وسيله ي يک رابط به headache مرتبط مي شد. در نهايت نيز ibuprofen توسط کلمه ي ارتباطي treats به headache متصل شده بود.

 

آن ها به همين صورت هزاران نسخه را برچسب گذاري کردند. در نهايت نيز کد تشخيص، درمان، علائم، علل اساسي و هر چيزي که فکر مي کنيد به شاخه ي پزشکي مربوط باشد را نوشتند. ديگر تيم هاي تفسير نيز کار کدنويسي اطلاعات ديگر مانند ترکيبات را انجام دادند. در نهايت مجموعه اي کامل از نسخه هاي پزشکي به وجود آمد که يک هوش مصنوعي قادر به خواندن آن ها بود.

رايانه تنها مي تواند ببيند که ايبوپروفن قادر به درمان سردرد است، اما وقتي اين اطلاعات را ياد مي گيرد قادر است آن را به يک مفهوم معني دار براي ما تبديل کند. يک هوش مصنوعي قطعاً مي تواند مانند يک انسان اين اطلاعات را به ما نشان دهد. اما آيا اين مورد شامل درک کردن نيز مي شود؟ بار ديگر مي گوييم که اين يک سوال فلسفي است.

يادگيري واقعيدر اين مرحله رايانه به سراغ نسخه ها رفته و تعدادي الگوريتم يادگيري ماشيني را به کار مي گيرد. برنامه نويسان روش هاي مختلفي را براي برچسب گذاري روي بخشي از گفتار، تجزيه و تحليل روابط و همچنين برچسب زدن نقش هاي معنايي توسعه مي دهند. در اصل هوش مصنوعي «خواندن» يک نسخه را ياد مي گيرد.

محققان در نهايت با دادن يک نسخه پزشکي و درخواست برچسب زدن به هر نهاده و رابطه، اين سيستم را تست مي نمايند. وقتي رايانه عيناً تفسيري که انسان تحويل مي دهد را توليد کرد، مي توان گفت که حالا اين سيستم ياد گرفته که چگونه نسخه هاي پزشکي را بخواند.

پس از آن از اين سيستم براي جمع آوري ميزان زيادي آمار و اطلاعات مانند: کدام داروها براي درمان مورد استفاده قرار مي گيرند، کدام موارد در درمان مؤثرتر هستند، علل بروز يک سري علائم و غيره استفاده مي شود. در پايان اين روند، هوش مصنوعي قادر خواهد بود به سوالات پزشکي بر اساس مشاهداتي که از نسخه ها داشته است، پاسخ دهد.

ضمنا يک هوش مصنوعي براي يادگيري اين موارد به هيچ وجه وابسته به کتاب هاي درسي، شرکت هاي داروسازي و يا درک مستقيم نيست.

يادگيري عميقاجازه دهيد به مثال ديگري رجوع کنيم. شبکه هاي عصبي پروژه ي deepmind گوگل در حال يادگيري خواندن اخبار و مقالات هستند. مانند هوش مصنوعي پزشکي که در بالا ديديد، محققان از اين سيستم مي خواهند تا اطلاعات مختصر و مفيد را از متن هاي بلند تر استخراج کند.

آموزش هوش مصنوعي در زمينه ي اطلاعات پزشکي به اندازه ي کافي سخت بود. بنابراين حالا مي دانيد که توانمند سازي يک هوش مصنوعي براي خواندن اخبار و مقالات تا چه اندازه نياز به تفسير داده دارد. استخدام آناليزور و به دست آوردن اطلاعات کافي يقينا فرآيند بسيار وقت گيري بوده و هزينه هاي گزافي دارد.

 

بنابراين تيم deepmind منابع ديگري چون وبسايت هاي خبري و به طور دقيق cnn و daily mail را به کار مي گيرند. اما چرا اين سايت ها؟ چون آن ها فهرستي نقطه دار از خلاصه ي مقالاتشان تهيه مي کنند که به سادگي از خود مقاله قابل استخراج نيستند. اين بدان معناست که هوش مصنوعي به واسطه ي آن چيزي براي يادگيري دارد.

محققان اساساً به هوش مصنوعي مي گويند که در اين مکان يک مقاله وجود دارد که شامل اطلاعات بسيار مهمي است. پس از آن آن ها از سيستم مي خواهند تا همان نوع اطلاعات را بدون فهرست نقطه دار از مقاله ي مورد نظر استخراج نمايند. اين سطح از پيچيدگي را مي توان با به کارگيري شبکه هاي عصبي عميق کنترل کرد که نوعي بسيار پيچيده از سيستم يادگيري ماشيني هستند.

يک هوش مصنوعي با خواندن چه کاري مي تواند انجام دهد؟احتمالا حالا درک خوبي از اين که چگونه يک رايانه «خواندن» را فرا مي گيرد پيدا کرده ايد . شما يک متن حجيم داريد؛ کافيست موارد مهم را به رايانه بگوييد و از چند الگوريتم يادگيري ماشيني براي استخراج اطلاعات استفاده کنيد. اما با يک هوش مصنوعي که اطلاعات را از متن استخراج مي کند چه کارهايي مي توان انجام داد؟ با مثال تفسير نسخه هاي پزشکي و خواندن اخبار و مقالات که آشنا شديد.

اما کارهاي ديگري هم هست، برنامه متن باز p.a.n را برايتان مثال مي زنيم. p.a.n مي تواند با خواندن اشعار، تشبيهات ادبي را از آن استخراج کرده و به تجزيه و تحليل آن ها بپردازد. محققان اغلب از يادگيري ماشيني براي تجزيه و تحليل حجم انبوه داده ها در شبکه هاي اجتماعي استفاده مي کنند. اين مورد توسط کمپاني ها براي درک احساسات کاربران، ديدن اين که مردم راجع به چه چيزي صحبت مي کنند و همچنين يافتن الگوهاي مفيد براي بازاريابي مورد استفاده قرار مي گيرد.

محققان همچنين از يادگيري ماشيني در جهت تحت نظر قرار دادن رفتار ايميل ها استفاده مي نمايند. ارائه دهندگان سرويس ايميل نيز مي توانند از آن براي فيلتر کردن ايميل هاي اسپم، انتقال آن ها از صندوق پستي به جايي ديگر و طبقه بندي برخي پيام ها بر اساس الويت استفاده کنند. قابليت خواندن و ادراک هوش مصنوعي در ساخت چت بات هاي خدمت رسان نيز بسيار حياتي است.

در آخر مي توان گفت که با بهبود و پيشرفت يادگيري ماشيني، احتمالات نيز به همان ميزان افزايش مي يابند. در حال حاضر رايانه ها در بازي شطرنج و همچنين بازي هاي ويديويي هوشمند تر و بهتر از انسان هستند. به زودي نيز در خواندن و يادگيري بهتر مي شوند. آيا اين اولين قدم به سوي يک هوش مصنوعي قوي است؟ بايد منتظر ماند و ديد.

  • Like 3
لینک به دیدگاه
×
×
  • اضافه کردن...