رفتن به مطلب

پیاده سازی الگوریتم های یادگیری ماشین در متلب


ارسال های توصیه شده

تمام دوستانی که درس یادگیری ماشین دارن احتمالا با الگوریتم هایی مانند اپسیلون گریدی ، سارسا یا کیو لرنینگ آشنایی دارن .

اینبار قصد این رو دارم که کد های این الگوریتم ها در زبان متلب رو در اختیار دوستان قرار دهم .

امیدوارم به کار دوستان بیاید.

 

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

  • Like 9
لینک به دیدگاه

بقیه ی کد ها هم می توانید از پیوست دانلود کنید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

  • Like 10
لینک به دیدگاه
  • 4 ماه بعد...

برنامه هایی که پیاده سازی شده برگرفته از کتاب Reinforcement_Learning_An_Introduction می باشد که در زیر پیوست شده است.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

  • Like 5
لینک به دیدگاه

تابع EepsilonGreedy به چه صورت کار می کند؟

در ابتدا یه توضیح خیلی مختصر درباره Greedy میدیم. همانطور که همه ی دوستان میدونن الگوریتم های Greedy به صورت حریصانه عمل می کنند.:banel_smiley_4:

یا به قول معروف همیشه دنبال بهترین هستن.

کاری که EepsilonGreedy انجام می دهد به این صورت است که یه عدد تصادفی بین صفر و یک انتخاب می کند بعد این عدد تصادفی را با اپسیلون مقایسه می کند و اگر از اپسیلون بزرگتر بود بهترین حالت(کاری که پاداش بیشتر دارد را انتخاب می کند) و اگر هم کمتر از اپسیلون بود به صورت تصادفی یک کار رو انتخاب می کند.

  • Like 5
لینک به دیدگاه

ممنون میشم اگه بگید این کدها برای حل چه مسائلی از کتاب استفاده شده؟ یعنی الان کد sars برای حل چه مسئله ای هست؟ یا اگه خودتون توضیح بیش تری در مورد کد بدید؟

  • Like 5
لینک به دیدگاه
ممنون میشم اگه بگید این کدها برای حل چه مسائلی از کتاب استفاده شده؟ یعنی الان کد sars برای حل چه مسئله ای هست؟ یا اگه خودتون توضیح بیش تری در مورد کد بدید؟

 

باید به خدمتتون عرض کنم که تمام اگوریتم ها برای پیاده سازی کردن یه بازی است که هدف بازی این است که با کمترین حرکت از خانه شروع به خانه پایان برسیم

 

مثلا با عکس زیر این را توضیح میدهم

نقاط آبی دیوار هستند و نقطه سبز هم مقصد است. نقطه شروع هم به صورت تصادفی است.و نقطه های قرمز هم مسیر طی شده می باشد.

یرنامه باید کمترین حرکت از نقطه شروع به هدف را بیابد.

12.jpg

  • Like 2
لینک به دیدگاه
  • 1 سال بعد...
×
×
  • اضافه کردن...