elmiramohammadi 596 اشتراک گذاری ارسال شده در 10 شهریور، ۱۳۹۳ تمام دوستانی که درس یادگیری ماشین دارن احتمالا با الگوریتم هایی مانند اپسیلون گریدی ، سارسا یا کیو لرنینگ آشنایی دارن . اینبار قصد این رو دارم که کد های این الگوریتم ها در زبان متلب رو در اختیار دوستان قرار دهم . امیدوارم به کار دوستان بیاید. برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام 9 لینک به دیدگاه
elmiramohammadi 596 مالک اشتراک گذاری ارسال شده در 10 شهریور، ۱۳۹۳ بقیه ی کد ها هم می توانید از پیوست دانلود کنید. برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام 10 لینک به دیدگاه
elmiramohammadi 596 مالک اشتراک گذاری ارسال شده در 10 شهریور، ۱۳۹۳ سپاس از مطالب خوبتون نظر لطفته شماست امیدوارم مفید واقع شود 3 لینک به دیدگاه
elmiramohammadi 596 مالک اشتراک گذاری ارسال شده در 7 بهمن، ۱۳۹۳ برنامه هایی که پیاده سازی شده برگرفته از کتاب Reinforcement_Learning_An_Introduction می باشد که در زیر پیوست شده است. برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام 5 لینک به دیدگاه
elmiramohammadi 596 مالک اشتراک گذاری ارسال شده در 7 بهمن، ۱۳۹۳ تابع EepsilonGreedy به چه صورت کار می کند؟ در ابتدا یه توضیح خیلی مختصر درباره Greedy میدیم. همانطور که همه ی دوستان میدونن الگوریتم های Greedy به صورت حریصانه عمل می کنند. یا به قول معروف همیشه دنبال بهترین هستن. کاری که EepsilonGreedy انجام می دهد به این صورت است که یه عدد تصادفی بین صفر و یک انتخاب می کند بعد این عدد تصادفی را با اپسیلون مقایسه می کند و اگر از اپسیلون بزرگتر بود بهترین حالت(کاری که پاداش بیشتر دارد را انتخاب می کند) و اگر هم کمتر از اپسیلون بود به صورت تصادفی یک کار رو انتخاب می کند. 5 لینک به دیدگاه
aminabedi20 15 اشتراک گذاری ارسال شده در 8 بهمن، ۱۳۹۳ ممنون میشم اگه بگید این کدها برای حل چه مسائلی از کتاب استفاده شده؟ یعنی الان کد sars برای حل چه مسئله ای هست؟ یا اگه خودتون توضیح بیش تری در مورد کد بدید؟ 5 لینک به دیدگاه
elmiramohammadi 596 مالک اشتراک گذاری ارسال شده در 11 بهمن، ۱۳۹۳ ممنون میشم اگه بگید این کدها برای حل چه مسائلی از کتاب استفاده شده؟ یعنی الان کد sars برای حل چه مسئله ای هست؟ یا اگه خودتون توضیح بیش تری در مورد کد بدید؟ باید به خدمتتون عرض کنم که تمام اگوریتم ها برای پیاده سازی کردن یه بازی است که هدف بازی این است که با کمترین حرکت از خانه شروع به خانه پایان برسیم مثلا با عکس زیر این را توضیح میدهم نقاط آبی دیوار هستند و نقطه سبز هم مقصد است. نقطه شروع هم به صورت تصادفی است.و نقطه های قرمز هم مسیر طی شده می باشد. یرنامه باید کمترین حرکت از نقطه شروع به هدف را بیابد. 2 لینک به دیدگاه
hamedhasany 10 اشتراک گذاری ارسال شده در 12 بهمن، ۱۳۹۴ سپاس واقعن عالی بود آیا تمرین های کتاب رو با متلب هم انجام دادین؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟ لینک به دیدگاه
ارسال های توصیه شده