فاطمه-زهرا 164 اشتراک گذاری ارسال شده در 27 اردیبهشت، ۱۳۹۳ سلام من برای برنامه بندیت تا قسمت Greedy یک برنامه نوشتم ولی فکر می کنم صورت مسئله رو درست متوجه نشدم. می خواستم خواهش کنم ببینید الگوریتمی رو که در نظر گرفتم درست هست یا نه من 5 ماشین در نظر گرفتم که در هر task هزار بار دسته هر کدوم از ماشین ها رو می کشیم. 5000 task داریم. بعد از هر هزار بار چک می کنیم که میانگین reward کدوم task ماکزیمم هست. مثلا ماشین شماره 2 ماکزیمم میانگین reward رو داره. حالا ماشین 2 رو انتخاب کردیم و 1000 بار دسته اون رو می کشیم و این کار رو ادامه می دیم. الگوریتم قسمت epsilon-greedy رو کلا نمی دونم. 1 لینک به دیدگاه
فاطمه-زهرا 164 مالک اشتراک گذاری ارسال شده در 28 اردیبهشت، ۱۳۹۳ هیچ کس صورت دقیق این مسئله رو نمی دونه؟ 1 لینک به دیدگاه
Imaaan 17059 اشتراک گذاری ارسال شده در 28 اردیبهشت، ۱۳۹۳ سلاممن برای برنامه بندیت تا قسمت Greedy یک برنامه نوشتم ولی فکر می کنم صورت مسئله رو درست متوجه نشدم. می خواستم خواهش کنم ببینید الگوریتمی رو که در نظر گرفتم درست هست یا نه من 5 ماشین در نظر گرفتم که در هر task هزار بار دسته هر کدوم از ماشین ها رو می کشیم. 5000 task داریم. بعد از هر هزار بار چک می کنیم که میانگین reward کدوم task ماکزیمم هست. مثلا ماشین شماره 2 ماکزیمم میانگین reward رو داره. حالا ماشین 2 رو انتخاب کردیم و 1000 بار دسته اون رو می کشیم و این کار رو ادامه می دیم. الگوریتم قسمت epsilon-greedy رو کلا نمی دونم. هیچ کس صورت دقیق این مسئله رو نمی دونه؟ سلام اطلاعی توی این زمینه ندارم. حالا شما صورت مساله رو از روی منبعی که دارین قرار بدین، شاید بتونیم کمکی بهتون بکنیم. 2 لینک به دیدگاه
فاطمه-زهرا 164 مالک اشتراک گذاری ارسال شده در 28 اردیبهشت، ۱۳۹۳ متشکرم برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام 1 لینک به دیدگاه
Imaaan 17059 اشتراک گذاری ارسال شده در 28 اردیبهشت، ۱۳۹۳ متشکرم همون قسمتی که میگین متوجه نمیشین رو بذارین. 2 لینک به دیدگاه
ارسال های توصیه شده