فاطمه-زهرا 164 ارسال شده در 17 مرداد، 2014 سلام من برای برنامه بندیت تا قسمت Greedy یک برنامه نوشتم ولی فکر می کنم صورت مسئله رو درست متوجه نشدم. می خواستم خواهش کنم ببینید الگوریتمی رو که در نظر گرفتم درست هست یا نه من 5 ماشین در نظر گرفتم که در هر task هزار بار دسته هر کدوم از ماشین ها رو می کشیم. 5000 task داریم. بعد از هر هزار بار چک می کنیم که میانگین reward کدوم task ماکزیمم هست. مثلا ماشین شماره 2 ماکزیمم میانگین reward رو داره. حالا ماشین 2 رو انتخاب کردیم و 1000 بار دسته اون رو می کشیم و این کار رو ادامه می دیم. الگوریتم قسمت epsilon-greedy رو کلا نمی دونم. 1
Imaaan 17059 ارسال شده در 18 مرداد، 2014 سلاممن برای برنامه بندیت تا قسمت Greedy یک برنامه نوشتم ولی فکر می کنم صورت مسئله رو درست متوجه نشدم. می خواستم خواهش کنم ببینید الگوریتمی رو که در نظر گرفتم درست هست یا نه من 5 ماشین در نظر گرفتم که در هر task هزار بار دسته هر کدوم از ماشین ها رو می کشیم. 5000 task داریم. بعد از هر هزار بار چک می کنیم که میانگین reward کدوم task ماکزیمم هست. مثلا ماشین شماره 2 ماکزیمم میانگین reward رو داره. حالا ماشین 2 رو انتخاب کردیم و 1000 بار دسته اون رو می کشیم و این کار رو ادامه می دیم. الگوریتم قسمت epsilon-greedy رو کلا نمی دونم. هیچ کس صورت دقیق این مسئله رو نمی دونه؟ سلام اطلاعی توی این زمینه ندارم. حالا شما صورت مساله رو از روی منبعی که دارین قرار بدین، شاید بتونیم کمکی بهتون بکنیم. 2
فاطمه-زهرا 164 مالک ارسال شده در 18 مرداد، 2014 متشکرم برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید. ورود یا ثبت نام 1
ارسال های توصیه شده