رفتن به مطلب

سوال در مورد صورت مسئله bandit


فاطمه-زهرا

ارسال های توصیه شده

سلام

من برای برنامه بندیت تا قسمت Greedy یک برنامه نوشتم ولی فکر می کنم صورت مسئله رو درست متوجه نشدم. می خواستم خواهش کنم ببینید الگوریتمی رو که در نظر گرفتم درست هست یا نه

من 5 ماشین در نظر گرفتم که در هر task هزار بار دسته هر کدوم از ماشین ها رو می کشیم. 5000 task داریم. بعد از هر هزار بار چک می کنیم که میانگین reward کدوم task ماکزیمم هست.

مثلا ماشین شماره 2 ماکزیمم میانگین reward رو داره. حالا ماشین 2 رو انتخاب کردیم و 1000 بار دسته اون رو می کشیم و این کار رو ادامه می دیم.

 

الگوریتم قسمت epsilon-greedy رو کلا نمی دونم.

  • Like 1
لینک به دیدگاه
سلام

من برای برنامه بندیت تا قسمت Greedy یک برنامه نوشتم ولی فکر می کنم صورت مسئله رو درست متوجه نشدم. می خواستم خواهش کنم ببینید الگوریتمی رو که در نظر گرفتم درست هست یا نه

من 5 ماشین در نظر گرفتم که در هر task هزار بار دسته هر کدوم از ماشین ها رو می کشیم. 5000 task داریم. بعد از هر هزار بار چک می کنیم که میانگین reward کدوم task ماکزیمم هست.

مثلا ماشین شماره 2 ماکزیمم میانگین reward رو داره. حالا ماشین 2 رو انتخاب کردیم و 1000 بار دسته اون رو می کشیم و این کار رو ادامه می دیم.

 

الگوریتم قسمت epsilon-greedy رو کلا نمی دونم.

 

هیچ کس صورت دقیق این مسئله رو نمی دونه؟

 

 

سلام

اطلاعی توی این زمینه ندارم.

 

حالا شما صورت مساله رو از روی منبعی که دارین قرار بدین، شاید بتونیم کمکی بهتون بکنیم.

  • Like 2
لینک به دیدگاه

متشکرم

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

  • Like 1
لینک به دیدگاه
×
×
  • اضافه کردن...