رفتن به مطلب

سوال در مورد صورت مسئله bandit


فاطمه-زهرا

ارسال های توصیه شده

سلام

من برای برنامه بندیت تا قسمت Greedy یک برنامه نوشتم ولی فکر می کنم صورت مسئله رو درست متوجه نشدم. می خواستم خواهش کنم ببینید الگوریتمی رو که در نظر گرفتم درست هست یا نه

من 5 ماشین در نظر گرفتم که در هر task هزار بار دسته هر کدوم از ماشین ها رو می کشیم. 5000 task داریم. بعد از هر هزار بار چک می کنیم که میانگین reward کدوم task ماکزیمم هست.

مثلا ماشین شماره 2 ماکزیمم میانگین reward رو داره. حالا ماشین 2 رو انتخاب کردیم و 1000 بار دسته اون رو می کشیم و این کار رو ادامه می دیم.

 

الگوریتم قسمت epsilon-greedy رو کلا نمی دونم.

لینک به دیدگاه
سلام

من برای برنامه بندیت تا قسمت Greedy یک برنامه نوشتم ولی فکر می کنم صورت مسئله رو درست متوجه نشدم. می خواستم خواهش کنم ببینید الگوریتمی رو که در نظر گرفتم درست هست یا نه

من 5 ماشین در نظر گرفتم که در هر task هزار بار دسته هر کدوم از ماشین ها رو می کشیم. 5000 task داریم. بعد از هر هزار بار چک می کنیم که میانگین reward کدوم task ماکزیمم هست.

مثلا ماشین شماره 2 ماکزیمم میانگین reward رو داره. حالا ماشین 2 رو انتخاب کردیم و 1000 بار دسته اون رو می کشیم و این کار رو ادامه می دیم.

 

الگوریتم قسمت epsilon-greedy رو کلا نمی دونم.

 

هیچ کس صورت دقیق این مسئله رو نمی دونه؟

 

 

سلام

اطلاعی توی این زمینه ندارم.

 

حالا شما صورت مساله رو از روی منبعی که دارین قرار بدین، شاید بتونیم کمکی بهتون بکنیم.

لینک به دیدگاه

متشکرم

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

لینک به دیدگاه

به گفتگو بپیوندید

هم اکنون می توانید مطلب خود را ارسال نمایید و بعداً ثبت نام کنید. اگر حساب کاربری دارید، برای ارسال با حساب کاربری خود اکنون وارد شوید .

مهمان
ارسال پاسخ به این موضوع ...

×   شما در حال چسباندن محتوایی با قالب بندی هستید.   حذف قالب بندی

  تنها استفاده از 75 اموجی مجاز می باشد.

×   لینک شما به صورت اتوماتیک جای گذاری شد.   نمایش به صورت لینک

×   محتوای قبلی شما بازگردانی شد.   پاک کردن محتوای ویرایشگر

×   شما مستقیما نمی توانید تصویر خود را قرار دهید. یا آن را اینجا بارگذاری کنید یا از یک URL قرار دهید.

×
×
  • اضافه کردن...