رفتن به مطلب

معادله بلمن


ارسال های توصیه شده

معادله بلمن که به نام یابنده آن ریچارد بلمن نام گذاری شد، یک شرط ضروری در روشهای ریاضی بهینه سازی‌است که با نام برنامه نویسی پویا نیز شناخته می‌شود. تقریبا هر مسئله را که بتوان با استفاده از نظریه کنترل بهینه حل کرد نیز می‌توان با تحلیل مناسب معادله بلمن حل کرد.معادله بلمن در ابتدا در مهندسی نظریه کنترل و دیگر مباحث در ریاضیات کاربردی اعمال و متعاقبا به یک ابزار قدرتمند در نظریه اقتصاد مبدل شد.

 

 

مثال

 

در فراگیری پاداش/جزا، یک معادله بلمن به یک بازگشت برای مقادیر مورد انتظار اشاره می‌کند.برای مثال، مقدار مورد انتظار برای بودن در یک وضعیت خاض s و دنبال کردن تعدادی روش ثابت π معادله بلمنی به صورت زیر دارد:

 

e1b31fa1ac2d1e70be699929d07dbf3b.png

 

این معادله مقدار مورد انتظار برای انجام کاری که توسط چند روش تعیین شده بود را توصیف می‌کند.

 

معادله مربوط به روش بهینه سازی به عنوان معادله بهینگی بلمن بیان می‌شود:

 

00609669bfd8850092a22922ffb87e58.png

 

این معادله پاداش برای انجام کاری که بالاترین انتظار را برآورده می‌کند، توصیف می‌کند.

 

 

روش‌های حل

 

* روش ضرایب نامعین، یا همان روش 'حدس و بررسی'، می‌تواند در حل بعضی معادلات بلمن مستقل کران-بینهایت استفاده شود.

 

* معادله بلمن را می‌توان به کمک استقرای وارونه، در بعضی موارد به صورت تحلیلی و یا به صورت عددی با کامپیوتر حل کرد.استقرای وارونه عددی قابل استفاده در بسیاری از مسائل است، ولی هنگامی که تعداد متغیرهای حالت زیاد شود با توجه به مشکل بعد پذیری حل مسئله غیر ممکن می‌شود.

 

با محاسبه شرایط مرتبه اول که به معادله بلمن مرتبط است، و سپس استفاده از قضیه پوش برای از بین بردن مشتقات تابع مقدار، به دست آوردن قاعده معادله تفاضلی یا معادله دیفرانسیل که 'معادله اویلر' نام دارد، ممکن می‌شود. روش‌های استاندارد برای حل معادلات تفاضلی یا دیفرانسیل می‌توانند برای محاسبه تغییرات متغیرهای حالت و متغیرهای کنترلی مسئله بهینه سازی استفاده شوند.

 

 

کاربرد در اقتصاد

 

اولین کاربرد اقتصادی معادله بلمن، مقاله سال ۱۹۷۳ اصلی مرتون در مدل قیمت گذاری دارایی حیاتی میان گذرا است.جواب مدل نظری مرتون، که در آن سرمایه گذاران از میان درآمد امروز و درآمد آینده یا عواید دارایی انتخاب می‌کنند، یک صورت از معادله بلمن است. به این دلیل که کاربردهای اقتصادی برنامه نویسی پویا معمولا به یک معادله بلمن می‌رسد که یک معادله تفاضلی است، اقتصاد دانان از برنامه نویسی پویا به عنوان یک «روش بازگشتی» یاد می‌کنند.

 

استوکی، لوکاس و پریسکات برنامه نویسی پویای تصادفی و غیر تصادفی را با جزییات دقیق، با زدن مثال‌های فراوان از چگونگی استفاده از برنامه نویسی پویا در نظریه اقتصاد، توصیف می‌کنند.

این کتاب به این موضوع می‌انجامد که برنامه نویسی پویا برای حل دامنهٔ وسیعی از مسائل نظری در اقتصاد به کار گرفته شود که این مسائل شامل رشد اقتصادی بهینه، استخراج منابع، مسائل عامل اصلی، سرمایه گذاری عمومی، تجارتسرمایه گذاری، قیمت گذاری دارایی، تدارک ضریب تولید، وسازمان دهی صنعتی می‌شوند.

 

استفاده از برنامه نویسی پویا برای حل مسائل ملموس بوسیله مشکلات اطلاعاتی، مثل انتخاب نرخ نزول غیر قابل مشاهده، پیچیده می‌شود.همچنین مسائل محاسباتی وجود دارند، یکی مسائل اصلی آن مشکل بعد پذیری است که از تعداد زیادی از پتانسیل‌های متغیرهای حالت ناشی شده‌است که قبل از آنکه استراتژی بهینه انتخاب شود، باید مورد توجه قرار گیرد.

  • Like 1
لینک به دیدگاه
×
×
  • اضافه کردن...