رفتن به مطلب

جنـگ و صلـح


*Mahla*

ارسال های توصیه شده

سخنراني مهم رابرت اومن هنگام دريافت جايزه نوبل اقتصاد در سال 2005

 

جنـگ و صلـح

 

 

رابرت جي اومن *

مترجم: حسن افروزي

«جنگ‌ها و ديگر نزاع‌ها از جمله سرچشمه‌هاي اصلي و عمده بدبختي انسان‌ها هستند» اين جمله آغازين اعلانيه سال 2005 بانك سوئد براي جايزه اقتصاد به ياد آلفرد نوبل است.

[TABLE=align: left]

[TR]

[TD=width: 100%] 28-01.jpg

[/TD]

[/TR]

[/TABLE]

 

بنابراين شايسته است كه اين سخنراني را به يكي از پرفشارترين و عميق‌ترين موضوعاتي كه بشر تا به حال با آن مواجه شده اختصاص دهيم: جنگ و صلح.

به نظر من شايد ما بايد براي رسيدگي به صلح در جهان جهت تلاش‌هاي خود را تغيير دهيم، تا امروز همه تلاش‌ها براي پايان دادن به نزاع‌هاي خاص بوده‌اند، مثلا: هند و پاكستان، ايرلند شمالي و جنوبي، جنگ‌هاي قاره آفريقا، جنگ‌هاي منطقه بالكان، روسيه و چچن، اسرائيل و ملت‌هاي عرب و ... به نظر من بهتر آن خواهد بود كه ما بايد توجه خود را از موارد خاص سلب كرده و به مطالعه خود جنگ به معناي عمومي آن بپردازيم.

اجازه دهيد تا مقايسه‌اي انجام دهم. دو راه براي مقابله با سرطان وجود دارد. يكي مطالعات باليني است. مثلا فردي سرطان سينه دارد. چه كار بايد بكند؟ جراحي؟ راديولوژي، شيمي درماني؟ چه نوع شيمي درماني! آيا نيازي به برداشتن غدد سرطاني هست؟ جواب اين سوال‌ها بستگي به آزمايشات باليني فرد دارد. نوع درمان هر فردي بستگي به نتيجه آزمايشات خود دارد و در نتيجه هر موردي بايد به طور خاص بررسي شود.

ولي راه ديگري نيز براي مقابله با سرطان وجود دارد. شما نه جراحي مي‌كنيد، نه راديولوژي، نه شيمي درماني و نه به آمار مراجعه مي‌كنيد، شما اصلا با مريض كاري نداريد بلكه سعي مي‌كنيد از ساز و كار سلول‌هاي سرطاني سر در بياوريد. آيا شكل از DNA است؟ چه اتفاقي در اين سلول‌ها مي‌افتد؟ شما در اين راه مقابله به دنبال «درمان» نيستيد بلكه فقط سعي مي‌كنيد «بفهميد» و نتايجتان را بر روي موش‌ها آزمايش مي‌كنيد، نه آدم‌ها. سعي مي‌كنيد كه موش‌ها را مريض كنيد نه درمان. لوئيس پاستوريك پزشك بود. براي او درمان بيماران امري مهم بود ولي رابرت كخ پزشك نبود و تلاشي براي درمان بيماران انجام نمي‌داد. او فقط سعي مي‌كرد بفهمد كه سازوكار بيماري‌هاي واگيردار چيست؟ ولي سرانجام نتايج تحقيقات وي در درمان بيماري‌ها از اهميت به سزايي برخوردار شد.

جنگ از ابتداي تمدن انسان‌ها وجود داشته، هيچ چيز به اندازه جنگ در طول تاريخ به طور ثابت حضور نداشته است. جنگ يك پديده است، نه يك سري اتفاقات مجزا از زندگي انسان‌ها.

البته مطمئنا تلاش‌هاي انجام گرفته براي حل و فصل نزاع‌هاي خاص، بسيار ارزشمند و ستودني‌اند و گاهي واقعا نتيجه مي‌دهند؛ ولي با اين حال راه ديگري نيز براي برخورد وجود دارد: مطالعه جنگ به عنوان يك پديده كلي و مطالعه مشخصات كلي و معرفي آن از لحاظ‌هاي تاريخي، اجتماعي، روان‌شناسي و –بله- عقلاني. چرا انسان عقلايي به جنگ مي‌رود؟ منظور من از «عقلانيت» اين است:

رفتار يك فرد «عقلائي» است اگر آن رفتار بر اساس اطلاعات وي در علائق وي بگنجد.

با اين تعريف، آيا جنگ مي‌تواند عقلائي باشد؟ متاسفانه جواب بله است. آبراهام لينكلن در يكي از بزرگ‌ترين و بهترين سخنراني‌هاي خود چنين گفت كه : «هر دو دسته جنگ را زشت مي‌دانستند؛ ولي يكي شروع جنگ را به حيات ترجيح داد و ديگري قبول آن را به مرگ ايشان و اين چنين جنگ آغاز شد.»

اين يك اشتباه بزرگ است كه بگوييم جنگ غيرعقلايي است. ما با غيرعقلايي خواندن پديده‌هاي ناخوشايند جهان- مانند جنگ‌ها، اعتصاب‌ها، تبعيض‌نژادي و ... – در واقع چشم را روي آنها مي‌بنديم و ناديده‌شان مي‌گيريم در حالي كه آنها لزوما غيرعقلائي نيستند و در واقع با وجود اينكه شايد اين امر ناخوشايند باشد، برخي از آنها عقلائي‌اند. اگر جنگ‌ عقلائي است، پس ما اگر بتوانيم ساختار آن را شناسايي كنيم، شايد بتوانيم مشكل را شناسايي كنيم در حالي كه اگر با تصور غيرعقلائي بودن، چشم بر آن ببنديم قطعا نخواهيم توانست كه مشكل را دريابيم. سال‌ها پيش من در جمعي از دانشجويان دانشگاه ييل حضور داشتم. جيم توبين، كه بعدها برنده جايزه نوبل شد، نيز آنجا بود. بحث آزادي در جريان بود و يكي از سوال‌هايي كه در جريان بحث مطرح شد، اين بود، آيا كسي مي‌تواند اقتصاد را در يك كلمه خلاصه كند؟» توبين پاسخ داد: «بله» گفت: «انگيزه‌ها» در واقع سر و كار اقتصاد فقط با انگيزه‌ها است.

بنابراين، آنچه كه من به دنبال آن هستم، تحليلي اقتصادي از جنگ است. البته ممكن است آن طور كه مي‌خواستم، نتوانسته باشم منظور خود را بيان كنم. من در مورد اينكه چگونه بايد يك جنگ را پشتيباني مالي كرد، يا چگونه بايد بعد از جنگ به نوسازي پرداخت يا هر چيزي شبيه اينها حرف نمي‌زنم، بلكه سخن من درباره شناسايي انگيزه‌هايي است كه به جنگ منتهي مي‌شود و اينكه چگونه مي‌توان انگيزه‌هايي ايجاد كرد كه از جنگ جلوگيري كرد.

بگذاريد مثالي بزنم. اقتصاد به ما نشان مي‌دهد كه چيزها هميشه آن طوري كه به نظر مي‌آيند، نيستند. براي مثال، فرض كنيد دولتي مي‌خواهد درآمدهاي مالياتي خود را افزايش دهد. به نظر مي‌رسد كه براي نيل به اين هدف بايد نرخ ماليات‌ها را افزايش يابد در حالي كه نه تنها اين كار درست نيست بلكه درست بر عكس چيزي است كه بايد انجام يابد. براي افزايش درآمدهاي مالياتي بايد نرخ ماليات كاهش يابد تا مردم انگيزه بيشتري براي كار كردن پيدا كنند، از ميزان فرار از ماليات‌ها كاسته شود، اقتصاد رونق بيشتري پيدا كند و ... اين فقط يك مثال بود و هزاران مورد شبيه آن وجود دارد. اقتصاد يك بازي است: انگيزه‌هاي بازيكنان تاثيرات متقابل و پيچيده‌اي بر هم مي‌گذارند و به نتايج غيرمنتظره و گاه مخالف با شهود موجود مي‌انجامند همان طور كه مي‌بينم اقتصاد واقعا اين گونه عمل مي‌كند.

حال بياييد به مساله جنگ بازگرديم و اينكه چگونه انسان عقلايي در اين تصوير مي‌گنجد. در اينجا نيز مثالي مانند مثال قبل وجود دارد. براي جلوگيري از وقوع جنگ بايد چه كرد؟ آنچه در نظر اول به وضوح بايد انجام يابد خلع سلاح و كم كردن تسهيلات نظامي است. اين طور نيست اتفاقا باز هم بايد درست بر عكس اين امر صورت گيرد. در طول سال‌هاي متمادي جنگ سرد بين ايالات متحده و شوروي، چيزي كه از وقوع جنگ واقعي بين دو كشور جلوگيري كرد هواپيماهايي بود كه هر 24ساعت روز و هر 365 روز سال را با سلاح‌هاي هسته‌اي پرواز مي‌كردند و آماده‌ حمله بودند. در آخر دوباره مي‌خواهم بر اين نكته تاكيد كنم كه بايد شروع به مطالعه محض جنگ كنيم، از تمام جوانب آن سعي كنيم بفهميم چه چيزي باعث وقوع آن مي‌شود. مطالعه‌اي محض و كاملا علمي كه شايد منتهي به صلح شود همان طور كه مي‌بينيم مطالعات جزئي و خاص تا به حال آنگونه كه بايد نتيجه نداده‌اند.

حال مايلم تا اندكي به فعاليت‌هاي خود كه توسط (Prize Committe) بررسي شده‌اند بپردازم، مخصوصا اجازه دهيد در مورد بازي‌هاي تكرار شونده (Repeated games) و ارتباط آنها با جنگ، ديگر نزاع‌ها از قبيل اعتصاب‌ها و .... و به طور كلي كليه وضعيت‌هايي كه به تقابل مي‌انجامند، صحبت كنم.

مدل بازي‌هاي تكرار شونده، تقابل‌هاي طولاني مدت را مدل مي‌كند. اين تئوري قادر است پديده‌هايي از قبيل نوع‌دوستي، همكاري، اعتماد، وفاداري، انتقام، تهديد(عليه خود يا ديگران) - پديده‌اي كه در ابتدا شايد غيرعقلاني به نظر آيد – را براساس پارادايم حداكثر كردن سود «فردي» تئوري بازي‌ها و اقتصاد نئوكلاسيك توضيح دهد.

اينكه اين تئوري مي‌تواند اين پديده‌ها را «توضيح» دهد به اين معني نيست كه مردم با فكر و انديشه و بنا به نفع شخصي خود تصميم مي‌گيرند كه انتقام بگيرند يا سخاوتمندانه رفتار كنند بلكه در طول قرن‌ها مردم هنجارهاي رفتاري را به وجود آورده‌اند كه عموما موفق و در واقع بهينه‌اند. اين چنين بهينه‌كردن رفتارها شايد بيولوژيكي يا ژنتيكي باشد و شايد Memotic، اين واژه از ريشه Meme ساخته شده كه اولين‌بار توسط ريچارد داوكين(زيست‌شناس) در مقابل واژه ژن (Gene) به كار برده شد.

وي معتقد بود همانگونه كه ژن عامل انتقال موروثي و تكامل زيستي است، Meme نيز عامل انتقال موروثي و تكامل اجتماعي است.

يكي از بزرگ‌ترين اكتشافات تئوري بازي‌ها در اوايل دهه هفتاد، هنگامي به وقوع پيوست كه زيست‌شناس‌هايي به نام‌هاي جان مينارد اسميت و جورج پرايس دريافتند كه تعادل استراتژيك در بازي‌ها و تعادل جمعيت در دنيا از قوانين مشابهي پيروي مي‌كنند، بدين ترتيب تكامل – چه از نوع ژنتيك و چه Mematic در نهايت به يك تعادل استراتژيك منتهي خواهد شد. پس آنچه مي‌خواهيم بدان برسيم اين است كه در بازي‌هاي تكرار شونده، تعادل استراتژيك منجر به پديده‌هايي همچون نوع‌دوستي، همكاري، اعتماد، وفاداري، انتقام، تهديد و ... مي‌گردد. اجازه دهيد ببينيم كه اين نتيجه‌گيري از كجا به دست مي‌آيد.

منظور من از «تعادل استراتژيك» چيست؟ به طور كلي، در يك بازي هنگامي گفته مي‌شود كه بازيكنان در تعادل استراتژيك به سر مي‌برند كه بازي‌هاشان متقابلا بهينه باشند: هنگامي كه رفتارها و طرح‌هاي هر بازيكن در محيط استراتژيك داده شده عقلاني باشد يعني هنگامي كه هركدام از آنها از رفتارهاي و طرح‌هاي ديگران آگاه است.

در سال 1994 در پانزدهمين سالگرد انتشار «تئوري بازي‌ها و رفتار اقتصادي» توسط جان‌فون نويمان و اسكار مورگنسترن، جايزه نوبل اقتصاد به دليل به قاعده درآوردن و توسعه مفهوم تعادل استراتژيك به جان‌نش اعطا شد.

اين جايزه مشتركا با نش به جان هرسيني (John Harsangi) و رينهارد زلتن تعلق گرفت كه اولي به خاطر به قاعده در آوردن و توسعه تعادل Bayesian و دومي تعادل كامل مورد تقدير قرار گرفتند. مفاهيم تعادل هماهنگ شده (Carrelated equilibrian) (اومن، 1974 و 1987) و تعادل قوي (Strony equilibrian) (اومن 1959) كه هر دو در اعطاي جايزه امسال درنظر گرفته شده‌اند و سه مفهوم بنيادي ذكر شده سنگ بناهاي تئوري بازي‌هاي غيرهمكارانه هستند.

پس از جايزه نوبل 1994، دو جايزه نوبل اقتصاد ديگر به كاربردهاي از مفاهيم بنيادي اعطا شد كه اولين آنها در 1996 به ويليام ويكري به خاطر تحقيقاتش در زمينه حراج تعلق گرفت (ويكري هر زمان بين اعلام برندگان و جشن درگذشت) ساختار حراج‌ها در ميان كاربردهاي عمده و كاربردي نظريه بازي‌ها است.

دومين جايزه امسال (2005) اعطا شد. پروفسور شلينگ به خاطر به كارگيري مفاهيم بنيادي تعادل (كه در بالا به آنها اشاره شد) به بازي‌‌هاي تكرار شونده، مورد تقدير قرار گرفته است. يك بازي تكرارشونده اينگونه است كه فرض كنيد كه شما بازي G را با همان بازيكنان هر سال بازي مي‌كنيد. يك نفر مي‌تواند اين رفتار را به عنوان يك بازي بزرگ درنظر بگيرد – كه به آن ابربازي G نيز مي‌گويند و با G نشان مي‌دهند – كه قانون آن اين است كه بازي G را هر سال بازيكن تكرار كند. ايده اين است كه مفاهيم مذكور به جاي به كارگيري بر روي بازي G، بر روي G به كار گرفته شوند و نتايج در اين حالت بررسي شوند.

نظريه بازي‌هاي تكرارشونده كه از اين فرآيند، پديدار گشته بسيار غني و عميق است. در چند دقيقه‌اي كه از زمان من باقيمانده، من به سختي خواهم توانست تا عمق آن را بشكافم، ولي اجازه دهيد كه سعي خود را بكنم. من به طور خلاصه فقط از يك جنبه به موضوع خواهم پرداخت: همكاري، به طور كلي نتيجه اين است: «تكرار، همكاري، را ممكن مي‌سازد». اجازه دهيد اين نتيجه را قدري روشن‌تر كنيم. ما هنگامي نتيجه يك بازي را «همكارانه» مي‌ناميم كه هيچ بازيكني نتواند تخمين‌كننده نتيجه بهتري براي خود شود. توجه به اين نكته مهم است كه در كل، يك نتيجه «همكارانه» ناشي از تعادل نيست، بلكه نتيجه يك توافق است. براي مثال، در بازي مشهور «معماي زنداني» (در اين بازي دو فرد مورد بازجويي قرار مي‌گيرند و از هر دو خواسته مي‌شود كه در مورد فرد ديگر اعتراف كنند، شرايط اينگونه است كه اگر يكي برعليه ديگري اعتراف كند، خود آزاد شده و ديگري به 20سال زندان محكوم مي‌شود، اگر هر دو برعليه هم اعتراف كنند، خود آزاد شده و ديگري به 20سال زندان محكوم مي‌شود، اگر هر دو بر عليه هم اعتراف كنند، هر دو به 5 سال زندان و اگر هيچ يك اعترافي نكنند هر دو به يك سال زندان محكوم مي‌شوند.م)

شرايطي كه هيچ يك از زنداني‌ها اعتراف نكنند يك نتيجه همكارانه است و با اينكه بهترين انتخاب هيچ يك از زنداني‌ها نيست ولي براي هر دو آنها بهتر از تعادل يكتاي بازي است (طبق نظريه‌ بازي‌ها مي‌توان اثبات كرد كه اين بازي تنها در يك حالت به تعادل مي‌رسد و آن شرايطي است كه هر دو زنداني‌ها برعليه ديگري اعتراف كنند.م)

مثال ساده‌تري نيز مي‌توان زد: در بازي H روناوكالين بازي مي‌كنند. رونا بايد تصميم بگيرد كه هردوشان به يك اندازه پول بگيرند (مثلا 1000تومان) يا خودش 10برابر بيشتر و به ديگري 10برابر كمتر. در همان زمان كالين نيز بايد تصميم بگيرد كه آيا بايد يك عمل مستحق مجازات را انجام دهد يا نه كه در صورت انجام هردوشان تنبيه شده و تقسيم پول منتفي خواهد شد و هيچ‌كدام از بازيكنان هيچ چيزي به دست نخواهند آورد. جدول بازي به شكل زير است:

28-04.jpg

نتيجه (ع‌و‌پ) يعني دريافت هركدام 1000تومان يك نتيجه همكارانه است.

در حالي كه هيچ بازيكني نمي‌تواند تعيين‌كننده مقدار بيشتري براي خود باشد، ولي مانند «معماي زنداني» اين نتيجه در حالت تعادل به دست نمي‌آيد.

چرا نتايج همكارانه با اينكه در حالت تعادل به دست نمي‌آيند باز هم جالب توجهند؟ پاسخ اين است كه اين نتايج در زمينه‌هايي كه در آنها قراردادها لازم الاجرا هستند با قرارداد – توافق – قابل دستيابي‌اند. چنين زمينه‌هايي بسيار‌اند؛ براي مثال يك زمينه ملي با يك دستگاه قضايي اگر قراردادها لازم‌الاجرا باشند، روناوكالين مي‌توانند به نتيجه (ع‌و‌پ) دست پيدا كنند و اگر نه (ع‌و‌پ) چندان قابل دستيابي نخواهد بود.

نظريه بازي‌هاي همكارانه كه ريشه در چنين ملاحظاتي دارد يك دهه قبل از مطالعات نش به وجود آمده است (فون نويمان و مورگن اشترن) اين نظريه كه به نظر من بسيار قوي و پربار است، باعث پربار شدن ايده‌هاي اصلي نظريه بازي‌ها شده است. چيزي كه من اينجا به دنبال آن هستم، رابط بين نظريه ‌بازي‌هاي همكارانه و بازي‌هاي تكرار شونده است. ايده‌ اصلي اين است كه تكرار مانند يك مكانيسم اجبار عمل مي‌كند كه باعث اهميت يافتن و روشن‌تر شدن نتايج همكارانه در حالت تعادل مي‌گردد- وقتي كه همه به گونه‌اي عمل مي‌كنند كه بيشترين نفع را برايشان دارد.

اين امر از لحاظ شهودي به سادگي قابل فهم است. مردم يك رابطه‌ طولاني مدت همكاري با هم دارند. آنها مي‌دانند كه فردايي هم وجود دارد و هر رفتار بي‌جايي مجازاتي در پي خواهد داشت. مثلا فردي كه به مشتريان خود كلك مي‌زند، درست است كه در كوتاه مدت سود مي‌برد ولي قطعا نخواهد توانست به مدت طولاني در بازار به فعاليت خود ادامه دهد.

حال اجازه دهيد اين مطالب را در قالب بازي H بيشتر توضيح دهم و روشن‌تر كنم. اگر بازي فقط يكبار انجام پذيرد، در اين صورت بهترين كار براي رونا اين خواهد بود كه دست به بازي حريصانه بزند و بهترين گزينه براي كالين اين خواهد بود كه به اين بازي تن دهد و دست به مجازات نزند. البته كالين خيلي از شرايط راضي نخواهد بود زيرا مبلغ خيلي كمتري از رونا به دست مي‌آورد ولي چاره ديگري نيز نخواهد داشت. به اين ترتيب تنها حالت تعادل اين بازي حالت (ح و پ) خواهد بود.

ولي در اين بازي H ، كاري هست كه كالين بتواند انجام دهد. او مي‌تواند رونا را تهديد كند كه اگر حريصانه بازي كرد، دست به مجازات خواهد زد، بنابراين به نفع رونا نخواهد بود كه حريصانه بازي كند.

استراتژي رونا اين است كه: «هميشه (ع) را بازي كن» و استراتژي كالين: «تا موقعي كه رونا (ع) را بازي كرد (پ) را بازي كن و اگر (ح) را بازي كرد (ت) را بازي كن».

اگر بخواهيم روشن‌تر سخن بگويم. چيزي كه باعث ايجاد اين تعادل مي‌شود، تهديد به مجازات است.

28-02.jpg

البته فرضي وجود دارد كه صحت مطلب بالا بسته به آن است و آن بالا نبودن نرخ ترجيح زماني بازيكنان است.

منظور من تنها نرخ ترجيح زماني مالي كه در بانك‌ها ارائه مي‌شود نيست. منظور من نرخ ترجيح زماني فردي و دروني است. براي اينكه تكرار بتواند باعث ايجاد همكاري در بين بازيكنان شود، لازم است كه آنها زياد خواهان نتايج آني نباشند، بدين معني كه اهميت زيادي براي زمان حال قائل نباشند. اگر شما همين حالا خواهان صلح هستيد احتمالا هيچ‌گاه به صلح نخواهيد رسيد. ولي اگر زمان داشته باشيد- اگر بتوانيد صبر كنيد- هر چيز تغيير خواهد كرد؛ در اين شرايط است كه خواهيد توانست به صلح دست يابيد. اين يكي از ويژگي‌هاي متناقض‌نما و وارونه تئوري بازي‌ها و در واقع علم است. همين يك يا دو هفته‌ پيش بود كه فهميدم گرم شدن زمين مي‌تواند با تغيير جهت جريان آب گرم گلف استريم (جريان آب گرم در اقيانوس اطلس كه از طرف مكزيك به سمت اروپا جريان دارد) باعث خنك‌تر شدن آب و هواي قاره اروپا شود.

يعني گرم شدن باعث خنك شدن شود. خواستار صلح آني بودن نيز ممكن است باعث شود كه نه حالا و نه در آينده به صلح نرسيم ولي اگر صبر داشته باشيم ممكن است حتي همين حالا به صلح برسيم.

دليل اين موضوع همان چيزي است كه در بالا گفته شد: در استراتژي‌هايي كه در حالت تعادل ابر بازي‌ها منجر به همكاري مي‌شوند مجازات‌هايي گنجانده شده‌اند، به اين ترتيب كه اگر در هر مرحله‌اي همكاري در شرف اتفاق افتادن نباشد، در مراحل بعد از آن اين مجازات‌ها اتفاق مي‌افتند. اگر نرخ ترجيح زماني بسيار بالا باشد، در اين صورت بازيكنان بيشتر به زمان حال علاقه‌مند خواهند بود تا آينده بدين ترتيب بازيكنان به جاي صبر كردن و منتظر نتيجه همكارانه ماندن گزينه‌اي را انتخاب خواهند كرد كه در زمان حال براي آنها بيشترين نفع را دارد. اين مساله باعث تباه شدن راهكار «مجازات در مراحل بعدي» مي‌شود.

به طور خلاصه: در ابر بازي H ، نتيجه همكارانه‌ (پ و ع) در حالت تعادل قابل دستيابي است. اين يك حالت خاص قاعده‌اي كلي به نام «تئوري فولك» است كه مي‌گويد هر نتيجه همكارانه بازي G يك نتيجه استراتژيك و تعادلي ابربازيG است (حتي اگر اين نتيجه يك نتيجه تعادل G نباشد) و برعكس؛ هر نتيجه استراتژيك و تعادلي بازي G يك نتيجه همكارانه براي G است.

به عبارت ديگر، تكرار به عنوان يك مكانيسم اجباري عمل مي‌كند، يعني در يك بازي كه شكاري در يك مرحله به دست نمي‌آيد، تكرار باعث دستيابي به نتيجه همكارانه مي‌شود. البته عامل ذكر شده در فوق را نيز نبايد ناديده گرفت، اين استدلال زماني صحيح خواهد بود كه نرخ ترجيح زماني همه بازيكنان كم باشد.

نكته ديگري كه بايد به آن اشاره كرد دوباره به جايزه نوبل سال 1994 مربوط مي‌شود: جان‌ نش به اين خاطر برنده جايزه نوبل شد كه بحث تعادل را توسعه داد و رينهارد سلتن نيز به خاطر دستاوردهايش در زمينه تعادل كامل برنده اين جايزه شد. تعادل كامل تقريبا به اين معني است كه «تهديد به مجازات» معتبر است به اين معني كه اگر شما مجبور به انجام مجازاتي شويد، بعد از انجام مجازات هنوز در حالت تعادل هستيد و انگيزه‌اي براي منحرف شدن نداريد.

28-03.jpg

آنچه در بالا ذكر شد، مسلما در مورد تعادلي كه در ابربازي H توضيح داديم صادق نيست. اگر رونا بازي (2) را به‌رغم تهديد كالين بازي كند، در اين صورت كالين هيچ گاه ترجيح نخواهد داد كه براي هميشه دست به مجازات بزند. اين مساله باعث مطرح‌شدن اين سوال مي‌شود كه آيا امكان دارد در بازي‌هاي تكرار‌شونده، (ع و پ) علاوه‌بر تعادل استراتژيك در تعادل كامل نيز دست‌يافتني باشد.

جواب آري است. در سال 1976، ليود شيپلي – كه به نظر بهترين تئوريسين نظريه‌بازي‌ها است – و من قضيه‌اي را كه به نام «قضيه كامل فولك» شناخته مي‌شود را اثبات كرديم. هم‌زمان با اين كار نتيجه مشابهي نيز مستقلا توسط آريل رابين اشتاين ارائه شد.

هر دو نتيجه تقريبا به طور هم‌زمان منتشر شدند (اومن و شيپلي 1994 – رابين اشتاين 1994). قضيه كامل فولك عبارت است از اينكه در ابربازي G هر نتيجه همكارانه G به عنوان يك نتيجه تعادل كامل ابربازي G قابل‌دستيابي است. (حتي اگر اين نتيجه يك نتيجه تعادلي بازي G نباشد.) عكس قضيه نيز برقرار است. به طور خلاصه، براي هر بازي G داريم:

قضيه كامل فولك: نتايج همكارانه بازي G منطبق با نتايج تعادل كامل ابربازي G هستند.

تكرار دوباره به عنوان يك مكانيسم اجبار عمل مي‌كند. يعني همكاري را كه در يك بازي يك مرحله‌اي قابل‌دستيابي نيست، دست‌يافتني مي‌كند، حتي وقتي كه تعادل استراتژيك جايش را به تعادل كامل كه بسيار دقيق‌تر از آن است مي‌دهد. در اين جا نيز دوباره بايد به فرض كم بودن نرخ‌هاي ترجيح زماني توجه داشته باشيم.

اثبات قضيه كامل فولك، اثبات جالبي است. به همين دليل من قصد دارم تا آن را به گونه‌اي ساده در قالب بازي H و نتيجه همكارانه (ع و پ) توضيح دهم. در وهله اول، تعادل بازي را هميشه به سمت نتيجه (ع و پ) هدايت مي‌كند. در صورتي كه رونا حريصانه بازي كند، كالين براي تنبيه او (ت) را بازي خواهد كرد. البته او اين بازي را براي هميشه انجام نخواهد داد، بلكه تنها تا زماني كه انحراف رونا براي بازي حريصانه بي‌ثمر شود. البته اين خود به تنهايي كافي نيست؛ بلكه علاوه‌بر اين انگيزه ديگري نيز بايد باشد تا كالين دست به بازي تنبيه كننده بزند. در واقع ايده اصلي اثبات نيز از همين موضوع به دست مي‌آيد: اگر كالين رونا را تنبيه نكند، آن گاه رونا با بازي حريصانه كالين را تنبيه خواهد كرد (يعني رونا كالين را به خاطر اينكه او را تنبيه نكرده تنبيه خواهد كرد.) اين پروسه به همين ترتيب ادامه مي‌يابد، ‌يعني اگر هر كدام از بازيكنان ديگري را تنبيه نكند، به خاطر اين كار توسط بازيكن ديگر تنبيه خواهد شد.

قسمت اعظمي از جامعه با اين چنين استدلالي از فروپاشي مصون مي‌ماند. اگر شما توسط يك افسر پليس براي سرعت غيرمجاز متوقف شويد،‌ از رشوه‌ دادن ابا مي‌كنيد زيرا از اين مي‌ترسيد كه وي شما را به اين كار متهم كند. اما او چرا نبايد پيشنهاد رشوه را قبول نكند؟ زيرا از اين مي‌ترسد كه شما از او به اين اتهام شكايت كنيد.

به اين ترتيب نظريه بازي‌هاي همكارانه نه تنها تمام نتايج همكارانه يك بازي را معين مي‌سازد، بلكه اطلاعات لازم براي انتخاب ميان آنها را نيز در اختيار ما قرار مي‌دهد. راه‌هاي بسياري براي اين كار وجود دارد، اما شايد شناخته‌ترين آنها نظريه «هسته» (Core) باشد كه توسط لويد شيپلي در اوايل دهه 50 ارائه شده است. گوييم نتيجه X از يك بازي در هسته آن قرار دارد، اگر هيچ مجموعه S از بازيكن‌ها وجود نداشته باشد كه بتوانند بهتر از آن عمل كنند. شايان ذكر است كه مفهوم هسته نقشي اساسي در كاربردهاي نظريه‌ بازي‌ها در اقتصاد بر عهده دارد.

ارتباط قوي ديگري كه بين بازي‌هاي تكرارشونده و تعادل وجود دارد اين است كه وقتي در يك بازي بازيكنان در تعادل (استراتژيك) هستند، براي هيچ كدام از آنها به صرفه نيست كه استراتژي بازي خود را تغيير دهند. يك تعادل قوي نيز به شكل مشابهي تعريف مي‌شود،‌ با اين تفاوت كه در اين نوع تعادل نه تنها براي هيچ يك از بازيكنان بلكه براي هيچ مجموعه‌اي از آنها نيز به‌صرفه نيست كه بازي خود را تغيير دهند. بنابراين قضيه زير را داريم:

قضيه (اومن - 1959): نتايجي كه در هسته بازي G قرار دارند مطابق با نتايج تعادل قوي ابربازي G هستند.

جان نش در مقاله سال 1950 خود علاوه‌بر تشريح تعادل استراتژيك (كه به خاطر آن برنده جايزه نوبل شد) به بررسي موضوع ديگري نيز پرداخت كه با نام برنامه‌اش (Nash program) شناخته مي‌شود. وي در اين موضوع به بررسي قضاياي نظريه‌بازي‌هاي همكارانه در قالب برخي بازي‌هاي غيرهمكارانه خاص پرداخت و به اين ترتيب پلي‌ بين نظريه بازي‌هاي همكارانه و غيرهمكارانه ايجاد كرد. سه قضيه‌اي كه در بالا معرفي شدند نشان مي‌دهند كه تكرار نيز عينا چنين پلي را ايجاد مي‌كند (در واقع تكرار، تحقق برنامه‌اش است.)

*اومن برنده جايزه نوبل سال 2005 اقتصاد است. اين سخنراني، سخنراني وي به مناسبت دريافت اين جايزه است.

 

دنیای اقتصاد

لینک به دیدگاه
×
×
  • اضافه کردن...