نظریه بازی ها علم استراتژی است. این نظریه تلاش می کند تا اعمالی که «بازیکن ها» در گستره ای از «بازی ها» باید انجام دهند تا بهترین پیامد به بار آید را به شکل ریاضی و منطقی تعیین کند.

بازی هایی که این نظریه مورد مطالعه قرار می دهد از شطرنج تا تربیت کودک و از تنیس تا اشتغال کشورها را در برمی گیرد. تمام این بازی ها یک ویژگی مشترک دارند و آن نوعی وابستگی درونی است به این معنا که نتیجه بازی برای هریک از شرکت کننده ها به انتخاب ها (استراتژی های) همه افراد بستگی دارد. در بازی های موسوم به بازی با حاصل جمع صفر، منافع بازیکن ها به طور کامل با یکدیگر تعارض پیدا می کند، به گونه ای که بهره ای که یک فرد کسب می کند، همواره معادل ضرر فرد دیگر است. شایان ذکر است که بازی هایی که در آنها همه بازیکنان ممکن است به منفعت دست یابند (یعنی بازی های با حاصل جمع مثبت) یا ضرر کنند (یعنی بازی های با حاصل جمع منفی) معمول ترند. در این بازی ها درجات مختلفی از تعارض وجود دارد.

جان فون نیومن استاد ریاضیات دانشگاه پرنیستون در نظریه بازی ها (game theory) پیشگام بود. تمرکز این نظریه در سال های اول شکل گیری آن بر بازی های دارای تعارض خالص (بازی های با حاصل جمع صفر) بود. سایر بازی ها همکارانه در نظر گرفته می شدند، به این معنا که شرکت کنندگان اعمال خود را به اتفاق یکدیگر انتخاب کرده و انجام می دهند. اما در تحقیقات اخیر بر بازی هایی تمرکز گردیده که نه دارای حاصل جمع صفر هستند و نه به طور خالص همکارانه هستند. در این بازی ها بازیکنان اقدامات خود را به صورت جداگانه انتخاب می کنند، اما روابط آنها با یکدیگر حاوی رقابت و همکاری است.

بازی ها اساسا با تصمیمات اتخاذ شده در یک محیط خنثی متفاوت هستند. برای آنکه این نکته روشن گردد، تفاوت میان تصمیمات یک چوب بر و تصمیمات یک ژنرال را در نظر آورید. زمانی که یک چوب بر تصمیمی را درباره چگونگی برش چوب اتخاذ می کند، از چوب انتظار ندارد که با او مقابله کند، به عبارت دیگر محیطی که وی در آن به فعالیت می پردازد خنثی است. اما زمانی که یک ژنرال نظامی تصمیم می گیرد که ارتش دشمن را از پا در آورد، باید مقاومت دشمن را هم پیش بینی کرده و طوری تصمیم بگیرد که بتواند بر این مقاومت ها غلبه کند. کسی که در یک بازی شرکت می کند باید همانند این ژنرال ارتباط متقابل خود و دیگر بازیکنان هوشمند و هدفمند را در نظر بگیرد.

بازیکنان باید در تصمیمی که اتخاذ می کنند هم تعارض و هم احتمال همکاری را در نظر داشته باشند. اصل و جوهر هر بازی، وابستگی درونی میان استراتژی های بازیکن ها است. دو نوع مختلف از ارتباط و وابستگی درونی وجود دارد: وابستگی پیاپی (sequential) و وابستگی همزمان (simultaneous). در نوع پیاپی بازیکن ها به ترتیب عمل کرده و هریک، از اقدامات قبلی دیگران آگاهند. در نوع همزمان بازیکنان در یک زمان عمل می کنند و هریک از اقدامات دیگری ناآگاه است. یک اصل عمومی برای بازیکنان شرکت کننده در بازی با حرکت های پیاپی، نگاه به جلو و استدلال عقب گرد است. هر بازیکن باید در نظر بگیرد که دیگران چگونه به حرکت فعلی او واکنش نشان خواهند داد و در مقابل، خودش دست به چه انتخابی خواهد زد. هر بازیکن پیش بینی می کند که تصمیمات اولیه او نهایتا به کجا خواهند انجامید و از این اطلاعات برای محاسبه بهترین تصمیمی که باید اتخاذ کند استفاده می کند. وی زمانی که راجع به چگونگی واکنش دیگران فکر می کند، باید خود را به جای آنها قرار داده و همانند آنها فکر کند. او نباید استدلال خود را به آنها تحمیل کند.

در اصل هر بازی پیاپی که پس از یک سلسله حرکات متناهی به پایان برسد را می توان کاملا «حل کرد». در این بازی ها بهترین استراتژی هر بازیکن با بررسی تمامی نتایج ممکن تعیین می شود. بازی های ساده از قبیل دوز را می توان به این شیوه حل کرد، بنابراین این گونه بازی ها چندان چالشی نیستند. اما انجام این محاسبات برای بسیاری از بازی های دیگر مثل شطرنج بسیار پیچیده است (حتی با کامپیوتر). از این رو بازیکنان برای چند حرکت محدود برنامه ریزی می کنند و سعی می کنند که موقعیت های حاصل را براساس تجربه ارزیابی کنند.

برخلاف بازی های پیاپی که در آنها زنجیره استدلال خطی است، بازی های همراه با حرکات همزمان یک دور منطقی در خود دارند. اگرچه بازیکن ها به صورت همزمان و بدون اطلاع از حرکات فعلی یکدیگر عمل می کنند، اما همه آنها باید از این نکته آگاه باشند که بازیکنان دیگر عاقلند. طبق این تفکر هر فرد «فکر می کند که بازیکن دیگر فکر می کند که او فکر می کند...» بنابراین هر بازیکن باید خود را به صورت مجازی به جای تمامی افراد دیگر قرار دهد و سعی کند پیامد هر حرکت را محاسبه نماید. بهترین اقدام برای او با توجه به اینگونه محاسبه های کلی به دست می آید.

این دور منطقی با استفاده از مفهوم تعادل که توسط جان نش، ریاضیدان دانشگاه پرینستون شکل داده شد به نتیجه می رسد (به عبارت دیگر استدلال دوری(circular reasoning) به نتیجه می رسد). ما به دنبال یک مجموعه تصمیم (برای همه بازیکنان) هستیم که در آن، استراتژی فرد برای او بهترین گزینه باشد و بازیکنان دیگر نیز بهترین استراتژی خود را انتخاب کنند. به عبارت دیگر هر بازیکن بهترین واکنش به آنچه دیگران انجام می دهند را انتخاب می کند.برخی اوقات بهترین گزینه برای یک فرد، فارغ از آنکه دیگران چه اقدامی صورت دهند یکسان است.

این حالت را «استراتژی غالب» برای آن بازیکن می نامند. در مواقع دیگر بازیکن با گزینه ای روبه رو است که همواره نامناسب است، به این معنا که فارغ از آنکه دیگران چه انتخابی کنند، گزینه ای وجود دارد که از این گزینه بهتر باشد (به این گزینه «استراتژی مغلوب» گفته می شود). جست وجو برای یافتن تعادل را باید با بررسی استراتژی های غالب و حذف استراتژی های مغلوب آغاز کرد. اینکه هر بازیکن بهترین گزینه خود را انتخاب می کند به این معنی نیست که تعادل الزاما جایی برقرار می شود که از لحاظ اجتماعی بهینه است. در واقع نمونه های معروفی مثل معمای زندانی (که در ادامه به آن می پردازیم) وجود دارند که در آنها هر بازیکن منافع خود را پیگیری می کند، ولی در نهایت نتیجه ای که به بار می آید نتیجه خوبی نیست. تعریف نش از تعادل راه حلی ناقص برای مساله استدلال دوری در بازی های دارای حرکات همزمان است. در برخی از بازی ها چند تعادل نش به دست می آید؛ در حالی که در بعضی از بازی ها اصلا تعادل نش نداریم. همچنین فرآیند دینامیکی که می تواند به تعادل منجر شود همچنان نامشخص است. اما این مفهوم با وجود این نقایص در تحلیل بسیاری از تعاملات استراتژیک بسیار کارآمد بوده است. غالبا چنین تصور می شود که نظریه بازی ها همه بازیکنان را عقلایی در نظر می گیرد. اما این نظریه چنین ادعایی ندارد. ممکن است بازیکن ها مغرض یا حسود بوده یا خیرخواه و نیکوکار باشند.

این گفته جورج برناردشاو در اصلاح قانون طلایی را به خاطر داشته باشید: «با دیگران آن گونه که می خواهید با شما رفتار کنند، رفتار نکنید. ممکن است سلایق آنها با شما فرق داشته باشد». بازیکنان دیگر ممکن است علاوه بر داشتن انگیزه های متفاوت، اطلاعات مختلفی داشته باشند. هر فرد باید همواره هنگام محاسبه یک وضعیت تعادلی یا هنگام پیش بینی عکس العمل های دیگر بازیکنان، آنها را همان گونه که هستند و نه آن گونه که خود هست، در نظر آورد. نمونه های زیر از تعامل استراتژیک، برخی از اصول نظریه بازی ها را نشان می دهند:

معمای زندانی:

دو مظنون به طور جداگانه مورد بازجویی قرار می گیرند و هرکدام می توانند اعتراف کرده یا ساکت بمانند. در صورتی که مظنون A سکوت اختیار کند، به نفع مظنون B است که اعتراف کند، چون مجازاتش کاهش می یابد. اگر مظنون A اعتراف کند، B نیز بهتر است اعتراف کند تا از شدیدترین مجازات در امان بماند. بنابراین اعتراف کردن، استراتژی غالب فرد B است. همین امر راجع به فرد A نیز صادق است. به همین دلیل تعادل جایی به دست می آید که هر دو اعتراف کنند. این در حالی است که اگر هر دو ساکت می ماندند، وضعشان بهتر بود. در صورتی این دو بازیکن همکارانه رفتار می کردند (و هر دو سکوت می کردند) بازی تکرار می شد، زیرا در آن صورت ضرر بلندمدت ناشی از تخطی از همکاری می توانست از منفعت موقت حاصل از تقلب (اعتراف) بیشتر باشد. در چنین شرایطی استراتژی هایی مثل مقابله به مثل نیز وجود دارد.

استراتژی های مختلط:

در برخی شرایط بروز تعارض، رقیب تمامی اقدامات سیستماتیک را کشف کرده و از آنها استفاده خواهد کرد. بنابراین فرد باید با به هم ریختن حرکات خود از اینکه رقیب او بتواند اقداماتش را حدس بزند، ممانعت به عمل آورد. نمونه هایی از این گونه در ورزش مشاهده می شود. مثلا اینکه یک بازیکن فوتبال در یک موقعیت خاص پا به توپ شود یا توپ را پاس دهد یا اینکه بازیکن نقش پاسور در والیبال توپ را پاس دهد یا خود آن را روانه زمین حریف کند نمونه هایی از گیج کردن حریف به شمار می رود. نظریه بازی ها این رفتارها را کمی می کند و نسبت های صحیح را نشان می دهد.

حرکات استراتژیک:

هر بازیکن می تواند برای تغییر انتظارات دیگران نسبت به اقدامات آتی خود از تهدید یا وعده استفاده کند و بنابراین آنها را وادار به انجام کارهایی کند که به نفعش است. البته این تهدیدها و وعده ها برای آنکه به موفقیت برسند باید باورپذیر باشند. این امر مشکل ساز است، زیرا وقتی نوبت به اجرای تهدید یا عمل به وعده می رسد عموما هزینه هایی به بار می آید. نظریه بازی ها، روش های مختلف برای افزایش باورپذیری را مورد مطالعه قرار می دهد. اصل کلی آن است که اگر یک بازیکن آزادی اش در انتخاب اقدامات آتی اش را محدود کند، ممکن است منافعش بهتر برآورده شوند. با انجام این کار این بازیکن وسوسه این احتمال که وسوسه شود تا زیر قولش بزند یا از تخطی های دیگران چشم پوشی کند را از بین می برد.

به عنوان مثال کورتس (Cortes) هنگام رسیدن به مکزیک همه کشتی های خود به جز یکی از آنها را غرق کرد. هدف او از این کار آن بود که امکان فرار را از بین ببرد. بدون کشتی ای که به کار بازگشت به موطن بیاید، کورتس یا باید در کشورگشایی خود به موفقیت می رسید یا جان خود را از دست می داد. اگرچه شمار سربازهای او بسیار کمتر از حریف بود، اما این تهدید او برای مبارزه تا حد مرگ، روحیه حریفان را تحلیل برد و سربازان دشمن نهایتا تصمیم گرفتند عقب نشینی کنند. شرکت پولاروید نیز زمانی که به نحوی هدفمند عبور از بازار عکس فوری را نپذیرفت، از استراتژی مشابهی استفاده کرد. این شرکت با هر مزاحمی که در این بازار وارد شده بود به یک مبارزه مرگ و زندگی دست زد. زمانی که کداک به بازار عکس فوری وارد شد، پولاروید تمامی منابع خود را به مبارزه با آن وارد کرد. این شرکت چهارده سال بعد در یک دعوی حقوقی تقریبا یک میلیارد دلاری علیه کداک به پیروزی رسید و دوباره به بازار انحصاری خود دست یافت. (البته بعدا و زمانی که شرکت پولاروید نتوانست خود را به بازار عکس دیجیتال گسترش دهد، تمرکز این شرکت بر محصولات فیلم فوری پرهزینه از آب درآمد). یک راه دیگر برای باورپذیر کردن تهدیدات، به کارگیری استراتژی ماجراجویانه لبه پرتگاه (brinkmanship) است (این استراتژی به این معنی است که یک بازیکن عامدانه ریسکی را به وجود آورد که اگر دیگران برخلاف خواسته او عمل کنند، نتیجه حاصله به ضرر همه تمام شود). سیاست لبه پرتگاه که توسط توماس شلینگ در «استراتژی تعارض» آورده شده است «تاکتیکی است که در آن به طور عامدانه اجازه داده می شود که شرایط به نوعی از کنترل خارج شود تنها به این دلیل که ممکن است چنین حالتی برای طرف مقابل غیرقابل تحمل بوده و او را به انطباق با آن وادار نماید». زمانی که انبوه اعتراض کننده ها به مخالفت با دولت های توتالیتر در چین و اروپای شرقی می پرداختند، طرفین از این استراتژی استفاده می کردند. برخی اوقات یک طرف کوتاه آمده و به شکست خود اعتراف می کند و در مواقع دیگر زمانی که هر دو طرف از لبه پرتگاه سقوط می کنند، یک تراژدی به وجود می آید.

چانه زنی: در این حالت دو بازیکن با هم تصمیم می گیرند که چگونه منافع را با یکدیگر تقسیم کنند. هریک از طرفین به دنبال سهم بیشتری است و هر دو ترجیح می دهند هرچه زودتر به توافق برسند. زمانی که این دو به ارائه پیشنهاد می پردازند، اصل نگاه به جلو و استدلال عقبگرد سهم تعادلی هریک را معین می کند. در این حالت توافق در یک زمان حاصل می شود، اما هزینه تاخیر بر سهم دو طرف تاثیر می گذارد. بازیکنی که خواهان سرعت بیشتری در رسیدن به توافق باشد، سهم کوچک تری را دریافت خواهد کرد.

پنهان سازی و افشای اطلاعات: زمانی که فردی چیزی را می داند که دیگران از آن بی خبرند، برخی اوقات خواهان پنهان سازی این اطلاعات است (مثلا برخی موارد یک طرف می خواهد نحوه تولید یک محصول خاص را پنهان کند). در مواقعی نیز بازیکنان می خواهند این اطلاعات را به طوری که باور پذیر باشد افشا کنند (مثلا زمانی که یک شرکت می خواهد همه بدانند که به کیفیت محصولاتش اهمیت می دهد). در هر دوی این موارد اصل عمومی این است که فایده عمل کردن بیشتر از صحبت کردن است. اگر بخواهیم اطلاعاتی را مخفی کنیم، باید حرکاتمان در هم ریخته باشد.

بلوف زدن در بازی ها نباید به شکل سیستماتیک صورت بگیرد. گفته وینستون چرچیل درباره مخفی کردن واقعیت میان «محافظانی از جنس دروغ» را به خاطر داشته باشید. برای انتقال اطلاعات باید از اقدامی استفاده کرد که «پیامی» باورپذیر را انتقال دهد طوری که واضح باشد در صورتی که شرایط طوری نبود که بازیکن ادعا می کرد این اقدام به ضررش تمام می شد. به عنوان مثال ارائه ضمانت طولانی مدت پیام معتبری به مصرف کننده و مبنی بر آن است که تولیدکننده به اینکه محصول با کیفیت بالایی را به تولید می رساند، باور دارد. پیشرفت های اخیر در نظریه بازی ها توانسته است استراتژی های مناسب در شرایط مختلف تضاد و همکاری را توضیح داده و تجویز نماید، اما هنوز راه زیادی تا کامل شدن این نظریه باقی است. هنوز هم طراحی یک استراتژی موفقیت آمیز از جهات زیادی یک هنر به شمار می رود.

آویناش دیکسیت، بری نالباف

مترجمان: محمدصادق الحسینی، محسن رنجبر