31.01.2017

Що Таке Теорія Ігор?

Original: http://levine.sscnet.ucla.edu/general/whatis.htm

Економічна теорія і теорія ігор

за Девідом К. Левайном, факультет економіки, Каліфорнійський університет у Лос-Анджелесі

Ти ставишся до світової історії як математик до математики, у якій нічого, крім законів і формул не існує: ні реальності, ні добра і зла, ні часу, ні вчора, ні завтра, нічого, крім вічної мілини, математичного сьогодення”. Герман Гессе

Що економісти називають теорії ігор психологи називають теорію соціальних ситуацій, що є точним описом того, що теорія ігор о. Хоча теорію ігор актуальна для салонних ігор, таких як покер або моста, більшість досліджень в теорії ігор фокусується на тому, як групи людей взаємодіють між собою. Існують дві основні гілки теорії ігор: кооперативні та некооперативного теорії ігор. Некооперативного теорії ігор розглядаються в основному з тим, як інтелектуальні індивіди взаємодіють один з одним з метою досягнення своїх власних цілей. Тобто гілка теорії ігор я буду обговорювати тут.

На додаток до теорії ігор, економічна теорія має три інших основних напрямки: теорія прийняття рішень, теорії загальної рівноваги і теорії проектування механізму. Усі вони тісно пов’язані з теорією ігор.

Теорію прийняття рішень можна розглядати як теорію одну людину ігор або гри одного гравця проти природи. Основна увага приділяється переваг і формування переконань. Найбільш широко використовується формою теорії прийняття рішень стверджує, що переваги серед ризикованих альтернатив може бути описана максимізація очікуваного значення числової функції корисності, де утиліта може залежати від цілого ряду речей, але в ситуації, що становлять інтерес для економістів часто залежить від того, грошовий дохід. Теорія ймовірностей широко використовується для того, щоб представляти невизначеність результатів, і Байеса закон часто використовується для моделювання спосіб, в якому використовується нова інформація переглянути переконання. Теорія прийняття рішень часто використовується в формі аналізу рішень, який показує, як найкраще отримати інформацію, перш ніж прийняти рішення.

Загальну теорію рівноваги можна розглядати як спеціалізованої галузі теорії ігор, яка займається торгівлею і виробництвом, і, як правило, з відносно великим числом індивідуальних споживачів і виробників. Він широко використовується в макроекономічному аналізі широкій основі економічної політики, таких як грошово-кредитної або податкової політики, в галузі фінансів для аналізу фондових ринків, вивчити інтерес і обмінні курси і інші ціни. В останні роки політична економія виникла як поєднання теорії загальної рівноваги і теорії ігор, в яких приватний сектор економіки моделюється загальної теорії рівноваги, в той час як електоральна поведінка і стимул урядів аналізується за допомогою теорії ігор. Питання, що розглядаються включають податкової політики, торгової політики, а також роль міжнародних торгових угод, таких, як Європейський союз.

Теорія дизайну механізму відрізняється від теорії ігор в цій теорії ігор бере правила гри, як зазначено, в той час як теорія дизайну механізм запитує про наслідки різних типів правил. Природно, що це багато в чому залежить від теорії ігор. Питання, розглянуті теорії проектування механізму включають проектування компенсації і заробітної плати угод, які ефективно розподіляти ризики при збереженні стимулів, а також дизайн аукціонів, щоб збільшити дохід, або досягнення інших цілей.

Повчальний приклад

Один із способів, щоб описати гру, перераховуючи гравців (або осіб), що беруть участь в грі, і для кожного гравця, в якому перераховані альтернативні варіанти (так звані дії або стратегії), доступних для цього гравця. У разі двох гравців грі, дії першого гравця утворюють рядки, а дії другого гравця на стовпці, матриці. Записи в матриці два числа, що представляють корисності або виграш першого і другого гравця відповідно. Дуже відома гра “Дилема в’язня”. У цій грі два гравця є партнерами у злочині, які були захоплені поліцією. Кожен підозрюваний поміщений в окрему камеру, і запропонував можливість зізнатися в скоєному. Гра може бути представлена наступною матрицею виграшами

не зізнається зізнається
не зізнається 5,5 -4,10
зізнається 10,-4 1,1

Зверніть увагу, що більш високі числа краще (корисність). Якщо жоден підозрюваний зізнається, вони йдуть безкоштовно, і розділити доходи від їх злочини, які ми представляємо на 5 одиниць корисності для кожного підозрюваного. Однак, якщо один ув’язнений зізнається, а інший не робить, укладений, який сповідує свідчення проти одного в обмін на збирається безкоштовно і отримує цілих 10 одиниць корисності, в той час як ув’язнений, який не зізнається потрапляє до в’язниці, і що призводить до низької корисність -4. Якщо обидва ув’язнені Зізнаюся, то обидва дають скорочений термін, але обидва засуджені, яку ми представляємо, надаючи кожному 1 одиницю корисності: краще, ніж інший ув’язнений, зізнаюся, але не так добре, як відбувається безкоштовно.

Ця гра зачарував теорії ігор для цілого ряду причин. По-перше, це просте уявлення безлічі важливих ситуацій. Наприклад, замість того, щоб зізнатися/не зізнатися, ми могли б позначити стратегії “внести свій вклад в загальне благо” або “поводяться егоїстично”. Це відображає різні ситуації економісти описують як проблеми суспільного блага. Прикладом може слугувати будівництво моста. Це краще для всіх, якщо міст побудований, але найкраще підходить для кожної людини, якщо хтось будує міст. Це іноді в посилання на це економіка як екстерналії. Точно так же ця гра може описати альтернативу двох фірм, що конкурують на одному ринку, і замість того, щоб зізнатися/не сповідуємо ми могли б позначити стратегії “встановити високу ціну” і “встановити низьку ціну.” Природно, краще всього підходить для обох фірм, якщо вони обидва встановлені високі ціни, але найкраще підходить для кожної окремої фірми встановити низьку ціну, а опозиція встановлює високу ціну.

Другою особливістю цієї гри є те, що це само собою зрозуміле, як розумна людина має себе вести. Незалежно від того, що підозрюваний вважає, що його партнер збирається зробити, це завжди краще признатися. Якщо партнер в інший осередку не зізнавшись, можна отримати 10 замість 5. Якщо партнер в іншому осередку, зізнавшись, можна отримати 1 замість -4. Проте, прагнення до індивідуальної здорових результатів поведінки в кожен гравець отримує тільки 1 одиницю корисності, набагато менше, ніж 5 одиниць кожен, що вони отримали б, якщо ні зізнавався. Цей конфлікт між прагненням окремих цілей і загального блага лежить в основі багатьох теоретико-ігрових проблем.

Третя особливість цієї гри полягає в тому, що вона змінюється в дуже істотно, якщо гра повторюється, або якщо гравці будуть взаємодіяти один з одним в майбутньому. Припустимо, наприклад, що після того, як ця гра закінчена, і підозрювані або звільнені або будуть звільнені з в’язниці вони будуть здійснювати ще один злочин, і гра буде грати знову. У цьому випадку в першому періоді підозрювані можуть міркувати, що вони не повинні зізнатися, тому що якщо вони не будуть їх партнер не зізнається в другій грі. Строго кажучи, цей висновок не діє, так як в другій грі обидва підозрюваних не визнають, незалежно від того, що сталося в першій грі. Проте, повторення відкриває можливість бути винагороджені або покарані в майбутньому для поточного поведінки, і теоретики гри передбачили цілий ряд теорій, щоб пояснити очевидну інтуїцію, що якщо гра повторюється досить часто, підозрювані повинні співпрацювати.

Якби ми всі були кращими людьми, світ став би кращим місцем

Деякі сили і сенс теорії ігор можна проілюструвати шляхом оцінки твердження “Якби ми були все краще людей світ став би кращим”. Це може здатися вам бути самостійною достовірною правдою. Або ж ви можете визнати, що в питанні логіки це передбачає помилковість композиції: тільки тому, що заява відноситься до кожної окремої людини не потрібно застосовувати до групи. Теорія ігор може дати точний зміст твердженням як то, що означає бути краще людей і що це означає для світу, щоб бути найкращим місцем, так і дає можливість підтвердити або спростувати заяву. Насправді це твердження не так, і це можна показати за допомогою зміни “Дилеми в’язня”.

Почнемо з варіації на Дилема гри в’язня ми можемо назвати гра “Гординя”.

пишається не зізнається зізнається
пишається 4.0, 4.0 5.4, 3.6 1.2, 0.0
не зізнається 3.6, 5.4 5.0, 5.0 -4.0, 10.0
зізнається 0.0, 1.2 10.0, -4.0 1.0, 1.0

Гра “Гординя” як гра з дилемою укладеного з додаванням нової стратегії гордості. Гордий людина є той, хто не сповідається, за винятком відплати проти щурячого як суперника, який сповідує. Іншими словами, якщо я повновладний і ти зізнаєшся, я отримую 1.2, тому що ми обидва зізналися, і я можу стояти пишатися перед вашим приниженням, але ви отримаєте 0, тому що ви стоїте і приниженим перед моїм гордості. З іншого боку, якщо ми обидва з гордістю, то жоден з нас буде зізнатися, проте, наша гордість приходить за ціною, так як ми обидва намагаються принизити іншого, тому ми кожен отримує 4, а не вищим значенням 5 ми отримали б, якби ми просто вирішили не зізнатися. Було б гірше, звичайно, для мене, щоб вдарити в бруд обличчям перед вашої гордості, вибираючи не визнає. У цьому випадку, я хотів би отримати 3,6 замість 4, і ви, горда в особі мого приниження отримає 5.4.

Гра “Гординя” сильно відрізняється від гри “Дилема в’язня”. Припустимо, що ми обидва пишаємося. Перед обличчям вашої гордості, якщо я просто вирішив не зізнатися, що я втратив би особа, і моя корисність знизиться від 4 до 3,6. Зізнатися б ще гірше, як ви б прийняти у відповідь заходи, зізнавшись, і я був би принижений, а, намотування з 0. Іншими словами, якщо ми обидва з гордістю, і кожен з нас вважають, інший з гордістю, то кожен з нас рішень правильний вибір. Більш того, так як ми обидва правильно, що-небудь або з нас дізнається, просто підтвердити наші вже правильні переконання. Цей тип ситуації – де гравці грають в кращому випадку вони можуть віддали свої переконання, і вони дізналися все, що потрібно дізнатися про гру своїх опонентів називають теорією ігор з рівновагою Неша.

Зверніть увагу на те, що початкове рівновагу Дилема Зізнаюся-сповідувати В’язня не є рівновагою гри “Гординя”: якщо я думаю, що ви збираєтеся зізнатися, я волів би, щоб стояти гордий і принизити вас, а не просто сповідуючи себе.

Тепер припустимо, що ми стали “кращими людьми”. Щоб дати точний зміст цього прийняти це означає, що ми дбаємо один про одного більше, тобто, ми більш альтруїстичні, більш щедрим. Зокрема, давайте уявимо собі, що, тому що я щедрішими і більше піклуватися про тебе, я розміщую значення як на корисності, яку я отримую в “егоїстичної” гри, описаної вище, і про корисність отриманого вами. Не будучи повністю альтруїстична, я розміщую в два рази більше ваги на моїй власній корисності, як і я на вашому. Так, наприклад, якщо в оригінальній грі я отримую 3 одиниці корисності, і ви отримаєте 6 одиниць корисності, то в новій грі, в якій я альтруїст, я отримую зважене середнє моєї корисності і вашої корисності. Я отримую 2/3 з 3-х одиниць корисності, що належали до мене в оригіналі “егоїстичної” ігри, і 1/3 з 6 одиниць корисності, що належали до вас в “егоїстичної” гри. В цілому я отримую 4 одиниці корисності замість 3. Тому що я став краще більш щедрою людиною, я радий, що ви отримуєте 6 одиниць корисності, і таким чином це підвищує мою власну утиліту від егоїстичного рівня 3 на більш високий рівень з 4. нова гра з альтруїстичними гравців описується приймаючи зважене середнє корисності кожного гравця з цим свого супротивника, поставивши 2/3 ваги на його власній корисності і 1/3 ваги на його супротивника. Це дає виграш матриці гри Альтруїстичне гординя

пишається не зізнається зізнається
пишається 4.00, 4.00 4.8, 4.20* 0.80, 0.40
не зізнається 4.20*, 4.80 5.00, 5.00 0.67, 5.33*
зізнається 0.40, 0.80 5.33*, 0.67 1.00*, 1.00*

Що сталося? Якщо ви пишаєтеся, я повинен вибрати не зізнатися: якби я був пишатися я отримую корисність 4, в той час як якщо я не зізнатися я отримую 4.2, і, звичайно ж, якщо я зізнаюся, що я отримую тільки 0,4. Дивлячись на оригінальній грі, було б краще для суспільства в цілому, якщо, коли ви з гордістю мені довелося вибирати не зізнатися. Це дозволяє уникнути конфронтації двох гордих людей, хоча, звичайно, за мій рахунок. Проте, як альтруїст, я визнаю, що вартість мені мала (я втратив тільки 0,4 одиниці корисності) в той час як користь для вас велика (ви отримуєте 1,4 одиниць корисності), і тому я вважаю за краще “не зізнаюся”. Це показано в матриці виграшу шляхом розміщення зірочки поряд з підкупом 4.2 в гордій колонці.

Що робити, якщо ви не хочете зізнатися? Якщо я пишаюся, я отримую 4.8, якщо я не зізнатися я отримую 5, але якщо я зізнаюся, я отримую 5.33. Таким чином, я повинен зізнатися. Знову ж таки, це відзначений зірочкою. Нарешті, якщо ви сповідуєте, то я більше не хочу стояти пишатися, визнаючи, що отримання 0,2 принижуючи вас приходить за ціною від 1 до вас. Якщо я вибираю не визнає, я отримую тільки 0,67. Так що краще для мене, зізнатися, як добре.

Що ми робимо висновок? Це вже не є рівноважним для нас обох, щоб пишатися. Кожен з нас перед обличчям гордості іншого хотів би перейти до не признаючись. Звичайно, це також не є рівноважним для нас обох, щоб вибрати не зізнатися: кожен з нас хотів би перейти до сповідуючи. Тільки рівновага коробка, відмічені двома зірочками, де ми обидва грали краще, що ми можемо грати з урахуванням іншого гравця: це те, де ми обидва вирішили зізнатися. До сих пір від робити нас краще, коли ми обидва стали більш альтруїстом і більше турботи один про одного, а не як отримати відносно високу корисність 4, рівновага порушується, і ми вітер в ситуації, в якій ми обидва отримуємо корисність тільки 1. Зверніть увагу, як ми можемо дати точний сенс “світ є найкращим місцем”. Якщо ми обидва отримують корисність 1, а не як отримання корисності 4, світ явно гірше місце.

Ключ до теорії ігор і до розуміння того, чому краще люди можуть зробити світ гірше, щоб зрозуміти тонкий баланс рівноваги. Це правда, що якщо ми просто стати більш турботливими і нічого не відбувається в світі не буде, принаймні не гірше. Тим не менше: якщо ми станемо більш турботливим ми хочемо змінити те, як ми поводимося. Як показує цей приклад, коли ми обидва намагаються зробити це в той же час, кінцевий результат може змусити нас все гірше.

Для того, щоб поставити це в контексті день у день життя: якби ми були всі більш альтруїстичні ми вибрали б пробачити і забути більш злочинну поведінку. Поведінка злочинців має ускладнення. Більш альтруїстичні злочинці воліють здійснювати менше злочинів. Однак, як злочин не карається так сильно, що вони будуть схильні до скоєння злочинів більше. Якщо в балансі більше злочинів скоюється, світ, безумовно, може бути гірше місце. Приклад показує, як це може працювати.

Для тих з вас, хто цікавиться або вже знають більш просунуті теорії ігор, гра “Гординя” має тільки рівновагу Неша одне показане – це можна вирішити ітерованих суворого домінування. Гра “Альтруїстична гординя”, однак, має кілька змішаних рівноваг стратегії. Ви можете обчислити їх за допомогою тонкої програмного забезпечення з відкритим вихідним кодом програми гамбіт, написану Річардом Маккелві, Ендрю Макленнаном і Теодором Тьюросі. Одне рівновагу передбачає рандомізації між гордими і зізнатися, так що гірше, ніж гордою горда рівноваги гри “Гординя”. Інший строго змішано в тому, що вона рандомізують між усіма трьома стратегіями. Виграші до цієї рівноваги дає кожному гравцеві 2,31 – так що поки це краще, ніж обидва гравці, які прославляють напевно, це ще гірше, ніж унікального рівноваги гри “Гординя”.


Подяка від автора оригіналу. Я хотів би подякувати Цзе Чжен за його допомогу. “Ми всі кращі люди” приклад натхненні і на основі академічної роботі Сунг-Ха Хван і Семюель Боулз називається “Альтруїзм погано підходить для співпраці?”. Якщо ви знаєте, деякі основні обчислення папір дуже читається, і я буду забезпечувати зв’язок як тільки вони відправляють його в Інтернеті. Вони забезпечують набагато більш переконливі і надійний приклад того, як альтруїзм шкодить співпраці, тісно пов’язані з експериментальними даними. Якщо ви хочете дізнатися більше про теорію ігор, є безліч хороших книг по цій темі.

About The Author

admin

Comments are closed.