Демонстрація математичною теорією ігор хибності моделі раціональної дії
К. В. Клименко
аспірантка
Розглянутий метод раціональної дії з синергетичним підтекстом та запропонований кардинально- новий варіант розгляду «дилеми ув´язнених» як однієї з основних задач економічної теорії за допомогою рефлексивних ігор як альтернативного варіанту рішення задач такого типу.
На сьогодні існує досить розвинений напрямок досліджень, що зазвичай пов´язаний з терміном “математична економіка». В роботах, що відносяться до цього напрямку, вивчаються властивості математичних моделей, які побудовані на основі формалізації деяких понять економічної науки (наприклад, поняття конкурентної рівноваги)1. Однак, академік РАН Н.Н.Моісеєв відмічає недоліки в розвитку математичної економіки: «...З розвитком математичної економіки проблеми, що в ній розглядаються, все більше відходять від економічної реальності й стають чисто математичними. В результаті цього в теперішній час математична економіка представляє собою своєрідний розділ математики, що вивчає математичні конструкції, які лише з великою ступінню довільності можна назвати економічними моделями»2. Також Н.Н.Моісеєв зазначає, що причини таких недоліків в тому, що в теоретичну та практичну економіку втручається велика кількість людей з інших сфер діяльності, які хочуть отримувати гроші як економісти, але не хочуть ставати ними по суті. Легко перефразувати, що велику шкоду наносять математики, які вдають з себе економістів. Щоб підтвердити свої претензії, вони використовують економічні терміни для позначення математичних понять, а потім доводять свої улюблені теореми або ж домагаються фінансування, заявляючи про свої досягнення в економічній науці. Біда в тому, що ці теореми не потрібні для практичної діяльності економістів. Одначе це не хвилює математиків, що видають себе за економістів, як не хвилює розтрата грошей платників податків і спонсорів, і майбутнє студентів, які мусять витрачати роки навчання на нікому не потрібну схоластику.
Отже, спираючись на авторитет Н.Н.Моісеєва та його послідовників, математичну економіку, тобто математику, виражену в псевдо економічних термінах, можна кваліфікувати як псевдонауку. В той же час треба підкреслити, що методи математичного моделювання реальних економічних явищ й процесів корисні й необхідні для успішної роботи менеджерів, економістів та інженерів. Але потрібні тільки ті математичні результати, які допомагають економісту в роботі, в тому числі й методи теорії прийняття рішень та математичної теорії ігор. Але вони мають бути такі, що відповідають баченням й потребам сьогодення, адже не можна описати економіку, науку, яка швидко розвивається та змінюється, бо змінюються її ринкові пріоритети, тільки однією формулою (автор, звичайно, говорить метафорично), бо ця наука постійно диференціюється.
Метою цієї статті є відшукання достатньо значних недоліків саме в економічній теорії, яка після Дж. Неша не визнала доцільним розвиватися далі пліч - о - пліч з математичною теорією ігор. Актуальність теми статті зумовлена швидким розвитком ринкових відносин в нашій країні, ідеалізований опис яких в мікроекономіці є, м´яко кажучи, наївним, бо не звертає жодної уваги на поведінку агентів, які ці відносини й формують. Не використовуючи підходів, враховуючих ірраціональні аспекти поведінки людей (так би мовити, «ірраціональних підходів»), економіка, що ми й спостерігаємо, задихається від нестачі нового методологічного підходу. Автор статті намагатиметься підвести економістів та математиків до істотно нового синергетичного підходу, що ми зробимо на прикладі найпростішого прикладу «дилема ув´язнених», яка описана майже у всіх підручниках з економічної теорії. Але спочатку трохи «історії» та основних понять з теорії ігор, бо автор дуже сподівається зацікавити цією темою не тільки науковців, а й всіх небайдужих до ринкових відносин людей.
Найбільшого успіху досягнуто в теорії ігор двох гравців з протилежними інтересами (антагоністичні ігри), де нормативний і дескриптивний аспекти конфліктної ситуації добре поєднуються в понятті максиміна: стану, в якому кожен гравець отримує максимум виграшу по змінних, що він контролює, в умовах, коли цей виграш мінімальний по змінних, що контролюються іншим гравцем3. Теорія антагоністичних ігор знаходить застосування в питаннях воєнної стратегії та практики, а також в багатьох аспектах еквівалентна задачам математичного програмування. Ця ігрова методологія є основною для перспективного напрямку математичної статистики, що трактує статистичні задачі як ігри дослідника з природою.
Аналіз ігор за участю багатьох осіб суттєво важчий із-за складності питання про механізми формування й дії коаліцій. В теорії безкоаліційних ігор багатьох осіб є два напрямки, що мають нетривіальне застосування до соціально-економічної проблематики. Перший з них
- це ігри з непротилежними інтересами і фіксованою послідовністю ходів, моделювання прийняття рішень в організаційних системах на основі принципу гарантованого результату. Другий напрямок пов´язаний з поняттям рівноваги (Нейман - Неш) ситуації, стійкої в тому сенсі, що ніякий гравець не може збільшити свій виграш за рахунок тільки власних дій. Це поняття частково лежить в основі концепцій соціально
- економічної рівноваги, згідно з якою в рівновазі всі соціальні і економічні агенти добиваються максимально можливого задоволення своїх інтересів в рамках певних обмежень, причому пропозиція відповідає попиту по всіх видах благ і праці, які розглядаються. Дана концепція використовується для аналізу ряду соціально - економічних процесів: поведінки в умовах дефіциту, розподілення доходів, сімейної поведінки, міжрегіональних відносин і т.д. Надалі ми будемо розглядати ситуацію Неш - рівноваги вкупі з синергетичним підходом, який передбачає врахування ірраціональності в його подальшому застосуванні.
В цілому, ідеї теорії ігор мають, безумовно, стимулююче значення як для внутрішньо-математичних, так і для соціально - економічних досліджень, але в останньому випадку власні її концепції занадто абстрактні й мають доповнюватись більш конкретними конструкціями в кожному випадку.
В підручниках з економіки зазвичай розглядається «дилема ув´язнених» й точка рівноваги по Нешу. Хотілося б більш детально зупинитися на «дилемі ув´язнених», тим більше, що в контексті появи синергетичної методології її розв´язання виглядає все більше ірраціональним та підпорядкованим не скільки економіко - соціологічній моделі, а моделі математичної теорії гри. Надалі хотілося б цей приклад з хибності методу раціональної дії перенести на інші моделі раціональної поведінки.
Так що таке проблема «дилеми ув´язнених” і модель раціональної дії? В застосуванні математичної теорії ігор до соціально - економічних моделей проблема співпраці носить назву проблеми «дилеми ув´язнених», що є найвідомішою субоптимальною ситуацією. Це інтерактивні ситуації, тобто такі, у вирішенні яких беруть участь більше одного учасника. Ситуації такого типу як “дилема ув´язнених” є центральними для математичної теорії ігор та її економічних та соціальних застосувань, тому сам цей тип ситуації удостоївся власної назви. Він був винайдений та описаний американським вченим М. фладом в 1952 році. Чому така назва? Суть справи така: двоє ув´язнених підозрюються в скоєнні тяжкого злочину. Прямих доказів у слідства немає, але є непрямі. Тому слідчий пропонує кожному з цих двох (а вони сидять в ізольованих камерах) одну й ту ж угоду. Якщо ув´язнений розкаже все сам і признається у скоєному, а його подільник буде мовчати, то він зразу ж вийде із в´язниці, як той, хто допоміг слідству, а його товариш отримає 10 років. Якщо ж признаються обидва - кожному суд призначить по 9 років; будуть обидва мовчати - то проведуть за грата ми лише рік за незначний злочин.
А.Л.Блінов в своїй статті “Синергетика колективної ірраціональності” спробував включити проблематику субоптимальних ситуацій в поле зору синергетики, бо сама математична теорія ігор залишається «антиси- нергетичною дисципліною» в сучасній математиці, бо зовсім ігнорує нелінійні феномени4. До них відносяться також поняття раціональної дії, або ж інструментальної раціональності, яке стало центральним в економічній теорії, а також користується великою популярністю в соціологічних науках. Інструментальна раціональність
- це відповідність засобів до цілі або, якщо одним словом - доцільність. Розумність та доречність цілі до уваги не приймаються, обговорюватись і вибиратись можуть тільки засоби - дії, що призводять (або не призводять) до цілі. Якщо дія призводить до цілі - вона інструментально раціональна.
За А.Л.Бліновим, інструментальна раціональність є максимізація корисності, якій відповідає модель раціональної дії. А якщо це модель, то не обійтися без ідеалізацій та спрощень. Але модель добре працює лише там, де маємо справу з одним ізольованим діячем, бо ситуація взаємодії двох або декількох осіб виходить з-під контролю моделі максимізації корисності, яка формально розроблена по теорії прийняття рішень лише для однієї особи. Звичайно, при переході від одинокого агента до взаємодії декількох осіб концепція раціональності як максимізації корисності заходить у глухий кут. Першим побачив тут проблему Джон фон Нейман, який писав: «Проблема Робінзона Крузо - це, звичайно, типова проблема максимізації, й труднощі її носять чисто технічний, а не концептуальний характер. Коли індивід знаходиться в ситуації взаємодії з іншими індивідами - це вже точно не проблема максимізації, а якась дивна суміш декількох проблем максимізацій, що знаходяться в конфлікті одна з одною»5. Кожен учасник діє, виходячи з свого власного принципу, що не співпадає з іншими, і жоден з учасників не контролює весь набір змінних, що зачіпає його інтереси. Можна з впевненістю сказати, що класична математика ніколи не стикалася з проблемою такого роду, тому вона не має засобів її розв´язання. В інтерактивних ситуаціях маємо прямо- таки драматичну картину, де цінність знання може бути негативною, і цей факт добре задокументований в літературі з мікроекономіки.
То як вирішити проблему переходу від індивіда до взаємодії його з іншими особами? Ясно, що ідея звичайного узагальнення принципу максимізації корисності на ситуацію взаємодіючих агентів провальна в своєму зародку, бо буде мати місце колективна «зрада» учасників взаємодії. Чому це станеться? По
- перше, концепція інструментальної раціональності включає в себе два фундаментальні пункти:
а) положення про те, що діяч завжди намагається максимізувати величину своєї індивідуальної корисності;
б) припущення про те, що він має ідеальні інтелектуальні здібності, тобто він знає або може дізнатися про свою ситуацію все, що потрібно знати, щоб обчислити дію, яка максимізує корисність. Ще він мислить абсолютно логічно та вміє безпомилково здійснити будь - яке обчислення за час, яким можна знехтувати.
Всі ці умови, звичайно, ідеалізації, яких не можна досягти в реальному житті, але без них неможливо обійтися в науці, бо вони досить ефективні, тому що допускають подальше наближення до реальних умов. Ці ідеалізації гарантують ідеальну когнітивну раціональність діяча, яку не потрібно плутати з інструментальною раціональністю, яка складається з устремління (рішучості) діяча максимізувати величину своєї корисності. Його когнітивна раціональність - це все те, що він спроможний дізнатися, розміркувати й обчислити для потреб максимізації корисності. Коли мова йде про взаємодію декількох осіб, то має місце ще одне припущення: припущення про взаємне знання, тобто всі учасники взаємодії знають, що всі вони інструментально і когнітивно раціональні. На прикладі «дилеми ув´язнених» показано, що наявність разом інструментальної та ідеальної когнітивної раціональності призвела до трагічного парадоксу: героям не вдалося максимізувати свої корисності саме тому, що вони більш за все намагалися максимізувати їх, використовуючи всю необхідну інформацію й свої необмежені інтелектуальні можливості. Така ситуація називається парето - субоптимальною (антонім - парето - оптимальність, що є втіленням принципу максимізації індивідуальної корисності при взаємодії декількох осіб, тобто колективну максимізацію).
Якщо ми зараз перейдемо до економіки, то варто зазначити предмет її розгляду, який нас хвилює в цій статті. З теоретико-ігрової точки зору завдання управління активною системою (елементи якої здатні до цілеспрямованої поведінки) полягає в тому, щоб створити для керованих суб´єктів (агентів) гру з такими правилами, щоб її результат (набір дій агентів) був якомога сприятливішим для органу, що управляє (центру). Сам центр не входить до числа гравців, а лише формує умови їх взаємодії («правила гри»). Надалі поняття «гравець» і «агент» вважатимемо синонімами (відзначимо, що перше характерне для теорії ігор, друге - для мікроекономіки). В даній роботі ми не розглядатимемо поняття центру, бо воно для нашої задачі не важливе, тому що цікавість викликає, перш за все, взаємодія двох агентів та їх поведінка в ситуації «дилеми ув´язнених». Але оскільки мова постійно йтиметься про поінформованість гравців, то доречно звернутись до економічної теорії, адже вона досить вдало описує таку модель взаємодії.
Предметом розгляду може виступати інформаційне управління, тобто вплив елементами активної системи на інформованість суб´єктів, що приймають рішення, з метою спонукати їх до необхідних дій6. Наприклад, бізнесмен приймає рішення про виробництво того або іншого товару в тому або іншому обсязі на основі своєї інформованості про ринок і про конкурентів. Виборець ухвалює рішення проголосувати за того або іншого кандидата на виборах на підставі інформованості про цього кандидата, про інших кандидатів, про думки і уподобання інших виборців. Відповідно, будь-яка цілеспрямована дія на інформованість бізнесмена в першому випадку і виборця в другому є інформаційним управлінням. Розгляд інформаційних аспектів дає можливість у ряді випадків розширити раціональні результати гри, що, у свою чергу, збільшує ефективність рішень.
Керований суб´єкт (агент) обирає дію на основі своєї інформованості про суттєві параметри. Зробивши дію, агент спостерігає результат цієї дії, причому спостережуваний результат залежить, взагалі кажучи, від дій решти агентів. Можна сказати так: він приймає те або інше рішення, але результат залежить також і від дій конкурентів (і, побічно, від їх інформованості). Спостережуваний результат, природно, робить вплив на інформованість.
Спираючись на модель, опишемо загальну технологію постановки і дослідження завдань інформаційного управління7. Вона складається з трьох етапів. Попередній етап включає, по-перше, формалізацію ситуації в термінах теорії ігор - опис множини агентів, їх допустимих дій і цільових функцій. По-друге, формалізацію невизначеності, присутньої в ситуації. По - третє, визначення множини інформаційних структур, які можуть бути сформовані, виходячи з особливостей ситуації. На етапі теоретико - ігрового аналізу обчислюються інформаційні рівноваги, тобто виявляється зв´язок між інформованістю і дією. Далі, перевіряється стабільність, тобто незмінність інформованості після спостереження агентом результату свого вибору.
На етапі синтезу вирішується власне завдання інформаційного управління - визначається якнайкраща для агента інформаційна структура, тобто така структура, при якій результат дій агентів є найбільш бажаним. Нарешті, завершальний крок - розробка інформаційної дії на агентів. Як відомо, гра з повною інформованістю в нормальній формі задається перерахуванням множини гравців (агентів), множини їх допустимих дій і набором їх цільових функцій. Проте істотним є питання: чи відомий самий цей опис учасникам гри? Довгий час в теорії ігор «за умовчанням» передбачалося, що гра відома всім її учасникам і, більш того, вона є загальним знанням серед учасників. Цей технічний термін - загальне знання - був введений філософом Девідом Люїсом8, а в теорію ігор Робертом Ауманом9 для позначення факту, про який відомо всім агентам, і всім агентам відомо, що про нього відомо всім агентам і так далі.
І знову повернемося до «дилеми ув´язнених». У кожного з двох в´язнів є дві можливі стратегії: мовчання або ж відверте зізнання. Добре відомо, що в цій грі має місце єдина Нешева рівновага, коли обидва гравці обирають відверте зізнання. Із цього слідує, що для кожного з ув´язнених раціональний вибір полягає в тому, щоб щиросердно співпрацювати зі слідством. Щоб краще зрозуміти ситуацію введемо поняття Неш - нерівноваги, що стало також центральним в математичній теорії ігор. Якщо результат А інтерактивної ситуації В є таким, що колективний договір сторін про вибір дій, що призведуть до А, здатен породити хоча б у однієї зі сторін спокусу до зради, то А буде називатися Неш - нерівноважним результатом.
Якщо всі учасники ситуації інструментально і когнітивно раціональні, то вони не будуть втрачати час і домовлятися про дії, що призведуть до Неш - нерівноважних результатів. Адже учасники знають, що ті з них, в яких Неш - нерівновага породить спокусу зрадити - зрадять, й Неш - нерівноважний результат досягнутий не буде. Беручи до уваги необмежені інтелектуальні здібності наших учасників, зробимо висновок, що вони домовлятимуться тільки про Неш - рівноважні результати, але якщо в ситуації В таких маємо тільки один, то попередні переговори втрачають сенс, бо їх результат відомий і всі про це знають, тому виберуть дії, що призведуть до Неш
- рівноваги, яка не породжує спокусу зради, бо в цьому і є рівновага. «Якщо в ситуації В є тільки один Неш - рівноважний результат А, то А називається рішенням ситуації В»10. Рішення ситуації - це той її результат, до якого прийдуть інструментально і когнітивно раціональні діячі, тобто реалістично мислячі максимізатори своєї корисності.
Тобто для кожного з двох гравців в «дилемі ув´язнених» стратегія щиросердного зізнання строго домінує над стратегією мовчання. Поняття соціальної субоптимальності (про що говорилося вище) тісно пов´язане з дилемою ув´язнених, бо інтерактивна ситуація субоптимальна, якщо її єдиний рівноважний результат парето - субоптимальний, тобто такий, що має інший результат, який кращий для кожного учасника, але цей другий результат, на жаль, нерівноважний, і тому нестабільний, тобто практично недосяжний. «Дилема ув´язнених» - приклад соціальної субоптимальності. Дії людей визначає не сама ситуація, а її переформування в свідомості діяча. Це відноситься й до субоптимальних ситуацій взагалі, й до «дилеми ув´язнених зокрема».
Принциповим же для теоретико-ігрової моделі є визначення концепції розв´язання гри, тобто відповіді на питання, які дії виберуть раціональні агенти в рамках своєї інформованості. Іншими словами, який зв´язок між інформованістю агента і обраною ним дією. Вирішенням гри рефлексії є інформаційна рівновага11, що є узагальненням рівноваги Неша, - найбільш загальнопоширеній концепції вирішення некооперативної гри. У «звичайній» грі з повною інформованістю рівновага має самопідтримуючий характер - якщо гра повторюється кілька разів, жодному з агентів невигідно відхилятися від рівноваги в односторонньому порядку.
Для ігор рефлексій це, взагалі кажучи, не так: якщо який-небудь агент спостерігає не той результат, який чекав побачити, ухвалюючи рішення, його уявлення про реальність може змінитися. Тому представляється необхідним виділити ті інформаційні рівноваги, для яких властивість стабільності рівноваги виконується. Для цього доповнимо визначення гри рефлексії функціями спостереження, що відображають ту інформацію, яку кожен агент спостерігає в результаті розігрування гри. Інформаційну рівновагу називатимемо стабільною, якщо кожен агент спостерігає саме той результат, на який розраховував. Наступний елемент моделі інформаційного управління - залежність між інформованістю агентів і тим результатом, тією корисністю, яку вони отримують в результаті гри.
Важливим допоміжним інструментом для дослідження питання про те, чого може досягти агент в результаті інформаційного управління, є відображення рефлексій. Областю значень відображення рефлексії кожного агента є множина його всіляких якнайкращих відповідей при заданому стані природи і заданій обстановці. Особливим випадком є стаціонарні відображення рефлексій, коли множина рівноваг не розширюється з ускладненням структури інформованості. Виявляється, що якщо відображення рефлексій стаціонарні, то при здійсненні інформаційного управління збільшення рангу рефлексії агентів не приводить до появи нових інформаційних рівноваг.
Наступний елемент представлено в моделі інформаційного управління - інформаційною дією, що управляє. Питання полягає в наступному: як формується інформаційна структура гри залежно від тих або інших інформаційних дій агентів. Тут необхідно визнати, що скількись вичерпну відповідь на це питання, мабуть, неможливо отримати, оперуючи виключно математичними (і, зокрема, теоретико - ігровими) моделями. Це обумовлено, в першу чергу, тим, що процес засвоєння людиною тієї або іншої інформації дуже великою мірою обумовлений чинниками соціально
- психологічного порядку. Проте, можна виділити і формалізувати деякі види інформаційних дій.
Першим, найбільш простим видом дії, що управляє, є однорідне інформаційне регулювання
- повідомлення агентам значення невизначеного параметра. Дане значення стає загальним знанням серед агентів. Наступний вид дії - неоднорідне інформаційне регулювання. Кожному агентові повідомляється значення невизначеного параметра, проте, кожному - своє. Для кожного агента дане значення суб´єктивно стає загальним знанням. Наступний вид дії - управління рефлексії. Кожному агентові повідомляється значення невизначеного параметра і представлення інших агентів. В результаті формується складніша структура інформованості.
Тоншим видом інформаційної дії є активний прогноз. Агентам повідомляється якась величина, залежна від стану природи і дій агентів (наприклад, сумарна дія агентів). Немовби повідомляється : «Якщо ви діятимете раціонально, тобто виберете рівноважні дії, то результат буде прогнозованим». Далі кожен агент на підставі прогнозу може «відновити» інформацію про стан природи і використовувати цю інформацію (як і при інформаційному регулюванні) при обчисленні рівноважних дій (у тому числі і власної дії).
Якщо до умов гри «дилема ув´язнених» додати додаткову умову: відміну у банді злочинців неминучого покарання за співпрацю зі слідством, то як мають себе повести наші гравці? Все буде залежати від того, наскільки вони проінформовані про результати зборів у банді щодо покарання за співпрацю. Ускладнивши ситуацію тим, що дізнатися про це вони можуть або ж обидва, або жоден з них, А.Л.Блінов назвав цю гру «добрий вартовий»12, яка відрізняється від гри «дилема ув´язнених» + «покарання за співпрацю» тим, що невідома умова щодо покарання може бути знята. «Невідома умова» - це двочлен інформаційної множини, яка може бути прибрана тоді, коли стане відомо, що покарання за співпрацю зі слідством більше немає. Тобто маємо гру, яка починається з того, що двоє ув´язнених мають одночасно зробити вибір між двома опціями: грати їм далі в гру «дилема ув´язнених» + «покарання за співпрацю» + «невідома умова»(1) або ж в гру «дилема ув´язнених» + «покарання за співпрацю» без умови щодо зняття покарання (2). Якщо один з них відмовиться від інформації щодо умови про покарання, то вони обидва гратимуть в гру типу (2). Головне питання гри «добрий вартовий» полягає в тому, який має бути раціональний вибір кожного з ув´язнених: 1) в тому, щоб дізнатися про результати зборів щодо покарання за зраду товариша; чи 2) в тому, щоб відмовитися від допомоги вартового? Для цього потрібно сформулювати питання про раціональність вибору відносно якої цілі буде йти мова; відносно епістемічної мети отримати якомога більше знання чи відносно всієї множини цілей гравця.
І тут ми можемо бачити, що кожен з двох ув´язнених віддає знанню хоч і позитивну цінність, але значно меншу, ніж цінність свободи або життя. Тому раціональний вибір щодо епістемічної цілі отримати знання вказує на те, щоб прийняти пропозицію вартового й дізнатися про результати зборів банди, а раціональний вибір щодо цілі свободи - відмовитися. Вся причина в тому, що якщо обидва гравці не знають про результати зборів, то їх інтегрально - практична раціональність рекомендує їм мовчати й вийти з в´язниці через рік. Таким чином, в інтерактивній ситуації може статися таке, що непоінформованість, якщо тільки вона поділяється всіма учасниками гри - виявляється не злом, а благом тоді, коли будуть прийняті до уваги всі цілі й цінності гравців. Тут ми і будемо мати конфлікт між поняттями конкретної епістемічної раціональності та інтегрально - практичної раціональності.
Доцільним є також показати, що в цій грі є рівно один Неш - рівноважний результат, який і представляє собою рішення гри. Цей результат є одночасно парето
- оптимальним, адже мовчання обох призведе до року ув´язнення для кожного. Ця ситуація цікава тим, що вона спростовує нашу інтуїтивну думку, що завжди в будь-якій ситуації знання - це сила. В даній грі знання
- це слабкість, тому інструментально раціонально, але не раціонально з когнітивної точки зору, відмовитися від його отримання. Адже шанси гравців, що покарання за співпрацю зі слідством (отже, за зраду товариша) відмінено 50 із 100, і вони обидва будуть знати, що знаходяться в ситуації «дилеми ув´язнених». Тоді раціональність заставить їх зрадити один одного й просидіти за гратами 9 років. Чому так? Оскільки обидва ув´язнених однаково ідеалізовані та проінформовані щодо зняття покарання, то кожен з них буде розмірковувати приблизно так:
- якщо я співпрацюватиму зі слідством, а товариш мовчатиме, то я вийду зараз же (10: 0), де ситуація все ж таки краща, коли мовчатимемо обидва (1:1),
- якщо я співпрацюватиму, й товариш зробить те саме, то матиму 9 років (9:9), що краще, ніж коли змовчу, бо тоді товариш вийде на свободу, а я отримаю 10 років (0:10), бо 9<10.
Звідси висновок, що мовчати невигідно, бо кожен гравець прагне максимізувати величину власної корисності (що є інструментально раціонально), а не стоїть на сторожі інтересів товариша. Між тим в початковому стані симетричної невизначенності (неповноти знання) раціональність диктує їм мовчати, бо шанси, що покарання не відмінене, достатньо великі. Але на початку гри двоє ув´язнених когнітивно раціональні настільки, наскільки це взагалі доступно людині, і якщо вони застосують всю свою блискучу раціональність до доступних їм обом фактів, то прийдуть висновку, що має місце шанс 1 до 100, що банда зберегла покарання, й 99 до 100, що воно відмінене. Тоді обидва зрадять, бо знатимуть, що знаходяться в ситуації «дилеми ув´язнених».
Якщо брати до уваги всі можливі втілення гри «добрий вартовий», то формальні моделі такого роду здатні пояснити деякі види когнітивної ірраціональності в судженнях людей. І «дилема ув´язнених» пояснює деякі важливі види інтерактивних ситуацій, які трапляються в повсякденному житті.
Все описане вище було потрібно для того, щоб показати некомпетентність сучасної економічної теорії в ситуаціях, коли маємо справу з Неш - нерівновагою, а також інформаційною нерівновагою. Обговорення та складність таких ситуацій не розглядається в економіці, а віддається перевага тільки одноходо- вим іграм в нормальній формі, де гравці обирають свої дії одночасно й незалежно. Нагадує «дилему ув´язнених» чи не так? В сучасній економічній теорії є проблема, яка в найбільшій мірі релевантна для теорії конфлікту між двома різновидами раціональності, що обговорювалося вище. Проблема така: дуже часто дійсні ринки недосконалі в тому смислі, який надає терміну «досконалий ринок» неокласична теорія. Тому набувають значення (для економічної теорії) переконання ринкових агентів, тоді коли в умовах досконалого ринку теорія ними нехтує. Отже, дуже часто системи переконань, що детермінують рішення реальних агентів реальних ринків виявляються такими дефектними з точки зору епістемічної раціональності утвореннями, як міфи, табу й пересуди ( А.Л.Блінов називає їх ідеологіями). Вони ідеалізовані в теорії й не мають нічого спільного з реальними ринками, тому займають цілі розділи в підручниках з економічної теорії та є мертвим вантажем, який ніколи нікому не принесе користі й не вийде далі теоретизування. З теорії конфлікту двох раціональностей можна зробити висновок, що недосконалі ринки не гарантують парето - оптимальності. Але соціальна субоптимальність може компенсуватися підходящою епістемічною ірраціональністю. Не є виключенням, що саме названі вище «ідеології» є компенсаторами парето - субоптимальності, які відповідає недосконалим ринкам. Як висновок, деякі види епістемічної ірраціональності реоптимізують соціально субоптимальні ситуації, і в цьому є їх послуга інтегрально - практичній раціональності.
Обмежений обсяг статті не дозволяє досить детально зупинитись на нових досягненнях в теорії ігор, але, якщо в двох словах, то нею вже давно розроблена модель ситуації, що нами розглядалась. Це описання поведінки гравців в покер. Досить просто провести тут паралель, бо поінформованість в покері не має великого значення для гравців, де елементи блефу та взаємних погроз більш дієві, ніж отримання найбільшої комбінації карт. В теорії ігор для покеру використовується поняття так званого «прийому», тобто недостатньої інформованості гравців один про одного. В цьому випадку «прийом» полягає у відгадуванні намірів супротивника за умови приховування своїх намірів: «прийом» позитивний і «прийом» негативний. Тактика кожного гравця повинна бути дуже гнучкою, і один і той же «прийом» не повинен використовуватися багато разів, інакше вона сама стане «тактикою» і повернеться, як бумеранг до того, хто «в лоб» використовує її. Гравець повинен прагнути модифікувати свою гру згідно реакції свого супротивника, роблячи кожного разу найбільш вдалий для даної ситуації вибір: звідси відбувається ймовірність ймовірності. Оскар Моргенштерн дав приклад вдалого вибору з невдалої самої по собі ситуації на основі одного з розповідей про Шерлока Холмса. Переслідуваний професором Моріарті, той сів в поїзд, що виходив з Лондона до Дувру через Кентербері. Але, сідаючи в поїзд, він помітив, що і Моріарті знаходиться в поїзді. Холмс знав, що, якщо він зійде одночасно з Моріарті, він напевно буде вбитий. Йому потрібно було дістатися до Дувра одному, щоб сісти на пароплав, що слідує через протоку. Така була його мета. Виникають наступні можливі варіанти:
а) Холмс виходить в Дуврі;
б) Холмс виходить в Кентербері;
в) Моріарті виходить в Кентербері;
г) Моріарті виходить в Дуврі.
Підсумком, з погляду Холмса, можуть бути:
1)повнийуспіх;
2) частковийуспіх;
3) поразка.
Ці три результати, з погляду переваг Холмса, послідовно убувають як гідні вибору, останній - найгірший. Система переваг Моріарті протилежна системі Холмса. Відразу очевидна складність вибору через нестачу інформації. Рішення і для Холмса, і для Моріарті - результат випадкового вибору, що грає роль оборонної тактики. Добре підготовлений, кожен насторожено чекає щонайменшого упущення супротивника, щоб негайно перейти в наступ. Але, крім цієї можливої (випадкової) помилки, випадок веде гру. Виходить те, що встановив Дж. фон Нейман. Можна математично виразити гру перед її початком, ввівши імовірнісні переваги кожного з гравців.
Але можна і не володіти всіма даними ситуації. Такий випадок гри в карти, що ґрунтується на припущеннях і недостатній інформації. Таким чином, тут доводиться обирати серед множини ситуацій, чий результат відомий не повністю. В цьому випадку доводиться створювати гіпотези ймовірних результатів. Вибір в такій ситуації вводить нас, у свою чергу, в черговий потік ймовірностей. Хід такої гри: від ймовірності до ймовірності. Роблячи можливі припущення, складну ймовірність можна обчислювати з простішої ймовірності за формулою умовної ймовірності. Таким чином математично давно пояснено як мають себе вести кожен з ув´язнених в нашій дилемі ув´язнених , щоб досягти якнайкращого результату для себе. Якщо ж врахувати їх інструментальну та когнітивну раціональність, які б були доповнені моделлю ірраціональної дії, то, мабуть, ми отримали б ідеалізовану, але успішно працюючу модель раціональної поведінки в умовах конкуренції ринкових відносин. Доцільність використання старої моделі дилеми ув´язнених як інтерактивної ситуації та її доречність, як прикладу, в економічній теорії, на думку автора, читач визначить сам.
В даній статті автор намагався продемонструвати хибність методу раціональної дії, адже в повсякденному житті досить рідко трапляються ситуації, коли такий метод є доцільним. На «допомогу» раціональності може прийти не радикально, але суттєво інша ірраціональність, як це було показано на прикладі «дилеми ув´язнених». Поінформованість, якій занадто, на думку автора, велику увагу приділяють економісти, не завжди виявляється благом, адже поняття дезінформації, яке заполонило наше теперішнє суспільство, ніхто не відміняв. На майбутнє автором буде детально розроблена «модель ірраціональної дії», в основі якої лежатимуть основні принципи математичної теорії ігор, але диференційовані синергетично параметром порядку й управляючим параметром, який так і не змогли ввести економісти, бо не володіли достатньою математичною теоретичною базою, і який не захотіли ввести математики, бо не побачили в цьому переконливих математичних відкриттів. Головною ж метою статті було зацікавити цією темою і тих, і інших.
´Mas-Colell A., Whinston M.D., Green J.R. Microeconomic theory. N.Y.: Oxford Univ. Press, 1995; 2Лотов А.В. Введення до економіко - математичного моделювання. М.: Наука, 2000; 3Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970; 4Бли- нов А.Л. Синергетика коллективной иррациональности. 2006; 5Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970; 6Там само; 7Aumann R. J. Agreeing to disagree // The Annals of Statistics. 1976. Vol. 4. № 6. P. 1236 - 1239; 8Lewis D. Convention: a philosophical study. Cambridge: Harvard University Press, 1969; 9Aumann R.J. Agreeing to disagree // The Annals of Statistics. 1976. Vol. 4. № 6. P. 1236 - 1239; 10Lewis D. Convention: a philosophical study. Cambridge: Harvard University Press, 1969; “Новиков Д.А., Чхартишвили А.Г Рефлексивные игры. М.: СИНТЕГ, 2003; 12Блинов А.Л. Может ли этос науки стать этосом общества в целом? 2007. - В кн. Этос науки. М., 2008. С.295-316.
|
:
Філософія: конспект лекцій
Філософія глобальних проблем сучасності
Історія української філософії
Філософські проблеми гуманітарних наук (Збірка наукових праць)
Філософія: конспект лекцій : Збірник працьФілософія: конспект лекцій : Збірник праць