Gry z niekompletną informacją i ich Bayesowska równowaga Nasha

Gry z niekompletną informacją i ich Bayesowska równowaga Nasha

Grę w teorii gier opisuje się poprzez nazwanie jej uczestników – graczy; przedstawienie zasad, czyli rodzajów działań oraz reguł, zgodnie z którymi mogą się porozumiewać; ustalenie wysokości wypłat towarzyszących poszczególnym zachowaniom; określenie stopnia niepewności towarzyszącego podejmowanym decyzjom. Ostatni element (określenie stopnia niepewności) stanowi wyróżnik wyodrębniający gry z kompletną informacją, w których każdy gracz zna zbiory strategii i funkcje wypłat wszystkich graczy, oraz gry z niekompletną informacją; przy czym strategia jest rozumiana jako działania, jakie gracz może podejmować w każdej możliwej sytuacji (jego decyzje odnoszą się do konkretnej sytuacji).[1]

Przypadek gier z niekompletną informacją jest bliższy rzeczywistości ekonomicznej, dzięki czemu jest jednym z najintensywniej badanych obszarów teorii gier.[2] Popularyzację badań nad decyzjami agentów ekonomicznych w warunkach asymetrii informacji wymownie ilustruje fakt, że założenie o asymetryczności informacji, jaką dysponują podmioty ekonomiczne, jest (obok braku ich pełnej racjonalności) najważniejszym założeniem dynamicznie rozwijającego się nurtu ekonomii instytucjonalnej. Podejście do zrozumienia zachowań decydentów ekonomicznych stosowane w ekonomii instytucjonalnej może być opisane przy wykorzystaniu języka teorii gier. Jeden z najważniejszych przykładów stanowi teoria gier ewolucyjnych, odrzucająca nie tylko pełną racjonalność jednostek, ale także ich dostęp do doskonałej informacji. Dzięki odrzuceniu tych założeń teoria gier ewolucyjnych może analizować m.in. postawy altruistyczne w społeczeństwach (człowiek racjonalny i dysponujący pełną informacją podejmowałby w niektórych sytuacjach bardziej egoistyczne decyzje), a także opisywać ewolucję instytucji nieformalnych takich jak normy społeczne.[3] Jest to jedynie przykład ukazujący, jak istotne są badania decyzji ekonomicznych w warunkach asymetrii informacji.

Brak pełnej informacji odnosi się do zdarzeń losowych znajdujących się poza kontrolą graczy. Zdarzenia te są określane przez teoretyków terminem „posunięcia Natury” lub „typy”, przy czym określenie „typ” to takie zdarzenie losowe, które obserwuje pojedynczy gracz. Natura jest zaś graczem niestrategicznym, a do jej akcji nie jest przypisany określony motyw działania.[4]

Gry z niekompletną informacją są bliższe rzeczywistości chociażby w analizie wielu sytuacji handlowych: aukcji, przetargów, zawierania kontraktów itd.[5] Można je podzielić na statyczne i dynamiczne gry z niekompletną informacją. Przykładem gry statycznej może być aukcja, w której oferty cenowe są składane w zamkniętych kopertach („aukcja zalakowanych kopert”),[6] jak w przypadku systemu Vickreya, czyli aukcji drugiej ceny.[7] W dynamicznych grach z niekompletną informacją podejmowanie decyzji jest sekwencyjne, co oznacza, że gracz nr 1 jako pierwszy podejmuje decyzję, a gracz nr 2 robi to później, wiedząc, co wybrał gracz nr 1.[8]

Współcześnie istnieją dwie najważniejsze teorie niepewności: bayesowska, w myśl której gracze są w stanie przypisać subiektywne prawdopodobieństwo występowania nieznanych im typów innych graczy, a także niebayesowska, zgodnie z którą nie mogą tego zrobić. Amerykański ekonomista i matematyk, J. Harsányi, był zwolennikiem koncepcji bayesowskiej oraz przypisywania zjawiskom całkowicie niepewnym równego prawdopodobieństwa ich wystąpienia zgodnie z podejściem Laplace’a. W analizie gier z niekompletną informacją przydatna jest transformacja Harsányi’ego, przekształcająca gry z niekompletną informacją w gry z kompletną informacją i posunięciami losowymi dzięki założeniu, że typy poszczególnych graczy występują z pewnym określonym subiektywnym prawdopodobieństwem.[9]

Wykorzystanie koncepcji bayesowskiej umożliwia nie tylko uzyskanie gier z posunięciami losowymi, ale też wyznaczenie ich bayesowskich równowag Nasha. Gry te można analizować na dwa sposoby: 1) poprzez zbadanie warunków racjonalizowalności i wyznaczaniu równowag Nasha gier, które można przedstawić w postaci macierzowej – poszczególne typy danego gracza traktuje się wówczas jako warianty zachowania tego samego gracza; 2) poprzez traktowanie typów jednego gracza jako odrębnych graczy.[10] Zanim zostaną przytoczone przykłady gier o obydwu sposobach rozwiązania, zostanie przedstawione pojęcia zwykłej racjonalizowalności i równowagi Nasha.

Proces racjonalizowalności polega na iteracyjnym usuwaniu strategii ściśle zdominowanych (zawsze gorszych od jakiejś innej strategii niezależnie od wyboru strategii przez przeciwnika i niezależnie od zdarzeń losowych). Gracz, który wybiera strategie będące najlepszymi odpowiedziami przy jego ocenie, racjonalizuje wybór strategii. Zbiór strategii racjonalizowalnych to taki zbiór, który przetrwał po usunięciu strategii ściśle zdominowanych w procesie iterowanej eliminacji.[11] Pojęcie racjonalizowalności odnosi się jednak do silnego założenia, według którego oceny poszczególnych graczy są zgodne z faktycznym postępowaniem pozostałych.[12] Bliższe rzeczywistości są warunki strategicznej niepewności dotyczącej postępowania innych graczy. Niepewność ta utrudnia osiągnięcie optymalnego wyniku. Jej wyrazem jest problem koordynacji graczy.

Przykładem problemu koordynacji może być sytuacja, w której obaj gracze mogą uzyskać największą wypłatę, gdy współpracują (np. nad napisaniem książki we współautorstwie). Gdy jeden gracz zdecyduje się na odstąpienie od wspólnego pisania, napisze i wyda swoje rozdziały w formie artykułów (mogących funkcjonować jako odrębne publikacje), uzyska wyższą wypłatę, niż gracz, który zdecydował się pisać je od początku jako rozdziały książkowe w niewiedzy o tym, że drugi gracz postanowił odstąpić od umowy. Sytuacja została przedstawiona w poniższej tabeli. Jako wypłaty można przyjąć przykładowo liczbę punktów, jakie można zdobyć do stypendium za napisanie poszczególnych prac.

Tabela 1.

Odpowiedź na problem koordynacji stanowi kongruencja odnosząca się do gier, w których oczekiwania graczy są w jakiś sposób powiązane z działaniami innych graczy. Ze słabą kongruencją zbioru strategii mamy do czynienia, kiedy strategie, które go tworzą, są wzajemnie najlepsze (gdy dodatkowo nie istnieje żadna inna strategia nienależąca do tego zbioru, będąca najlepszą odpowiedzią na jedną ze strategii do niego należących – zbiór jest zamknięty ze względu na najlepsze odpowiedzi – to jest on kongruentny, nie tylko słabo kongruentny).[13]

Równowaga Nasha stanowi właśnie słabo kongruentny profil strategii, wolny od strategicznej niepewności. Pojęcie kongruencji jest powiązane ze ścisłą równowagą Nasha – sytuacji, w której strategie ją tworzące są jedynymi najlepszymi odpowiedziami na siebie nawzajem. Strategia Nasha być także ona definiowana jako para strategii, w której żadnemu graczowi nie opłaca się zmieniać swojej decyzji przy założeniu, że pozostali gracze nie zmienią swoich własnych decyzji. Profil strategii (s1*, s2*,…, sn*) jest równowagą Nasha w grze, w której uczestniczy n graczy, gdy dla każdego i (i=1, 2,…, n) strategia si* jest najlepszą możliwą strategią gracza i, gdy pozostali gracze wybierają strategie (s1*, s2*,…, si-1*, si+1*,…, sn*). Obowiązuje więc ui( s1*, s2*,…, si-1*, si*, si+1*,…, sn*) ⩾ ui(s1*, s2*,…, si-1*, si, si+1*,…, sn*), gdzie un jest funkcją wypłat gracza n.[14]

Równowagę Nasha w strategiach mieszanych można podzielić na równowagi w strategiach czystych (ściśle dominujących wybieranych z prawdopodobieństwem 1, zawsze lepszych od innych strategii niezależnie od wyboru strategii przez innych graczy) i ściśle mieszanych.[15]

Po przedstawieniu definicji zwykłej równowagi Nasha zostanie pokazany przykład gry z niekompletną informacją, którą można zapisać w postaci macierzowej – poszczególne typy danego gracza będą traktowane jako warianty zachowania tego samego gracza.

Własny przykład gry z niekompletną informacją, którą można wyrazić w postaci macierzowej, wraz z rozwiązaniem:

Zadanie dotyczy hiszpańskiej ekspedycji na terenie Meksyku i reakcji Azteków (Az) na pojawienie się przybyszów. Hiszpanie dzielą się na dwa typy: Konkwistadorów (Ko) i Kupców (Ku). Zarówno jeden, jak i drugi typ Hiszpanów po dotarciu do Mezoameryki może zdecydować się na dokonanie najazdu lub próbę nawiązania stosunków handlowych z tubylcami. Konkwistadorzy lepiej sobie radzą w walce niż Kupcy, którzy z kolei potrafią się bardziej dorobić na handlu. Aztekowie natomiast nie poznają typu Hiszpanów przed podjęciem przez tych działania, gdyż nie mieli z nimi dotychczas styczności. Mogą jedynie przybrać wobec odkrywców postawę agresywną lub przyjąć w swoim państwie niczym bogów i pozostać otwartymi na współpracę ufając w przepowiednię o przybyciu Quetzalcoatla w roku jednej trzciny.

Aztekowie mają więc cztery strategie:

  1. Zachować się agresywnie wobec przybyszów niezależnie od tego, jak tamci zachowają się po wylądowaniu, żeby następnie złożyć ich w ofierze. (AA)
  2. Odpowiedzieć agresją na próbę dokonania najazdu, lecz zachować się w sposób pokojowy, jeśli Hiszpanie nie podejmą wrogich działań, i nawiązać z nimi współpracę. (AP)
  3. W przypadku najazdu uznać, że Quetzalcoatl chce ich ukarać za złożenie zbyt małej ofiary i próbować udobruchać najeźdźców, zaś w przypadku próby nawiązania przez Hiszpanów stosunków handlowych zdecydować o braku ich boskości i konieczności złożenia z nich ofiar, które nakarmią słońce. (PA)
  4. Posłuchać się swojego Tlatoani i uznać przepowiednię o lądującym Quetzalcoatlu za pewnik – podjąć działania zmierzające do ugoszczenia przybyszów niezależnie od ich zachowania. (PP)

Hiszpanie niezależnie od tego, czy są Konkwistadorami, czy Kupcami mogą wybierać między dwiema strategiami: dokonaniem najazdu (N) lub próbą nawiązania stosunków handlowych (H).

Jeśli najazd Konkwistadorów spotka się z agresją Indian, wówczas będą w stanie uciec na statek i odpłynąć wraz z łupami, które przyniosą im wypłatę równą 3. Aztekowie natomiast uzyskają wypłatę wynoszącą 1, dzięki temu, że udało im się odeprzeć najeźdźców, a niewielką część złożyć w ofierze. W sytuacji, w której poddani Montezumy II nie odpowiedzą agresją, lecz próbą uspokojenia Konkwistadorów, zostaną dotkliwie najechani, a ich wypłata wyniesie 0. Wypłata Konkwistadorów wyniesie natomiast 6. Gdy najazdu spróbują Kupcy, nie będzie już tak łatwo – przegrają z agresywnymi Aztekami uzyskując wypłatę 0 (złożenie ich w ofierze da tym drugim wypłatę równą 2) lub ograbią pokojowo nastawionych Indian i odpłyną. Ich nieporadność w roli najeźdźców pozwoli im jedynie uzyskać wypłatę równą 2, a ich odpłynięcie będzie równoznaczne z uśmierzeniem gniewu Quetzalcoatla, co da Aztekom wypłatę 1.

Kupcy mogą też spróbować nawiązać stosunki handlowe z tubylcami. Jeśli jednak ci zareagują wrogo, pokonają Hiszpanów i złożą ich w ofierze, a ich satysfakcja pozwoli im uzyskać wypłatę wynoszącą 5. Wypłata Kupców wyniesie wtedy 0. Jeśli Aztekowie będą nastawieni w pokojowy sposób, to współpraca handlowa przyniesie obopólne korzyści oznaczające wypłatę równą 6 uzyskaną przez obie strony uczestniczące w handlu. Gdy Konkwistadorzy spróbują wywiązać współpracę handlową i natrafią na agresywną odpowiedź Indian, to przegrają mniej dotkliwie, ale ich brak satysfakcji przyniesie im zerową wypłatę, natomiast liczba złożonych w ofierze Europejczyków umożliwi tubylcom uzyskanie wypłaty równej 2. W przypadku, kiedy Konkwistadorzy nawiążą współpracę handlową dzięki przyjacielskiemu przyjęciu przez Azteków, obopólne korzyści przyniosą wypłatę równą 4 obu stronom.

W zadaniu należy dokonać transformacji tej gry na grę z posunięciem losowym i znaleźć jej Bayesowskie równowagi Nasha w strategiach ściśle mieszanych, dla prawdopodobieństwa p, że Hiszpan okaże się Konkwistadorem, równego ½.

Macierze wypłat gier, które mogą się rozegrać w zależności od tego, czy do Mezoameryki przybiją Konkwistadorzy, czy Kupcy, wyglądają następująco:

Tabela 2.

Tabela 3.

Rysunek nr 1 przedstawia drzewko decyzyjne (postać ekstensywną gry), które ułatwi zastosowanie transformacji Harsányi’ego.

Rysunek 1.

W poniższej tabeli (nr 4) pierwsza litera w nazwie strategii Hiszpanów oznacza działanie podjęte, gdy są Konkwistadorami, a druga, gdy są Kupcami. W zapisie zastosowano dwie litery, gdyż strategia musi być z definicji planem działania na całą grę.

Tabela 4.

Tabela 5. Macierz wypłat dla p=½.

Z tabeli nr 5 wynika, że Bayesowskie równowagi Nasha to pary strategii (NN, AA) oraz (NH, AP). Pierwsza para oznacza agresywną odpowiedź na hiszpański najazd niezależnie od tego, jaki typ Hiszpanów będzie go dokonywał, a z perspektywy przybyszów: zdecydowanie się na najazd niezależny od tego, czy są oni Konkwistadorami, czy Kupcami. Druga para oznacza zaś, że zarówno Konkwistadorzy, jak i Kupcy decydują się na akcje wychodzącą im najlepiej (odpowiednio najazd i próbę rozpoczęcia handlu), natomiast Aztekowie odpowiadają agresją na obcy atak i pokojowym nastawieniem na próbę nawiązania stosunków handlowych.

Jeśli w powyższym zadaniu założymy, że Aztekowie wiedzą, że mogą zostać najechani lub że przybysze będą chcieli z nimi nawiązać współpracę handlową, to będzie to gra, w której nieznane dla Indian są jedynie funkcje wypłat Hiszpanów – niepewność co do funkcji wypłat innych graczy. Istnieją jednak gry, w których gracze nie znają także wszystkich strategii pozostałych graczy – występuje niepewność co do zbioru strategii innych graczy. Przykładowo w grze mógłby się pojawić jeszcze jeden typ Hiszpanów – Jezuici, którzy oprócz najazdu i próby nawiązania relacji handlowych mogą też spróbować założyć misyjne osiedla (Aztekowie spodziewaliby się jednak ze strony Hiszpanów jedynie najazdu lub próby zapoczątkowania handlu). Wówczas tabele nr 1 i 2 należałoby przedłużyć o dodatkowy wiersz z nową strategią.

Własny przykład gry z niekompletną informacją, której nie można wyrazić w postaci macierzowej, wraz z rozwiązaniem:

Rozważmy model duopolu Cournota (rywalizacja między firmami następuje poprzez zmianę wielkości produkcji), w której odwrócona funkcja popytu jest dana wzorem P(Q)=2-Q, gdzie Q=q1+q2 oznacza zagregowaną produkcję dwóch firm – graczy. Załóżmy, że funkcja kosztów pierwszej firmy wynosi C1(q1)=3. Funkcja kosztów drugiej firmy wynosi C2(q2)=2q2 z prawdopodobieństwem równym ⅓ i C2’(q2)=3q2 z prawdopodobieństwem równym ⅔. Pierwsza firma zna jedynie wartości tych prawdopodobieństw. Nie wie jednak, jakiego faktycznie typu jest firma druga. Pamiętając, że przy danej funkcji kosztów C(q)=c*q wzór na wartość zysku firmy k w modelu Curnota wynosi Πk=qk*[(1–qk–qk)–c],[16] możemy obliczyć wypłaty oraz funkcje reakcji (funkcje najlepszych odpowiedzi) poszczególnych firm (graczy).

Wypłata firmy drugiej typu pierwszego:

u2 = (2-q1-q2)q2-2q2

Wypłata firmy drugiej typu drugiego:

u2’ = (2-q1-q2’)q2’-3q2

Wypłata firmy pierwszej:

u1 = [(2-q1-q2)q1]*(⅓)+[(2-q1-q2’)q1]*(⅔) = (2-q1-⅓q2-⅔q2’)q1

Funkcja reakcji firmy drugiej typu pierwszego:

R2: q2=-½q1

Funkcja reakcji firmy drugiej typu drugiego:

R2’: q2’=-½-½q1

Funkcja reakcji firmy pierwszej:

R1: q1=1-⅙q2-⅓q2

Po rozwiązaniu układu równań złożonego z funkcji reakcji graczy otrzymujemy Bayesowską równowagę Nasha złożoną z następujących strategii produkcyjnych: q1=(14/9), q2=(-7/9), q2’=(-23/18).

Przykład dynamicznych gier z niekompletną informacją stanowią gry z sygnałami. W tych grach relacja między graczami będzie przebiegała na linii Nadawca sygnału – Odbiorca sygnału. Są one szeroko wykorzystywane w ekonomii, przykładowo w grach, w których graczami są inwestor i firma chcąca przyciągnąć inwestycje, czy też pracownik i rynek potencjalnych pracodawców. W grze z sygnałami początkowo Natura określa stan świata, czyli typ Nadawcy sygnału (znany jedynie jemu), następnie zależnie od stanu świata Nadawca wysyła sygnał Odbiorcy, który w zależności od jego specyfiki podejmuję akcję decydującą o wypłatach obu graczy. Gracze chcą zmaksymalizować swoje wypłaty.

Zbiór wszystkich stanów natury (typ Gracza 1, czyli Nadawcy) można oznaczyć jako T = {t1, t2,…, tn}, zbiór możliwych sygnałów Nadawcy jako M = {m1, m2,…, mn}, a zbiór możliwych akcji (reakcji) Odbiorcy jako A = {a1, a2,…, an}. Wypłaty, do których maksymalizacji dążą gracze, można przedstawić jako funkcje użyteczności UN(ti, mj, ak), UO(ti, mj, ak), gdzie ti, mj, ak składają się na zaistniałą sytuację warunkującą wysokość wypłat. Skoro strategie stanowią działania, jakie gracze mogą podejmować w każdej możliwej sytuacji, należy też odpowiednio nazwać strategie.

Dla prostej gry, w której T = {t1, t2}, M = {m1, m2}, A = {a1, a2}, można wyróżnić cztery strategie czyste: strategię łączącą Nadawcy (w której wysyła on ten sam sygnał niezależnie od stanu świata); strategię łączącą Odbiorcy (w której reaguje on na sygnał w ten sam sposób niezależnie od jego rodzaju); strategię separującą Nadawcy (przyporządkowującą do każdego stanu świata z prawdopodobieństwem 1 dokładnie jeden sygnał – odmienny dla poszczególnych stanów świata); strategię separującą Odbiorcy (przyporządkowującą do każdego sygnału z prawdopodobieństwem 1 dokładnie jedną akcję – odmienną dla poszczególnych sygnałów). Strategia całkowicie łącząca to taka, w której zarówno jeden, jak i drugi gracz grają strategię łączącą. Warto zaznaczyć, że dla gier bardziej skomplikowanych strategii prostych jest więcej (występują wtedy przykładowo strategie pół-łączące i pół-separujące). Strategie czyste mogą okazać się niewystarczające do maksymalizacji zysku, stąd w grach z sygnałami ma również zastosowanie pojęcie strategii mieszanych – przyjmujących wartości z przedziału (0, 1).

Ostateczną wypłatę stanowią wartości oczekiwane względem rozkładu prawdopodobieństwa na T. Dwie strategie tworzą punkt równowagi, kiedy przy ustalonej strategii jednego z graczy, zmiana strategii drugiego nie może doprowadzić do podwyższenia jego wypłaty. Równowaga Nasha występuje dla pary strategii, w których każdy gracz wybiera odpowiedź optymalną na oczekiwaną przez niego strategię innego gracza (w przypadku dwóch graczy).[17] Gdy nie istnieje para strategii czystych gwarantująca uczestnikom gry maksymalne wypłaty, to równowagi Nasha trzeba szukać wśród strategii mieszanych.

Własny przykład gry z sygnałami wraz z rozwiązaniem:

Rozważmy grę z sygnałami dotyczącą międzynarodowych porozumień handlowych w krajach rozwijających się. Nadawcą typu pierwszego (t1) jest Togo, a Nadawca typu drugiego (t2) to Indie. Odbiorcą sygnału jest Burkina Faso. Togo i Burkina Faso są eksporterami orzechów kokosowych, nerkowca i brazylijskich, natomiast Indie to drugi po Stanach Zjednoczonych światowy importer tych towarów.[18] Sygnały Nadawcy sprowadzają się do działań zmierzających do ograniczenia światowej wymiany handlowej w obrocie orzechami w dążeniu do stabilizacji ich światowych cen (sygnał O) lub zaniechaniu takich działań (sygnał NO). Togo może zagrać swój sygnał dzięki ograniczeniu ilości eksportowanych orzechów w celu ustanowienia kwot eksportowych na ten towar.[19] Decydenci hinduscy mogą zmierzać do stabilizacji cen poprzez ograniczenie importu. Takie zagranie oznacza chęć stworzenia przez Indie systemu zapasów buforowych.[20] Nadawca obu typów wysyła propozycję współpracy decydentowi z Burkiny Faso przekazując informację jedynie o tym, czy zostały podjęte działania mające na celu ograniczenie wymiany handlowej. Burkina Faso może podobnie jak Togo ograniczać swój eksport orzechów przystając na propozycję (Og) lub nie podejmować tego działania i na nią nie przystać (NOg). Przyjmijmy, że decydent w Burkinie Faso nie wie, jaki kraj wytacza propozycję współpracy, gdyż zarówno Togo, jak i Indie mają powody do obaw, że ten niepewny rodzaj porozumienia handlowego nie doprowadzi do oczekiwanych rezultatów i nie informują, że są autorami propozycji. Przyjmijmy też, że decydent wie na podstawie doświadczeń, że szanse na pochodzenie propozycji z sąsiedniego Toga lub z Indii rozkładają się po równo. Ponadto Burkina Faso może sama zdecydować o ograniczeniu eksportu, nawet gdy nie dostaje żadnej propozycji, co w niektórych warunkach, opisanych w dalszej części zadania, może się dla niej okazać opłacalne.

Jeśli Natura zadecyduje o tym, że Graczem nr 1 jest Togo i oba afrykańskie kraje pozostaną bierne, czyli Togo wybierze NO, a akcją Burkiny Faso będzie NOg, to wypłaty obu państw wyniosą kolejno 2 i 3 – Burkina Faso jest nieco ważniejszym eksporterem orzechów kokosowych, nerkowca i brazylijskich[21] i tak wyglądają dotychczasowe korzyści z wymiany. Jeśli Burkina Faso zadecyduje o ograniczeniu własnego eksportu przy braku tego działania ze strony Toga, to straci ona całą wypłatę przez brak współpracy. Podobnie Togo straci swoją wypłatę w przypadku samotnego ograniczenia eksportu (braku reakcji sąsiedniego kraju po odbiorze propozycji współpracy). Jeśli natomiast Burkina Faso przystanie na ofertę współpracy i odpowie na ograniczenie eksportu czyniąc to samo, to wystarczy to do utworzenia systemu kwot eksportowych i wpłynięcia na światowe ceny orzechów, a wypłaty obu krajów wzrosną o jednostkę w stosunku do niepodejmowania żadnych działań – wyniosą odpowiednio 3 i 4 dla Toga i Burkiny Faso.

W przypadku gdy Indie (t2) okażą się Graczem nr 1 i nie podejmą działań mających na celu utworzenie systemu zapasów buforowych, a jednocześnie Burkina Faso nie ograniczy eksportu, to wypłaty obu krajów będą zerowe, co odzwierciedla sytuację wyjściową (brak zapasów buforowych). Gdy jedynie Burkina Faso zdecyduje się podjąć działania ograniczające handel orzechami, to relacja wypłat (równa 3 do 2) stanie się korzystniejsza dla Indii, które są ważniejszym importerem w skali świata, niż Burkina Faso eksporterem. Obie wypłaty wzrosną wówczas, gdyż w wyniku zagrania Og przez państwo afrykańskie powstał pewien zapas buforowy. Kiedy Indie dadzą sygnał O, a odpowiedzią Burkiny Faso będzie NOg, to Indie, posiadające znaczny wpływ na ceny światowe, zyskają niepodzielny wpływ na stabilizację cen orzechów i wypłata o wysokości 5, płynąca z utworzenia zapasu buforowego, przypadnie tylko im. Rozważmy ostatnią możliwość, w której Nadawca, czyli Indie, gra O, a Odbiorca, czyli Burkina Faso, reaguje działaniem w postaci Og. Wówczas wyższy wzrost wypłaty w stosunku do sytuacji wyjściowej otrzyma kraj afrykański, który dzięki decyzji administracyjnej (umowie z Indiami) może wywierać wpływ na sprzedaż i zakupy interwencyjne orzechów w ramach powstałego systemu zapasów buforowych mimo relatywnie małego wpływu na ceny światowe w stosunku do gospodarki hinduskiej. Wzrost łącznej wypłaty graczy do 6 odzwierciedla podwójne działanie prowadzące do utworzenia zapasu buforowego. Z całkowitej wypłaty 2 jednostki przypadły Indiom, a 4 Burkinie Faso.

W celu uogólnienia rozwiązania zadania zostały zmodyfikowane niektóre oznaczenia. Oznaczenia wykorzystane w rozwiązaniu przedstawiają się następująco:

Nadawca typu pierwszego (Togo) – t1

Nadawca typu drugiego (Indie) – t2

Strategia Nadawcy nieograniczająca handlu orzechami – NO → L (Lewo)

Strategia Nadawcy ograniczająca handel orzechami – O → P (Prawo)

Odbiorca (Burkina Faso) – Odbiorca

Strategia Odbiorcy nieograniczająca handlu orzechami – NOg → g (góra)

Strategia Odbiorcy ograniczająca handel orzechami – Og → d (dół)

Wynikające z oczekiwań Odbiorcy prawdopodobieństwo, że Nadawca okaże się być typu pierwszego po zagraniu L – p

Wynikające z oczekiwań Odbiorcy prawdopodobieństwo, że Nadawca okaże się być typu pierwszego po zagraniu P – q

Poniższy rysunek pokazuje poszczególne wypłaty (odpowiednio Gracza nr 1 i Gracza nr 2) w zależności od wysłanych sygnałów i reakcji na nie.

Rysunek 2.

Dla strategii łączącej Nadawcy (L, L), czyli takiej, w której gra on Lewo niezależnie od swojego typu, oczekiwania Odbiorcy (p, 1-p) co do typu Nadawcy zależą od jego strategii i wyznaczane są według reguły Bayesa. Przyjmując p=0,5 najlepszą odpowiedzią na L jest góra, przy której Nadawca typu pierwszego i drugiego otrzymałby odpowiednio wypłatę 2 i 0. Do znalezienia równowagi należy jeszcze sprawdzić, jak Odbiorca zareagowałby na zagranie P przez Nadawcę. Odbiorca nie odpowie poprzez g, gdyż niezależnie od jego oczekiwań dotyczących stanu świata wyższą wypłatę przyniesie mu akcja d. Gdy Odbiorca odpowie na P wyborem d, to wypłata t1 i t2 wyniesie odpowiednio 3 i 2 (dla wyboru L i odpowiedzi g wynosiła ona kolejno 2 i 0). Nie będzie więc Bayesowskiej równowagi, w której Nadawca gra (L, L).

W przypadku strategii łączącej Nadawcy (P, P) Odbiorca zagra dół niezależnie od wartości q, a wypłaty dwóch typów Nadawcy wyniosą odpowiednio 3 i 2 – jak przed chwilą zauważono. Hipotetyczne zagranie L przez Nadawcę i reakcja Odbiorcy w postaci g przyniosłyby Nadawcy typu pierwszego i drugiego wypłaty równe 2 oraz 0. W przypadku reakcji d analogiczne wypłaty wyniosłyby kolejno 2 oraz 3, przy czym wypłata 3 przekracza wypłatę Nadawcy typu drugiego, jaką otrzymałby z zagrania P (równą 2). Z tego wynika, że równowaga dla strategii łączącej (P, P) istnieje, jeśli Odbiorca w swojej strategii zamierza odpowiedzieć akcją g na sygnał L – jego strategią jest wówczas (g, d), gdzie pierwsza litera stanowi odpowiedź na zaobserwowanie sygnału Gracza nr 1 typu pierwszego (L), a druga – sygnału Gracza nr 1 typu drugiego (P). Reakcja g po odbiorze sygnału L nie jest jednak optymalna dla Odbiorcy zawsze, lecz jedynie dla p⩾⅖. Stąd para strategii [(P, P), (g, d), p, q=1/2] stanowi tzw. doskonałą łączącą Bayesowską równowagę[22] dla każdego p⩾⅖.

Rozważmy strategię separującą Nadawcy (L, P). Dla strategii separującej oczekiwania Odbiorcy cechują się jego pewnością co do typu Nadawcy – sygnał zdradza typ. Dla tej konkretnej strategii wynoszą one p=1, q=0. Ponadto najlepsze reakcje Odbiorcy tworzą strategię (g, d). Należy teraz sprawdzić, czy wówczas strategia Nadawcy jest optymalna. Jeśli pierwszy jego typ (t1) wybierze P zamiast L, to Odbiorca odpowie akcją d, która przyniesie Nadawcy wypłatę 3, czyli więcej niż w przypadku zagrania L. Strategia (L, P) nie wchodzi więc w skład Bayesowskiej równowagi.

Gdy strategię separującą Nadawcy stanowi (P, L), to oczekiwania Odbiorcy przedstawiają się następująco: p=0, q=1. Optymalną strategią jest dla niego wówczas (d, d). Jeśli Nadawca t1 odstąpiłby od swojej strategii grając L, to dla reakcji d (Gracz nr 2 nie zmienia swojej strategii) jego wypłata zmniejszyłaby się do 2 z 3. Jeśli zaś Nadawca t2 wybrałby P zamiast L, to (przy odpowiedzi d Odbiorcy) otrzymałby wypłatę 2 zamiast trójki, jaka przypadłaby mu w przypadku braku dewiacji. Oznacza to, że [(P, L), (d, d), p=0, q=1] stanowi doskonałą separującą Bayesowską równowagę.

Wracając do konkretnego przykładu związanego z międzynarodowymi porozumieniami handlowymi w krajach rozwijających się, z rozwiązania można odczytać, że równowaga została ustalona w przypadku próby ograniczenia handlu orzechami zarówno przez Togo, jak i przez Indie połączonej z reakcją Burkiny Faso, która nie prowadzi do stworzenia systemu kwot eksportowych z sąsiadem, ale jednocześnie zmierza do utworzenia systemu zapasów buforowych z Indiami, jeśli tylko prawdopodobieństwo (wynikające z oczekiwań Burkiny Faso), że Nadawcą nieograniczającym handlu jest Togo, będzie niemniejsze niż ⅖.

Druga równowaga odnosi się do sytuacji, w której Nadawca, jeśli jest Togiem, ogranicza eksport orzechów kokosowych, nerkowca i brazylijskich, a kiedy jest Indiami – nie ogranicza ich importu. Jednocześnie strategią Burkiny Faso jest ograniczanie eksportu niezależnie od otrzymanego sygnału. Ponadto po sygnale Odbiorca jest pewien co do typu Gracza nr 1 dzięki znajomości jego strategii wynikającej z reguł gry.

  1. Biorąc pod uwagę kryterium niepewności informacji gry można także podzielić na gry z doskonałą (pełną) informacją, w których każdy gracz zna nie tylko zbiory strategii i funkcje wypłat wszystkich graczy, ale też wcześniejsze decyzje zarówno swoje, jak i pozostałych graczy, oraz niedoskonałą informacją (Notatka własna z zajęć Wstępu do teorii gier.).
  2. M. Malawski, A. Wieczorek, H. Sosnowska: Konkurencja i kooperacja. Teoria gier w ekonomii i naukach społecznych. PWN, Warszawa 2004, str. 79.
  3. M. G. Villena, M. J. Villena: Evolutionary Game Theory and Thorstein Veblen’s Evolutionary Economics: Is EGT Veblenian? “Journal of Economic Issues”, vol. 38, no. 3, 2004, str. 602-603.
  4. J.Watson: Strategia. Wprowadzenie do teorii gier. Walters Kluwer, Warszawa 2011, str. 309-310.
  5. Ibid., str. 310.
  6. R. Gibbons: Game Theory for Applied Economists. Princeton University Press, Princeton 1992, str. 143.
  7. Cf. M. Rothkopf, R. Harstad: Two Models of Bid-Taker Cheating in Vickrey Auctions. The Journal of Business, vol. 68, no. 2, 1995, str. 257–267.
  8. Notatka własna z zajęć Wstępu do teorii gier.
  9. F. Kandil: La justice est aveugle: Rawls, Harsanyi et le voile d’ignorance, « Revue économique », 65(1), 2014, str. 97-124.
  10. J.Watson: Strategia. Wprowadzenie do teorii gier. Walters Kluwer, Warszawa 2011, str. 333.
  11. Ibid., str. 82-84.
  12. Ibid., str. 104.
  13. Ibid., str. 106-107.
  14. Notatka własna z zajęć Wstępu do teorii gier.
  15. Ibid.
  16. R. Gibbons: Game Theory for Applied Economists. Princeton University Press, Princeton 1992, str. 144.
  17. R. Gibbons: Game Theory for Applied Economists. Princeton University Press, Princeton 1992, str. 183-190.
  18. Łączny hinduski import orzechów kokosowych, nerkowca i brazylijskich stanowił w 2017 roku 17% importu światowego, a amerykański 21%, dane z bazy The Observatory of Economic Complexity: https://oec.world/en/visualize/tree_map/hs92/export/all/show/0801/2017/, dostęp: 17 października 2019.
  19. Cf. A. Budnikowski: Ekonomia międzynarodowa. PWE, Warszawa 2017, str. 410-412.
  20. Ibid, str. 412.
  21. Całkowita wartość eksportu orzechów kokosowych, nerkowca i brazylijskich z Burkiny Faso wynosiła 53,8 mln dolarów amerykańskich, a eksportu togijskiego 26,9 mln dolarów w 2017 roku, dane z bazy The Observatory of Economic Complexity: https://oec.world/en/visualize/tree_map/hs92/import/all/show/0801/2017/, dostęp: 18 października 2019.
  22. Cf. R. Gibbons: Game Theory for Applied Economists. Princeton University Press, Princeton 1992, str. 187-188.
Comments are closed.