Teoria gier i jej zastosowanie w badaniach ekonomicznych
Podmioty ekonomiczne oddziałują strategicznie na siebie na wiele różnych sposobów. Do
analizy wielu z nich używany jest aparat teorii gier. Teoria gier skupia się na ogólnej analizie
wzajemnych strategicznych oddziaływań. Może być wykorzystywana do badania gier
salonowych,
negocjacji
politycznych
i
zachowania
ekonomicznego.
W
badaniach
ekonomicznych teoria gier wykorzystywana jest np. do analizy ekonomicznego funkcjonowania
rynku oligopolistycznego.
Gracz to najczęściej pojedynczy „osobnik”, który świadomie podejmuje decyzje najbardziej dla
siebie korzystne w sposób niezależny od tego, co robią pozostali gracze.
Wzajemne oddziaływanie strategiczne (strategiczna interakcja) może dotyczyć wielu graczy
i wielu strategii. Efekty gry przedstawiane są w postaci macierzy wypłat.
Przykład gry
Dwie osoby prowadzą prostą grę, w której osoba A będzie pisała jeden z dwóch wyrazów na
kawałku papieru, „góra” lub „dół". Jednocześnie osoba B, również na kawałku papieru,
niezależnie od tego będzie pisała „lewa" lub „prawa". Potem kartki papieru zostaną sprawdzone i
każdy z uczestników otrzyma nagrodę, tak jak przedstawiono w poniższej tabeli. Jeśli A napisał
„góra", a B „lewa", to sprawdzamy górny lewy róg macierzy (wypłatą dla A jest l, dla B jest 2).
Jeśli A napisał „dół", a B „prawa" , to A otrzyma l, a B otrzyma 2. Osoba A ma dwie strategie:
może wybrać „górę" albo „dół". Strategie te mogą reprezentować takie wybory ekonomiczne, jak
„podnieś cenę" albo „obniż cenę".
Macierz wypłat gry
Gracz B
Lewa
Prawa
.
Góra
1,2
0, 1
Gracz A Dół
2, 1
1,0
Wynik gry jest następujący: z punktu widzenia osoby A zawsze lepiej jest napisać „dół",
ponieważ wypłaty dla niej przy tym wyborze (2 albo 1) są zawsze większe niż wygrane na
„górze” (l albo 2). Podobnie dla gracza B zawsze lepiej jest napisać „lewa", bo 2 i 1 dominuje
nad l i 0. Tak więc strategią dla A jest „dół", a dla B „góra". W takim przypadku mamy strategię
dominującą, tzn. istnieje jedna optymalna strategia dla każdego z graczy, niezależnie od tego co
zrobi drugi gracz. Jakiegokolwiek wyboru dokona gracz B, gracz A otrzyma wyższe wypłaty,
jeśli zagra „dół", i jakiegokolwiek wyboru dokona gracz A, gracz B osiągnie wyższą wypłatę,
jeśli zagra „lewa". Ten wybór dominuje nad innymi możliwościami. Jeśli w jakiejś grze
występuje strategia dominująca dla każdego gracza, to możemy przewidywać, że będzie ona
stanem równowagi w tej grze. Dzieje się tak dlatego, że strategia dominująca jest strategią
najlepszą, niezależnie od tego, co zrobi drugi gracz. Równowaga w tym przykładzie wystąpi, jeśli
A zagra „dół", otrzymując wypłatę 2 a B gra „lewa", otrzymując wypłatę 1.
Stany równowagi ze strategiami dominującymi nie zdarzają się zbyt często. Gra przedstawiona
poniżej nie ma stanu równowagi cechującego się strategią dominującą.
Równowaga Nasha
Gracz B
Lewa
Prawa
2,1
0,0
Góra
Gracz A Dół
0,0
1,2
Wówczas, gdy gracz B wybiera „lewa", wypłaty dla A wynoszą 2 albo 0. Kiedy B wybiera
„prawa", to wypłaty dla A wynoszą O albo 1. Oznacza to, że kiedy B wybiera „lewa", to A
chciałby wybrać „górę"; a kiedy B wybiera „prawa” A chciałby wybrać „dół". Optymalny wybór
A zależy zatem od tego, jakiego spodziewa się posunięcia ze strony B. Sytuacja, w której wariant
wyboru A jest optymalny przy danym wyborze B oraz wybór dokonany przez B jest optymalny
przy danym wyborze A nazywana jest równowagą Nasha.
W rozgrywanych grach żadna z osób nie wie, co zrobi druga, kiedy dokonuje wyboru własnej
strategii. Każda osoba jednak ma pewne oczekiwania co do tego, jaki będzie wybór dokonany
przez drugą osobę. Równowaga Nasha może być więc interpretowana jako para oczekiwań
dotyczących wyborów dokonywanych przez każdą z osób, tylko, że kiedy wybór dokonywany
przez drugą osobę zostaje ujawniony, żadna ze stron nie chce zmieniać swojego zachowania.
W grze może wystąpić więcej niż jeden stan równowagi. W powyższej tablicy wariant „dół",
„prawa" także stanowi stan równowagi Nasha. Gra ta ma też symetryczną budowę: wypłaty dla B
są takie same przy jednym wyniku, jak wypłaty dla A przy drugim.
Istnieją gry, które nie mają w ogóle stanu równowagi Nasha (tabela poniżej). Jeśli gracz A stawia
na „górę", to gracz B chce grać „lewa", ale kiedy gracz B gra „lewa", to gracz A chce „dół".
Podobnie, jeśli gracz A stawia na „dół", to B zagra „prawa". Ale jeśli B gra „prawa", to gracz A
postawi na „górę".
Gra bez stanu równowagi Nasha (strategie czyste)
Gracz B
Lewa Prawa
0,0
0,-1
Góra
Gracz A
1,0
-1,3
Dół
Jeśli podmiot dokonywał jednego wyboru i trwał przy nim to taką sytuację nazywamy strategią
czystą. Jeśli podmiot przypisuje jakieś prawdopodobieństwo każdemu wariantowi i podejmuje
wybór zgodnie z tym prawdopodobieństwem to taka strategię nazywamy strategią mieszaną (np.
jeśli gracz A stawiałby na „górę" przez 50% czasu i na „dół" przez 50% czasu, podczas gdy B
grałby „lewy" przez 50% czasu i „prawy" przez 50% czasu).
Dylemat więźnia
Gra ze stanem równowagi Nasha niekoniecznie musi prowadzić do wyników efektywnych
w rozumieniu Pareta. Gra taka znana jest jako dylemat więźnia. Zarys sytuacji: w oddzielnych
pokojach przesłuchiwano dwóch więźniów, którzy byli współuczestnikami przestępstwa. Każdy
więzień miał wybór: przyznać się do przestępstwa i w konsekwencji uwikłać w nie wspólnika
albo wyprzeć się udziału przestępstwie. Gdyby przyznał się tylko jeden więzień, zostałby
uwolniony, a drugi oskarżony i skazany na sześć miesięcy więzienia. Gdyby obaj nie przyznali
się do winy, to byliby przetrzymani przez miesiąc w areszcie. Gdyby zaś obydwaj przyznali się,
to otrzymaliby wyrok 3-miesięczny. Macierz przedstawiająca wynik tej gry w postaci ujemnych
wartości długości wyroku przedstawiona jest poniżej.
Gracz B
Przyznać się Nie przyznać się
Gracz A
Przyznać się
-3, -3
0, -6
Nie przyznać się
-6, 0
-1, -1
Jeśli postawimy się w sytuacji gracza A i B postanowimy się nie przyznawać, to będziemy
w znacznie lepszej sytuacji, jeśli się jednak przyznamy, ponieważ zostaniemy uwolnieni.
Podobnie jeśli gracz B się przyzna, to będziemy w lepszej sytuacji jeśli się przyznamy, ponieważ
zostaniemy skazani jedynie na 3 miesiące a nie na 6. Niezależnie od tego co uczyni gracz B, A
zrobi lepiej przyznając się do winy. To samo dotyczy gracza B - on również znajdzie się
w lepszej sytuacji przyznając się. Jedynym stanem równowagi Nasha dla obu więźniów jest
przyznanie się do winy. Jest równowaga przy dominującej strategii, ponieważ każdy gracz ma
optymalny wybór, niezależnie od strategii drugiego.
Gdyby jednak obydwaj mogli „pójść w zaparte", obydwaj byliby w lepszej sytuacji. Gdyby byli
pewni, że drugi się nie przyzna, i uzgodniliby podtrzymywanie się nawzajem, to każdy z nich
otrzymałby wypłatę -l, która byłaby dla każdego z nich lepsza. Strategia „nie przyznać się", „nie
przyznać się" jest efektywna w rozumieniu Pareta - nie istnieje inna strategia wyboru, przy której
sytuacja obydwu graczy byłaby lepsza. Problem polega na tym, że nie ma sposobu, by dwaj
więźniowie skoordynowali swoje działania. Gdyby sobie nawzajem ufali, obydwaj mogliby
poprawić swoją sytuację.
Dylemat więźnia stosuje się do szerokiego zakresu zjawisk ekonomicznych i politycznych.
Możemy np. rozważać problem oszukiwania w kartelu i interpretować „przyznać się" jako
„produkować więcej, niż dopuszcza porozumienie", a „nie przyznać się" jako „trwać przy
wyznaczonej ilości". Jeżeli sądzimy, że inna firma ma zamiar trwać przy swoim kontyngencie,
opłaca się nam wytwarzać więcej, niż wynosi przyznany kontyngent. Jeśli zaś myślimy, że druga
firma przekroczy limit, to my również zrobimy tak samo. Jeśli gra ma się odbyć jedynie raz , to
strategia zdrady wydaje się rozsądna.
Gry powtarzalne
Jeśli gra „dylemat więźnia" ma być powtarzana wiele razy, to przed każdym z graczy otwierają
się nowe możliwości strategiczne. Jeśli drugi gracz wybiera zdradzieckie posunięcie w pierwszej
rundzie, to pierwszy w następnej rundzie może także zagrać zdradziecko i „ukarać" przeciwnika.
W grze powtarzalnej każdy z graczy ma możliwość ustalenia swojej reputacji o skłonności do
kooperacji i w ten sposób może zachęcać innych graczy do uczynienia tego samego. Wynik
rozgrywki zależy od tego, czy gra będzie prowadzona ustaloną liczbę razy, czy nieskończoną.
Jeśli gra odbędzie się np. 10 razy, to w rundzie 10 (ostatniej), wydaje się prawdopodobne, że
każdy z graczy wybierze strategię dominującą w równowadze i zdradzi, ponieważ granie po raz
ostatni jest podobne do grania jeden raz. Skoro każdy z graczy zdradzi w rundzie 10, dlaczego
miałby kooperować w 9? Jeśli będzie skłonny do współpracy, to drugi może i tak zdradzić
i wykorzystać sytuację. Każdy z graczy może rozumować w ten sam sposób, a zatem zdradzi.
Podobnie będzie w rundzie 8, 7... itd. Jeśli gra ma znaną, ustaloną liczbę rund, to każdy z graczy
będzie zdradzał w każdej rundzie. Jeśli nie ma sposobu wymuszenia kooperacji w ostatniej
rundzie, to nie będzie sposobu wymuszenia kooperacji w poprzednich rundach.
Jeśli gra ma być powtarzana nieskończoną liczbę razy, to gracz ma sposób wpływania na
zachowanie przeciwnika: jeśli przeciwnik odrzuca kooperację, to gracz może odrzucić ją
następnym razem. Jeśli obie strony troszczą się o przyszłe wypłaty, to groźba zerwania
współpracy w przyszłości może wystarczyć do grania według strategii efektywnej w rozumieniu
Pareta. W takim przypadku strategią wygrywająca (z najwyższymi łącznymi wypłatami) jest
strategia nazywana „wet za wet", która przebiega następująco: w pierwszej rundzie gracze
kooperują, w każdej następnej rundzie, jeśli przeciwnik współpracował w poprzedniej, gracz
kooperuje, jeśli przeciwnik zdradził w poprzedniej, gracz zdradza w następnej, czyli to co
przeciwnik zrobił w poprzedniej gracz robi w bieżącej.
Struktura macierzy wypłat w dylemacie więźnia jest taka sama jak w grze duopolowej przy
ustalaniu ceny. Jeśli każda z firm pobiera wysoki ceny, to obydwie osiągają wysokie zyski (obie
współpracują aby utrzymać wyniki monopolowe). Jeśli jednak jedna pobiera wysokie ceny, to
drugiej opłaca się obniżyć nieco cenę, przejąć rynek pierwszej i zwiększyć zyski. Jeśli obie
obniżają ceny to obie osiągają niskie zyski. Jeśli gra jest powtarzana nieskończoną liczbę razy
i gramy „wet za wet" to każdy z graczy będzie obawiał się obniżenia ceny i rozpoczęcia wojny
cenowej. Uważa się, że rzeczywiste kartele stosują czasami takie strategie.
Gry sekwencyjne
Gry, w których jeden z graczy wykonuje posunięcie jako pierwszy a drugi odpowiada na nie
nazywamy grami sekwencyjnymi. Gracz A wybiera „górę" albo „dół", potem gracz B wybiera
„lewa" albo „prawa" (B wie co zrobił A). Jeśli gracz A wybrał „górę", to nie ma znaczenia, co
zrobi B, bo wypłata będzie i tak (l, 9). Jeśli A wybrał „dół", to B wybierze „prawa", bo wypłata
wyniesie (2,1). Dla A rozsądnym wyborem jest „dół". Z punktu widzenia gracza B jest to
niekorzystne bo kończy z wypłatą l, a nie 9. Gracz B może zagrozić, że zagra „lewa", jeśli A
zagra „dół". Jeśli A sądzi, że B faktycznie wykona groźbę, powinien zagrać „góra", co da mu l,
a nie O przy wykonaniu groźby.
Gra sekwencyjna
Gracz B
Lewa Prawa
Gracz A Góra
1, 9
1, 9
0, 0
2, 1
Dół
Gra sekwencyjna opisuje sytuację, w której monopolista staje wobec groźby wejścia innej firmy
na rynek. W interesie monopolisty jest powstrzymanie tej firmy od wejścia. Wyniki przybysza
zależą od tego, czy monopolista podejmie walkę, czy też nie. Zasiedziałym jest gracz B,
wchodzącym A. „Góra" oznacza powstrzymanie od wejścia, a „dół" oznacza wchodzenie. „lewa"
oznacza walkę, „prawa" rezygnację z walki. Wynik dający równowagę w tej grze sugeruje
wejście oraz rezygnację z walki. Zachowaniem racjonalnym dla monopolisty jest żyć i pozwolić
żyć innym. Jeśli B zda sobie z tego sprawę to groźbę walki uzna za gołosłowną. Jeśli jednak
monopolista może powiększyć swoje zdolności produkcyjne, będzie mógł konkurować
z wchodzącym z większymi szansami na sukces (macierz w pozycji lewa-dół będzie miała
wartość np. „0, 2"). Teraz z powodu zwiększonych zdolności groźba walki jest wiarygodna i B
postąpi racjonalnie wybierając „walkę". Przybyszowi opłaca się więc pozostać poza rynkiem
monopolisty bo otrzyma l, a nie 0.
Gra o powstrzymanie wejścia
Gracz B
Walcz Nie walcz
Gracz A Nie wchodź
1, 9
1, 9
0, 2
2, 1
Wchodź
Źródło: Hal R. Varian, Mikroekonomia, str. 494-507