Chociaż von Neumann wprowadził w RAND teorię gier, nie on wynalazł dylemat więźnia ani nie on zbadał jego konsekwencje. Von Neumann koncentrował się prawie wyłącznie na tym, co sam nazwał „grami o sumie zerowej”. W grach takich całkowita tzw. wypłata jest stała i wygrana przeciwnika oznacza w sposób nieunikniony twoją stratę. Większość gier planszowych na przykład jest grami o sumie zerowej: jeśli twój partner wygrywa, ty przegrywasz. Poker też jest taką grą - wygrywający bierze wszystko.
Jeden ze współpracowników von Neumanna w RAND, John Nash, rozszerzył teorię gier dwuosobowych, wprowadzając gry, których suma nie jest zerowa. Jego teoria mówi, że w takich grach istnieje zawsze „punkt równowagi” - przy założeniu, że ani twój przeciwnik, ani ty nie zmienicie swojej strategii. Rozpatrzmy na przykład następującą grę:
K wybiera reszkę |
K wybiera orła | |
Wybierasz reszkę |
Wygrywasz ł $ |
Tracisz i $ |
K wygrywa 3 $ |
K wygrywa 4 $ | |
Wybierasz orła |
Wygrywasz 2 $ |
Wygrywasz 1 $ |
K nic nie wygrywa |
K wygrywa 2 $ |
W grze tej „punkt równowagi” to orzeł/orzeł (prawa dolna kratka). Jest tak, ponieważ niezależnie od tego, co zrobi K, zawsze jest korzystne, abyś wybrał orła i to samo tyczy się K. I nawet jeśli K miałby zmienić swoją strategię, ty nadal wybierałbyś orła i odwrotnie.
To, z czego Nash od razu nie zdał sobie sprawy lub co przyjął dopiero później, to fakt, iż samo istnienie punktu równowagi nie przesądza, że w realnym życiu ludzie go wybiorą. Dzieje się tak szczególnie w przypadku gier iteracyjnych - gier pomiędzy dwoma lub większą liczbą partnerów, które powtarza się raz za razem, z tą samą określoną strategią i wypłatami. Przyjrzyjmy się powtórnie dylematowi więźnia, który tak naprawdę został odkryty przez dwóch innych naukowców z RAND, Meniłla Floda i Melvina Dreshera, w roku 1950. (Opisali oni zasady gry; później, w tym samym roku, Albert Tucker wprowadzi! do niej więźniów i nadał jej nazwę). Punkt równowagi to wzajemna zdrada: jeśli założysz, że twój partner/przeciwnik wybrał strategię i że nie może jej zmienić, zawsze wyjdziesz lepiej, zdradzając.
Ale przypuśćmy, że ty i twój przeciwnik gracie w grę w rodzaju dylematu więźnia sto razy z rzędu. Powiedzmy, że chodzi o wypła-
K kooperuje |
K zdradza | |
Kooperujesz |
2 $ dla ciebie |
0 $ dla ciebie |
3 $ dla K |
4 $ dla K | |
Zdradzasz |
3 $ dla ciebie |
1 $ dla ciebie |
1 $ dla K |
2 $ dla K |
Nieważne, co zrobi K, zawsze lepiej wyjdziesz na zdradzie -zawsze wygrasz o dolara więcej. To samo dotyczy K: nieważne, co ty zrobisz, on wygra dolara więcej, zdradzając. Ale wzajemna współpraca jest lepsza dla was obu niż wzajemna zdrada; najgorszy dla ciebie scenariusz, to kiedy ty kooperujesz, a K zdradza.
Jeśli ta gra miałaby tylko jedną partię, a ty i K nie moglibyście wcześniej uzgodnić strategii, wtedy logiczne jest, abyś zdradzał, ponieważ nie znasz strategii K i nie możesz jej zmienić. Ale obraz jest zupełnie inny w grze, którą się powtarza. Przypuśćmy, że K decyduje się współpracować w nadziei, że ty też będziesz, co zapewnia największy wspólny zysk. Ty natomiast wybierasz strategię jednorazowej gry i zdradzasz. Wygrywasz dużo (3 $), podczas gdy K wygrywa najmniejszą z możliwych sum (1 $), a więc w następnej kolejce K postanawia cię „ukarać” przez zdradę. W istocie, zdradziwszy, K pozbawia cię dwóch dolarów - dwa razy tyle, ile wyniósł twój dodatkowy zysk, kiedy zdradziłeś za pierwszym razem. Zatem jeśli zdrada byłaby bezpieczna, mógłbyś zdobyć dużo więcej pieniędzy, niż kiedy ty i K byście kooperowali. Oczywiście jeśli K kooperuje, kiedy ty za każdym razem zdradzasz, zyskasz maksymalną sumę 300 $. Ale jeśli K racjonalnie myśli, powtórzy ten schemat, zdradzając za każdym razem i zarabiając o 100 $ więcej niż wtedy, gdyby za każdym razem współpracował. Jaka jest więc najlepsza strategia?
Teoria gier, dzięki zastosowaniu modeli komputerowych, daje odpowiedź: nazywa się to „wet za wet”. Zaczynasz od współpracy. Jeśli K także kooperuje, ty kooperujesz w następnej kolejce. Kontynuujesz aż do momentu, kiedy K zdradzi, wtedy karzesz go, zdra-
119