91
Dylemat więźnia jako przykład wykorzystania teorii gier
z możliwych strategię. Przy czym wybrana strategia jest dodatkowo najlepszą odpowiedzią na zachowania wybrane przez pozostałych graczy. Oznacza to, że żaden z graczy nie ma możliwości poprawienia swojej sytuacji poprzez wybór innej strategii. Nash badał „gry o dowolnej sumie zerowej i udowodnił, że każda taka gra (ze skończoną ilością strategii każdego gracza) ma równowagę" [Malawski i inni, 1997, s. 30].
Żaden z graczy nie ma pewności, co do ostatecznej decyzji drugiego gracza. Gracz jest wyposażony jedynie w wiedzę o przesłankach racjonalności, którymi kieruje się on sam i którymi powinien kierować się drugi z graczy. Wiedza o racjonalności drugiego gracza pozwala pierwszemu oczekiwać, że zachowanie jego konkurenta będzie zmierzało do maksymalizacji własnego zysku (lub użyteczności). Gracz ma jednak na uwadze warunki zewnętrzne, czyli to, jaką decyzję podejmie konkurent i jak wpłynie to na jego własną sytuację. Strategia ta jest warta polecenia szczególnie wtedy, gdy o drugim graczu wiadomo tylko tyle, że będzie chciał zminimalizować swoją przegraną [Borucki, 2001, s. 231].
Równowaga Nasha jest nazywana uogólnieniem modelu Cournota. W modelu tym spotykają się dwaj producenci, a przedmiotem wyboru jest poziom produkcji każdego z nich. Przy czym każdy przedsiębiorca definiuje swój poziom produkcji przy założeniu, że jego konkurent utrzyma dotychczasowy poziom produkcji. „Równowaga Cournota zachodzi wtedy, gdy każda firma maksymalizuje zyski przy danym zachowaniu drugiej firmy" [Varian, 2005, s. 515].
Równowaga Nasha, co do zasady, powinna zachodzić tylko dla jednego przypadku, jednak istnieją takie gry, w których można wyróżnić więcej niż jeden stan równowagi lub też nie ma żadnego ze stanów równowagi.
Tradycyjny przykładem pokazującym na czym polega równowaga Nasha jest dylemat więźnia. Historia przedstawia sytuację dwóch mężczyzn zatrzymanych przez policję, jednak bez wystarczających dowodów na ich winę. Umieszczono ich w osobnych pomieszczeniach oraz powiedziano, że przyznanie się do winy daje im tylko rok więzienia. W przypadku, gdy obaj nie przyznają się zostaną wypuszczeni na wolność. Sytuacja komplikuje się w przypadku, gdy tylko jeden z nich przyzna się do winy. W ten sposób obciąży drugiego, a sam uzyska korzystny wyrok. W takim przypadku ten, który przyznał się otrzyma pół roku więzienia, a drugi aż pięć lat. Macierz wypłat w postaci ilości lat do odsiedzenia w więzieniu przedstawia poniższa tabela.