Skórzewski P Wszyscy jesteśmy więźniami


Paweł Skórzewski
Wszyscy jesteśmy więzniami
czyli o wieloosobowym dylemacie więznia
W pewnym mieście dokonano przestępstwa. Dochodzenie wykazało, że w grę
wchodzi jedynie dwóch podejrzanych. Prokurator przypuszczał (i miał rację!),
że przestępstwa dokonali wspólnie, jednak wiedział, że ślady zatarto tak sta-
rannie, że nie będzie w stanie znalezć dowodów winy. Ale prokurator nie był
w ciemię bity. Miał plan... Każdemu z aresztantów zamkniętych w osobnych
celach przedstawił propozycję nie do odrzucenia:
- Wiem, że to wy to zrobiliście. Przyznaj się, to na tym tylko skorzystasz:
Jeżeli przyznacie się obaj, dostaniecie łagodne wyroki. Jeżeli tylko jeden z was
będzie chciał z nami współpracować, to ten przyznający się dostanie nagrodę,
a drugi - krnąbrny - będzie siedzieć długo... oj, nie chciałbym być w jego skórze...
- A jeśli nikt z nas się nie przyzna?
- No cóż, muszę przyznać, że z braku dowodów będę zmuszony was uwolnić...
"
Ta lub podobna historia zapewne obiła się o uszy każdemu, kto choć trochę
miał do czynienia z teorią gier. Tak mniej więcej brzmi bowiem idea dylema-
tu więznia - gry wymyślonej w roku 1950 przez Melvina Dreshera i Merrilla
Flooda, a sformalizowanej przez Alberta W. Tuckera. W teorii gier gry przedsta-
wia się zazwyczaj w formie tabelki (macierzy wypłat). Dylemat więznia można
przedstawić tak (liczby oznaczają tzw. wypłaty: im wyższa wartość, tym ko-
rzystniej dla gracza):
Więzień B (niebieski)
nie przyznać się przyznać się
nie przyznać się (0, 0) (-2, 1)
Więzień A (czerwony)
przyznać się (1, -2) (-1, -1)
lub w nieco bardziej ogólnej postaci:
Niebieski
strategia C strategia D
strategia C (R, R) (S, T )
Czerwony
strategia D (T , S) (U, U)
gdzie spełnione są warunki1:
 T > R > U > S
S+T
 R >
2
Jak widać, dla każdego z graczy z osobna lepiej jest wybrać strategię D niż C,
gdyż uzyska wyższą wypłatę niezależnie od tego, co wybierze drugi gracz (1 > 0,
-1 > -2) - mówimy, że strategia zdrady D dominuje strategię kooperacji C.
Jednak wynik uzyskany, gdy obaj gracze wybiorÄ… strategiÄ™ D, (-1, -1) jest
wyraznie gorszy od wyniku (0, 0) - który dawałaby kombinacja strategii CC. O
1
Oznaczenia literowe strategii i wypłat pochodzą z języka angielskiego:
C - strategia współpracy (cooperation),
D - strategia zdrady (defection),
R - nagroda (za współpracę) (reward),
S - wypłata frajera (sucker),
T - wypłata pokusy (temptation),
U - wypłata niekooperacyjna (uncooperative).
1
takim wyniku, który daje gorsze (lub przynajmniej nie lepsze) wypłaty dla każ-
dego z graczy niż jakiś inny wynik, mówimy, że nie jest optymalny w sensie
Pareto (nie jest paretooptymalny).
W tym miejscu dochodzimy do pewnego paradoksu: mimo iż gracze wybiera-
ją strategie, które są jak najbardziej racjonalne z ich punktu widzenia, dochodzą
do wcale nie najlepszego wyniku. Lepszy wynik mogliby osiągnąć przez koope-
rację - tylko wtedy trzeba byłoby zaufać rywalowi - ale czy rywal okazałby się
godny zaufania?...
Nad problemem, jak zachęcić obie strony do kooperacji, głowiło się wielu
specjalistów, znajdując różne (choć może nie zawsze do końca satysfakcjonujące)
rozwiązania, jak np. odwołanie się do tzw. metagry ( ja myślę, że on myśli, że
ja zrobię tak ) czy rozegranie serii gier (iterowany dylemat więznia). W tym
artykule chciałbym się jednak skupić raczej nad zagadnieniem, co się stanie, gdy
więzniów będzie więcej niż tylko dwóch.
Macierz wypłat trzyosobowego dylematu więznia przedstawia się następu-
jąco (trudno rysować trójwymiarową tabelkę na płaskiej kartce, więc musimy
poradzić sobie trochę inaczej):
Niebieski
C D
C
C (2, 2, 2) (0, 3, 0)
Czerwony
D (3, 0, 0) (1, 1, -2)
Zielony
Niebieski
C D
D
C (0, 0, 3) (-2, 1, 1)
Czerwony
D (1, -2, 1) (-1, -1, -1)
Gra jest symetryczna, również tu dla każdego z graczy strategia D domi-
nuje strategię C, mimo że wynik DDD nie jest paretooptymalny (DDD =
(-1, -1, -1) jest gorsze niż CCC = (2, 2, 2)). Widzimy, że dodanie nowego
gracza wcale nie polepszyło sytuacji  więzniów . Jednak w przypadku gry wie-
loosobowej dochodzi możliwość zawiązywania koalicji między graczami. Może
umożliwienie porozumienia i współpracy między graczami sprawi, że będą bar-
dziej skłonni do wyboru strategii kooperacyjnych (C)?
W rozstrzyganiu gier wieloosobowych często pomaga tzw. funkcja charak-
terystyczna gry, która przyporządkowuje każdej koalicji wartość wygranej2,
jaką łącznie osiągną gracze należący do tej koalicji, grając grę dwuosobową
przeciwko koalicji złożonej z pozostałych graczy. Pomijając szczegóły obliczenia
wartości funkcji charakterystycznej, podam jedynie wartości tej funkcji (tra-
dycyjnie oznaczanej symbolem ½) dla przedstawionego powyżej trzyosobowego
dylematu więznia:
½(") = 0
½(Czerwony) = ½(Niebieski) = ½(Zielony) = -1
½(Czerwony & Niebieski) = ½(Czerwony & Zielony) = ½(Niebieski & Zielony) = 0
½(Czerwony & Niebieski & Zielony) = 6
Wynik wydaje się obiecujący: największą wartość ma koalicja trzyosobowa,
czyli współpraca wszystkich, koalicje dwuosobowe otrzymują wartość większą
niż gracze pojedynczy. Lecz nie miejmy zbytniego zaufania do funkcji charakte-
rystycznej. Wystarczy spróbować zagrać raz w tą grę, aby uzmysłowić sobie, że
nasza radość była przedwczesna.
Niebieski & Zielony
C & C C & D D & C D & D
strategia C (2, 4) (0, 3) (0, 3) (-2, 2)
Czerwony
strategia D (3, 0) (1, -1) (1, -1) (-1, -2)
2
dokładniej mówiąc, najczęściej jako wartość wygranej przyjmuje się tzw. poziom bez-
pieczeństwa gracza (koalicji)
2
Widać, że gracz Czerwony na pewno wybierze strategię D, która dominuje
jego strategię C. W związku z tym dla niebiesko-zielonej koalicji najlepsza będzie
strategia kooperacyjna C & C - gwarantująca największą z możliwych wypłatę
(0). Cóż z tego, skoro i tak Czerwony wygra więcej (3)? Widać jak na dłoni, że
w żadne koalicje wchodzić się nie opłaca - najlepiej  trzasnąć drzwiami i wyjść .
Przedstawmy tę grę w jeszcze innej postaci, co pozwoli nam uprościć zapis,
gdy liczba graczy wzrośnie. Zauważmy, że ponieważ wieloosobowy dylemat więz-
nia jest grą symetryczną, wypłata poszczególnego gracza zależy tak naprawdę
nie od tego, kto zagra jakÄ… strategiÄ™, lecz od tego, ilu graczy zagra strategiÄ™ C,
a ilu D:
liczba pozostałych graczy grających C 0 1 2
strategia C -2 0 2
wypłata gracza X
strategia D -1 1 3
Teraz widać wyraznie, że dla każdego gracza strategia D dominuje strategię
C, natomiast wybór strategii D przez wszystkich prowadzi do subparetoop-
tymalnego (czyli nieoptymalnego w sensie Pareto) wyniku (-1 < 2). Model
n-osobowego dylematu więznia wyglądałby na przykład tak:
liczba pozostałych graczy grających C 0 1 2 . . . n - 1
strategia C 0 1 2 . . . n - 1
wypłata gracza X
strategia D 1 2 3 . . . n
Nasuwa się nieuchronna myśl, że sytuacja jest tak naprawdę jeszcze gorsza
niż myśleliśmy. Nie dość, że niechętni do współpracy egoiści zyskują więcej,
to na dodatek zyskują tym więcej, im więcej ofiarnych altruistów znajdzie się
wśród ich przeciwników! Oznacza to, że im więcej altruistów będzie ofiarnie
współpracować (licząc na to, że swoją szlachetną postawą zachęcą do altruizmu
innych), tym bardziej będzie opłacał się wredny egoizm!
Wystarczy chwila zastanowienia, aby stwierdzić, że często podobne sytuacje
zdarzają się w codziennym życiu. Przykładem mogą być chociażby nawoływa-
nia organizacji ekologicznych do oszczędnego gospodarowania zasobami środo-
wiska. Oszczędzanie energii, segregacja odpadów czy budowanie oczyszczalni
mają przynosić korzyść całemu społeczeństwu, aby więcej ludzi mogło cieszyć
się czystym środowiskiem, a jego zasobów wystarczyło dla przyszłych pokoleń.
Jednak ekologiczne inwestycje wymagają poniesienia pewnych nakładów: budo-
wa oczyszczalni ścieków kosztuje, segregowanie odpadów wymaga pewnej pracy.
W związku z tym opłaca się być leniwym egoistą:  niech inni się męczą i dbają o
czystą wodę, a ja będę jej używał i zanieczyszczał, ile mi się podoba . Do czego
by jednak doszło, gdyby każdy myślał w ten sposób?
Znalezienie innych przykładów pozostawiam Czytelnikowi, jako podstawę do
samodzielnych przemyśleń na ten temat. Czasami jedynym sensownym rozwią-
zaniem wydaje się  zbiorowy przymus - na przykład zgoda na pewne prawne
regulacje wymuszające stosowanie strategii C (w przykładzie z oczyszczalnią
ścieków mógłby być to prawny nakaz, by każde większe przedsiębiorstwo produk-
cyjne miało własną oczyszczalnię). Jednak nie wszystkie sytuacje da się prawnie
unormować - co zrobić z egoizmem w zwykłych kontaktach międzyludzkich?
A może mimo wszystko warto być szlachetnym i wierzyć w ludzi? Przecież
nie wszyscy musimy być więzniami!
Literatura
[1] P. D. Straffin, Teoria gier. Wydawnictwo Naukowe  Scholar , Warszawa 2001.
[2] J. Miękisz, Być albo nie być altruistą - dylemat więznia, w: O twierdzeniach i hi-
potezach. Matematyka według Delty. Wydawnictwa Uniwersytetu Warszawskiego,
Warszawa 2005.
[3] Wikipedia, wolna encyklopedia.
http://pl.wikipedia.org
3


Wyszukiwarka

Podobne podstrony:
07 Wszyscy jesteśmy obserwowani
biznes i ekonomia wszyscy jestesmy sprzedawcami
wszyscy jestesmy geniuszami
Daniken Erich Von Wszyscy jestesmy dziecmi Bogow
Wszyscy jesteśmy odmieńcami Przyczynki do społecznej teorii queer
Wszyscy jestesmy O micie masowosci i koncu posluszenstwa
Daniken Erich Wszyscy jestesmy dziecmi bogow
Domanska Olsen Wszyscy jestesmy konstruktywistami
Daniken Wszyscy jesteśmy dziećmi bogów

więcej podobnych podstron