Wybrane eksperymenty z TOU
Metoda eksperymentalna służyła również jako narzędzie testowania teorii
oczekiwanej użyteczności von Neumanna i Morgensterna. Znacznie więcej eksperymentów
ujawniło zachowania stojące w sprzeczności z jej treścią
1
. Najbardziej znany jest paradoks
Allaisa polegający na sprzeczności miedzy dwoma wyborami. Poprosił on uczestników
eksperymentu by dokonali wyboru pomiędzy dwiema alternatywami, których opcje mogą
zostać opisane jako wartości oczekiwane w postaci ogólnej:
n
n
2
2
1
1
A
p
A
p
A
p
EV
+
+
+
=
L
1
p
p
p
n
2
1
=
+
+
+
L
gdzie:
p
i
– prawdopodobieństwo otrzymania kwoty A
i
.
Pierwszy wybór, miedzy opcją A (p
1
=1, A
1
=100 mln franków) i B (p
1
=0,1, B
1
=500
mln; p
2
=0,89, B
2
=100 mln; p
3
=0,01, B
3
=0), uczestnicy eksperymentu rozstrzygali w istotnej
większości na rzecz opcji A. Jednocześnie, w drugim wyborze, ci sami uczestnicy preferowali
opcję D (p
1
=0,1, D
1
=500 mln; p
2
=0,9, D
2
=0) bardziej niż C (p
1
=0,11, C
1
=100 mln; p
2
=0,89,
C
2
=0). Hipotetyczny podmiot, dla którego U(A)>U(B)
2
powinien przejawiać preferencję
odwrotną U(C)>U(D). Wyniki tego eksperymentu, opartego na hipotetycznych wyborach,
znalazły potwierdzenie w późniejszych badaniach z realnymi wypłatami, oczywiście
mniejszych kwot.
Przedmiotem eksperymentalnego testu były nie tylko aksjomaty TOU, ale również jej
aspekt deskryptywny. Wiele testów poświęcono analizie procesów dokonywania wyborów w
warunkach ryzyka. Jedno z późniejszych studiów badało przechodniość preferencji [Loomes,.
Starmer, Sugden]. Uczestnicy eksperymentu, w wielu przypadkach, bardziej preferowali
możliwość wygrania 8£ z prawdopodobieństwem 0,6 (p
a
=0,6;a=8£) niż opcję (p
b
=0,3;b=18£).
Pewność otrzymania 4£ (p
c
=1;c=4£) była dla tych samych podmiotów cenniejsza niż opcja
(p
a
=0,6;a=8£). Jednocześnie jednak, preferowali oni możliwość (p
b
=0,3;b=18£) bardziej niż
pewność wygrania 4£. Tą nieprzechodniość preferencji, autorzy tłumaczyli preferowaniem
bardziej prawdopodobnej wygranej, gdy różnice w ich wartości były relatywnie nieduże. Gdy
różnica w wygranych stała się wysoka, górę wziął wybór przynoszący wyższą wartość
oczekiwaną.
1
Przytoczone niżej wyniki eksperymentów pochodzą zarówno z prac psychologów jak i ekonomistów.
Eksperymenty częściej przynosiły wyniki sprzeczne z TOU niezależnie, czy przeprowadzali je ekonomiści, czy
psychologowie.
2
Taka preferencja charakteryzuje podmiot unikający ryzyka, wybierający mniejszą wartość oczekiwaną, jeśli
związana jest z wyższym prawdopodobieństwem osiągnięcia.
Inny
eksperyment
testował
efekt
istotności
prawdopodobieństw.
Gdy
prawdopodobieństwa wygranych są tak niewielkie, że wydają się niemożliwe, podmioty
wybierają wygraną o wyższej wartości pomijając różnice w prawdopodobieństwach. W teście
eksperymentalnym
86%
podmiotów
wybrało
opcję
(p
a
=0,9;a=3 000)
kosztem
(p
b
=0,45;b=6 000), jednocześnie ci sami gracze w 73% preferowali (p
c
=0,001;c=6 000)
zamiast (p
d
=0,002;d=3 000) [Kahneman, Tversky]. Podobne wyniki uzyskano również w
innych eksperymentach [MacCrimmon, Larsson].
1
Gra strategiczna i jej opis
1.
Definicja gry
Najpowszechniej stosowanym podejściem do definiowania gry strategicznej jest
wymienienie jej elementów składowych. Ich jednoczesne wystąpienie uprawnia do nazwania
jakiejś sytuacji grą strategiczną ([Shubik, 1995, s. 1-16], [Straffin, 2001, s. 1], [Drabik, 2005,
s. 18] oraz przede wszystkim [von Neumann, Morgenstern, 1944, s. 48-55])
1
. Zgodnie z
powszechnie uznaną definicją z grą strategiczną (Γ) mamy do czynienia zawsze wtedy, gdy:
a.
bierze w niej udział, co najmniej, dwóch graczy; zbiór graczy to N={1,2,…,n},
gdzie n jest liczbą naturalną nie mniejszą od dwóch,
b.
każdy z graczy dysponuje zbiorem strategii określających jego sposób
rozgrywania gry M
i
; zbiór strategii wszystkich graczy M składa się z
elementów m
j
, w ramach których każdy z graczy jest reprezentowany przez
jedną strategię; M=M
1
xM
2
x…xM
n
, m
j
=[m
1j
,m
2j,…,
m
nj
]
c.
każdemu elementowi zbioru M przyporządkowany jest n-wymiarowy wektor
wypłat u(m
j
)=[u
1
(m
j
),u
2
(m
j
),…,u
n
(m
j
)]; wektor ten jest nazywany również
wynikiem gry.
Konkretyzacja tej definicji dla gry dwuosobowej będzie miała postać:
a.
bierze w niej udział dwóch graczy; zbiór graczy to N={A,B},
b.
każdy z graczy dysponuje zbiorem strategii określających jego sposób
rozgrywania gry: M
a
={a
1
,a
2
,…,a
i
,…,a
m
} i M
b
={b
1
,b
2
,…,b
j
,…,b
n
}; zbiór
strategii obydwu graczy M składa się z elementów m
ij
, w których każdy z
graczy jest reprezentowany przez jedną strategię; M=M
a
xM
b
, m
ij
=[a
i
,b
j
],
c.
każdemu elementowi zbioru M przyporządkowany jest wynik gry w postaci
punktu dwuwymiarowej przestrzeni euklidesowej określającego wypłaty
2
graczy u(m
ij
)=(u
a
(m
ij
),u
b
(m
ij
)).
Gracze, którzy są nieodzownymi podmiotami gry muszą spełniać określoną
charakterystykę.
„Każdy
gracz
powinien
dysponować
zdefiniowanymi
zasobami
obejmującymi również informacje, mieć do wyboru określoną ilość sposobów postępowania,
1
Alternatywnym podejściem jest zdefiniowanie gry jako drzewa topologicznego [Owen, 1975, s. 12]. Aby
niepotrzebnie nie komplikować zagadnień, których analiza ma spełniać funkcje pomocnicze, autor postanowił
zrezygnować z tego podejścia.
2
W dalszej części wywodu, przez wypłaty graczy należy rozumieć doświadczane przez nich użyteczności.
Prezentacja alternatywnych koncepcji użyteczności zysków oraz przyjęte założenie w tym zakresie zostały
przedstawione w rozdziale 2.1.1. Rozdział 3.5.1. został poświęcony znaczeniu ekonomii eksperymentalnej dla
rozwoju teorii użyteczności.
2
ze szczególnym uwzględnieniem możliwości komunikowania się i porozumiewania oraz
wewnętrznie spójny system preferencji lub użyteczności odnoszący się do uzyskiwanych
wypłat” [Shubik, 1995, s. 16]. Wszystkie te cechy powinny być uwzględnione w obrębie
reguł gry. Nie może być tak, że istotne zróżnicowanie graczy nie zostanie objęte regułami gry.
Graczami mogą być osoby fizyczne, przedsiębiorstwa, instytucje, związki zawodowe, związki
pracodawców, państwa. Tak duże zróżnicowanie jakościowe może powodować problemy
metodologiczne. Jeśli na przeciw siebie staje osoba fizyczna i organizacja nieodzownym jest
przyjęcie założenia, że ta druga również obdarzona jest wolną wolą i nie ma problemu z jej
jednoznacznym wyrażeniem.
Niezwykle istotnym założeniem jest racjonalność graczy, z których każdy „analizuje
grę w poszukiwaniu sposobu uzyskania pożądanego wyniku, uwzględniając fakt, że pozostali
robią to samo” [Straffin, 2001, s. 2]. Na ogół, racjonalność graczy ma postać występującą w
przypadku podejmowania decyzji w warunkach niepewności [Luce, Raiffa, 1964, s. 22].
Rzadziej jest to racjonalność związana z podejmowaniem decyzji w warunkach ryzyka.
Dzieje się tak jedynie w przypadku tzw. gier przeciwko Naturze, w których jednym z graczy
jest przyroda „dokonująca wyborów strategii” z założonymi prawdopodobieństwami
[Straffin, 2001, ss. 74-81]. W grach przeciwko Naturze różnica między charakterem
podmiotowym graczy polega również na tym, że gracz aktywny osiąga określone wypłaty a
Natura nie [Rapoport, 1989, s. 177]. Przykładem takiej gry jest sytuacja opisana w artykule
Davenporta o rybołówstwie na Jamajce [Davenport, 1960].
Zdarza się, że w określonych wynikach gry bardziej lub mniej zainteresowany jest
tzw. „gracz statysta” (dummy player), który nie ma możliwości wpływania swoimi decyzjami
na nie [Shubik, 1995, s. 18]. Dobrym przykładem jest zbiorowy konsument, który w grze
rynkowej może osiągnąć wyższą lub niższą kwotę nadwyżki, w zależności od wyborów
strategii dokonywanych przez przedsiębiorstwa. Rola konsumentów sprowadza się jedynie do
wpływu preferencji na krzywą popytu rynkowego, która z kolei staje się elementem reguł gry.
Strategie, jakie stoją do wyboru przed każdym graczem należy rozumieć jako sposoby
rozegrania gry w kompletnym zakresie, od jej rozpoczęcia aż do końca [Shubik, 1995, s. 34].
Gra może bowiem polegać na sekwencji ruchów decyzyjnych przeplatanych niekiedy
wpływem zmiennych losowych lub na jednorazowym wyborze strategii przez graczy.
Strategie gracza mogą mieć postać czystą i występować jako jeden z elementów
zbioru M
i
(np. m
i1
lub m
in
). Strategia gracza i może też się pojawić w postaci mieszanej
3
,
3
O metodach wyznaczania strategii mieszanych i problemach z ich praktyczną aplikacją traktują rozdziały 1.2.2
i 1.2.3.
3
której obraz powstaje w wyniku losowania wszystkich spośród dostępnych graczowi strategii
„czystych” zgodnie z określonym rozkładem prawdopodobieństwa p
j
={p
j1
,p
j2
,...,p
jk
,...,p
jm
}
takim, że 0≤p
jk
≤
1 oraz:
∑
=
=
m
1
k
jk
1
p
,
[1.1]
gdzie m jest liczbą dostępnych strategii czystych. Dla gracza A strategia mieszana a
pj
∈
M
pa
(M
pa
to zbiór jego wszystkich strategii mieszanych), to:
a
pj
=[p
j1
a
1
,p
j2
a
2
,...,p
jk
a
k
,...,p
jm
a
m
].
[1.2]
Przy takim zdefiniowaniu strategii mieszanej każda strategia czysta a
k
jest jej
szczególną postacią, w przypadku której tylko jeden składnik rozkładu prawdopodobieństwa
p
jk
jest większy od zera. Wygrana gracza A, jaką uzyska wybierając strategię mieszaną a
pj
przy jednoczesnym wyborze strategii czystej b
j
przez gracza B wyraża się formułą:
u
a
([a
pj
,b
j
])=p
j1
u
a
([a
1
,b
j
])+p
j2
u
a
([a
2
,b
j
])+...+p
jk
u
a
([a
k
,b
j
])+...+p
jm
u
a
([a
m
,b
j
]).
[1.3]
Konstrukcja strategii mieszanej, pożyteczna i poprawna pod względem formalnym,
nastręcza pewnych trudności z praktycznego punktu widzenia. Dla ustalenia strategii
mieszanej a
pj
możemy przeprowadzić eksperyment, w którym dzielimy zbiór możliwych
wyników pomiędzy
m wzajemnie niezależnych i wzajemnie wykluczających się zdarzeń o
rozkładzie prawdopodobieństwa p
j
[Luce, Raiffa, 1964, s. 77]. Można do tego użyć tablic
losowych lub zaprojektować loterię, w której kolejnych
m zdarzeń wystąpi odpowiednio z
prawdopodobieństwami {p
j1
,p
j2
,...,p
jk
,...,p
jm
}. W kolejnym kroku gracz powinien dokonać
losowania. W losowaniu tym może się okazać, że wskazana przezeń strategia czysta przynosi
niższy poziom wygranej niż u
a
([a
pj
,b
j
]) lub niższy niż inne strategie czyste
4
. Osiągnięcie
ś
redniej wartości wygranej równej u
a
([a
pj
,b
j
]) byłoby możliwe dopiero po przeprowadzeniu
nieskończonej ilości losowań w opisanej loterii. Obrońcy koncepcji strategii mieszanych
wskazują na ich dwie istotne cechy. Po pierwsze, poszukiwanie rozwiązania gry w strategiach
mieszanych odbywa się dopiero wtedy, gdy nie można go znaleźć wśród strategii czystych.
Po drugie, operowanie strategiami mieszanymi nie daje przeciwnikowi żadnych informacji o
tym, jakiej użyjemy strategii czystej [Luce, Raiffa, 1964, s. 78].
Teoria gier bada zachowania podmiotów w sytuacji konfliktu i kooperacji
[Straffin, 2001, s. 1]. Podstawowym obszarem zainteresowania są oczywiście sytuacje
konfliktu interesów [Malawski, Wieczorek, Sosnowska, 1997, s.12]. O konflikcie interesów w
4
Luce i Raiffa dają kilka bardzo ciekawych przykładów na praktyczne problemy z wykorzystaniem strategii
mieszanych [Luce, Raiffa, 1964, s. 79]
4
postaci pełnej możemy mówić w przypadku gier o sumie stałej
5
. Podstawową klasę
reprezentującą ten typ gier, gry o sumie zerowej można zdefiniować jako te, w przypadku
których dla każdego m
j
należącego do M:
0
)
m
(
u
j
n
1
i
i
=
∑
=
,
[1.4]
lub w przypadku gier dwuosobowych:
u
a
(
m
ij
)+u
b
(
m
ij
)=0.
[1.5]
W przypadku gier o sumie zerowej wygrane graczy w ramach określonego wyniku gry
zawsze sumują się do zera. Związane jest to z naturalnym konfliktem interesów
wykluczającym jakiekolwiek formy kooperacji. Wygrana jednego gracza wiąże się
nierozerwalnie z przegraną drugiego tożsamą, co do wartości bezwzględnej. W
dwuosobowych grach o sumie zerowej nie ma pola do kooperacji. Każdy z graczy pragnie
osiągnąć jak najwyższą wygraną uwzględniając to samo dążenie u przeciwnika. Jedynie w
przypadku liczby graczy większej niż dwa, możliwa jest kooperacja poprzez tworzenie
koalicji pozostającej w konflikcie interesów z graczami pozostającymi poza nią.
Alternatywa pomiędzy kooperacją a konfliktem ma również szansę pojawić się w
przypadku gier o sumie różnej od zera (lub nie stałej). Jeśli gracze nie mają w nich
możliwości porozumiewania się ani zawierania wiążących umów przybierają one postać gier
niekooperacyjnych [Luce, Raiffa, 1964, s. 112], jeśli pojawia się taka możliwość można
mówić o grze kooperacyjnej.
2.
Formy prezentacji gier
Prezentacja reguł gry może mieć postać opisową, która zawiera wszystkie istotne
fakty, zależności i charakterystyki istotne dla jej rozegrania. Wyrażona zwartym tekstem
postać gry znajduje najczęściej zastosowanie w przypadku prostych gier, których reguły nie
wymagają skomplikowanych zapisów. Przykładem może być gra rynkowa wzorowana na
grach rynkowych o zmiennym zakresie informacji [Kreps, 1990]. Nazwijmy ją „A vs B”.
Gra „A vs B”
5
Podstawową klasą tego typu gier są gry o sumie zerowej, i tak je pierwotnie nazwali von Neumann i
Morgenstern [von Neumann, Morgenstern, 1944]. Niektórzy autorzy pozostali wierni tej nazwie [Straffin, 2001],
[Drabik, 2005], [Luce, Raiffa, 1964], [Owen, 1975]. Niektórzy przyjęli szerszy znaczeniowo termin „gry o
sumie stałej” [Rapoport, 1989]. Każdą grę o sumie stałej można przekształcić liniowo w grę o sumie zerowej
odejmując, od wygranych poszczególnych graczy, iloraz stałej sumy wygranych i liczby graczy. Takie
przekształcenie pozostaje bez wpływu na wyznaczenie równowagi w grze. Ze względu na powszechność
stosowania, autor będzie posługiwał się terminem „gra o sumie zerowej”.
5
Rynek przenośnych odtwarzaczy muzyki z internetu jest opanowany przez dwie firmy
Audioslave i Broadcast. Pierwsza specjalizuje się w odtwarzaczach popularnych, o niższej
cenie i gorszych parametrach jakościowych. Posiada w swojej ofercie również bardziej
zaawansowane technologicznie produkty. Firma Broadcast jest wyspecjalizowana w wysokiej
jakości sprzęcie dla wyrobionych słuchaczy. Obydwie firmy pracują nad wprowadzeniem na
rynek nowego mobilnego odtwarzacza umożliwiającego ściąganie plików muzycznych z
internetu. Każdy z konkurentów ma do wyboru produkowanie tańszego, ale gorszego
jakościowo odtwarzacza (T) lub zaawansowanego technologicznie, ale droższego (D).
W sytuację rynkową wpisany jest czynnik losowy. śadna z firm nie wie czy przyszły
popyt na nowy produkt będzie duży, czy mały. Mały popyt to sytuacja, w której udział
koneserów zainteresowanych sprzętem wysokiej jakości w całkowitym zapotrzebowaniu jest
większy. O perspektywach rynkowych wiadomo jedynie, że duży popyt pojawi się z
prawdopodobieństwem p
d
=0,6 i zapewni obroty w wysokości u
a
+u
b
=60 (u
a
i u
b
to
odpowiednio wygrane firm Audioslave i Broadcast tożsame ich poziomowi przychodów).
Mały popyt może przynieść graczom sumę przychodów u
a
+u
b
=30. Zmienna losowa może
wskazać tylko na jeden lub na drugi z wymienionych rozmiarów rynku. Obydwie firmy
podejmują decyzję o wyborze profilu produkcyjnego jednocześnie, nie znając oczywiście
wyboru konkurenta.
Jeśli na małym rynku, obydwie firmy wybiorą strategie a
1
=T i b
1
=T, to osiągną
wygrane u
a
([a
1
,b
1
])=20 i u
b
([a
1
,b
1
])=10. W sytuacji, gdy na tym samym rynku zgodny wybór
strategii wskaże na produkowanie wysokiej jakości sprzętu (a
2
=D i b
2
=D), ich przychody
również będą wynosić u
a
([a
2
,b
2
])=20 i u
b
([a
2
,b
2
])=10. Wygrane firm w pozostałych
przypadkach osiągają wartości: u
a
([a
2
,b
1
])=25, u
b
([a
2
,b
1
])=5 i u
a
([a
1
,b
2
])=10, u
b
([a
1
,b
2
])=20.
Jeśli firmom przyjdzie operować na rynku o dużym popycie, te same wybory strategii
przyniosą wyższą sumę wygranych do podziału. Wygrane we wszystkich możliwych
kombinacjach strategii wynosić będą: u
a
([a
1
,b
1
])=45 i u
b
([a
1
,b
1
])=15, u
a
([a
2
,b
2
])=36 i
u
b
([a
2
,b
2
])=24, u
a
([a
2
,b
1
])=24, u
b
([a
2
,b
1
])=36 i u
a
([a
1
,b
2
])=42, u
b
([a
1
,b
2
])=18.
Tak zapisane reguły gry podziału rynku miedzy dwóch konkurentów zawierają w
sobie wszystkie istotne informacje. Gdyby jednak przyszło nam poszukać najwłaściwszych
strategii dla obydwu graczy, nawet bez posiadania koniecznej wiedzy na ten temat, posiłkując
się wyłącznie intuicją, sama postać opisowa gry nie ułatwi nam specjalnie zadania. Ze
względu na przydatność w poszukiwaniu rozwiązań gier o różnych cechach jakościowych,
obowiązują trzy metody ich zapisu. Są to postać ekstensywna (rozwinięta), macierzowa oraz
postać funkcji charakterystycznej.
6
Pierwsza z nich, postać ekstensywna, to ta, której podstawowym elementem jest
drzewko lub dendryt gry [Malawski, Wieczorek, Sosnowska, 1997, s. 16]. Dendryt gry jest
układem gałęzi i wierzchołków (węzłów), pokazujących wybory graczy i wskazania zmiennej
losowej w całej partii gry. Możliwości, jakie stoją przed graczem w momencie dokonywania
wyboru nazywamy ruchem. Ciąg wyborów od początku gry do jej końca to partia
[Luce, Raiffa, 1964, s. 46]. Ten wierzchołek, do którego nie dochodzi żadna gałąź to początek
gry a ten, od którego nie wychodzą już gałęzie jest wynikiem gry [ibidem, s. 50]. Poziom
dendrytu gry zawierający jej wyniki oznacza jej koniec. Aby określona konstrukcja
topologiczna mogła być nazwana drzewkiem gry musi spełniać wyznaczone kryteria:
a)
każdy wewnętrzny węzeł przypisany jest któremuś z graczy (włączając Los),
wykonującemu z niego ruch,
b)
każda z gałęzi wyprowadzona w dół z danego węzła reprezentuje możliwy wybór
gracza,
c)
każdej gałęzi odpowiadającej „wyborowi” w ramach ruchu Losu przypisane jest
prawdopodobieństwo z jakim los dokona określonych wyborów,
d)
każdemu węzłowi końcowemu przypisane są wypłaty graczy,
e)
wierzchołki należące do danego gracza w ramach jednego ruchu podzielone są na zbiory
informacyjne; dokonując wyboru gracz wie, w którym zbiorze informacyjnym się
znajduje ale nie wie, w którym z jego węzłów,
f)
z każdego z węzłów należących do tego samego zbioru informacyjnego wyprowadzana
jest taka sama liczba gałęzi, oznaczanych w taki sam sposób.
Ilustrację opisu postaci ekstensywnej gry oparto na przykładzie „A vs B”. Dendryt gry
wygląda, w tym przypadku, następująco:
7
Kolejność, w jakiej gracze zostali przedstawieni w dendrycie gry nie ma znaczenia,
gdy tak jak w opisywanej grze, żaden z nich nie zna ani „wyboru” Losu ani wyboru drugiej
strony. Wyniki gry, które pojawiają się na ostatnim poziomie byłyby takie same gdybyśmy,
na przykład, zaczęli od węzła firmy Broadcast a skończyli na „wyborach” Losu. Wszystkie
wierzchołki gracza Audioslave (A) tworzą jeden zbiór informacyjny, ponieważ nie zna on ani
rozmiarów rynku ani decyzji konkurenta, w momencie dokonywania własnego wyboru.
Podobnie jest z graczem Broadcast (B).
Dendryt gry pokazuje wszystkie ścieżki, jakimi może potoczyć się gra. Wyniki gry na
samym dole dendrytu informują o wygranych graczy według porządku (u
a
,u
b
). W naszym
przykładzie, jeśli rynek będzie duży a obydwaj gracze wybiorą produkcję tańszego
odtwarzacza ([a
1
,b
1
]), ich wygrane (przychody ze sprzedaży) wyniosą odpowiednio u
a
=20 i
u
b
=10. Gracz A, w ramach swojego ruchu może dokonać wyboru a
1
lub a
2
. Podobnie jest w
przypadku gracza B. Splot dokonanych przez graczy wyborów, poprzedzony nieznanym
„wyborem” losu, decyduje o tym, która para wygranych stanie się ich udziałem.
Prezentowany przykład dendrytu gry jest obrazem gry skończonej. Mówimy o grze
skończonej wtedy, gdy jej dendryt zawiera tylko skończoną ilość wierzchołków [Owen, 1975,
s. 15]. W grze skończonej gracz ma również skończoną liczbę strategii. Przykład gry
nieskończonej to sytuacja, w której gracze podają dowolne liczby całkowite i ten, który poda
niższą płaci jedną jednostkę drugiemu. Zbiór strategii czystych jest nieskończony, co czyni
taką i grę [Luce, Raiffa, 1964, s. 415].
Los
Audioslave
Broadcast
mały rynek
p
m
=0,4
duży rynek
p
d
=0,6
a
1
a
1
a
2
a
2
b
2
b
2
b
2
b
2
b
1
b
1
b
1
b
1
(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)
Schemat 1.1. Dendryt gry „A vs B”
Ź
ródło: opracowanie własne na podstawie [Kreps, 1990]
8
Tabela 1.1. Macierz gry dwuosobowej
u
b
a
1
a
2
...
a
i
...
a
m
b
1
u
b
([a
1
,b
1
]) u
b
([a
2
,b
1
])
...
u
b
([a
i
,b
1
])
...
u
b
([a
m
,b
1
])
b
2
u
b
([a
1
,b
2
]) u
b
([a
2
,b
2
])
...
u
b
([a
i
,b
2
])
...
u
b
([a
m
,b
2
])
...
...
...
...
...
...
...
b
j
u
b
([a
1
,b
j
]) u
b
([a
2
,b
j
])
...
u
b
([a
i
,b
j
])
...
u
b
([a
m
,b
j
])
...
...
...
...
...
...
...
b
n
u
b
([a
1
,b
n
]) u
b
([a
2
,b
n
])
...
u
b
([a
i
,b
n
])
...
u
b
([a
m
,b
n
])
u
a
a
1
a
2
...
a
i
...
a
m
b
1
u
a
([a
1
,b
1
]) u
a
([a
2
,b
1
])
...
u
a
([a
i
,b
1
])
...
u
a
([a
m
,b
1
])
b
2
u
a
([a
1
,b
2
]) u
a
([a
2
,b
2
])
...
u
a
([a
i
,b
2
])
...
u
a
([a
m
,b
2
])
...
...
...
...
...
...
...
b
j
u
a
([a
1
,b
j
]) u
a
([a
2
,b
j
])
...
u
a
([a
i
,b
j
])
...
u
a
([a
m
,b
j
])
...
...
...
...
...
...
...
b
n
u
a
([a
1
,b
n
]) u
a
([a
2
,b
n
])
...
u
a
([a
i
,b
n
])
...
u
a
([a
m
,b
n
])
Ź
ródło: opracowanie własne
Drugą podstawową formą prezentacji gry jest jej postać macierzowa. Jakkolwiek jej
przydatność ogranicza się do gier dwuosobowych
6
, bardzo ułatwia poszukiwanie rozwiązań w
tej klasie gier. Postać macierzowa gry dwuosobowej to tabela, której wiersze odpowiadają
wyborom strategii czystych jednego gracza, a kolumny wyborom strategii czystych drugiego.
Na przecięciu każdej pary strategii w tabeli pomieszczone są wartości wygranych obydwu
graczy, jakie osiągają oni przy koincydencji tych właśnie wyborów. Posługując się
oznaczeniami z definicji gry dwuosobowej możemy zbudować jej macierz, jaką pokazuje
Tabela 1.1. Macierz wygranych została przedstawiona w postaci dwumodułowej. Jej górny
moduł zawiera wygrane gracza, którego strategie zostały wymienione w wierszach tabeli.
Dolny moduł to wygrane drugiego gracza, którego strategie to nagłówki kolumn. Takie
podejście sprawiło, że niektórzy autorzy gry dwuosobowe o sumie różnej od zera i nie stałej
nazywają grami dwumacierzowymi [Drabik, 2005, s. 68]. Można oczywiście informacje
zawarte w Tabeli 1.1 skoncentrować w jednym module, podając w każdej komórce parę
wygranych. W takim wariancie prezentacji zawsze jako pierwsza podawana jest wypłata
gracza, którego strategie wymienione są w nagłówkach wierszy. Gry dwuosobowe o sumie
zerowej zapisuje się w postaci macierzy z wygranymi jednego z graczy. Taki skrócony zapis
w pełni przekazuje zależność między wyborami strategii a wygranymi obydwu uczestników
gry. Gra o sumie stałej, choć tożsama liniowo z grą o sumie zerowej, jest często
6
O ile można jeszcze sobie wyobrazić prostopadłościan, podzielony na sześcianiki odpowiadające splotom
strategii w grach trzyosobowych, to gry o ilości graczy większej od trzech nie mogłyby znaleźć czytelnej
prezentacji macierzowej. Utożsamienie, o którym mowa jest tak silne w literaturze tematu, że niektórzy autorzy
nazywają gry dwuosobowe grami macierzowymi [Straffin, 2001].
9
przedstawiana w postaci dwumacierzowej, by ułatwić czytelnikowi orientację w zmienności
wygranych obydwu graczy.
Gra „A vs B” zawiera w swoich regułach wpływ czynnika losowego. Gdyby gracze
znali rozmiar rynku przed podjęciem decyzji mielibyśmy do czynienia z jedną lub drugą
jednoznacznie określoną macierzą wygranych. Tak nie jest, zatem wpływ ryzyka związanego
z kształtowaniem się czynnika losowego należy uwzględnić poprzez wyznaczenie wartości
oczekiwanych wygranych obydwu graczy. Uprawnia nas do tego przyjęcie założenia o
liniowej użyteczności liczbowej. Liczymy, więc na przykład: u
a
([a
1
,b
1
])=0,4·20+0,6·45=35 a
u
b
([a
1
,b
1
])=0,4·10+0,6·15=13.
Tabela 1.2. Macierz gry „A vs B”
Audioslave
u
a
a
1
a
2
b
1
35,0
24,4
Broadcast
b
2
29,2
29,6
Audioslave
u
b
a
1
a
2
b
1
13,0
23,6
Broadcast
b
2
18,8
18,4
Ź
ródło: opracowanie własne
Gra w postaci funkcji charakterystycznej jest obrazem wykreowanym dla potrzeb gier
n-osobowych. „Oznaczmy zbiór wszystkich graczy gry n-osobowej przez N={1,2,...,n}.
Każdy niepusty podzbiór zbioru N (łącznie z całym N i zbiorami jednoelementowymi)
nazwiemy koalicją. Przez funkcje charakterystyczną gry n-osobowej będziemy rozumieć
funkcję rzeczywistą v określoną dla wszystkich podzbiorów zbioru N, która każdemu
podzbiorowi S
⊂
N przyporządkowuje wartość maksyminową
7
(dla S) w grze dwuosobowej
rozgrywanej między S a N-S, przy założeniu, że utworzyły się właśnie dwie koalicje” [Owen,
1975, s. 136]. Wartość v(S) oznacza wartość użyteczności, jaką mogą osiągnąć uczestnicy
koalicji bez względu na decyzje podmiotów pozostających poza nią. Twórcy koncepcji
funkcji charakterystycznej wymienili trzy cechy, które musi spełniać [von Neumann,
Morgenstern, 1944, s. 241]:
v(Ø)=0; gdzie Ø to podzbiór pusty,
[1.6]
v(-S)=-v(S),
[1.7]
7
Pojęcie maksyminu gry o sumie zerowej zostanie przedstawione w dalszej części pracy. Tutaj wystarczy
powiedzieć, że jest to wartość wygranej v przynoszona przez parę strategii, która zapewnia, że jeden z graczy
wygra, co najmniej v a drugi przegra najwyżej v.
10
v(S
∪
T)≥v(S)+v(T); jeśli S
∩
T=Ø.
[1.8]
W następnym kroku von Neumann i Morgenstern udowodnili, że funkcja
charakterystyczna spełnia warunki [1.6-1.8] dla każdej gry. Prostą ilustracją koncepcji funkcji
charakterystycznej była następująca gra [von Neumann, Morgenstern, 1944, s. 222-223].
Gra w dobór koalicjanta
Każdy z trzech graczy (N={1,2,3}) podaje jednocześnie, numer jednego z
pozostałych. Jeśli dwóch poda, na wzajem, swoje numery to tworzą koalicję i dzielą po
połowie jednostkę, którą daje im gracz pozostający poza koalicją.
Zapis tej gry w postaci funkcji charakterystycznej spełnia wszystkie warunki
sformułowane przez von Neumanna i Morgensterna:
v(Ø)=v(123)=0,
[1.9]
v(1)=v(2)=v(3)=-1
[1.10]
v(12)=v(23)=v(13)=1.
[1.11]
Na ogół, nie zapisuje się gier dwuosobowych w postaci funkcji charakterystycznej.
Niemniej, dla porównania wszystkich trzech prezentowanych form zapisu gier strategicznych,
gra „A vs B” zostanie przedstawiona również w postaci funkcji charakterystycznej
8
.
v(Ø)=0; v(A)=29,41; v(B)=18,59; v(AB)=48.
[1.12]
Jak widać, dla gier dwuosobowych, warunek [1.8] przybiera postać równości.
Zapisanie gry n-osobowej w postaci funkcji charakterystycznej jest możliwe dopiero po
rozwiązaniu szeregu gier dwuosobowych. O metodach temu służących będą traktowały dwie
kolejne części pracy.
Zanim jednak do nich przejdziemy, sprawdźmy, jak na reguły gry wpływa zakres
informacji, jakim dysponują gracze. W grze „A vs B” dokonywali oni wyborów strategii nie
znając, na wzajem, swoich posunięć ani rozmiarów rynku. Sprawdźmy, co stanie się, jeśli
zmienimy nieco warunki gry „A vs B”.
Gra „A przeciw B”
Ta gra opiera się na zachowaniu wszystkich, poza jedną reguł gry „A vs B”.
Zmienioną regułą jest jednoczesność wyboru strategii. Firma Broadcast, ze względu na
mniejsze rozmiary i, co za tym idzie, większą elastyczność, podejmuje decyzję później,
znając już wybór firmy Audioslave.
Opisana modyfikacja warunków zmieni rozłożenie zbiorów informacyjnych postaci
ekstensywnej gry. Gracz B podejmuje decyzję wiedząc, czy A wybrał a
1
czy a
2
.
8
Sposób wyznaczenia v(A) i v(B) zostanie przedstawiony w następnej części pracy.
11
W porównaniu z grą „A vs B” sytuacja gracza A nie zmieniła się. Gracz B natomiast,
zamiast jednego, ma dwa zbiory informacyjne. Jeden łączy wierzchołki połączone z gałęziami
odpowiadającymi wyborom strategii a
1
(produkować tańszy odtwarzacz T), drugi to dwa
wierzchołki, do których dochodzą gałęzie a
2
(produkować droższy odtwarzacz D). Wiedza
dotycząca wyboru strategii przez gracza A modyfikuje zbiór strategii gracza B. Nie jest on już
prostą alternatywą b
1
lub b
2
. W obecnej postaci gry, gracz B ma do wyboru cztery strategie:
b
3
– zawsze wybierać odtwarzacz tańszy („TT;DT”),
b
4
– wybierać ten sam profil produktu co A („TT;DD”),
b
5
– zawsze wybierać przeciwnie niż A („TD;DT”)
b
6
– zawsze wybierać odtwarzacz droższy („TD;DD”).
Strategia b
3
jest tożsama ze strategią b
1
z poprzedniej wersji gry. Podobnie jest z parą
b
6
i b
2
. Niemniej dla zaakcentowania odmienności gier „A vs B” i „A przeciw B”
wprowadzono odmienne oznaczenia. Postać macierzowa gry „A przeciw B” musi uwzględnić
wzrost ilości strategii czystych gracza B oraz inne kombinacje wygranych brane do kalkulacji
wartości oczekiwanej wypłat graczy. Na przykład, wynik gry dla kombinacji strategii [a
1
,b
5
]
będzie następujący u
a
([a
1
,b
5
])=0,4·10+0,6·42=29,2 i u
b
([a
1
,b
5
])=0,4·20+0,6·18=18,8.
Los
Audioslave
Broadcast
mały rynek
p
m
=0,4
duży rynek
p
d
=0,6
a
1
a
1
a
2
a
2
b
2
b
2
b
2
b
2
b
1
b
1
b
1
b
1
(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)
Schemat 1.2. Dendryt gry „A przeciw B”
Ź
ródło: opracowanie własne na podstawie [Kreps, 1990]
12
Tabela 1.3. Macierz gry „A przeciw B”
Audioslave
u
a
a
1
a
2
b
3
35,0
24,4
b
4
35,0
29,6
b
5
29,2
24,4
Broadcast
b
6
29,2
29,6
Audioslave
u
b
a
1
a
2
b
3
13,0
23,6
b
4
13,0
18,4
b
5
18,8
23,6
Broadcast
b
6
18,8
18,4
Ź
ródło: opracowanie własne
Macierze gier „A vs B” i „A przeciw B” różnią się ze względu na pojawienie się
nowych wierszy b
4
i b
5
. Nowa macierz podległa istotnemu rozbudowaniu. Zmiany postaci
ekstensywnej gry nie są tak ewidentne. W niej, zmianie ulega tylko zakres zbioru
informacyjnego jednego gracza. Oczywiście to nie zmienia faktu, że obydwie postacie
przedstawiają tą samą grę.
Przykład wpływu zmiany zbiorów informacyjnych w grze „A przeciw B” ilustruje
dobrze metamorfozę, jaką przechodzi obraz gry od postaci ekstensywnej do macierzowej.
Wpływ czynnika losowego, który rozgałęział dendryt gry zostaje zredukowany do udziału
prawdopodobieństw w liczeniu wartości oczekiwanych wypłat graczy. Każdy możliwy
przebieg gry, czyli partia gracza zostaje zredukowana do postaci jednej strategii czystej i
jednego ruchu. Konstrukcja strategii nie wymaga jakiejkolwiek wiedzy o decyzjach
przeciwnika. Dopiero jej wybór, połączony ze znajomością decyzji przeciwnika, w sposób
automatyczny dobiera wygrane do policzenia odpowiedniej wartości oczekiwanej. Opisana
procedura to „redukcja każdej gry do prostej postaci standardowej, zwanej postacią normalną
gry” [Luce, Raiffa, 1964, s. 58]. Postać normalna, o której mowa, różni się od postaci
macierzowej jedynie szczegółami technicznymi dotyczącymi konstrukcji tabeli.
Idąc dalej w przemianach zakresu informacji graczy, możemy zbudować kolejną grę.
Zmiana zbiorów informacyjnych gracza A powinna pociągnąć za sobą zwiększenie się liczby
jego strategii czystych.
Gra „A kontra B”
13
Przyjmijmy wszystkie reguły gry „A przeciw B” zmieniając tylko jedną. Firma
Audioslave zamówiła badanie rynku i poznała jego rozmiar przed podjęciem decyzji o profilu
produktu. Firma Broadcast wie, że badania zostały przeprowadzone, ale nie zna ich wyniku.
Postać rozwinięta gry „A kontra B” zmieni się w stosunku do poprzedniej wersji
analizowanej sytuacji rynkowej w zakresie zbioru informacyjnego gracza A. Wiedza o
rozmiarach rynku sprawi podzieli się on na dwa reprezentujące odpowiednio informacje:
„rynek jest duży” lub „rynek jest mały”.
W porównaniu z grą „A przeciw B”, zbiór strategii gracza B nie ulegnie zmianie.
Zbiór strategii gracza A musi zostać zbudowany z uwzględnieniem zmian w zakresie
informacji. Nowe strategie budowane są przed zdobyciem wiedzy o rozmiarach rynku, ale w
swojej istocie muszą ją uwzględniać. W obecnej postaci gry, gracz A ma do wyboru cztery
strategie:
a
3
– niezależnie od rozmiarów rynku wybierać odtwarzacz tańszy („mT;dT”),
a
4
– wybrać tańszy na mały rynek i droższy na duży („mT;dD”),
a
5
– wybrać droższy na mały rynek i tańszy na duży („mD;dT”),
a
6
– zawsze wybierać odtwarzacz droższy („mD;dD”).
Nie potrzeba głębszej analizy, aby zauważyć, że najniższe wygrane powinna przynosić
strategia a
4
. Polega ona na wejściu z tanim odtwarzaczem na mały rynek, na którym dominują
audiofile lub z drogim odtwarzaczem na rynek duży, który oczekuje tzw. „sprzętu dla
Los
Audioslave
Broadcast
mały rynek
p
m
=0,4
duży rynek
p
d
=0,6
a
1
a
1
a
2
a
2
b
2
b
2
b
2
b
2
b
1
b
1
b
1
b
1
(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)
Schemat 1.3. Dendryt gry „A kontra B”
Ź
ródło: opracowanie własne na podstawie [Kreps, 1990]
14
każdego”. Najwyższe wygrane powinien, zatem przynieść graczowi A wybór strategii a
5
.
Zapis macierzowy gry „A kontra B” potwierdza te przypuszczenia.
Tabela 1.4. Macierz gry "A kontra B"
Audioslave
u
a
a
3
a
4
a
5
a
6
b
3
35,0
22,4
37,0
24,4
b
4
35,0
29,6
35,0
29,6
b
5
29,2
18,4
35,2
24,4
Broadcast
b
6
29,2
25,6
33,2
29,6
Audioslave
u
b
a
3
a
4
a
5
a
6
b
3
13,0
25,6
11,0
23,6
b
4
13,0
18,4
13,0
18,4
b
5
18,8
29,6
12,8
23,6
Broadcast
b
6
18,8
22,4
14,8
18,4
Ź
ródło: opracowanie własne
Podobnie, jak w przypadku przejścia od gry „A vs B” do gry „A przeciw B” macierz
gry „A kontra B” różni się od poprzedniej pojawieniem się dwóch dodatkowych kolumn a
4
i
a
5
9
. Gdybyśmy z tej macierzy usunęli wszystkie komórki poza narożnikowymi,
otrzymalibyśmy macierz gry, od której zaczynaliśmy („A vs B”).
1.
Gry o sumie zerowej
1.1.4.
Punkt siodłowy jako rozwiązanie w strategiach czystych
Natura gier o sumie zerowej
10
przejawia się w ich ściśle konkurencyjnym charakterze
[Luce, Raiffa, 1964, s. 64]. Jest on widoczny w czystej postaci, jeśli mamy do czynienia z grą
dwuosobową. Zwiększenie ilości graczy do n>2 stwarza możliwość dla budowania koalicji,
co zmienia naturę sytuacji strategicznych opisywanych grami o sumie zerowej. Ścisły konflikt
interesów ustępuje miejsca wyborowi między koalicjami. Oczywiście suma wygranych
koalicji i jej dopełnienia nadal jest zerowa, ale sytuacja pojedynczego gracza jest inna niż w
przypadku gry dwuosobowej. Z tej przyczyny, oraz ze względu na przedmiot zainteresowania
zasadniczej części pracy uwaga zostanie skoncentrowana na grach dwuosobowych.
Ś
cisły konflikt interesów połączony z dokonywaniem wyborów w warunkach
niepewności przynosi szczególną konstrukcję sytuacji decyzyjnej. Dążąc do maksymalnej
9
Strategia a
3
jest tożsama z a
1
a a
6
z a
2
. Analogicznie jak w przypadku gracza B.
10
Przypomnijmy, że prawie wszystkie obserwacje dotyczące tej klasy gier można rozciągnąć na szerszą
kategorię gier o sumie stałej.
15
wygranej gracz może doprowadzić do bardzo niepożądanego wyniku. Dokonując wyborów
strategii każdy z graczy musi mieć świadomość tego, że przeciwnik pośrednio ma na celu
minimalizację jego wygranej. Racjonalnym jest zatem dokonywanie takich wyborów, które
uchronią od jak najwyższych przegranych. Gdyby posłużyć się terminologią wojskową, w
grach o sumie zerowej należy stosować strategie minimalizacji strat. Przyjrzyjmy się
przykładowi następującej gry.
„Walka o rynek 1”
Dwa przedsiębiorstwa walczą o udział w rynku lokalnym. Każde z nich ma do wyboru
trzy strategie tzw. mixu marketingowego. W zależności od tego, jakie wybiorą strategie,
mogą stracić lub zyskać kosztem konkurenta określoną część rynku mierzoną w punktach
procentowych. Wyniki przyporządkowania wygranych graczy parom strategii przedstawia
Tabela 1.5.
Tabela 1.5. Macierz gry "Walka o rynek 1"
u
b
a
1
a
2
a
3
b
1
2%
1%
2%
b
2
-4%
-1%
3%
b
3
2%
-2%
-1%
Ź
ródło: opracowanie własne
Gdyby gracz B postawił sobie za cel odebranie konkurentowi największej, możliwej w
tej grze, części rynku (u
b
=3%), musiałby wybrać strategię b
2
. Jednak, jeśli jednocześnie gracz
A wybierze strategię a
1
, udziałem B stanie się maksymalna możliwa utrata części rynku, czyli
u
b
=-4%. Gdyby podobnym dążeniem kierował się gracz A, mogłoby się skończyć utratą 2%
rynku. Teoria gier nie daje odpowiedzi jak powinien postąpić gracz, aby osiągnąć jak
najwyższą wygraną w grze o sumie zerowej. Może jednak wskazać sposób wyboru strategii,
który zapewni pewien minimalny poziom wygranej, lub patrząc z innego punktu widzenia,
maksymalny poziom przegranej.
Już von Neumann i Morgenstern w swoim kanonicznym dziele sformułowali
postulaty, których spełnienie powinno towarzyszyć odnajdywaniu rozwiązań w grach o sumie
zerowej. Jednym z nich jest dominacja strategii. Jeśli strategia
11
a
d
przynosi, co najmniej,
takie same wygrane jak inna strategia a
z
, niezależnie od wyboru pozostałych graczy, a
11
Von Neumann i Morgenstern definiując dominację posłużyli się terminem „imputacja” czyli n-wymiarowy
wektor wypłat wszystkich graczy spełniający kryteria indywidualnej i zbiorowej racjonalności w grach n-
osobowych. W wielu pracach powstałych później, w przypadku gier dwuosobowych, operuje się definicją
dominacji strategii [Owen, 1975, s. 31] [Straffin,2001, s. 7] i to podejście zostało przyjęte przez autora.
16
przynajmniej w jednym wypadku wyższą to, możemy powiedzieć, że a
d
dominuje a
z
, lub a
z
jest zdominowane przez a
d
[von Neumann, Morgenstern, 1944, s. 37]. W przypadku gier
dwuosobowych, opisana dominacja ma miejsce wtedy, i tylko wtedy, gdy dla każdego
b
j
∈
M
b
:
])
b
,
a
([
u
]
b
,
a
([
u
j
z
a
j
d
a
≥
,
[1.13]
i istnieje co najmniej jedno b
k
∈
M
b
, że:
])
b
,
a
([
u
]
b
,
a
([
u
k
z
a
k
d
a
>
.
[1.14]
Analogicznie moglibyśmy zdefiniować dominację w obrębie zbioru strategii gracza B.
Racjonalnie zachowujący się gracz nigdy nie wybierze strategii zdominowanej
12
. Postulat
dominacji pozwala na ograniczenie zbioru strategii podczas poszukiwania rozwiązania gry.
Można z niego usunąć wszystkie strategie zdominowane.
Tabela 1.6. Wyznaczanie wartości gry "Walka o rynek 1"
u
b
a
1
a
2
a
3
a
M
i
a
min
∈
b
1
2%
1%
2%
1%
b
2
-4%
-1%
3%
-4%
a
M
i
a
b
M
j
b
min
max
∈
∈
b
3
2%
-2%
-1%
-2%
1%
b
M
bj
max
∈
2%
1%
3%
b
M
j
b
a
M
i
a
max
min
∈
∈
1%
Ź
ródło: opracowanie własne
Postulowany sposób rozwiązywania gier wykorzystuje pojęcie maksyminu
13
[von
Neumann, Morgenstern, 1944, s. 89-93]. Maksyminem gry dwuosobowej o sumie zerowej
nazywamy, taką wartość v
b
, że:
])
b
,
a
([
u
min
max
v
j
i
b
a
M
i
a
b
M
j
b
b
∈
∈
=
[1.15]
Maksymin gry jest wskazaniem strategii gracza B przynoszącym najwyższą z najniższych
wygranych, jakie poszczególne strategie tego gracza mogą przynieść. Innymi słowy, dla
każdej strategii gracza B odnajdujemy najniższą wartość, zakładając, że gracz A będzie
odpowiadał w sposób najkorzystniejszy dla siebie. Spośród wszystkich, tak wskazanych
minimów, wybieramy największe. W grze „Walka o rynek 1” maksyminem jest
12
Niektórzy autorzy dzielą dominacje na słabą, zgodną z nierównością [1.13] i ostrą, w przypadku której ta
nierówność przybiera postać ostrą [Drabik, 2005, s. 34]. Nie zmienia to praktycznego wymiaru dominacji.
Strategia zdominowana nie wejdzie w skład rozwiązania niezależnie od tego, czy jest to nierówność ostra czy
nieostra.
13
Matematyczną koncepcję maksyminu przedstawił po raz pierwszy E. Borel [Borel, 1921]. Von Neumannowi
przypisuje się jej pionierskie wykorzystanie w sformułowaniu twierdzenia maksyminowego dla gier o sumie
zerowej [von Neumann, 1928].
17
v
b
=u
b
([a
2
,b
1
])=1%. Gracz B, wybierając strategię b
1
, czyli swoją strategię maksyminową,
zapewnia sobie, że wygra, co najmniej, 1% rynku.
Z punktu widzenia gracza A, interesująca jest inna postać tej samej kategorii teorii
gier. śeby zapewnić sobie minimalny poziom wygranej A musi wybierać strategię tak, aby
gracz B wybierając najkorzystniej dla siebie, osiągnął najniższą z najwyższych wygranych.
Gracz A powinien się kierować kryterium minimaksu. Minimaksem gry dwuosobowej jest
taka wartość gry v
a
, że:
])
b
,
a
([
u
max
min
v
j
i
b
b
M
j
b
a
M
i
a
a
∈
∈
=
[1.16]
W grze „Walka o rynek 1”, minimaksem gry jest v
a
=u
b
([a
2
,b
1
])=1%. Gracz A
wybierając strategię minimaksową a
2
gwarantuje sobie, że nie przegra więcej niż 1% rynku.
Wyznaczenie maksyminu i minimaksu gry pozwala wyznaczyć poziomy bezpieczeństwa
obydwu graczy. Strategia maksyminowa jest nazywana również strategią bezpieczeństwa
[Luce, Raiffa, 1964, s. 70]. Wybierając ją, gracz zapewnia sobie bezpieczeństwo
maksymalizacji minimalnego poziomu wygranej równego v
b
. Wygrane v
a
i v
b
nazywane są
również, odpowiednio dolną i górną wartością gry [Drabik, 2005, s. 31-32].
Łatwo udowodnić, że minimaks gry dwuosobowej o sumie zerowej jest równy, co do
bezwzględnej wartości i przeciwny, co do znaku, jej maksyminowi na wygranych drugiego
gracza [von Neumann, Morgenstern, 1944, s. 109]:
])
b
,
a
([
u
min
max
])
b
,
a
([
u
max
min
v
j
i
a
a
M
i
a
b
M
j
b
j
i
b
b
M
j
b
a
M
i
a
a
∈
∈
∈
∈
−
=
=
,
[1.17]
])
b
,
a
([
u
max
min
])
b
,
a
([
u
min
max
v
j
i
a
b
M
j
b
a
M
i
a
j
i
b
a
M
i
a
b
M
j
b
b
∈
∈
∈
∈
−
=
=
.
[1.18]
Gra „Walka o rynek 1” jest przykładem konfliktu interesów, w którym maksymin
zrównuje się z minimaksem:
v
v
])
b
,
a
([
u
max
min
])
b
,
a
([
u
min
max
v
a
j
i
b
b
M
j
b
a
M
i
a
j
i
b
a
M
i
a
b
M
j
b
b
=
=
=
=
∈
∈
∈
∈
[1.19]
Jeśli mamy do czynienia z taką sytuacją, oznacza to, że gra posiada punkt siodłowy
[von Neumann, Morgenstern, 1944, s. 95]. Jednocześnie taką grę można określić jako ściśle
określoną [von Neumann, Morgenstern, 1944, s. 106]. Punkt siodłowy w grach
dwuosobowych o sumie zerowej to taka para strategii, przy której zachodzi warunek [1.19].
Wygrana „v” w punkcie siodłowym nazywana jest wartością gry. Jest ona jednocześnie równa
lub wyższa od pozostałych w kolumnie i niższa lub równa od pozostałych w wierszu
14
. Punkt
siodłowy w grach o sumie zerowej traktujemy jako rozwiązanie gry w strategiach czystych, a
14
Oczywiście mówimy o macierzy wygranych gracza, którego strategie stanowią nagłówki wierszy.
18
strategię nań się składające jako optymalne strategie czyste graczy. Niektórzy autorzy
definiują rozwiązanie dwuosobowej gry o sumie zerowej jako trzyelementowy zbiór: wartość
gry oraz optymalne strategie graczy [Straffin, 2001, s. 17].
Wróćmy na moment do gry „A przeciw B”, którą pozostawiliśmy bez rozwiązania.
Jest to gra o sumie stałej tożsama liniowo z grą o sumie zerowej opisaną Tabelą 1.7, która ma
punkt siodłowy w strategiach [a
1
,b
5
] (Audioslave produkuje odtwarzacz tańszy a Broadcast
wybiera inaczej od konkurenta). W tym rozwiązaniu gracze dzielą się oczekiwaną wartością
rynku w sposób następujący: u
a
([a
1
,b
5
])=29,2 i u
b
([a
1
,b
5
])=18,8. Te same wygrane staną się
udziałem graczy, jeśli wybiorą strategie [a
1
,b
6
]. Nie jest to jednak punkt siodłowy,
u
b
’([a
1
,b
6
])=-5,2 nie jest wartością najniższą w wierszu i najwyższą w kolumnie. Ponadto,
jeśli przed wyznaczeniem maksyminu i minimaksu wykorzystamy kryterium dominacji to
okaże się, że strategia b
5
dominuje wszystkie pozostałe, co czyni wybór gracza B trywialnym.
Gracz A zna macierz wygranych, zatem pozostaje mu wybór najlepszej odpowiedzi na b
5
,
czyli a
1
.
Tabela 1.7. Wyznaczenie punktu siodłowego gry "A przeciw B"
u
b
’
a
1
a
2
a
M
i
a
min
∈
b
3
-11
-0,4
-11
b
4
-11
-5,6
-11
b
5
-5,2
-0,4
-5,2
a
M
i
a
b
M
j
b
min
max
∈
∈
b
6
-5,2
-5,6
-5,6
-5,2
b
M
bj
max
∈
-5,2
-0,4
b
M
j
b
a
M
i
a
max
min
∈
∈
-5,2
Ź
ródło: opracowanie własne
Aby dopełnić powinności wyznaczenia punktu siodłowego w grze, która była
rozwinięciem „A przeciw B” ponownie dokonano przekształcenia liniowego macierzy
wygranych z Tabeli 4. Powstała gra o sumie zerowej ma jeden punkt siodłowy w strategiach
[a
5
,b
6
]. Wartością gry jest:
2
,
9
])
b
a
([
'
u
])
b
,
a
([
'
u
max
min
])
b
,
a
([
'
u
min
max
v
6
,
5
b
j
i
b
b
M
j
b
a
M
i
a
j
i
b
a
M
i
a
b
M
j
b
−
=
=
=
=
∈
∈
∈
∈
[1.20]
Taka wartość gry oznacza podział rynku: u
a
([a
5
,b
6
])=33,2 i u
b
([a
5
,b
6
])=14,8.
Wykorzystanie kryterium dominacji prowadzi, tym razem, gracza A do
jednoznacznego wyboru strategii a
5
, która dominuje wszystkie pozostałe. Graczowi B
pozostaje wybrać b
6
, która jest jego najlepszą odpowiedzią na a
5
. Znalezione rozwiązania gier
„A przeciw B” i „A kontra B” wskazują, że graczowi A, czyli firmie Audioslave, opłaca się
19
zapłacić za badania rynku tylko wtedy, gdy ich cena nie będzie większa od czterech
(u
a
([a
5
,b
6
])-u
a
([a
1
,b
5
])=33,2-29,2=4).
Tabela 1.8. Wyznaczenie punktu siodłowego w grze "A kontra B"
u
b
a
3
a
4
a
5
a
6
a
M
i
a
min
∈
b
3
-11
1,6
-13
-0,4
-13
b
4
-11
-5,6
-11
-5,6
-11
b
5
-5,2
5,6
-11,2
-0,4
-11,2
a
M
i
a
b
M
j
b
min
max
∈
∈
b
6
-5,2
-1,6
-9,2
-5,6
-9,2
-9,2
b
M
bj
max
∈
-5,2
5,6
-9,2
-0,4
b
M
j
b
a
M
i
a
max
min
∈
∈
-9,2
Ź
ródło: opracowanie własne
Zdarza się, że w grach dwuosobowych o sumie zerowej są dwa punkty siodłowe. Taka
sytuacja oczywiście może mieć miejsce, ale zawsze są to rozwiązania ekwiwalentne i
zamienne. „Każde dwa punkty siodłowe tej samej gry, mają tą samą wartość. Jeśli zarówno
gracz A jak i gracz B wybiorą strategie zawierające punkty siodłowe, to wynik gry zawsze
będzie punktem siodłowym” [Straffin, s. 10].
Tabela 1.9. Wyznaczanie wartości gry "Walka o rynek 2"
u
b
a
1
a
2
a
3
a
M
i
a
min
∈
b
1
3%
1%
2%
1%
b
2
-4%
-1%
4%
-4%
a
M
i
a
b
M
j
b
min
max
∈
∈
b
3
2%
1%
3%
1%
1%
b
M
bj
max
∈
3%
1%
4%
b
M
j
b
a
M
i
a
max
min
∈
∈
1%
Ź
ródło: opracowanie własne
Poszukiwanie punktu siodłowego w grze „Walka o rynek 2”
15
przyniosło podwójne
wskazanie. Niezmieniona, w porównaniu z grą „Walka o rynek 1”, wartość gry v=1% pojawia
się dla dwóch par strategii:
%
1
])
b
a
([
u
])
b
a
([
u
])
b
,
a
([
u
max
min
])
b
,
a
([
u
min
max
v
3
,
2
b
1
,
2
b
j
i
b
b
M
j
b
a
M
i
a
j
i
b
a
M
i
a
b
M
j
b
=
=
=
=
=
∈
∈
∈
∈
[1.21]
Gra „Walka o rynek 2” ma dwa punkty siodłowe. Zgodnie z twierdzeniem o ekwiwalentności
i zamienności, graczom obojętne jest, w którym z punktów siodłowych przyjdzie im się
znaleźć.
15
„Walka o rynek 2” różni się od pierwszej wersji tylko macierzą wypłat.
20
Oczywiście, liczba punktów siodłowych równa dwa nie jest limitem ich liczebności w
jednej grze. Wystarczy wyobrazić sobie grę, w której nieparzyste wiersze macierzy
zawierałyby wyłącznie wypłaty większe od v w nieparzystych kolumnach lub równe v w
parzystych. Parzyste wiersze zaś powinny zawierać wyłącznie wygrane niższe od v. Liczba
punktów siodłowych
Ψ
, jakie posiada ta gra można byłoby określić wzorem:
)
(
E
)
(
E
)
n
,
m
(
2
1
n
2
m
+
=
Ψ
,
[1.22]
gdzie m to liczba strategii gracza A (kolumny) a n to ilość strategii gracza B (wiersze), E zaś
jest funkcją przyporządkowującą każdej liczbie rzeczywistej jej część całkowitą.
Wystarczyłoby, żeby tylko jedna z liczby strategii zmierzała do nieskończoności, a taka gra
miałaby nieskończoną ilość punktów siodłowych.
1.1.5.
Rozwiązanie w strategiach mieszanych; twierdzenie maksyminowe
W praktyce możemy mówić o dużym szczęściu, jeśli uda się znaleźć, chociaż jeden
punkt siodłowy. Większość gier, z jakimi mamy do czynienia, nie ma żadnego punktu
siodłowego, tożsamego z rozwiązaniem w strategiach czystych. Z taką grą już mieliśmy do
czynienia. Przypomnijmy sobie grę „A vs B” w postaci macierzowej (Tabela 1.2). Odejmując
od wygranych obydwu graczy 24 (połowa wartości oczekiwanej rynku), otrzymamy grę o
sumie zerowej.
Warunek [1.19] nie jest spełniony w przypadku tej gry. Von Neumann i Morgenstern
zdefiniowali takie gry jako nie ściśle określone. W ich przypadku v
b
≤
v
a
[von Neumann,
Morgenstern, 1944, s. 110]. To nie oznacza, że nie posiadają one rozwiązań. Należy ich
poszukiwać innymi metodami. Niezależnie od tego, jaką wybierzemy metodę, w skład
rozwiązania nie będzie już wchodzić para strategii czystych. Koniecznym będzie rozszerzenie
przynajmniej jednego zbioru strategii o ich mieszaną postać.
Tabela 1.10. Gra "A vs B" przekształcona liniowo
u
b
'
a
1
a
2
a
M
i
a
min
∈
b
1
-11
-0,4
-11
a
M
i
a
b
M
j
b
min
max
∈
∈
b
2
-5,2
-5,6
-5,6
-5,6
b
M
bj
max
∈
-5,2
-0,4
b
M
j
b
a
M
i
a
max
min
∈
∈
-5,2
Ź
ródło: obliczenia własne
21
Znalezienie optymalnej strategii mieszanej, dla każdego z obydwu graczy, polega na
wyznaczeniu takiej, która spełniać będzie analogiczną rolę jak czysta strategia optymalna w
grach z punktem siodłowym. Aby tego dokonać należy wyznaczyć zbiór prawdopodobieństw,
który wyznaczy taką strategię mieszaną, że nie będzie można znaleźć innej, gwarantującej
wyższy poziom wygranej niezależnie od wyborów drugiego gracza.
Dowolna strategia mieszana gracza A zbudowana z m strategii czystych i rozkładu
prawdopodobieństwa p
j
={p
j1
,p
j2
,...,p
jk
,...,p
jm
} takiego, że 0≤p
jk
≤
1 oraz
∑
=
=
m
1
k
jk
1
p
, to
a
pj
=[p
j1
a
1
,p
j2
a
2
,...,p
jk
a
k
,...,p
jm
a
m
]. Analogicznie możemy zdefiniować postać ogólną strategii
mieszanej gracza B (b
qi
∈
M
qb
) jako b
qi
=[q
i1
b
1
,q
i2
b
2
,...,q
il
b
l
,...,q
in
b
n
] (0≤q
il
≤
1 oraz
∑
=
=
n
1
l
il
1
q
).
Spośród wszystkich strategii mieszanych a
pj
∈
M
pa
i b
qi
∈
M
qb
, optymalnymi a
po
i b
qo
będą te,
które spełnią warunki:
])
b
,
a
([
u
inf
sup
])
b
,
a
([
u
v
qi
pj
b
pa
M
pj
a
qb
M
qi
b
qo
pj
b
qb
∈
∈
=
=
,
[1.23]
])
b
,
a
([
u
sup
inf
])
b
,
a
([
u
v
qi
pj
b
qb
M
qi
b
pa
M
pj
a
qi
po
b
pa
∈
∈
=
=
,
[1.24]
gdzie:
v
qb
– dolna wartość gry w strategiach mieszanych,
v
pa
– górna wartość gry w strategiach mieszanych,
sup – kres górny zbioru wypłat generowanych przez strategie mieszane,
inf – kres dolny zbioru wypłat generowanych przez strategie mieszane
16
.
Inaczej rzecz ujmując, możemy stwierdzić, że wyznaczenie optymalnej strategii
mieszanej polega na znalezieniu takich prawdopodobieństw losowania strategii, by drugi z
graczy nie mógł przekroczyć pewnego maksymalnego poziomu wygranej, niezależnie od
tego, jaką strategię czystą wybierze. I odwrotnie, gracz, którego wygrane opisane są macierzą
gry będzie szukał takich prawdopodobieństw, by zapewnić sobie minimalny poziom wypłaty
niezależnie od wyborów przeciwnika. Optymalna strategia mieszana wyznaczona w tym
drugim przypadku musi przynieść maksymalną v
qb
spełniającą układ warunków
przedstawiony niżej.
16
W ślad za E. Drabik zastąpiono pojęcia „max” i „min” by zaakcentować odmienność gier ściśle określonych
od gier nie ściśle określonych [Drabik, 2005, s. 36].
22
≤
≤
=
+
+
+
+
+
≥
+
+
+
+
+
≥
+
+
+
+
+
≥
+
+
+
+
+
≥
+
+
+
+
+
1
q
0
1
q
...
q
...
q
q
v
])
b
,
([a
u
q
...
])
b
,
([a
u
q
...
])
b
,
([a
u
q
])
b
,
([a
u
q
...
v
])
b
,
([a
u
q
...
])
b
,
([a
u
q
...
])
b
,
([a
u
q
])
b
,
([a
u
q
...
v
])
b
,
([a
u
q
...
])
b
,
([a
u
q
...
])
b
,
([a
u
q
])
b
,
([a
u
q
v
])
b
,
([a
u
q
...
])
b
,
([a
u
q
...
])
b
,
([a
u
q
])
b
,
([a
u
q
il
in
il
i2
i1
qb
n
m
b
in
l
m
b
il
2
m
b
i2
1
m
b
i1
qb
n
k
b
in
l
k
b
il
2
k
b
i2
1
k
b
i1
qb
n
2
b
in
l
2
b
il
2
2
b
i2
1
2
b
i1
qb
n
1
b
in
l
1
b
il
2
1
b
i2
1
1
b
i1
[1.25]
Dwuosobowe gry o sumie zerowej, bez punktów siodłowych, o dwuelementowych
zbiorach
strategii
czystych,
możemy
zawsze
rozwiązać
wykorzystując
metodę
przyrównywania [Shubik, 1995, s. 222]. Wybierając swoją optymalną strategię mieszaną,
gracz zapewnia sobie, że przeciwnik nie odniesie żadnej korzyści z poznania jej [Straffin,
2001, s. 15]. Postawmy się na miejscu gracza B w grze „A vs B”. Musi on wybrać takie
prawdopodobieństwa q
1
i q
2
losowania strategii b
1
i b
2
, aby gracz A nie mógł odnieść korzyści
z wiedzy o jego wyborze strategii mieszanej. Dzieje się tak wtedy, gdy:
≤
≤
=
+
+
=
+
⇒
=
1
q
0
1
q
q
])
b
,
a
([
'
u
q
])
b
,
a
([
'
u
q
])
b
,
a
([
'
u
q
])
b
,
a
([
'
u
q
)
a
(
EV
)
a
(
EV
i
2
1
2
2
b
2
1
2
b
1
2
1
b
2
1
1
b
1
2
1
[1.26]
W analizowanej grze ten warunek daje się sprowadzić do równania:
)
q
1
(
6
,
5
q
4
,
0
)
q
1
(
2
,
5
q
11
1
1
1
1
−
−
−
=
−
−
−
,
[1.27]
którego rozwiązaniem jest
55
2
1
q
=
. Optymalną strategią mieszaną gracza B jest
b
qo
=[
55
2
b
1
,
55
53
b
2
]. Przynosi ona dolną wartość gry w strategiach mieszanych:
41
,
5
)
6
,
5
(
)
4
,
0
(
)
2
,
5
(
)
11
(
v
55
53
55
2
55
53
55
2
qb
−
=
−
+
−
=
−
+
−
=
.
[1.28]
Wybór optymalnej strategii przez gracza B oznacza podział wartości oczekiwanej
rynku, przy którym firma Audioslave osiąga przychód u
a
=29,41 a firma Broadcast u
b
=18,59.
Wybierając optymalną strategię mieszaną gracz B gwarantuje sobie, że osiągnie przychód, co
najmniej równy 18,59, niezależnie od wyboru strategii przez gracza A. Porównanie
uzyskanego wyniku z rozwiązaniem gry „A przeciw B” (u
b
=18,8) pokazuje, że znajomość
decyzji konkurenta pozwala firmie Broadcast zagwarantować sobie wygraną wyższą o 0,21.
23
Wykres 1.1. Graficzna interpretacja metody przyrównań dla gry "A vs
B" przekształconej liniowo (v
qb
)
-12
-11
-10
-9
-8
-7
-6
-5
-4
-3
-2
-1
0
1
2
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
q
1
EV
EV(a
1
)
EV(a
2
)
2
/
55
v
qb
Ź
ródło: opracowanie własne na podstawie [Luce, Raiffa, 1964, s. 366]
Dolna wartość gry w strategiach mieszanych niesie z sobą podobną interpretację jak
maksymin w grach ściśle określonych. Jest to dobrze widoczne na wykresie obrazującym
działanie metody przyrównywania. Gracz A, znając wybraną przez B strategię mieszaną, dla
każdego q
1
≠
55
2
, mógłby tak dobierać swoją strategię czystą, aby B osiągał wygrane mniejsze
od v
qb
=-5,41. Dla q
1
>
55
2
wybierałby a
1
, a gdy q
1
<
55
2
, a
2
. Tylko wybór optymalnej strategii
mieszanej, opartej na q
1
=
55
2
gwarantuje, że wygrana B nie będzie niższa niż v
qb
=-5,41.
Analogicznie wyznaczana jest górna wartość gry w strategiach mieszanych.
Optymalna strategia mieszana gracza musi spełniać warunek:
≤
≤
=
+
+
=
+
⇒
=
1
p
0
1
p
p
])
b
,
a
([
'
u
p
])
b
,
a
([
'
u
p
])
b
,
a
([
'
u
p
])
b
,
a
([
'
u
p
)
b
(
EV
)
b
(
EV
i
2
1
2
2
b
2
2
1
b
1
1
2
b
2
1
1
b
1
2
1
[1.29]
W grze „A vs B” warunek [1.29] przybiera postać:
)
p
1
(
6
,
5
p
2
,
5
)
p
1
(
4
,
0
p
11
1
1
1
1
−
−
−
=
−
−
−
,
[1.30]
którego rozwiązaniem jest
55
26
1
p
=
. Optymalną strategią mieszaną gracza A jest
a
po
=[
55
26
a
1
,
55
29
a
2
]. Przynosi ona dolną wartość gry w strategiach mieszanych:
41
,
5
)
6
,
5
(
)
2
,
5
(
)
4
,
0
(
)
11
(
v
55
29
55
26
55
29
55
26
pa
−
=
−
+
−
=
−
+
−
=
.
[1.31]
24
Wykres 1.2. Graficzna interpretacja metody przyrównań dla gry "A vs
B" przekształconej liniowo (v
pa
)
-12
-11
-10
-9
-8
-7
-6
-5
-4
-3
-2
-1
0
1
2
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
p
1
EV
EV(b
1
)
EV(b
2
)
26
/
55
v
pa
Ź
ródło: opracowanie własne na podstawie [Luce, Raiffa, 1964, s. 366]
Grając swoją strategię optymalną A gwarantuje sobie, że B nie wygra więcej niż v
pa
,
niezależnie od tego czy wybierze b
1
czy b
2
.
Wyniki obliczeń przeprowadzonych dla gry „A vs B” są ilustracją twierdzenia
von Neumanna. Zgodnie z nim, w każdej dwuosobowej grze o sumie zerowej z pełną
informacją, można znaleźć rozwiązanie składające się z optymalnych strategii mieszanych
takich, że:
w
])
b
,
a
([
u
v
])
b
,
a
([
u
v
qi
po
b
pa
qo
pj
b
qb
=
=
=
=
,
[1.32]
gdzie w jest wartością gry w strategiach mieszanych [von Neumann, Morgenstern, 1944,
s. 123]. Jeśli rozszerzymy zbiory strategii graczy dopuszczając ich mieszanie, każda gra jest
ś
ciśle określona. Autorski dowód tego twierdzenia jest dość skomplikowany i opiera się na
twierdzeniu Brouwera o punkcie stałym. Wśród późniejszych wersji prostotą wyróżnia się
dowód Nasha [Luce, Raiffa, 1964, s. 362-364]. Niezależnie od sposobu dowodzenia,
twierdzenie minimaksowe von Neumanna ma fundamentalne znaczenie dla poszukiwania
rozwiązań w grach o sumie zerowej.
Wykres pokazujący metodę przyrównania, wykorzystaną w rozwiązaniu gry
dwuosobowej o sumie zerowej i macierzy wygranych 2x2, ma wyłącznie znaczenie
25
ilustracyjne. Jeśli rozszerzymy rozmiar macierzy do nx2, okaże się, że graficzna ilustracja
ułatwia i przyspiesza analityczne wyznaczenie rozwiązania metodą przyrównania
17
.
Tabela 1.11. Poszukiwanie punktu siodłowego gry "Walka o rynek 3"
u
b
a
1
a
3
a
M
i
a
min
∈
b
1
3%
2%
2%
b
2
-4%
4%
-4%
a
M
i
a
b
M
j
b
min
max
∈
∈
b
3
2%
3%
2%
2%
b
M
bj
max
∈
3%
4%
b
M
j
b
a
M
i
a
max
min
∈
∈
3%
Ź
ródło: opracowanie własne
„Walka o rynek 3”
Wróćmy do gry „Walka o rynek 2” redukując ją. Okazało się, bowiem że ze względu
na wysokie koszty, gracz A na pewno nie wybierze strategii a
2
.
Nowa gra nie ma punktu siodłowego. Nie można też, zacząć od metody przyrównania
w postaci analitycznej ze względu na nierówną liczebność zbiorów strategii czystych obydwu
graczy. Wybór optymalnej strategii mieszanej gracza A poprzedźmy konstrukcją
odpowiedniego wykresu.
Wykres 1.3. Graficzna interpretacja metody
przyrównań dla gry "Walka o rynek 3"
-5%
-4%
-3%
-2%
-1%
0%
1%
2%
3%
4%
5%
0,0
0,2
0,4
0,6
0,8
1,0
p
1
EV
EV(b
2
)
EV(b
1
)
EV(b
3
)
Ź
ródło: opracowanie własne
17
Williams idzie dalej w uznaniu znaczenia interpretacji graficznej twierdząc, że istnieje autonomiczna metoda
graficzna rozwiązywania gier o macierzach wygranych 2xm [Williams, 1965, s. 88].
26
Właściwy wykres, dla ułatwienia odczytu szukanych wartości należy uzupełnić tabelą,
która pokazuje jak zmieniają się wartości oczekiwane wygranych gracza B w zależności od
prawdopodobieństwa p
1
wyboru strategii a
1
przez gracza A.
Tabela 1.12. Wyznaczanie wartości gry "Walka o rynek 3" metodą przyrównania
p
1
0,0000
0,1429
0,2222
0,5000
1,0000
EV(b
1
)
2,000%
2,143%
2,222%
2,500%
3,000%
EV(b
2
)
4,000%
2,857%
2,222%
0,000%
-4,000%
EV(b
3
)
3,000%
2,857%
2,778%
2,500%
2,000%
Ź
ródło: opracowanie własne
Gracz A wie, że konkurent będzie dążył do osiągnięcia jak najwyższej wygranej przy
danym wyborze prawdopodobieństwa p
1
. Jeśli 0≤p
1
≤
0,1429, B wybierze strategię b
2
, gdy
0,1429≤p
1
≤
0,5 najwyższą wygraną przyniesie strategia b
3
i ostatecznie dla 0,5≤p
1
≤
1
najlepszym wyborem B będzie strategia b
1
(zob. Wykres 1.3). Graczowi A pozostaje wybór
takiego prawdopodobieństwa p
1
, by „osadzić” B w najniższym punkcie, najkorzystniejszej dla
niego, łamanej. Zarówno z wykresu jak i z Tabeli 1.12 wynika, że najkorzystniej dla A będzie
wybrać p
1
=0,5, gwarantując sobie tym, że B nie wygra więcej niż v
pa
=2,5%.
W takiej sytuacji B, z pewnością nie wybierze b
2
. Aby wyznaczyć jego optymalną
strategię mieszaną, należy posłużyć się loterią strategii b
1
i b
3
. Musi ona zapewnić spełnienie
warunku [1.26], który w przypadku gry „Walka o rynek 3” daje się sprowadzić do postaci:
)
q
1
%(
3
q
%
2
)
q
1
%(
2
q
%
3
1
1
1
1
−
+
=
−
+
.
[1.33]
Rozwiązaniem tego równania jest q
1
=0,5. Dolna wartość gry w strategiach mieszanych
wynosi v
qb
=2,5%. Możemy już wskazać rozwiązanie gry „Walka o rynek 3”. Składają się na
nie:
a)
optymalna strategia gracza A: a
po
=[
2
1
a
1
,
2
1
a
3
],
b)
optymalna strategia gracza B: b
qo
=[
2
1
b
1
,0b
2
,
2
1
b
3
],
c)
wartość gry v
pa
=v
qb
=w=2,5%.
Porównanie rozwiązań gier „Walka o rynek 2” i „Walka o rynek 3” wskazuje, że
usunięcie strategii a
2
, jakkolwiek konieczne ze względu na wysokie koszty, było niekorzystne
dla gracza A. Wartość gry wzrosła z v=1% do w=2,5%. Można się tego było spodziewać,
wszak usunęliśmy strategię, która dominowała a
3
we wcześniejszej wersji gry. Jeśli zatem,
dodatkowe koszty związane z podjęciem realizacji strategii a
2
są niższe od wartości, jaką
może przynieść utrzymanie 1,5% rynku, gracz A powinien pozostać przy „Walce o rynek 2”.
Wyróżnienie gier o sumie zerowej zawdzięczać należy ich jednoznacznej naturze. W
grach tego typu konflikt interesów występuje w czystej postaci. „Główną ideą
27
niekooperacyjnego podejścia jest, jednym słowem, ‘egoizm’, nie mizantropijny lub
windykacyjny, ale polegający na obojętności wobec dążeń innych. Gra n-osobowa rozpada się
na n problemów jednoosobowych rozwiązywanych jednocześnie” [Shubik, 1995, s. 217].
Jednoznaczności związanej z nieodłącznym brakiem aspektu kooperacyjnego
towarzyszy jednoznaczność towarzysząca rozwiązywaniu gier o sumie zerowej. Twierdzenie
minimaksowe von Neumanna niesie z sobą przesłanie pozwalające nam przystępować do ich
rozwiązywania z przekonaniem o ostatecznym sukcesie. „Z powodu swojego determinizmu
skończone gry o sumie zerowej mogą być uznane za ‘kompletne’, w sensie możliwości
wyznaczenia optymalnych strategii. Prawdopodobnie z tych względów, teoria gier
przyciągnęła żywe zainteresowanie, szczególnie w kręgach, w których problem wyznaczania
optymalnych decyzji w warunkach konfliktu lub konkurencji jest uznany za naczelny”
[Rapoport, 1989, s. 195]. Nawet, jeśli poziom rozbudowania bazy teoretycznej gier o sumie
zerowej można uznać za umiarkowany w porównaniu z ogólną teorią gier, trudno wyobrazić
sobie dzisiejszy obraz tej ostatniej bez podstaw, jakie zbudowali von Neumann i Morgenstern.
15
1.3.
Niekooperacyjne gry o sumie różnej od zera
1.3.1.
Równowaga w strategiach czystych
Naturalnym dopełnieniem zbioru gier o sumie zerowej są gry o sumie różnej od zera
1
.
Jednocześnie można powiedzieć, że zarówno gry o sumie zerowej jak i gry o sumie różnej od
zera są rozłącznymi podzbiorami gier o sumie dowolnej. Gry n-osobowe o sumie różnej od
zera to te, w przypadku których istnieje przynajmniej jedno m
j
należące do M takie, że:
0
)
m
(
u
n
1
i
j
i
≠
∑
=
,
[1.34]
lub w przypadku gier dwuosobowych, istnieje przynajmniej jedno m
ij
należącego do M, takie,
ż
e:
u
a
(m
ij
)+u
b
(m
ij
)≠0.
[1.35]
W przypadku gier o sumie różnej od zera wygrane graczy w ramach określonego
zbioru wyników gry, przynajmniej w jednym przypadku, nie sumują się do zera. Powoduje to
niejednoznaczność sytuacji strategicznej. Może być tak, że zmiana wskazania strategii, przez
co najmniej jednego gracza zwiększy wygrane wszystkich uczestników gry, albo tak, że
wygrane części graczy zwiększają się, części zmniejszają a pozostałych nie zmieniają się.
Brak powszechności konfliktu interesów może w skrajnej sytuacji przybrać postać ich
pełnej zbieżności. W takiej sytuacji, każda zmiana strategii prowadzi do zmian wygranych
graczy o tym samym znaku. Z punktu widzenia teorii gier takie sytuacje są trywialne.
Ewentualność wystąpienia sytuacji, w której wszyscy gracze będą zainteresowani w
określonej zmianie strategii zdecydowanie wyróżnia gry o sumie różnej od zera. Istnieje
ważna klasa dwuosobowych gier o sumie różnej od zera zwana grami kooperacyjnymi. Ich
rozwiązanie polega na wyznaczeniu par strategii, co do przyjęcia których gracze podejmują
wiążące zobowiązanie i przynoszących obydwu wyższe wygrane niż przy niekooperacyjnym
wyborze strategii. Ich szczególne znaczenie sprawia, że wyznaczaniu rozwiązań
kooperacyjnych poświęcono odrębną część pracy.
W tej części pracy uwaga zostanie skoncentrowana na grach niekooperacyjnych. Są to
te gry o sumie zerowej, w przypadku których niedozwolone jest komunikowanie się graczy
przed grą i żaden z nich nie zna wyboru strategii konkurenta przed dokonaniem własnego. W
przypadku niekooperacyjnych gier n-osobowych niedopuszczalne jest tworzenie koalicji.
1
Oczywiście, to samo dotyczy relacji między grami o sumie stałej a grami o sumie zmiennej.
16
Rozważania nad wyznaczaniem rozwiązań w grach niekooperacyjnych rozpocznijmy
od analizy prostej gry o nazwie „Ścisła”.
„Ścisła”
Dwa działające na tym samym rynku przedsiębiorstwa mają do wyboru po dwie
strategie rynkowe: typu 1 i 2. Wygranymi są ich zyski. Jeśli jednocześnie wybiorą strategie
typu 1, osiągną parę najniższych z osiągalnych wygranych. Gdy zgodny wybór padnie na
strategie typu 2, udziałem graczy będą najwyższe dostępne im wygrane. Mieszanie typów
strategii przynosi wygrane mieszczące się wewnątrz dostępnych przedziałów, a ten z graczy,
który wybierze typ o wyższej numeracji wygrywa mniej niż gdyby było odwrotnie.
Tabela 1.13. Macierze wygranych gry „Ścisła”
2
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
5
5
8
0,5
Strategia
b
2
20
12
15
30
ź
ródło: opracowanie własne
Wyznaczenie pary strategii w tej grze nie nastręcza problemów nawet wtedy, gdy nie
miało się styczności z teorią gier. śadnemu z nich nie opłaca się grać strategii typu 1,
ponieważ, niezależnie od wyboru konkurenta, strategia typu 2 zawsze przyniesie wyższą
wygraną. Możemy zatem wykorzystać, znane z teorii gier o sumie zerowej kryterium
dominacji. Eliminacja zdominowanych strategii typu 1 prowadzi do rozwiązania [a
2
,b
2
] i
wygranych u
a
([a
2
,b
2
])=25 i u
b
([a
2
,b
2
])=30.
Spójrzmy na inny aspekt tego rozwiązania zakładając, że kryterium dominacji nie
może zostać zastosowane. Gracz A nie znając wyboru strategii przez konkurenta starać się
będzie znaleźć najlepsze na nie odpowiedzi. Zarówno na b
1
jak i na b
2
najlepszą odpowiedzią
jest a
2
. Analogicznie gracz B wybiera strategię b
2
. W ten sposób wyłonić się może para
strategii, która jest najlepszą odpowiedzią na siebie nawzajem. Taką parę strategii
definiujemy jako równowagę w grze. Równowaga jako wskazanie rozwiązania w grze
niekooperacyjnej została zaproponowana po raz pierwszy przez Johna Nasha. Po raz pierwszy
zdefiniował ją bez wskazywania konkretnej pary wartości użyteczności opierając się na
2
Ze względu na konieczność przedstawienia wygranych obydwu graczy, bardzo często dwuososbowe gry o
sumie różnej od zera określane są mianem dwumacierzowych [Drabik, 2005, s. 68], [Owen, 1975, s. 121].
17
relacjach między strategiami [Nash, 1950b, 1951]. Każdy z n graczy ma do wyboru określoną
liczbę strategii M
i
={m
i1
,m
i2
,...,m
ij
,...,m
im
}. Niech wygraną gracza i, przy określonym
wektorze strategii m
k
(każdy z graczy wskazuje jedną), będzie u
i
([m
1k
,m
2k
,...,m
ik
,...,m
nk
]).
Określony wektor strategii m
r
=[m
1r
,m
2r
,...,m
ir
,...,m
nr
] nazwiemy równowagą wtedy, gdy dla
każdego gracza i:
u
i
([m
1r
,m
2r
,...,m
ir
,...,m
nr
])=
ij
m
max
u
i
([m
1r
,m
2r
,...,m
ij
,...,m
nr
]).
[1.36]
ś
aden z graczy nie może poprawić swojej sytuacji zmieniając swoją strategię m
ir
na
jakąkolwiek inną m
ij
, jeśli pozostali utrzymają wybory strategii, które złożyły się na
równowagę.
1.3.2.
Równowaga w strategiach mieszanych, twierdzenie Nasha
Nash, oprócz zdefiniowania równowagi w teorii gier, udowodnił, że każda gra o sumie
różnej od zera ma, co najmniej jeden punkt równowagi [Nash, 1951]. Dowód cechował się
„wyjątkową elegancją” [Luce, Raiffa, 1964, s. 105] i opierał się na twierdzeniu Brouwera o
punkcie stałym. Równowaga, której istnienie dowiódł Nash może opierać się zarówno na
wektorach strategii czystych jak i mieszanych. Znaczenie twierdzenia Nasha jest
porównywane do znaczenia twierdzenia minimaksowego von Neumanna. Niestety, jego
praktyczna przydatność dla wyznaczania rozwiązań gier jest mniejsza.
Powróćmy na chwilę do gier o sumie zerowej. Przywołanie definicji punktu
siodłowego pozwala na stwierdzenie, że jest on szczególnym przypadkiem równowagi dla tej
klasy gier. Idąc tym tropem Nash zaproponował równowagę jako rozwiązanie gier o sumie
różnej od zera. Związek z grami o sumie zerowej rozszerza się również na możliwość
poszukiwania rozwiązań w strategiach mieszanych. Jeśli gra nie ma równowagi w strategiach
czystych, istnieje możliwość wyznaczenia jej szukając optymalnych prawdopodobieństw
losowania strategii. W grach dwuosobowych o symetrycznych macierzach możemy posłużyć
się metodą przyrównania. Przyjrzyjmy się grze „Mix”
„Mix”
Dwa działające na tym samym rynku przedsiębiorstwa mają do wyboru po dwie
strategie rynkowe: typu 1 i 2. Wygranymi są ich zyski. Wygrane zmieniają się zgodnie z
zapisami Tabeli 1.14.
18
Tabela 1.14. Macierze wygranych gry „Mix”
3
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
34
18
0
8
Strategia
b
2
6
28
36
0
ź
ródło: opracowanie własne
Gra nie ma równowag w strategiach czystych. Znalezienie równowagi w strategiach
mieszanych polega na znalezieniu takich prawdopodobieństw losowania strategii przez gracza
A {p,1-p} i przez gracza B {q,1-q}, że żaden z nich nic nie zyska na zmianie swojej strategii
na inną. Innymi słowy, jeśli obydwaj gracze zastosują swoje optymalne strategie mieszane, to
ż
aden z nich nie może zwiększyć swojej wygranej zmieniając strategię. Wyznaczone
prawdopodobieństwa muszą spełniać warunki:
EVb
1
(p)=pu
b
([a
1
,b
1
])+(1-p)u
b
([a
2
,b
1
])=EVb
2
(p)=pu
b
([a
1
,b
2
])+(1-p)u
b
([a
2
,b
2
]),
[1.37]
EVa
1
(q)=qu
a
([a
1
,b
1
])+(1-q)u
a
([a
1
,b
2
])=EVa
2
(q)=qu
a
([a
2
,b
1
])+(1-q)u
a
([a
2
,b
2
]).
[1.38]
W grze “Mix” te warunki konkretyzują się do postaci:
18p+8(1-p)=28p,
[1.39]
34q+6(1-q)=36(1-q).
[1.40]
Rozwiązaniem równań [1.43] i [1.44] są p=
9
4
i q=
32
15
. Na równowagę w strategiach
mieszanych składają się a
r
=[
9
4
a
1
,
9
5
a
2
] i b
r
=[
32
15
b
1
,
32
17
b
2
]. Wartości wygranych w równowadze
to u
ar
=19
8
1
oraz u
br
=12
9
4
. Wybór optymalnych strategii mieszanych pozostających w
równowadze trudno uznać za satysfakcjonujący. Para strategii [a
1
,b
1
] przynosi wyższe
wygrane obydwu graczom.
Niestety gry podobne do „Mix” nie są jedynymi, w przypadku których trudno wskazać
równowagę jako rozwiązanie. Dzieje się tak również w przypadku równowag w strategiach
czystych. Kanonicznym przykładem jest „K lub P”. Jest to gra należąca do typu „dylemat
więźnia”
4
.
„K lub P”
3
Ze względu na konieczność przedstawienia wygranych obydwu graczy, bardzo często dwuososbowe gry o
sumie różnej od zera określane są mianem dwumacierzowych [Drabik, 2005, s. 68], [Owen, 1975, s. 121].
4
Szerzej o genezie i eksperymentalnej weryfikacji „dylematu więźnia” napisano w rozdziale poświęconym
historii zastosowania eksperymentów w ekonomii.
19
Dwa przedsiębiorstwa
5
mają do wyboru strategię konkurencji (1) lub porozumienia
(2). Jednoczesny wybór strategii konkurencji [a
1
,b
1
] przynosi graczom niższe zyski niż
jednoczesny wybór strategii porozumienia [[a
1
,b
1
]. Jeśli jednak któryś z graczy zerwie
porozumienie i wybierze strategię konkurencji przy lojalnej postawie konkurenta, osiągnie
wyższy zysk niż gdyby go dochował. Jednocześnie drugi z graczy traci wygrywając mniej niż
przy zgodnym wyborze strategii konkurencji. Na przykład, gdy porozumienie zrywa A
u
a
([a
1
,b
2
])>u
a
([a
2
,b
2
]) i jednocześnie u
b
([a
1
,b
2
])<u
b
([a
1
,b
1
]).
Tabela 1.15. Macierze wygranych gry „K lub P”
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
15
20
8
35
Strategia
b
2
30
12
25
30
ź
ródło: opracowanie własne
Najlepszą odpowiedzią A na dowolną strategię B jest a
1
. Analogiczną rolę spełnia b
1
.
Zgodnie z definicją para strategii opartych na konkurencji stanowi równowagę w tej grze
[a
r
,b
r
]=[a
1
,b
1
]. Widać jednak, że jednoczesna zmiana wyboru strategii na [a
2
,b
2
] podnosi zyski
obydwu graczy. To wskazanie, z kolei, pozostaje pod istotnym zagrożeniem jednostronnej
zmiany strategii na a
1
lub b
1
. Analizowana gra, podobnie jak inne reprezentujące typ „dylemat
więźnia”, jest najbardziej jaskrawym przykładem trudności, na jakie napotykamy podczas
wyznaczania rozwiązania gry niekooperacyjnej o sumie zerowej. Każdej propozycji
towarzyszy alternatywa korzystniejsza, przynajmniej dla jednego z graczy.
Przewaga pary strategii [a
2
,b
2
] nad [a
1
,b
1
], wynika z tego, że ta druga nie spełnia
kryterium optymalności, które łączy racjonalność indywidualną z racjonalnością zbiorową.
Opiera się ono postulacie sformułowanym ok. 1900 roku przez włoskiego ekonomistę
Vilfredo Pareto. Zgodnie z nim „nie powinien być akceptowany system ekonomiczny, jeśli
możliwy jest inny, korzystniejszy dla wszystkich uczestników” [Straffin, 2001, s. 86]. Ta
definicja może zostać zaadaptowana dla potrzeb teorii gier z jednoczesną zamianą ostrej
nierówności na nieostrą. Optymalny w sensie Pareto będzie każdy wektor strategii n graczy
5
Gra jest uproszczoną wersją duopolu Cournot’a, któremu więcej miejsca poświęcono w rozdziale dotyczącym
duopolu jako gry strategicznej.
20
m
p
=[m
1p
,m
2p
,...,m
ip
,...,m
nr
] taki, że nie będzie można znaleźć innego dostępnego
m
k
=[m
1k
,m
2k
,...,m
ik
,...,m
nk
] takiego, że dla każdego gracza i:
u
i
([m
1p
,m
2p
,...,m
ip
,...,m
np
])≤u
i
([m
1k
,m
2k
,...,m
ik
,...,m
nk
]),
[1.41]
i przynajmniej dla jednego:
u
i
([m
1p
,m
2p
,...,m
ip
,...,m
np
])<u
i
([m
1k
,m
2k
,...,m
ik
,...,m
nk
]).
[1.42]
Kryterium optymalności w sensie Pareto możemy wykorzystać jako postulat, który
spełniać powinno rozwiązanie gry o sumie różnej od zera. Nie będziemy wówczas
przyjmować jako rozwiązań tych wektorów strategii, które nie przynoszą Pareto optymalnych
kombinacji wygranych. Spełnienie tego postulatu jest dobrze widoczne na graficznym obrazie
zbioru wyników gry, czyli obszarze wygranych. W przypadku dwuosobowych gier o sumie
różnej od zera jest to część przestrzeni euklidesowej składająca się z punktów opisujących
pary wygranych dla wszystkich możliwych par strategii (po jednej każdego z graczy),
zarówno czystych jak i mieszanych.
Ź
ródło: opracowanie własne
Ź
ródło: opracowanie własne
Wykres 1.4. Obszar wygranych gry
"Ścisła"
0
5
10
15
20
25
30
35
0
5
10
15
20
25
30
35
u
b
u
a
[a
1
,b
1
]
[a
1
,b
2
]
[a
2
,b
2
]
[a
2
,b
1
]
r
Wykres 1.5. Obszar wygranych gry "K lub P"
0
5
10
15
20
25
30
35
0
5
10
15
20
25
30
35
u
b
u
a
[a
1
,b
1
]
[a
2
,b
2
]
[a
2
,b
1
]
[a
1
,b
2
]
r
21
Wykres 1.4 pokazuje, że w grze „Ścisła” jedyna równowaga jest jednocześnie
optymalna w sensie Pareto
6
. Jeżeli jedyna równowaga w grze o sumie różnej od zera jest
jednocześnie optymalna w sensie Pareto, to mówimy o rozwiązaniu w sensie ścisłym
[Straffin, 2001, s. 90]. Jest to niesłychanie rzadki przypadek jednoznaczności wyznaczenia
rozwiązania gry o sumie różnej od zera.
Wykres 1.5 przedstawia sytuację stojącą na przeciwnym krańcu osi jednoznaczności.
Równowaga w grze „K lub P” występuje w jedynym nie optymalnym w sensie Pareto
wierzchołku obszaru wygranych. Rekomendacja równowagi jako rozwiązania tej gry może
upaść pod zarzutem niespełnienia kryterium optymalności Pareto. Kontrowersja pomiędzy
kryterium równowagi i kryterium Pareto pojawiająca się w grach niekooperacyjnych
podzieliła w swoim czasie badaczy zajmujących się tą dziedziną. Nash obstawał przy swojej
propozycji nawet wtedy, gdy eksperymenty wskazywały na przewagę rozwiązania
optymalnego w sensie Pareto [Flood, 1958]. Poglądy innych były zgodne z wynikami tych
eksperymentów. Według nich, „na korzyść optymalności w sensie Pareto przemawia to, że
każdy z graczy zachowując się racjonalnie, przypisuje racjonalność drugiemu. Jeśli jest wynik
gry inny od równowagi, który podnosi wygraną jednego z graczy, co najmniej nie
zmniejszając wygranej drugiego, to równowaga nie stanie się racjonalnym wynikiem gry”
[Rapoport, 1989, s.221].
1.3.3.
Wybór rozwiązania spośród wielu równowag tej samej gry
Niejednoznaczność wskazania rozwiązania gry niekooperacyjnej może się pojawić
również wtedy, gdy mamy do czynienia z mnogością równowag optymalnych w sensie
Pareto. O ile rozwiązaniem w sensie ścisłym jest jedyna równowaga optymalna w sensie
Pareto, to ich większa liczba spełnia warunek ścisłości tylko wtedy, gdy są one ekwiwalentne
i wymienne [Straffin, 2001, s. 90]. Tak nie jest w przypadku gry „Dwie równowagi”.
„Dwie równowagi”
Dwa przedsiębiorstwa działające na tym samym rynku mają do wyboru po dwie
strategie rynkowe: typu 1 i 2. Wygranymi są ich zyski. Jeśli jednocześnie wybiorą strategie
typu 1, osiągną rozwiązanie najkorzystniejsze dla gracza A. Gdy zgodny wybór padnie na
strategie typu 2, najwyższą wygraną cieszyć się będzie gracz B. Mieszanie typów strategii
przynosi najniższą z dostępnych wygranych temu z przedsiębiorstw, które wybierze typ 2.
6
Na wykresach zbiór Pareto optymalny składa się z punktów zaznaczonych romboidalnym powiększonym
znacznikiem oraz odcinków łączących te punkty. Te właśnie odcinki są obrazem wektorów mieszanych strategii
optymalnych w sensie Pareto. Równowagi oznaczono małą literą r.
22
Tabela 1.16. Macierze wygranych gry „Dwie równowagi”
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
14
8
4
4
Strategia
b
2
6
-2
8
14
ź
ródło: opracowanie własne
Równowagi w tej grze to pary strategii [a
1
,b
1
] i [a
2
,b
2
]. Gracz A zdecydowanie
preferuje pierwszą z nich, gracz B drugą, nie są zatem ekwiwalentne i wymienne. Nawet jeśli
obydwie są optymalne w sensie Pareto, trudno przyjąć, że gracze zgodzą się na jedną z nich.
Konieczność wyboru między dwiema równowagami optymalnymi w sensie Pareto jest
naturalnym zaproszeniem do poszukiwania rozwiązania kooperacyjnego, o którym traktować
będzie następna część tego rozdział.
Wykres 1.6. Wielobok wygranych gry "Dwie
równowagi"
0
2
4
6
8
10
12
14
-4
-2
0
2
4
6
8
10
12
14
u
b
u
a
[a
1
,b
1
]
[a
2
,b
2
]
[a
2
,b
1
]
[a
1
,b
2
]
r
r
Ź
ródło: opracowanie własne
Bardzo istotną propozycję kryterium wyboru miedzy dwiema równowagami w ramach
gier niekooperacyjnych zgłosił John Harsanyi. Polegała ona na wykorzystaniu dwóch
kategorii: dominacji wypłat i dominacji ryzyka [Harsanyi, 1977, s. 274]. Pierwsze z nich
opiera się na wyborze tej równowagi, która przynosi wyższą wygraną przynajmniej jednemu z
graczy i nie niższą pozostałym. Racjonalność tego kryterium nie powinna budzić dyskusji,
wszak pokrywa się z kryterium optymalności Pareto.
23
Drugie z kryteriów Harsanyi’ego jest inspirowane koncepcją Luce’a i Raiffy
„dominacji psychologicznej”, jaka może mieć miejsce w relacjach dwóch nieekwiwalentnych
i niewymiennych równowag [Luce, Raiffa, 1964, s. 108-109]. W pierwszym kroku należy
sprawdzić, czy optymalna strategia mieszana może zapewnić graczom wyższe wygrane, niż
gdyby wybrali strategię czystą korzystniejszą dla przeciwnika. Równowaga w strategiach
mieszanych w grze „Dwie równowagi” to para strategii a
r
=[
2
1
a
1
,
2
1
a
2
] i b
r
=[
6
1
b
1
,
6
5
b
2
]
przynosząca wygrane u
ar
=7
3
1
oraz u
br
=6. Taki wynik gry jest zdominowany przez obydwie
równowagi. Racjonalnie zachowujący się gracz nie wybierze równowagi w strategiach
mieszanych nawet, jeśli przyszłoby mu wybrać strategię czystą umożliwiającą ustalenie się
równowagi mniej korzystnej dla niego.
Następnym krokiem w wykorzystaniu kryterium dominacji ryzyka jest wyznaczenie
indeksów ryzyka towarzyszących obydwu równowagom [Harsanyi, 1977, s. 276]. Dla
każdego z graczy indeks zbudowany jest tak, że w liczniku znajduje się różnica jego
wygranych w alternatywnych równowagach liczona tak by zawsze miała znak dodatni, a w
mianowniku różnica jego wygranej w preferowanej równowadze i wygranej w sytuacji, gdy
przeciwnik odpowie najmniej korzystnie na próbę forsowania tej równowagi. W grze „Dwie
równowagi” odpowiednie indeksy będą miały następującą postać:
4
3
])
b
,
a
([
u
])
b
,
a
([
u
])
b
,
a
([
u
])
b
,
a
([
u
i
2
1
a
1
1
a
2
2
a
1
1
a
ar
=
−
−
=
[1.43]
8
3
])
b
,
a
([
u
])
b
,
a
([
u
])
b
,
a
([
u
])
b
,
a
([
u
i
2
1
b
2
2
b
1
1
b
2
2
b
br
=
−
−
=
[1.44]
Wyższa wartość indeksu oznacza, że równowaga preferowana przez gracza A ([a
1
,b
1
])
dominuje w zakresie ryzyka równowagę [a
2
,b
2
] i ona powinna być wskazana jako unikalne
rozwiązanie w tej grze. Wskazana zostaje ta równowaga, której ewentualne odrzucenie przez
konkurenta wiąże się z mniejszą względną szkodą. Niestety dominacja ryzyka pozostaje
bezużytecznym narzędziem wyboru równowagi w strategiach czystych w szczególnym
przypadku, w którym liczniki i mianowniki indeksów ryzyka są sobie równe. Dzieje się tak w
przypadku gry „Tchórz”.
„Tchórz”
Dwa przedsiębiorstwa utworzyły konsorcjum dla realizacji pewnego kontraktu. Każde
z nich ma do wyboru dwie strategie. Mogą wykonać kontrakt (1) lub nie podejmować
ż
adnych działań licząc na to, że druga strona wypełni go sama (2). Jeśli zgodnie kooperując
wykonają zlecone prace ([a
1
,b
1
]), osiągną zyski równe 2. Jeśli żadne z przedsiębiorstw nie
24
podejmie wykonania kontraktu ([a
2
,b
2
]), wysokie kary umowne spowodują straty równe -8 u
obydwu. W sytuacji, gdy jeden wykona cały kontrakt a drugi osiągnie wypłatę bez ponoszenia
kosztów ([a
1
,b
2
] lub [a
2
,b
1
]), zyski wyniosą odpowiednio -4 i 6.
Tabela 1.17. Macierze wygranych gry „Tchórz”
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
2
2
6
-4
Strategia
b
2
-4
6
-8
-8
ź
ródło: opracowanie własne
Gra „Tchórz” ma dwie, optymalne w sensie Pareto, równowagi w strategiach
czystych
7
. Przynoszą je pary strategii [a
1
,b
2
] (korzystniejsza dla B) i [a
2
,b
1
] (korzystniejsza dla
A). Można też w niej wyznaczyć równowagę w strategiach mieszanych. Jest nią para
a
r
=[
2
1
a
1
,
2
1
a
2
] i b
r
=[
2
1
b
1
,
2
1
b
2
], która przynosi wygrane u
ar
=u
br
=-1. Równowagi te nie są
ekwiwalentne ani wymienne. Nie można w tej grze skorzystać z kryterium dominacji wypłat.
ś
adna z równowag nie dominuje pozostałych.
Wykres 1.7. Wielobok wygranych gry "Tchórz"
-10
-8
-6
-4
-2
0
2
4
6
8
10
-10 -8
-6 -4
-2
0
2
4
6
8
10
u
b
u
a
[a1,b1]
[a2,b2]
[a2,b1]
[a1,b2]
r
r
Ź
ródło: opracowanie własne
7
Gra „Tchórz” jest modyfikacją archetypowej gry „Chicken” popularnej wśród amerykańskich nastolatków w
latach pięćdziesiątych ubiegłego stulecia. Dwa samochody jadą naprzeciw siebie z dużą prędkością. Kierowca,
który pierwszy zahamuje „traci twarz” i przegrywa. Gracze mają do wyboru dwie strategie, hamować lub nie
hamować [Straffin, 2001, s. 103]. W polskich tłumaczeniach książek dotyczących teorii gier, na ogół,
zachowana zostaje oryginalna nazwa tej gry, choć zdarzają się jej tłumaczenia nie oddające istoty rzeczy (np.
„kurczak” [Leibenstein, 1988, s. 301]).
25
Kryterium dominacji ryzyka również nie posłuży wskazaniu unikalnej równowagi w
strategiach czystych. Wyznaczenie indeksów ryzyka przynosi rezultat i
ar
=i
br
=
7
5
. Dramatyczny
brak możliwości wyznaczenia rozwiązania w strategiach czystych w grze „Tchórz” można
wytłumaczyć następująco: „im bardziej jesteś przekonany do wyboru stchórzenia, tym
bardziej kusząca jest strategia przeciwna” [Raiffa, Metcalfe, Richardson, 2002, s. 69]. Jedynie
równowaga w strategiach mieszanych może zostać wskazana jako rozwiązanie ze względu na
dominację ryzyka. Ten wybór jest oparty na tożsamości indeksów ryzyka równowag w
strategiach czystych.
1.3.4.
Gry o sumie różnej od zera z asymetrią informacji
Wyznaczenie rozwiązania w grze „Tchórz” może się stać trywialne, jeśli zmienimy
zakresy informacji, jakimi dysponują gracze. W pierwotnej wersji gry żaden z nich nie wie,
co wybierze przeciwnik (zbiory informacyjne zaznaczone linią kreskowaną na Schemacie
1.5). Wybory strategii są dokonywane jednocześnie. Wyobraźmy sobie jednak, że jeden z
graczy decyduje jako drugi i wie, jaką strategię wybrał rywal. Załóżmy, że A wybiera
strategię jako pierwszy (zbiory informacyjne zaznaczone linią kropkowaną).
Pełen zakres informacji gracza B stwarza możliwość przedstawienia jeszcze jednej z
metod szukania rozwiązań w grach o sumie dowolnej. Metoda ta wykorzystuje ich postać
rozwiniętą. Polega na odrzucaniu przez gracza tych gałęzi, które przynoszą mu mniejsze
wygrane. Lewy węzeł, będący jednocześnie lewym zbiorem informacyjnym, zostanie
zredukowany przez gracza B o wybór b
1
(6>2). W przypadku prawego węzła odrzucona
zostanie gałąź b
2
(-4>-8). Gracz B wybierze więc strategię: „wybierać zawsze inaczej niż
przeciwnik”. Jeśli gracz A zakłada, że ma do czynienia z racjonalnym przeciwnikiem łatwo
A
B
a
1
a
2
b
2
b
2
b
1
b
1
(2,2)
(-4,6)
(6,-4)
(-8,-8)
Schemat 1.4. Dendryt gry „Tchórz”
Ź
ródło: opracowanie własne
26
może zidentyfikować jego wybór. Najlepszą odpowiedzią A na strategię gracza B „wybierać
zawsze inaczej niż przeciwnik” będzie wybór strategii a
2
(6>-4). „Taka metoda znajdowania
dobrych strategii poprzez analizę drzewka gry od końca nazywa się indukcją wsteczną”
[Malawski, Wieczorek, Sosnowska, 1997, s. 30].
Gracz A wiedząc, że przeciwnik będzie podejmował decyzję znając jego wybór,
wybierze strategię biernego oczekiwania na zrealizowanie kontraktu przez gracza B.
Dokonywanie wyboru strategii w pierwszej kolejności przynosi przewagę w grze w
„Tchórza”. Jednocześnie większy zakres informacji stawia gracza B w mniej korzystnej
sytuacji. Sprawa ma się tutaj odwrotnie niż w przypadku gry „A przeciw B”, w której
znajomość decyzji rywala przyniosła firmie B wzrost wygranej w punkcie siodłowym.
Możliwość wyboru strategii w pierwszej kolejności stworzyła sytuację, w której gracz
A swoją decyzją może sformułować skuteczną groźbę. Wybierając jako pierwszy bierne
oczekiwanie na wykonanie kontraktu przez partnera, wymusza na nim reakcję obronną w
postaci wyboru strategii „wykonanie kontraktu”. O groźbach mówimy wtedy, gdy:” (i) gracz
A deklaruje, że w wypadku jakiegoś działania gracza B sam podejmie określone działanie,
które (ii) będzie niekorzystne dla B, oraz (iii) będzie niekorzystne także dla niego samego”
[Straffin, 2001, s. 111]. Załóżmy, że w grze „Tchórz” dopuszczamy możliwość kontaktu
między graczami przed jednoczesnym wyborem strategii. Każdy z nich może sformułować
wówczas groźbę: „jeśli ty zagrasz swoją strategię (2) to ja zrobię to samo”. Wystosowanie
groźby rodzi problem wiarygodności. Ze względu na warunek (iii) adresat ma prawo wątpić
w jej realizację. Gdy dokona on swojego wyboru, wykonanie groźby nie przynosi już żadnej
korzyści jej autorowi. Próba rozwiązania tego problemu może pojawić się w powtarzanej
wersji gry, w której dla uwiarygodnienia groźby gracz może pozwolić sobie na niższe
wygrane w kilku pierwszych turach.
Tabela 1.18. Macierz gry „Tchórz: różnica wygranych”
Wygrane B = u
b
’
a
1
a
2
b
1
0
-10
b
2
10
0
Ź
ródło: opracowanie własne
Optymalne strategie gróźb są najlepszą odpowiedzią na siebie nawzajem.
Wyznaczamy je jako punkt siodłowy gry powstałej w wyniku odjęcia od siebie wygranych z
wyjściowej gry o sumie różnej od zera:
u
a
’([a
i
,b
j
])=u
a
([a
i
,b
j
])-u
b
([a
i
,b
j
] oraz u
b
’([a
i
,b
j
])=u
b
([a
i
,b
j
])-u
a
([a
i
,b
j
])).
[1.45]
W przypadku gry „Tchórz” punktem siodłowym takiej gry jest para strategii [a
2
,b
2
].
27
Każdy z graczy deklarując brak jakiegokolwiek działania na rzecz wykonania
kontraktu, formułuje groźbę, która jest najlepszą odpowiedzią na groźbę przeciwnika.
Optymalne groźby pozostają w równowadze. Pamiętać należy jednak, że ich realizacja
przynosi jedyny wynik, który nie jest Pareto optymalny w zbiorze strategii czystych. Para
optymalnych strategii gróźb nie może być traktowana jako propozycja rozwiązania gry o
sumie różnej od zera. Groźby stanowią jedynie narzędzie służące osiągnięciu pożądanego
wyniku gry. Ich przydatność widoczna jest w przypadku gier powtarzanych oraz przy
wyznaczaniu rozwiązań kooperacyjnych, o czym szerzej przeczytać będzie można w
następnej części pracy.
1.3.5.
Poziomy bezpieczeństwa, wykorzystanie kryterium maksyminowego
Trudności w wyborze jednoznacznego rozwiązania gier o sumie różnej od zera
stwarzają pokusę wykorzystania narzędzi służących wyznaczaniu optymalnego rozwiązania
gier o sumie zerowej. Ulegnięcie tej pokusie prowadzi nas do wyznaczenia optymalnych
strategii w grach o sumie różnej od zera zwanych strategiami bezpieczeństwa. Wartość gry
uzyskana w ten sposób to poziom bezpieczeństwa gracza. Z praktycznego punktu widzenia,
wyznaczenie poziomów bezpieczeństwa polega na znalezieniu maksyminów w grach o
wygranych każdego z graczy z osobna. Macierze wygranych w grze o sumie różnej od zera
traktowane są jak macierze gry o sumie zerowej. Zakładamy tym samym, że wygrana
każdego z graczy jest jednocześnie przegraną drugiego. Wyborowi strategii przyświeca
przekonanie, że przeciwnik jest zainteresowany w minimalizacji naszej wygranej.
Tabela 1.19. Gra "Tchórz: suma zero B"
u
b
a
1
a
2
a
M
i
a
min
∈
b
1
2
-4
-4
a
M
i
a
b
M
j
b
min
max
∈
∈
b
2
6
-8
-8
-4
b
M
bj
max
∈
6
-4
b
M
j
b
a
M
i
a
max
min
∈
∈
-4
Ź
ródło: obliczenia własne
Pozostańmy przy najczęściej analizowanej ostatnio grze w „Tchórza”. Macierz gry o
sumie zerowej na wygranych gracza B ma punkt siodłowy w strategiach czystych. Jest nim
para strategii [a
2
,b
1
]. Wartość tej gry to v=-4 i taki jest właśnie poziom bezpieczeństwa gracza
B. Niezależnie od wyboru przeciwnika, wybierając strategię b
1
, gwarantuje on sobie, że
wygra, co najmniej -4.
28
Wyznaczony analogicznie poziom bezpieczeństwa gracza A wynosi również -4 i
gwarantowany jest wyborem strategii a
1
. Zwróćmy uwagę, że obustronny wybór strategii
bezpieczeństwa w grze „Tchórz” przynosi wynik gry, który nie jest równowagą, ale spełnia
kryterium optymalności Pareto. Wiedza o wyborze strategii bezpieczeństwa może jednak
zostać wykorzystana przez przeciwnika, który ma sposobność wybrać strategię
kontrbezpieczną, czyli najlepszą na nią odpowiedź. Strategią kontrbezpieczną gracza A jest a
2
a gracza B b
2
. Wykorzystanie strategii bezpieczeństwa jako wskazania rozwiązania w grach o
sumie zerowej ma, jak widać, jedną podstawową wadę. Strategie bezpieczeństwa nie są w
równowadze i nie przynoszą rozwiązania stabilnego.
Tabela 1.20. Alternatywy dla równowag w grze „Tchórz”
Strategie A
Strategie B
u
a
u
b
bezpieczna
bezpieczna
2
2
bezpieczna
kontrbezpieczna
-4
6
kontrbezpieczna
bezpieczna
6
-4
kontrbezpieczna
kontrbezpieczna
-8
-8
Ź
ródło: opracowanie własne na podstawie [Straffin, 2001]
Wybierając swoje strategie bezpieczeństwa, każdy z graczy umożliwia przeciwnikowi
osiągnięcie równowagi bardziej korzystnej dla niego. Nie można zatem zaryzykować tezy o
przydatności narzędzi wyznaczania rozwiązań gier o sumie zerowej dla rozwiązywania gier o
sumie różnej od zera.
Wszechstronne próby znalezienia rozwiązania w grze „Tchórz” przyniosły jedynie
wskazanie równowagi w strategiach mieszanych a
r
=[
2
1
a
1
,
2
1
a
2
] i b
r
=[
2
1
b
1
,
2
1
b
2
]. Przy
nieskończonej liczbie powtórzeń przyniesie ona wygrane u
ar
=u
br
=-1. Nie zapominajmy jednak
o sytuacji, jaka stoi za analizowaną grą. Jeśli w którymś z powtórzeń wylosowana zostanie
para strategii [a
2
,b
2
], nie będzie już kolejnego kontraktu do zrealizowania. Podobnie może być
również wtedy, gdy losowanie strategii przyniesie którąkolwiek z równowag w strategiach
czystych. Konsorcjum rozpadnie się z przyczyn oczywistych.
Wskazanie równowagi jako rozwiązania gry o sumie różnej od zera ma dwie zalety.
Po pierwsze, jest to propozycja wyróżniająca się tym, że pojedynczy gracz nie może poprawić
swojej sytuacji wyłącznie swoimi działaniami. Po drugie, jak dowiódł Nash, w każdej grze
można wskazać równowagę. Niestety, gdy mamy do czynienia z liczbą nie ekwiwalentnych i
nie wymiennych równowag większą niż jeden, pojawia się problem wskazania tej właściwej.
Harsanyi zaproponował wykorzystanie kryteriów dominacji wypłat i dominacji ryzyka. Ich
zastosowanie umożliwia wskazanie unikalnej równowagi jako rozwiązania gry. Jednak w
29
niektórych przypadkach uzyskane rozwiązanie w strategiach mieszanych nie spełnia
oczekiwań graczy. Są bowiem gry, w których praktyczny aspekt mieszania strategii kłóci się z
naturą sytuacji strategicznej.
Podjęcie próby wykorzystania narzędzi poszukiwania punktów siodłowych w grach o
sumie zerowej również nie przyniosło pożądanych rezultatów. Pomijając trudności związane
z naturą poszczególnych przypadków, wystarczy powiedzieć, że strategie bezpieczeństwa
wyznaczone metodą maksyminu nie sprawdzą się w grach o sumie różnej od zera, ponieważ
nie są w równowadze.
Widać teraz, jak błahe były problemy, które pojawiały się podczas rozwiązywania gier
o sumie zerowej. Rozwiązując grę o sumie różnej od zera pozostaje nam jedynie zatęsknić za
jednoznacznością jej być może mniej wyrafinowanej, ale jakże wdzięczniejszej siostry.
1.4.
Teoria gier powtarzalnych
1.4.1.
Natura gier iterowanych
Powtarzalność gry rodzi istotne konsekwencje strategiczne. Wybory graczy w
kolejnych turach pozostają pod wpływem znanych im wyników poprzednich iteracji. Gracza
poznają się i z czasem ich wybory uwzględniają „dopasowanie” do postawy przeciwnika.
Dodatkowo pojawia się czynnik uczenia się obejmujący nie tylko zachowania innych graczy,
ale również istotę i dynamikę gry. Wszystkie te względy przesuwają zainteresowanie badacza
w kierunku pozytywnej analizy zachowań graczy. Jest ona domeną empirycznych badań nad
zachowaniami podmiotów gospodarczych oraz przedmiotem ekonomii eksperymentalnej. W
tym rozdziale uwaga zostanie skoncentrowana na normatywnym aspekcie gier powtarzalnych.
Przedstawione zostaną próby wyznaczenia racjonalnych sposobów postępowania w tych
grach. Elementy analizy pozytywnej obejmujące skutki porozumiewania się graczy, ich
indywidualnych charakterystyk oraz wzajemnych przewidywań, co do kolejnych ruchów
pojawią się tylko wtedy, gdy będzie to konieczne.
Celem graczy w grze powtarzalnej jest uzyskanie maksymalnej sumy użyteczności
wygranych. Spełnienie założenia o tym, że użyteczność sumy wygranych jest równa sumie
użyteczności jej składników jest możliwe tylko przy liniowej postaci tej funkcji. Formułując
bazowe założenia dla modeli budowanych w tej pracy, taką właśnie funkcję przyjęto. To
daleko idące uproszczenie będzie przydatne jeszcze niejednokrotnie. Można też przyjąć inne
podejście zakładając, że gracze są „zainteresowani jedynie w maksymalizacji swych własnych
30
oczekiwanych wypłat pieniężnych, i niech wtedy liczby macierzy wypłat przedstawiają
wypłaty pieniężne” [Luce, Raiffa, 1964, s. 98].
1.4.2.
Powtarzanie jako metoda rozwiązywania gier o sumie zerowej
Powtarzanie gry o sumie zerowej przynosi supergrę o tej samej charakterystyce.
Każda powtarzalna gra o sumie zerowej, tak jak jej składowa, jest ściśle konkurencyjna. Jej
rozwiązaniem będzie wybór strategii maksyminowej w każdej iteracji. Gry ściśle
konkurencyjne w wersji powtarzanej nie stwarzają istotnych problemów z teoretycznego
punktu widzenia. Możemy nawet stwierdzić, że stworzenie fikcyjnej gry, poprzez
powtarzanie bazowej gry o sumie zerowej, może przynieść nową metodę jej rozwiązywania.
„Ekspansja”
8
Dwa przedsiębiorstwa produkują ten sam wyrób. Przedsiębiorstwo A charakteryzuje
się mniejszym udziałem w rynku i wyższymi kosztami marginalnymi niż przedsiębiorstwo B.
Otwierają się przed nimi dwa nowe rynki. Jeśli obydwa wejdą na ten sam rynek ([a
1
,b
1
] lub
[a
2
,b
2
]), słabsze przedsiębiorstwo A przegrywa zyski równe jedności na rzecz konkurenta.
Odwrotnie dzieje się wtedy, gdy wybierają różne rynki ([a
1
,b
2
] lub [a
2
,b
1
]), ponieważ A może
wzmocnić się nie będąc atakowane przez konkurenta.
Tabela 1.21. Gra "Ekspansja"
u
b
a
1
a
2
a
M
i
a
min
∈
b
1
-1
1
-1
a
M
i
a
b
M
j
b
min
max
∈
∈
b
2
1
-1
-1
-1
b
M
bj
max
∈
1
1
b
M
j
b
a
M
i
a
max
min
∈
∈
1
Ź
ródło: obliczenia własne na podstawie [Shubik, 1995]
Gra nie ma punktu siodłowego w strategiach czystych, ale sprawdźmy, jak będzie się
zmieniać sytuacja, jeśli będzie powtarzana. Załóżmy, że gracze zaczynają od jednoczesnego
wyboru drugiego rynku. Przez cały czas, gracze monitorują częstość wyboru strategii przez
przeciwnika. W następnych turach wybierają odpowiednią strategię tak długo, dopóki drugi z
graczy nie zacznie częściej wybierać strategii, na którą najlepszą odpowiedzią będzie zmiana
własnej strategii. Gracz B powinien zmienić strategię już w drugiej turze, ponieważ najlepszą
8
Gra jest odmianą archetypowej gry „Matching Pennies” polegającej na jednoczesnym wskazaniu jednej z
dwóch stron monety przez dwóch graczy. Jeśli wskażą tą samą stronę wygrywa jeden, jeśli różne wygrywa
drugi. Wygraną jest pokazywana moneta.
31
odpowiedzią na a
2
jest b
1
. Gracz A zmienia strategię na a
1
w turze czwartej, zaraz po tym jak
okazuje się, że gracz B zaczął częściej grać b
1
.
Tabela 1.22. Gra "Ekspansja" rozgrywana wielokrotnie
Wybór A
Częstość wyboru A
Wybór B
Częstość wyboru B
Tura
a
1
a
2
a
1
a
2
b
1
b
2
b
1
b
2
1
1
0,0000
1,0000
1
0,0000
1,0000
2
1
0,0000
1,0000
1
0,5000
0,5000
3
1
0,0000
1,0000
1
0,6667
0,3333
4
1
0,2500
0,7500
1
0,7500
0,2500
5
1
0,4000
0,6000
1
0,8000
0,2000
6
1
0,5000
0,5000
1
0,8333
0,1667
7
1
0,5714
0,4286
1
0,8571
0,1429
8
1
0,6250
0,3750
1
0,7500
0,2500
9
1
0,6667
0,3333
1
0,6667
0,3333
10
1
0,7000
0,3000
1
0,6000
0,4000
11
1
0,7273
0,2727
1
0,5455
0,4545
Ź
ródło: obliczenia własne na podstawie [Shubik, 1995]
Zgodnie z tą dynamiką gra może się toczyć w nieskończoność. Robinson [1951]
udowodnił, że częstości wyboru strategii zmierzają w niej do wartości optymalnych
prawdopodobieństw mieszania strategii. W grze „Ekspansja” punkt siodłowy w strategiach
mieszanych to para a
r
=[
2
1
a
1
,
2
1
a
2
] i b
r
=[
2
1
b
1
,
2
1
b
2
] przynosząca wartość gry v=0. Już przy 250
powtórzeniach średnia wypłata gracza B wynosi 0,02. Zdaniem Robinsona, analizując grę o
sumie zerowej poprzez dokonywanie powtórzeń, możemy wyznaczyć optymalne strategie
mieszane graczy i jej wartość.
Wykres 1.8. Częstość wyboru strategii a
1
w powtarzanej grze "Ekspansja"
0,0
0,3
0,5
0,8
1,0
1,3
1
26
51
76
101
126
151
176
201
226
tury
Ź
ródło: opracowanie własne
32
Wykres 1.8 pokazuje jak wygasają oscylacje częstości wybierania strategii wokół
optymalnego prawdopodobieństwa jej losowania. W miarę, jak przyrasta ilość iteracji, ich
odchylenie od p=0,5 jest coraz mniejsze. Podobnie będzie wyglądać wykres dla każdej z
pozostałych strategii czystych dostępnych graczom. Co prawda, wraz z gaśnięciem oscylacji
wydłuża się jej okres, ale nie zmienia to faktu, że częstość wyboru strategii zmierza do
optymalnego prawdopodobieństwa jej losowania.
1.4.3.
Powtarzane gry o sumie różnej od zera
Niestety metoda Robinsona nie znajduje zastosowania w grach o sumie różnej od zera.
Zbudowanie normatywnego modelu wskazującego na najlepszą strategię każdego z graczy
wymaga przyjęcia szeregu założeń upraszczających. Badacze chętniej zajmują się
konkretnymi przykładami gier niż uniwersalną teorią powtarzalnych gier o sumie niezerowej.
Najczęściej przedmiotem ich zainteresowania był „dylemat więźnia”. Zbiega się to
szczęśliwie z powinowactwem gier tego typu z modelem duopolu, którego uproszczoną
postacią była gra „K lub P”.
Zanim zajmiemy się metodami znajdowania rozwiązań w powtarzanym dylemacie
więźnia, przedstawmy ogólną postać tego typu gry w wersji jednoetapowej. Każdy z graczy
ma do wyboru dwie strategie: zdrada (z) lub kooperacja (k). Załóżmy, że macierze wygranych
obydwu graczy będą symetryczne. Nie będzie to miało wpływu na naturę wyznaczonego
rozwiązania.
Tabela 1.23. Macierze wygranych gry „Dylemat więźnia”
A
B
Strategia
a
1
Strategia
a
2
Strategia
b
1
z
z
f
c
Strategia
b
2
c
f
k
k
ź
ródło: opracowanie własne
Relacja pomiędzy wygranymi zawsze układać się będzie zgodnie z nierównościami
c>k>z>f oraz
2
f
c
k
+
≥
. Przypomnijmy, że równowaga w tej grze to para strategii [a
z
,b
z
].
Jednocześnie jest to jedyny wynik gry w strategiach czystych, który nie jest optymalny w
sensie Pareto.
33
Załóżmy, że gracze znają ilość powtórzeń, jaką przyjdzie im rozegrać. Analizując grę
z perspektywy ostatniej iteracji, uznają za racjonalne wybranie w niej strategii zdrady, która
dominuje kooperację. Wybór jest oczywisty, bowiem więcej powtórzeń nie będzie. To z kolei
sprawia, że tura przedostania, ze strategicznego punktu widzenia, upodabnia się do ostatniej.
Ponownie najbardziej racjonalnym wyborem dla obydwu graczy będzie zdrada. „Szanse na
kooperacje upadają jak kostki domina – również pierwszym wynikiem musi być para strategii
zdrady” [Straffin, 2001, s. 96]. Zgodnie z tą logiką równowaga w dylemacie więźnia jest
równocześnie równowagą w jego powtarzanej określoną ilość razy wersji. Jednak
doświadczenie uczy, że gracze nie zawsze z żelazną konsekwencją stosują opisany sposób
myślenia, a i w teorii znaleziono sposób na odejście od tego zdeterminowanego rozwiązania.
Polega on na założeniu, że gracze nie znają ilości powtórzeń, jaka będzie ich udziałem. Nie
znają ostatniej tury, więc nie mogą rozpocząć wstecznego odliczania strategii zdrady w
kolejnych powtórzeniach.
W literaturze wymienia się cztery metody wyboru strategii w przypadku dylematu
więźnia powtarzanego nieokreśloną ilość razy [Shubik, 1970]:
•
wprowadzenie dodatniego prawdopodobieństwa zakończenia gry na każdym jej etapie,
•
wprowadzenie dodatniego współczynnika dyskontującego,
•
zastąpienie gry jej skończoną wersją z funkcją wartości końcowej,
•
optymalizacja średniej wypłaty dla pojedynczej iteracji.
Pierwszy ze sposobów zakłada, że każda tura, następna po pierwszej, zostanie
rozegrana z prawdopodobieństwem 0≤p≤1 [Shubik, 1970]. Gdyby każdy z graczy zawsze
wybierał strategię kooperacji, jego suma wygranych wyniosłaby:
p
1
k
k
p
k
p
pk
k
3
2
−
=
+
+
+
+
L
[1.46]
Mógłby jednak zdecydować się na zagranie zdrady w m-tej iteracji. Przeciwnik odpowie tą
samą zmianą w turze m+1 i dalej wybrane strategie pozostaną w równowadze. Suma
wygranych tego, który zdradzi pierwszy przybiera postać:
p
1
z
p
c
p
)
p
1
(
)
p
1
(
k
z
p
z
p
c
p
k
p
k
p
pk
k
m
1
m
1
m
1
m
m
1
m
2
m
2
−
+
−
+
−
=
+
+
+
+
+
+
+
+
−
−
+
−
−
L
L
[1.47]
Nie będzie się opłacało zdradzić, jeśli [1.50] będzie większe od [1.51].
p
1
z
p
c
p
)
p
1
(
)
p
1
(
k
p
1
k
m
1
m
1
m
−
+
−
+
−
>
−
−
−
[1.48]
Przekształcając tą nierówność otrzymujemy:
34
z
c
k
c
p
−
−
>
[1.49]
Gracze powinni grać kooperacyjnie pod warunkiem, że prawdopodobieństwo rozegrania
kolejnego powtórzenia jest większe od ilorazu różnic wygranych z nierówności [1.49].
Warunek jest niezależny od tego, w którym powtórzeniu może pojawić się zdrada.
Powróćmy na chwilę do gry „K lub P”. W przypadku obydwu graczy graniczna
wartość prawdopodobieństwa wynosi p=
3
1
. Jeśli w tej grze o wystąpieniu kolejnej iteracji
decydować będzie rzut monetą, zdrada nie będzie się opłacała żadnemu z graczy. Na
przykład, stałe granie kooperacji przez gracza A przynosi mu oczekiwaną wartość sumy
wygranych równą 50. Jednocześnie ta sama suma osiąga wartość 48,75 w wypadku zdrady w
czwartym powtórzeniu. Jeśli w odmiennej sytuacji, o kolejnym powtórzeniu będzie
decydować wyrzucenie szóstki przy pomocy kości do gry, to stałe wybieranie kooperacji
przez obydwu graczy przynosi oczekiwaną wartość sumy wygranych równą 30, a zdrada w
czwartej iteracji przyniesie jej wzrost do 30,0139.
Druga z przedstawionych metod jest modyfikacją pierwszej. Prawdopodobieństwo
rozegrania kolejnej iteracji zostaje zastąpione przez współczynnik dyskontujący. Gracze,
oczekując na wygrane w kolejnych turach, ponoszą koszty alternatywne związane z
odroczeniem wypłaty w czasie. Ich miarą jest stopa dyskontowa d. Jeśli pierwsza tura
rozgrywana jest dziś, a kolejne z interwałem rocznym, to wartość obecna wygranej gracza A
otrzymanej w etapie m jest warta:
1
m
am
am
m
)
d
1
(
u
)
u
(
PV
−
+
=
[1.50]
Nierówność [1.52] przybiera teraz postać:
1
m
1
m
2
m
)
d
1
(
d
1
z
)
d
1
(
1
c
)
d
1
(
d
1
d
1
1
k
d
1
1
k
−
−
−
+
+
+
+
+
−
+
>
+
,
[1.51]
a nierówność [1.53]:
k
c
z
k
d
−
−
<
[1.52]
W grze „K lub P” górną granicą wartości stopy dyskontowej, poniżej której nie opłaca
się zdradzać, jest d=200%. Jest to na tyle duża wartość, że można być spokojnym o trwałość
kooperacji. Przy zdecydowanie częściej spotykanej d=10%, strategia trwałej kooperacji
35
przynosi graczowi A wartość oczekiwaną sumy wygranych równą 275, a zdrada w czwartym
powtórzeniu to jedynie 203,6
9
.
Graniczne prawdopodobieństwo rozegrania kolejnej tury i maksymalna stopa
dyskontowa są koncepcjami wskazującymi warunki dla opłacalności zdrady w dowolnym
powtórzeniu gry w przyszłości. Trzeba jednak pamiętać o ograniczonym zastosowaniu tych
propozycji. Opierają się one na daleko idących założeniach upraszczających. Gracze
zaczynają od jednoczesnego wyboru kooperacji, a zdrada jednego z graczy przynosi mu
jednorazową korzyść i od następnego powtórzenia prowadzi do trwałego wyboru zdrady
przez obydwu. Nie trzeba specjalnie wysilać wyobraźni, by dostrzec możliwość pojawienia
się ponownie odmiennego scenariusza, na przykład kooperacji po paru kolejnych
obustronnych wyborach zdrady.
Trzecia z wymienionych przez Shubika metod wyboru strategii w powtarzanym
dylemacie więźnia polega na wyznaczeniu wartości końcowej. „Pozwala ona na zamianę
nieskończonego horyzontu czasowego gry możliwością jej zakończenia przez gracza „i” w
okresie T i uzyskania wypłaty końcowej Q
i
, która ma zrekompensować mu odstąpienie
uczestnictwa sukcesorowi. Q
i
może być dowolną ogólną funkcją gry do etapu T” [Shubik,
1995, s. 289]. Technika wyznaczania wartości końcowej opiera się na takim modelowaniu
gry, że konkretną rolę spełnia w niej określona sekwencja graczy, w której każdy odstępuje
od gry w zamian za opłatę końcową. Horyzont czasowy gry kolejnych graczy jest, tym
samym, skończony. „Wartość końcowa dla każdego z nich może być określona przez
czynniki introspektywne takie jak, altruizm lub skłonność do pozostawienia spuścizny, albo
zewnętrzne takie jak, podatki, subsydia, prawa i zwyczaje [Shubik, 1980, 1981].
Wróćmy ponownie do gry „K lub P”. Załóżmy, że dodatkowy bonus o wartości 25 jest
wypłacany graczowi A w wypadku jednoczesnego wyboru kooperacji w powtórzeniu T.
9
Graniczna wartość stopy dyskontowej d=10% występuje w tych wariantach dylematu więźnia, w których
różnica wygranych między zgodnymi wyborami zdrady i kooperacji jest dziesięciokrotnie mniejsza od
relatywnej korzyści ze zdrady partnera wybierającego kooperację:
Wygrane A = u
a
a
z
a
k
b
z
21,8
10,0
b
k
35,0
23,0
Wygrane B = u
b
a
z
a
k
b
z
21,8
35,0
b
k
10,0
23,0
Ź
ródło: opracowanie własne
Obustronny wybór strategii kooperacji przynosi relatywnie niewielki przyrost wygranych w stosunku do
równowagi w tej grze. Zdrada partnera gotowego do współpracy jest dalece korzystniejsza. Dodać należy, że
minimalną wartością prawdopodobieństwa rozegrania kolejnej tury w tej grze gwarantującą trwałość kooperacji
jest p=10/11.
36
Gracz B, w tej samej sytuacji, otrzymuje wypłatę końcową równą 30. Każda inna para
strategii sprawia, że wypłata końcowa wynosi -23 dla gracza B i -22 dla gracza A. Takie
ustalenie sprawia, że para strategii [a
k
,b
k
] staje się równowagą w iterowanej wersji gry „K lub
P”. Dodatkowo powoduje to zmniejszenie się prawdopodobieństwa wystąpienia wyniku
[a
z
,b
z
], który jest równowagą w jednoetapowej wersji gry. Zwróćmy uwagę, że ustanowienie
wypłaty końcowej w powtarzanym dylemacie więźnia umożliwia wyznaczenie rozwiązania
bez konieczności przejścia do sfery gier kooperacyjnych.
Czwarta z wyróżnionych przez Shubika metod, optymalizacja średniej wygranej z
jednego powtórzenia polega na takim skonstruowaniu optymalnej strategii by uzyskać
możliwie najwyższą granicę, do której zmierzać będzie średnia wypłata przy nieskończonej
ilości powtórzeń. Jeśli wygrane w każdym powtórzeniu są mniejsze od stałej C, to ich średnia
wartość również. Ta metoda, zaproponowana przez Aumanna [1959], prowadzi do uzyskania
nowej gry, w której wygranymi są średnie z nieskończonej ilości powtórzeń, a strategiami
sekwencje dostępnych strategii czystych. Rozwiązaniem będzie równowaga tak zbudowanej
gry.
Propozycje rozwiązań gier powtarzanych swoją poprawność formalną opierają na
założeniach upraszczających, które często budzą wątpliwości u autorów zajmujących się tą
dziedziną
10
. W sposób naturalny pojawiła się potrzeba eksperymentalnej weryfikacji
zachowań podmiotów decyzyjnych w grach typu „dylemat więźnia” lub podobnych. Wiele
studiów o tym charakterze istotnie uzupełniło naszą wiedzę. O ich wynikach będzie można
przeczytać w rozdziale 3.5.2.
10
Poza przedstawionymi dobrym przykładem jest wskazanie rozwiązania w dylemacie więźnia poprzez
odwołanie do metagry drugiego stopnia. Idea ta, znana wcześniej, została sformalizowana przez Howarda
[1971]. Wymaga się w niej, aby jeden z graczy wybierał spośród strategii uwzględniających trafne
przewidywanie wyboru zdrady lub kooperacji przez drugiego. Jednocześnie ten drugi wybiera spośród strategii
zakładających, że trafnie przewiduje jak wybierze pierwszy opierający się na własnej antycypacji. Na przykład,
gracz A może wybrać strategię „zz”, czyli zdradę niezależnie od tego, co zagra gracz B. Gracz B natomiast, ma
do wyboru między innymi, strategię „zzzk” czyli wybór zdrady gdy A wybiera „zz” i kooperacji w pozostałych
przypadkach. Za wyborem rozwiązania metodą metagry drugiego stopnia stoi założenie o zdolności graczy do
trafnego przewidywania wyborów przeciwnika. Jego realność wydaje się, co najmniej, dyskusyjna.