Gry statystyczne
1. Założenia
Gry z naturą, zwane również grami statystycznymi, wywodzą się z teorii
statystycznych funkcji decyzyjnych stworzonej przez A.Walda w latach
pięćdziesiątych. Modele gier statystycznych dotyczą tzw. niepewnych sytuacji
decyzyjnych, gdy na skutki decyzji wpływają parametry niepewne, o których nie
mamy żadnych informacji na temat ich możliwych zmian. Klasyczny model
dwuosobowej gry strategicznej o sumie zero (co jeden przeciwnik wygrał, to drugi
przegrał) zostaí przez A.Walda rozszerzony na przypadek nieskończonej liczby
strategii obu graczy. O naturze powiedziano, że — z definicji — nie jest
zainteresowana rozgrywaną grą. Ponadto człowiekowi prowadzącemu grę z
naturą zapewniono dodatkową informację o strategiach natury: „Ponieważ natura
nie zmienia przez dłuższy czas tego losowego mechanizmu, według którego
realizują się stany natury, statystyk może zdobyć pewne informacje o tym losowym
mechanizmie, tzn. o rozkładzie prawdopodobieństw stanów natury".
W odróżnieniu od gry o sumie zero, gry z naturą rozgrywane są przy założeniu
pasywnej postawy drugiego gracza. Założenie o pasywnej postawie drugiego gracza
wymusza na nas zmianę reguł wyboru decyzji.
2. Reguła maxmin (Walda)
Decyzje opierają się na regule analogicznej do reguły von Neumanna. Podejmujemy
taką decyzję, przy której minimalna wygrana (ze względu na stan natury) dla
decyzji wybranej przyjmie wartość największą, tzn. szukamy takiego Ai, dla którego:
maxmin
i
ij
j
i
a
a
Można powiedzieć, że jest to reguła asekurancka (wybór wartości najmniejszej —
najmniejsza zapewniona wygrana), reguła gracza ostrożnego, ale inteligentnego
(stąd poszukiwanie maksimum).
3. Reguła Laplas’a (Bayes’a)
Reguła Laplace'a (Beyes’a) to reguła oparta na założeniu, że wszystkie przyszłe
stany natury są jednakowo prawdopodobne (dla reguły Beyes’a są znane
prawdopodobieństwa pj stanów natury) i w związku z tym możliwe jest wyliczenie
wartości oczekiwanej rezultatów każdej decyzji. Najlepsza będzie decyzja, dla której
oczekiwana wygrana jest największa.
Można to zapisać w następujący sposób: znajdź takie Ai, dla którego:
n
j
j
ij
i
i
p
a
a
E
1
max
)
(
4. Kryterium Hurwicza
Kryterium Hurwicza łączy chęć zapewnienia sobie wygranej na możliwie wysokim
poziomie z pewną skłonnością do podejmowania ryzyka.
Reguła Hurwicza polega na wyznaczeniu wielkości d, ze wzoru:
(1
)
i
i
i
d
A
a
min
i
ij
j
a
a
max
i
ij
j
A
a
gdzie
,
,
oznacza współczynnik skłonności do ryzyka i przyjmuje wartości z przedziału [0,
1].
Decyzja optymalna w sensie kryterium Hurwicza określona zostanie przez wartość
maksymalną wielkości d
i
.
5. Kryterium Savage’a
Wyznaczenia decyzji na podstawie reguły Savage'a dokonuje się w dwóch etapach. W
pierwszym tworzymy macierz nazywaną „macierzą żalu". Macierz ta zdefiniowana jest
w następujący sposób:
{ }, gdzie
max{ }
ij
ij
ij
ij
i
R
r
r
a
a
Następnie w tak określonej macierzy dla każdego wiersza poszukuje się elementu
maksymalnego, a następnie wiersza, w którym wartość ta jest najmniejsza, tzn.:
minmax{ }
i
ij
i
j
r
r
Regułę tę można wyjaśnić w następujący sposób: dla każdego ze stanów natury z
osobna, a następnie dla każdej możliwej decyzji wyznaczamy wielkość utraconych
korzyści, które moglibyśmy osiągnąć (w stosunku do decyzji najlepszej przy danym
stanie natury). Następnie postępujemy zgodnie z regułą von Neumanna, uwzględniając,
że mamy do czynienia z wielkościami niepożądanymi, czyli wśród różnic w wierszu i
wybieramy największą, a potem spośród nich najmniejszą. Wybrana wartość wskaże
nam decyzję optymalną w sensie kryterium Savage'a.
Przykład. Bank może kupić na sumę b akcji Аi firmy z cenami ai (i=1,2,3). Na koniec
roku rynek papier wartościowych może być w jednym z trzech możliwych stanów R1,
R2 lub R3. Eksperci ustalili, że dywidendy z jednej akcji z cenami a
i
(i=1,2,3) firmy dla
stanu rynku Rj na koniec roku mają wartości d
ij
% od ceny.
1) zapisać zadanie w postaci gry, zbadać typ gry i gracze. Dla gracze wskazać
możliwe strategii;
2) zapisać macierz płac;
3) zrobić rekomendacji dla banku w sprawie zakupu akcji i otrzymania największego
zysku dla następujących przypuszczeń:
a) są znane prawdopodobieństwa р1, р2, p3 stanów rynku R1, R2 i R3 na koniec roku;
b) prawdopodobieństwa р1, p2 i р3 stanów rynku R1, R2 i R3 na koniec roku są
nieznane.
b=14 a1=6 a2=4 a3=4 p1=0,4 p2=0,35 =0,6 d11=7 d12=14 d13=3 d21=8
d22=10 d23=0 d31=12 d32=5 d33=11.
Rozwiązanie.
1) Jednym z uczestników rozpatrywanej w zadaniu sytuacji jest bank, który kupuje akcji firmy dla
osiągnięcia największego zysku. Jeżeli przekształcić zadanie do postaci gry, wtedy bank występuje
jako pierwszy gracz i dąży do maksymalizacji zysku od akcji firmy. Drugim uczestnikiem (drugim
graczem) będzie rynek, gdzie w ogólnym przypadku losowo zmieniają się ceny na akcji. Rynek
można traktować jako „naturę”, która losowo realizuje swoi stany. Drugi gracz jest obojętny do
wygranej pierwszego gracza. Podobna sytuacja jest charakterystyczna dla gry statystycznej.
b=14
strategi
i
a
1
=
6
a
2
=
4
a
3
=
4
1
1
1
1
2
1
2
0
3
1
0
2
Kupując akcji na sumę b, bank może kupić akcji w różnych cenach.
Możliwe następujące kombinacji kupowania akcji:
Z tabeli wynika, że u pierwszego gracza istnieje 3 czyste strategii:
1-a: kupić 1 akcją z ceną a
1
, 1 – z ceną a
2
i 1- z ceną a
3
;
2-a: kupić 1 akcją z ceną a
1
, 2 – z ceną a
2
;
3-a: kupić 1 akcją z ceną a
1
, 2 – z ceną a
3
;
U drugiego gracza (natury) możliwe trzy strategii R
1
, R
2
i R
3
.
2) zapiszemy macierz płac. Dla tego obliczymy zysk banku na
koniec roku. Macierz płac ma postać:
gracz 2
gracz
1
R
1
R
2
R
3
1
1*6*7%+1*4*8%
+1*4*12%=1,22
1*6*14%+1*4*10%
+1*4*5%=1,44
1*6*3%+1*4*0%
+1*4*11%=0,62
2
1*6*7%+2*4*8%
+0*4*12%=1,06
1*6*14%+2*4*10%
+0*4*5%=1,64
1*6*3%+2*4*0%
+0*4*11%=0,18
3
1*6*7%+0*4*8%
+2*4*12%=1,38
1*6*14%+0*4*10%
+2*4*5%=1,24
1*6*3%+0*4*0%
+2*4*11%=1,06
Otrzymujemy macierz 3 х 3, która jest macierzą płac:
1,22 1,44 0,62
1,06 1,64 0,18
1,38 1,24 1,06
�
�
�
�
�
�
�
�
�
�
Ponieważ a=b, gra ma punkt siodłowy i dla tego ma rozwiązanie w czystych
strategiach. To oznacza, że bank otrzyma optymalny zysk a=1,06, jeśli kupi 1 akcje z
ceną a1 i 2 akcje z ceną a3 i stan rynku będzie R3.
Kryterium Walda
0,62
maxmin
max 0,18
1,06
1,06
ij
j
i
i
V
a
�
�
�
�
=
=
=
�
�
�
�
�
�
Obliczamy
Dla rozwiązania gry obliczymy dolną a=1,06 i górną b=1,06 czystą ceną gry.
optymalną będzie strategia A3: kupić 1 akcją z ceną a1, 2 – z ceną a3
Kryterium Laplace'a
Prawdopodobieństwa stanów rynka są takie samy i równe 1/3. Obliczamy
1
1,22*1/3 1,44*1/3 0,62*1/3
1,09
max
max 1,06*1/3 1,64*1/ 3 0,18*1/3
max 0,96
1,23
1,38*1/ 3 1,24*1/ 3 1,06*1/ 3
1,23
n
ij
j
i
i
i
j
V
a p
=
+
+
�
�
�
�
�
�
�
�
=
=
+
+
=
=
�
�
�
�
�
�
�
�
+
+
�
�
�
�
�
Kryterium Beyes’a
1
1,22*0,4 1,44*0,35 0,62*0,25
1,15
max
max 1,06*0,4 1,64*0,35 0,18*0,25
max 1,04
1,25
1,38*0,4 1,24*0,35 1,06*0,25
1,25
n
ij
j
i
i
i
j
V
a p
=
+
+
�
�
�
�
�
�
�
�
=
=
+
+
=
=
�
�
�
�
�
�
�
�
+
+
�
�
�
�
�
Kryterium Hurwicza
0,6*0,62 0,4*1,44
0,95
max( min
(1
)max ) max 0,6*0,18 0,4*1,64
max 0,76
1,19
0,6*1,06 0,4*1,38
1,19
ij
ij
j
i
j
i
i
V
a
a
g
g
+
�
�
�
�
�
�
�
�
=
+ -
=
+
=
=
�
�
�
�
�
�
�
�
+
�
�
�
�
Kryterium Savage'a
{ }
0,16 0,20 0,44
0,44
minmax
minmax 0,32
0
0,88
min 0,88
0,40
0
0,40
0
0,40
ij
i
i
j
j
V
r
�
�
�
�
�
�
�
�
=
=
=
=
�
�
�
�
�
�
�
�
�
�
�
�
optymalną będzie strategia A3
optymalną będzie strategia A3
optymalną będzie strategia A3
optymalną będzie strategia A3
Obliczymy “macierz żalu”
1,38 1,22 1,64 1,44 1,06 0,62
0,16 0,20 0,44
max( )
1,38 1,06 1,64 1,64 1,06 0,18
0,32
0
0,88
1,38 1,38 1,64 1,24 1,06 1,06
0
0,40
0
ij
ij
ij
j
R
a
a
-
-
-
�
� �
�
�
� �
�
=
-
=
-
-
-
=
�
� �
�
�
� �
�
-
-
-
�
� �
�