Ekonomia menedzerska wyklady dodatkowe id 155947

background image

Wybrane eksperymenty z TOU

Metoda eksperymentalna służyła również jako narzędzie testowania teorii

oczekiwanej użyteczności von Neumanna i Morgensterna. Znacznie więcej eksperymentów

ujawniło zachowania stojące w sprzeczności z jej treścią

1

. Najbardziej znany jest paradoks

Allaisa polegający na sprzeczności miedzy dwoma wyborami. Poprosił on uczestników

eksperymentu by dokonali wyboru pomiędzy dwiema alternatywami, których opcje mogą

zostać opisane jako wartości oczekiwane w postaci ogólnej:

n

n

2

2

1

1

A

p

A

p

A

p

EV

+

+

+

=

L

1

p

p

p

n

2

1

=

+

+

+

L

gdzie:

p

i

– prawdopodobieństwo otrzymania kwoty A

i

.

Pierwszy wybór, miedzy opcją A (p

1

=1, A

1

=100 mln franków) i B (p

1

=0,1, B

1

=500

mln; p

2

=0,89, B

2

=100 mln; p

3

=0,01, B

3

=0), uczestnicy eksperymentu rozstrzygali w istotnej

większości na rzecz opcji A. Jednocześnie, w drugim wyborze, ci sami uczestnicy preferowali

opcję D (p

1

=0,1, D

1

=500 mln; p

2

=0,9, D

2

=0) bardziej niż C (p

1

=0,11, C

1

=100 mln; p

2

=0,89,

C

2

=0). Hipotetyczny podmiot, dla którego U(A)>U(B)

2

powinien przejawiać preferencję

odwrotną U(C)>U(D). Wyniki tego eksperymentu, opartego na hipotetycznych wyborach,

znalazły potwierdzenie w późniejszych badaniach z realnymi wypłatami, oczywiście

mniejszych kwot.

Przedmiotem eksperymentalnego testu były nie tylko aksjomaty TOU, ale również jej

aspekt deskryptywny. Wiele testów poświęcono analizie procesów dokonywania wyborów w

warunkach ryzyka. Jedno z późniejszych studiów badało przechodniość preferencji [Loomes,.

Starmer, Sugden]. Uczestnicy eksperymentu, w wielu przypadkach, bardziej preferowali

możliwość wygrania 8£ z prawdopodobieństwem 0,6 (p

a

=0,6;a=8£) niż opcję (p

b

=0,3;b=18£).

Pewność otrzymania 4£ (p

c

=1;c=4£) była dla tych samych podmiotów cenniejsza niż opcja

(p

a

=0,6;a=8£). Jednocześnie jednak, preferowali oni możliwość (p

b

=0,3;b=18£) bardziej niż

pewność wygrania 4£. Tą nieprzechodniość preferencji, autorzy tłumaczyli preferowaniem

bardziej prawdopodobnej wygranej, gdy różnice w ich wartości były relatywnie nieduże. Gdy

różnica w wygranych stała się wysoka, górę wziął wybór przynoszący wyższą wartość

oczekiwaną.

1

Przytoczone niżej wyniki eksperymentów pochodzą zarówno z prac psychologów jak i ekonomistów.

Eksperymenty częściej przynosiły wyniki sprzeczne z TOU niezależnie, czy przeprowadzali je ekonomiści, czy
psychologowie.

2

Taka preferencja charakteryzuje podmiot unikający ryzyka, wybierający mniejszą wartość oczekiwaną, jeśli

związana jest z wyższym prawdopodobieństwem osiągnięcia.

background image

Inny

eksperyment

testował

efekt

istotności

prawdopodobieństw.

Gdy

prawdopodobieństwa wygranych są tak niewielkie, że wydają się niemożliwe, podmioty

wybierają wygraną o wyższej wartości pomijając różnice w prawdopodobieństwach. W teście

eksperymentalnym

86%

podmiotów

wybrało

opcję

(p

a

=0,9;a=3 000)

kosztem

(p

b

=0,45;b=6 000), jednocześnie ci sami gracze w 73% preferowali (p

c

=0,001;c=6 000)

zamiast (p

d

=0,002;d=3 000) [Kahneman, Tversky]. Podobne wyniki uzyskano również w

innych eksperymentach [MacCrimmon, Larsson].

background image

1

Gra strategiczna i jej opis

1.

Definicja gry

Najpowszechniej stosowanym podejściem do definiowania gry strategicznej jest

wymienienie jej elementów składowych. Ich jednoczesne wystąpienie uprawnia do nazwania

jakiejś sytuacji grą strategiczną ([Shubik, 1995, s. 1-16], [Straffin, 2001, s. 1], [Drabik, 2005,

s. 18] oraz przede wszystkim [von Neumann, Morgenstern, 1944, s. 48-55])

1

. Zgodnie z

powszechnie uznaną definicją z grą strategiczną (Γ) mamy do czynienia zawsze wtedy, gdy:

a.

bierze w niej udział, co najmniej, dwóch graczy; zbiór graczy to N={1,2,…,n},

gdzie n jest liczbą naturalną nie mniejszą od dwóch,

b.

każdy z graczy dysponuje zbiorem strategii określających jego sposób

rozgrywania gry M

i

; zbiór strategii wszystkich graczy M składa się z

elementów m

j

, w ramach których każdy z graczy jest reprezentowany przez

jedną strategię; M=M

1

xM

2

x…xM

n

, m

j

=[m

1j

,m

2j,…,

m

nj

]

c.

każdemu elementowi zbioru M przyporządkowany jest n-wymiarowy wektor

wypłat u(m

j

)=[u

1

(m

j

),u

2

(m

j

),…,u

n

(m

j

)]; wektor ten jest nazywany również

wynikiem gry.

Konkretyzacja tej definicji dla gry dwuosobowej będzie miała postać:

a.

bierze w niej udział dwóch graczy; zbiór graczy to N={A,B},

b.

każdy z graczy dysponuje zbiorem strategii określających jego sposób

rozgrywania gry: M

a

={a

1

,a

2

,…,a

i

,…,a

m

} i M

b

={b

1

,b

2

,…,b

j

,…,b

n

}; zbiór

strategii obydwu graczy M składa się z elementów m

ij

, w których każdy z

graczy jest reprezentowany przez jedną strategię; M=M

a

xM

b

, m

ij

=[a

i

,b

j

],

c.

każdemu elementowi zbioru M przyporządkowany jest wynik gry w postaci

punktu dwuwymiarowej przestrzeni euklidesowej określającego wypłaty

2

graczy u(m

ij

)=(u

a

(m

ij

),u

b

(m

ij

)).

Gracze, którzy są nieodzownymi podmiotami gry muszą spełniać określoną

charakterystykę.

„Każdy

gracz

powinien

dysponować

zdefiniowanymi

zasobami

obejmującymi również informacje, mieć do wyboru określoną ilość sposobów postępowania,

1

Alternatywnym podejściem jest zdefiniowanie gry jako drzewa topologicznego [Owen, 1975, s. 12]. Aby

niepotrzebnie nie komplikować zagadnień, których analiza ma spełniać funkcje pomocnicze, autor postanowił
zrezygnować z tego podejścia.

2

W dalszej części wywodu, przez wypłaty graczy należy rozumieć doświadczane przez nich użyteczności.

Prezentacja alternatywnych koncepcji użyteczności zysków oraz przyjęte założenie w tym zakresie zostały
przedstawione w rozdziale 2.1.1. Rozdział 3.5.1. został poświęcony znaczeniu ekonomii eksperymentalnej dla
rozwoju teorii użyteczności.

background image

2

ze szczególnym uwzględnieniem możliwości komunikowania się i porozumiewania oraz

wewnętrznie spójny system preferencji lub użyteczności odnoszący się do uzyskiwanych

wypłat” [Shubik, 1995, s. 16]. Wszystkie te cechy powinny być uwzględnione w obrębie

reguł gry. Nie może być tak, że istotne zróżnicowanie graczy nie zostanie objęte regułami gry.

Graczami mogą być osoby fizyczne, przedsiębiorstwa, instytucje, związki zawodowe, związki

pracodawców, państwa. Tak duże zróżnicowanie jakościowe może powodować problemy

metodologiczne. Jeśli na przeciw siebie staje osoba fizyczna i organizacja nieodzownym jest

przyjęcie założenia, że ta druga również obdarzona jest wolną wolą i nie ma problemu z jej

jednoznacznym wyrażeniem.

Niezwykle istotnym założeniem jest racjonalność graczy, z których każdy „analizuje

grę w poszukiwaniu sposobu uzyskania pożądanego wyniku, uwzględniając fakt, że pozostali

robią to samo” [Straffin, 2001, s. 2]. Na ogół, racjonalność graczy ma postać występującą w

przypadku podejmowania decyzji w warunkach niepewności [Luce, Raiffa, 1964, s. 22].

Rzadziej jest to racjonalność związana z podejmowaniem decyzji w warunkach ryzyka.

Dzieje się tak jedynie w przypadku tzw. gier przeciwko Naturze, w których jednym z graczy

jest przyroda „dokonująca wyborów strategii” z założonymi prawdopodobieństwami

[Straffin, 2001, ss. 74-81]. W grach przeciwko Naturze różnica między charakterem

podmiotowym graczy polega również na tym, że gracz aktywny osiąga określone wypłaty a

Natura nie [Rapoport, 1989, s. 177]. Przykładem takiej gry jest sytuacja opisana w artykule

Davenporta o rybołówstwie na Jamajce [Davenport, 1960].

Zdarza się, że w określonych wynikach gry bardziej lub mniej zainteresowany jest

tzw. „gracz statysta” (dummy player), który nie ma możliwości wpływania swoimi decyzjami

na nie [Shubik, 1995, s. 18]. Dobrym przykładem jest zbiorowy konsument, który w grze

rynkowej może osiągnąć wyższą lub niższą kwotę nadwyżki, w zależności od wyborów

strategii dokonywanych przez przedsiębiorstwa. Rola konsumentów sprowadza się jedynie do

wpływu preferencji na krzywą popytu rynkowego, która z kolei staje się elementem reguł gry.

Strategie, jakie stoją do wyboru przed każdym graczem należy rozumieć jako sposoby

rozegrania gry w kompletnym zakresie, od jej rozpoczęcia aż do końca [Shubik, 1995, s. 34].

Gra może bowiem polegać na sekwencji ruchów decyzyjnych przeplatanych niekiedy

wpływem zmiennych losowych lub na jednorazowym wyborze strategii przez graczy.

Strategie gracza mogą mieć postać czystą i występować jako jeden z elementów

zbioru M

i

(np. m

i1

lub m

in

). Strategia gracza i może też się pojawić w postaci mieszanej

3

,

3

O metodach wyznaczania strategii mieszanych i problemach z ich praktyczną aplikacją traktują rozdziały 1.2.2

i 1.2.3.

background image

3

której obraz powstaje w wyniku losowania wszystkich spośród dostępnych graczowi strategii

„czystych” zgodnie z określonym rozkładem prawdopodobieństwa p

j

={p

j1

,p

j2

,...,p

jk

,...,p

jm

}

takim, że 0≤p

jk

1 oraz:

=

=

m

1

k

jk

1

p

,

[1.1]

gdzie m jest liczbą dostępnych strategii czystych. Dla gracza A strategia mieszana a

pj

M

pa

(M

pa

to zbiór jego wszystkich strategii mieszanych), to:

a

pj

=[p

j1

a

1

,p

j2

a

2

,...,p

jk

a

k

,...,p

jm

a

m

].

[1.2]

Przy takim zdefiniowaniu strategii mieszanej każda strategia czysta a

k

jest jej

szczególną postacią, w przypadku której tylko jeden składnik rozkładu prawdopodobieństwa

p

jk

jest większy od zera. Wygrana gracza A, jaką uzyska wybierając strategię mieszaną a

pj

przy jednoczesnym wyborze strategii czystej b

j

przez gracza B wyraża się formułą:

u

a

([a

pj

,b

j

])=p

j1

u

a

([a

1

,b

j

])+p

j2

u

a

([a

2

,b

j

])+...+p

jk

u

a

([a

k

,b

j

])+...+p

jm

u

a

([a

m

,b

j

]).

[1.3]

Konstrukcja strategii mieszanej, pożyteczna i poprawna pod względem formalnym,

nastręcza pewnych trudności z praktycznego punktu widzenia. Dla ustalenia strategii

mieszanej a

pj

możemy przeprowadzić eksperyment, w którym dzielimy zbiór możliwych

wyników pomiędzy

m wzajemnie niezależnych i wzajemnie wykluczających się zdarzeń o

rozkładzie prawdopodobieństwa p

j

[Luce, Raiffa, 1964, s. 77]. Można do tego użyć tablic

losowych lub zaprojektować loterię, w której kolejnych

m zdarzeń wystąpi odpowiednio z

prawdopodobieństwami {p

j1

,p

j2

,...,p

jk

,...,p

jm

}. W kolejnym kroku gracz powinien dokonać

losowania. W losowaniu tym może się okazać, że wskazana przezeń strategia czysta przynosi

niższy poziom wygranej niż u

a

([a

pj

,b

j

]) lub niższy niż inne strategie czyste

4

. Osiągnięcie

ś

redniej wartości wygranej równej u

a

([a

pj

,b

j

]) byłoby możliwe dopiero po przeprowadzeniu

nieskończonej ilości losowań w opisanej loterii. Obrońcy koncepcji strategii mieszanych

wskazują na ich dwie istotne cechy. Po pierwsze, poszukiwanie rozwiązania gry w strategiach

mieszanych odbywa się dopiero wtedy, gdy nie można go znaleźć wśród strategii czystych.

Po drugie, operowanie strategiami mieszanymi nie daje przeciwnikowi żadnych informacji o

tym, jakiej użyjemy strategii czystej [Luce, Raiffa, 1964, s. 78].

Teoria gier bada zachowania podmiotów w sytuacji konfliktu i kooperacji

[Straffin, 2001, s. 1]. Podstawowym obszarem zainteresowania są oczywiście sytuacje

konfliktu interesów [Malawski, Wieczorek, Sosnowska, 1997, s.12]. O konflikcie interesów w

4

Luce i Raiffa dają kilka bardzo ciekawych przykładów na praktyczne problemy z wykorzystaniem strategii

mieszanych [Luce, Raiffa, 1964, s. 79]

background image

4

postaci pełnej możemy mówić w przypadku gier o sumie stałej

5

. Podstawową klasę

reprezentującą ten typ gier, gry o sumie zerowej można zdefiniować jako te, w przypadku

których dla każdego m

j

należącego do M:

0

)

m

(

u

j

n

1

i

i

=

=

,

[1.4]

lub w przypadku gier dwuosobowych:

u

a

(

m

ij

)+u

b

(

m

ij

)=0.

[1.5]

W przypadku gier o sumie zerowej wygrane graczy w ramach określonego wyniku gry

zawsze sumują się do zera. Związane jest to z naturalnym konfliktem interesów

wykluczającym jakiekolwiek formy kooperacji. Wygrana jednego gracza wiąże się

nierozerwalnie z przegraną drugiego tożsamą, co do wartości bezwzględnej. W

dwuosobowych grach o sumie zerowej nie ma pola do kooperacji. Każdy z graczy pragnie

osiągnąć jak najwyższą wygraną uwzględniając to samo dążenie u przeciwnika. Jedynie w

przypadku liczby graczy większej niż dwa, możliwa jest kooperacja poprzez tworzenie

koalicji pozostającej w konflikcie interesów z graczami pozostającymi poza nią.

Alternatywa pomiędzy kooperacją a konfliktem ma również szansę pojawić się w

przypadku gier o sumie różnej od zera (lub nie stałej). Jeśli gracze nie mają w nich

możliwości porozumiewania się ani zawierania wiążących umów przybierają one postać gier

niekooperacyjnych [Luce, Raiffa, 1964, s. 112], jeśli pojawia się taka możliwość można

mówić o grze kooperacyjnej.

2.

Formy prezentacji gier

Prezentacja reguł gry może mieć postać opisową, która zawiera wszystkie istotne

fakty, zależności i charakterystyki istotne dla jej rozegrania. Wyrażona zwartym tekstem

postać gry znajduje najczęściej zastosowanie w przypadku prostych gier, których reguły nie

wymagają skomplikowanych zapisów. Przykładem może być gra rynkowa wzorowana na

grach rynkowych o zmiennym zakresie informacji [Kreps, 1990]. Nazwijmy ją „A vs B”.

Gra „A vs B”

5

Podstawową klasą tego typu gier są gry o sumie zerowej, i tak je pierwotnie nazwali von Neumann i

Morgenstern [von Neumann, Morgenstern, 1944]. Niektórzy autorzy pozostali wierni tej nazwie [Straffin, 2001],
[Drabik, 2005], [Luce, Raiffa, 1964], [Owen, 1975]. Niektórzy przyjęli szerszy znaczeniowo termin „gry o
sumie stałej” [Rapoport, 1989]. Każdą grę o sumie stałej można przekształcić liniowo w grę o sumie zerowej
odejmując, od wygranych poszczególnych graczy, iloraz stałej sumy wygranych i liczby graczy. Takie
przekształcenie pozostaje bez wpływu na wyznaczenie równowagi w grze. Ze względu na powszechność
stosowania, autor będzie posługiwał się terminem „gra o sumie zerowej”.

background image

5

Rynek przenośnych odtwarzaczy muzyki z internetu jest opanowany przez dwie firmy

Audioslave i Broadcast. Pierwsza specjalizuje się w odtwarzaczach popularnych, o niższej

cenie i gorszych parametrach jakościowych. Posiada w swojej ofercie również bardziej

zaawansowane technologicznie produkty. Firma Broadcast jest wyspecjalizowana w wysokiej

jakości sprzęcie dla wyrobionych słuchaczy. Obydwie firmy pracują nad wprowadzeniem na

rynek nowego mobilnego odtwarzacza umożliwiającego ściąganie plików muzycznych z

internetu. Każdy z konkurentów ma do wyboru produkowanie tańszego, ale gorszego

jakościowo odtwarzacza (T) lub zaawansowanego technologicznie, ale droższego (D).

W sytuację rynkową wpisany jest czynnik losowy. śadna z firm nie wie czy przyszły

popyt na nowy produkt będzie duży, czy mały. Mały popyt to sytuacja, w której udział

koneserów zainteresowanych sprzętem wysokiej jakości w całkowitym zapotrzebowaniu jest

większy. O perspektywach rynkowych wiadomo jedynie, że duży popyt pojawi się z

prawdopodobieństwem p

d

=0,6 i zapewni obroty w wysokości u

a

+u

b

=60 (u

a

i u

b

to

odpowiednio wygrane firm Audioslave i Broadcast tożsame ich poziomowi przychodów).

Mały popyt może przynieść graczom sumę przychodów u

a

+u

b

=30. Zmienna losowa może

wskazać tylko na jeden lub na drugi z wymienionych rozmiarów rynku. Obydwie firmy

podejmują decyzję o wyborze profilu produkcyjnego jednocześnie, nie znając oczywiście

wyboru konkurenta.

Jeśli na małym rynku, obydwie firmy wybiorą strategie a

1

=T i b

1

=T, to osiągną

wygrane u

a

([a

1

,b

1

])=20 i u

b

([a

1

,b

1

])=10. W sytuacji, gdy na tym samym rynku zgodny wybór

strategii wskaże na produkowanie wysokiej jakości sprzętu (a

2

=D i b

2

=D), ich przychody

również będą wynosić u

a

([a

2

,b

2

])=20 i u

b

([a

2

,b

2

])=10. Wygrane firm w pozostałych

przypadkach osiągają wartości: u

a

([a

2

,b

1

])=25, u

b

([a

2

,b

1

])=5 i u

a

([a

1

,b

2

])=10, u

b

([a

1

,b

2

])=20.

Jeśli firmom przyjdzie operować na rynku o dużym popycie, te same wybory strategii

przyniosą wyższą sumę wygranych do podziału. Wygrane we wszystkich możliwych

kombinacjach strategii wynosić będą: u

a

([a

1

,b

1

])=45 i u

b

([a

1

,b

1

])=15, u

a

([a

2

,b

2

])=36 i

u

b

([a

2

,b

2

])=24, u

a

([a

2

,b

1

])=24, u

b

([a

2

,b

1

])=36 i u

a

([a

1

,b

2

])=42, u

b

([a

1

,b

2

])=18.

Tak zapisane reguły gry podziału rynku miedzy dwóch konkurentów zawierają w

sobie wszystkie istotne informacje. Gdyby jednak przyszło nam poszukać najwłaściwszych

strategii dla obydwu graczy, nawet bez posiadania koniecznej wiedzy na ten temat, posiłkując

się wyłącznie intuicją, sama postać opisowa gry nie ułatwi nam specjalnie zadania. Ze

względu na przydatność w poszukiwaniu rozwiązań gier o różnych cechach jakościowych,

obowiązują trzy metody ich zapisu. Są to postać ekstensywna (rozwinięta), macierzowa oraz

postać funkcji charakterystycznej.

background image

6

Pierwsza z nich, postać ekstensywna, to ta, której podstawowym elementem jest

drzewko lub dendryt gry [Malawski, Wieczorek, Sosnowska, 1997, s. 16]. Dendryt gry jest

układem gałęzi i wierzchołków (węzłów), pokazujących wybory graczy i wskazania zmiennej

losowej w całej partii gry. Możliwości, jakie stoją przed graczem w momencie dokonywania

wyboru nazywamy ruchem. Ciąg wyborów od początku gry do jej końca to partia

[Luce, Raiffa, 1964, s. 46]. Ten wierzchołek, do którego nie dochodzi żadna gałąź to początek

gry a ten, od którego nie wychodzą już gałęzie jest wynikiem gry [ibidem, s. 50]. Poziom

dendrytu gry zawierający jej wyniki oznacza jej koniec. Aby określona konstrukcja

topologiczna mogła być nazwana drzewkiem gry musi spełniać wyznaczone kryteria:

a)

każdy wewnętrzny węzeł przypisany jest któremuś z graczy (włączając Los),

wykonującemu z niego ruch,

b)

każda z gałęzi wyprowadzona w dół z danego węzła reprezentuje możliwy wybór

gracza,

c)

każdej gałęzi odpowiadającej „wyborowi” w ramach ruchu Losu przypisane jest

prawdopodobieństwo z jakim los dokona określonych wyborów,

d)

każdemu węzłowi końcowemu przypisane są wypłaty graczy,

e)

wierzchołki należące do danego gracza w ramach jednego ruchu podzielone są na zbiory

informacyjne; dokonując wyboru gracz wie, w którym zbiorze informacyjnym się

znajduje ale nie wie, w którym z jego węzłów,

f)

z każdego z węzłów należących do tego samego zbioru informacyjnego wyprowadzana

jest taka sama liczba gałęzi, oznaczanych w taki sam sposób.

Ilustrację opisu postaci ekstensywnej gry oparto na przykładzie „A vs B”. Dendryt gry

wygląda, w tym przypadku, następująco:

background image

7

Kolejność, w jakiej gracze zostali przedstawieni w dendrycie gry nie ma znaczenia,

gdy tak jak w opisywanej grze, żaden z nich nie zna ani „wyboru” Losu ani wyboru drugiej

strony. Wyniki gry, które pojawiają się na ostatnim poziomie byłyby takie same gdybyśmy,

na przykład, zaczęli od węzła firmy Broadcast a skończyli na „wyborach” Losu. Wszystkie

wierzchołki gracza Audioslave (A) tworzą jeden zbiór informacyjny, ponieważ nie zna on ani

rozmiarów rynku ani decyzji konkurenta, w momencie dokonywania własnego wyboru.

Podobnie jest z graczem Broadcast (B).

Dendryt gry pokazuje wszystkie ścieżki, jakimi może potoczyć się gra. Wyniki gry na

samym dole dendrytu informują o wygranych graczy według porządku (u

a

,u

b

). W naszym

przykładzie, jeśli rynek będzie duży a obydwaj gracze wybiorą produkcję tańszego

odtwarzacza ([a

1

,b

1

]), ich wygrane (przychody ze sprzedaży) wyniosą odpowiednio u

a

=20 i

u

b

=10. Gracz A, w ramach swojego ruchu może dokonać wyboru a

1

lub a

2

. Podobnie jest w

przypadku gracza B. Splot dokonanych przez graczy wyborów, poprzedzony nieznanym

„wyborem” losu, decyduje o tym, która para wygranych stanie się ich udziałem.

Prezentowany przykład dendrytu gry jest obrazem gry skończonej. Mówimy o grze

skończonej wtedy, gdy jej dendryt zawiera tylko skończoną ilość wierzchołków [Owen, 1975,

s. 15]. W grze skończonej gracz ma również skończoną liczbę strategii. Przykład gry

nieskończonej to sytuacja, w której gracze podają dowolne liczby całkowite i ten, który poda

niższą płaci jedną jednostkę drugiemu. Zbiór strategii czystych jest nieskończony, co czyni

taką i grę [Luce, Raiffa, 1964, s. 415].

Los

Audioslave

Broadcast

mały rynek
p

m

=0,4

duży rynek
p

d

=0,6

a

1

a

1

a

2

a

2

b

2

b

2

b

2

b

2

b

1

b

1

b

1

b

1

(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)

Schemat 1.1. Dendryt gry „A vs B”

Ź

ródło: opracowanie własne na podstawie [Kreps, 1990]

background image

8

Tabela 1.1. Macierz gry dwuosobowej
u

b

a

1

a

2

...

a

i

...

a

m

b

1

u

b

([a

1

,b

1

]) u

b

([a

2

,b

1

])

...

u

b

([a

i

,b

1

])

...

u

b

([a

m

,b

1

])

b

2

u

b

([a

1

,b

2

]) u

b

([a

2

,b

2

])

...

u

b

([a

i

,b

2

])

...

u

b

([a

m

,b

2

])

...

...

...

...

...

...

...

b

j

u

b

([a

1

,b

j

]) u

b

([a

2

,b

j

])

...

u

b

([a

i

,b

j

])

...

u

b

([a

m

,b

j

])

...

...

...

...

...

...

...

b

n

u

b

([a

1

,b

n

]) u

b

([a

2

,b

n

])

...

u

b

([a

i

,b

n

])

...

u

b

([a

m

,b

n

])

u

a

a

1

a

2

...

a

i

...

a

m

b

1

u

a

([a

1

,b

1

]) u

a

([a

2

,b

1

])

...

u

a

([a

i

,b

1

])

...

u

a

([a

m

,b

1

])

b

2

u

a

([a

1

,b

2

]) u

a

([a

2

,b

2

])

...

u

a

([a

i

,b

2

])

...

u

a

([a

m

,b

2

])

...

...

...

...

...

...

...

b

j

u

a

([a

1

,b

j

]) u

a

([a

2

,b

j

])

...

u

a

([a

i

,b

j

])

...

u

a

([a

m

,b

j

])

...

...

...

...

...

...

...

b

n

u

a

([a

1

,b

n

]) u

a

([a

2

,b

n

])

...

u

a

([a

i

,b

n

])

...

u

a

([a

m

,b

n

])

Ź

ródło: opracowanie własne

Drugą podstawową formą prezentacji gry jest jej postać macierzowa. Jakkolwiek jej

przydatność ogranicza się do gier dwuosobowych

6

, bardzo ułatwia poszukiwanie rozwiązań w

tej klasie gier. Postać macierzowa gry dwuosobowej to tabela, której wiersze odpowiadają

wyborom strategii czystych jednego gracza, a kolumny wyborom strategii czystych drugiego.

Na przecięciu każdej pary strategii w tabeli pomieszczone są wartości wygranych obydwu

graczy, jakie osiągają oni przy koincydencji tych właśnie wyborów. Posługując się

oznaczeniami z definicji gry dwuosobowej możemy zbudować jej macierz, jaką pokazuje

Tabela 1.1. Macierz wygranych została przedstawiona w postaci dwumodułowej. Jej górny

moduł zawiera wygrane gracza, którego strategie zostały wymienione w wierszach tabeli.

Dolny moduł to wygrane drugiego gracza, którego strategie to nagłówki kolumn. Takie

podejście sprawiło, że niektórzy autorzy gry dwuosobowe o sumie różnej od zera i nie stałej

nazywają grami dwumacierzowymi [Drabik, 2005, s. 68]. Można oczywiście informacje

zawarte w Tabeli 1.1 skoncentrować w jednym module, podając w każdej komórce parę

wygranych. W takim wariancie prezentacji zawsze jako pierwsza podawana jest wypłata

gracza, którego strategie wymienione są w nagłówkach wierszy. Gry dwuosobowe o sumie

zerowej zapisuje się w postaci macierzy z wygranymi jednego z graczy. Taki skrócony zapis

w pełni przekazuje zależność między wyborami strategii a wygranymi obydwu uczestników

gry. Gra o sumie stałej, choć tożsama liniowo z grą o sumie zerowej, jest często

6

O ile można jeszcze sobie wyobrazić prostopadłościan, podzielony na sześcianiki odpowiadające splotom

strategii w grach trzyosobowych, to gry o ilości graczy większej od trzech nie mogłyby znaleźć czytelnej
prezentacji macierzowej. Utożsamienie, o którym mowa jest tak silne w literaturze tematu, że niektórzy autorzy
nazywają gry dwuosobowe grami macierzowymi [Straffin, 2001].

background image

9

przedstawiana w postaci dwumacierzowej, by ułatwić czytelnikowi orientację w zmienności

wygranych obydwu graczy.

Gra „A vs B” zawiera w swoich regułach wpływ czynnika losowego. Gdyby gracze

znali rozmiar rynku przed podjęciem decyzji mielibyśmy do czynienia z jedną lub drugą

jednoznacznie określoną macierzą wygranych. Tak nie jest, zatem wpływ ryzyka związanego

z kształtowaniem się czynnika losowego należy uwzględnić poprzez wyznaczenie wartości

oczekiwanych wygranych obydwu graczy. Uprawnia nas do tego przyjęcie założenia o

liniowej użyteczności liczbowej. Liczymy, więc na przykład: u

a

([a

1

,b

1

])=0,4·20+0,6·45=35 a

u

b

([a

1

,b

1

])=0,4·10+0,6·15=13.

Tabela 1.2. Macierz gry „A vs B”

Audioslave

u

a

a

1

a

2

b

1

35,0

24,4

Broadcast

b

2

29,2

29,6

Audioslave

u

b

a

1

a

2

b

1

13,0

23,6

Broadcast

b

2

18,8

18,4

Ź

ródło: opracowanie własne

Gra w postaci funkcji charakterystycznej jest obrazem wykreowanym dla potrzeb gier

n-osobowych. „Oznaczmy zbiór wszystkich graczy gry n-osobowej przez N={1,2,...,n}.

Każdy niepusty podzbiór zbioru N (łącznie z całym N i zbiorami jednoelementowymi)

nazwiemy koalicją. Przez funkcje charakterystyczną gry n-osobowej będziemy rozumieć

funkcję rzeczywistą v określoną dla wszystkich podzbiorów zbioru N, która każdemu

podzbiorowi S

N przyporządkowuje wartość maksyminową

7

(dla S) w grze dwuosobowej

rozgrywanej między S a N-S, przy założeniu, że utworzyły się właśnie dwie koalicje” [Owen,

1975, s. 136]. Wartość v(S) oznacza wartość użyteczności, jaką mogą osiągnąć uczestnicy

koalicji bez względu na decyzje podmiotów pozostających poza nią. Twórcy koncepcji

funkcji charakterystycznej wymienili trzy cechy, które musi spełniać [von Neumann,

Morgenstern, 1944, s. 241]:

v(Ø)=0; gdzie Ø to podzbiór pusty,

[1.6]

v(-S)=-v(S),

[1.7]

7

Pojęcie maksyminu gry o sumie zerowej zostanie przedstawione w dalszej części pracy. Tutaj wystarczy

powiedzieć, że jest to wartość wygranej v przynoszona przez parę strategii, która zapewnia, że jeden z graczy
wygra, co najmniej v a drugi przegra najwyżej v.

background image

10

v(S

T)≥v(S)+v(T); jeśli S

T=Ø.

[1.8]

W następnym kroku von Neumann i Morgenstern udowodnili, że funkcja

charakterystyczna spełnia warunki [1.6-1.8] dla każdej gry. Prostą ilustracją koncepcji funkcji

charakterystycznej była następująca gra [von Neumann, Morgenstern, 1944, s. 222-223].

Gra w dobór koalicjanta

Każdy z trzech graczy (N={1,2,3}) podaje jednocześnie, numer jednego z

pozostałych. Jeśli dwóch poda, na wzajem, swoje numery to tworzą koalicję i dzielą po

połowie jednostkę, którą daje im gracz pozostający poza koalicją.

Zapis tej gry w postaci funkcji charakterystycznej spełnia wszystkie warunki

sformułowane przez von Neumanna i Morgensterna:

v(Ø)=v(123)=0,

[1.9]

v(1)=v(2)=v(3)=-1

[1.10]

v(12)=v(23)=v(13)=1.

[1.11]

Na ogół, nie zapisuje się gier dwuosobowych w postaci funkcji charakterystycznej.

Niemniej, dla porównania wszystkich trzech prezentowanych form zapisu gier strategicznych,

gra „A vs B” zostanie przedstawiona również w postaci funkcji charakterystycznej

8

.

v(Ø)=0; v(A)=29,41; v(B)=18,59; v(AB)=48.

[1.12]

Jak widać, dla gier dwuosobowych, warunek [1.8] przybiera postać równości.

Zapisanie gry n-osobowej w postaci funkcji charakterystycznej jest możliwe dopiero po

rozwiązaniu szeregu gier dwuosobowych. O metodach temu służących będą traktowały dwie

kolejne części pracy.

Zanim jednak do nich przejdziemy, sprawdźmy, jak na reguły gry wpływa zakres

informacji, jakim dysponują gracze. W grze „A vs B” dokonywali oni wyborów strategii nie

znając, na wzajem, swoich posunięć ani rozmiarów rynku. Sprawdźmy, co stanie się, jeśli

zmienimy nieco warunki gry „A vs B”.

Gra „A przeciw B”

Ta gra opiera się na zachowaniu wszystkich, poza jedną reguł gry „A vs B”.

Zmienioną regułą jest jednoczesność wyboru strategii. Firma Broadcast, ze względu na

mniejsze rozmiary i, co za tym idzie, większą elastyczność, podejmuje decyzję później,

znając już wybór firmy Audioslave.

Opisana modyfikacja warunków zmieni rozłożenie zbiorów informacyjnych postaci

ekstensywnej gry. Gracz B podejmuje decyzję wiedząc, czy A wybrał a

1

czy a

2

.

8

Sposób wyznaczenia v(A) i v(B) zostanie przedstawiony w następnej części pracy.

background image

11

W porównaniu z grą „A vs B” sytuacja gracza A nie zmieniła się. Gracz B natomiast,

zamiast jednego, ma dwa zbiory informacyjne. Jeden łączy wierzchołki połączone z gałęziami

odpowiadającymi wyborom strategii a

1

(produkować tańszy odtwarzacz T), drugi to dwa

wierzchołki, do których dochodzą gałęzie a

2

(produkować droższy odtwarzacz D). Wiedza

dotycząca wyboru strategii przez gracza A modyfikuje zbiór strategii gracza B. Nie jest on już

prostą alternatywą b

1

lub b

2

. W obecnej postaci gry, gracz B ma do wyboru cztery strategie:

b

3

– zawsze wybierać odtwarzacz tańszy („TT;DT”),

b

4

– wybierać ten sam profil produktu co A („TT;DD”),

b

5

– zawsze wybierać przeciwnie niż A („TD;DT”)

b

6

– zawsze wybierać odtwarzacz droższy („TD;DD”).

Strategia b

3

jest tożsama ze strategią b

1

z poprzedniej wersji gry. Podobnie jest z parą

b

6

i b

2

. Niemniej dla zaakcentowania odmienności gier „A vs B” i „A przeciw B”

wprowadzono odmienne oznaczenia. Postać macierzowa gry „A przeciw B” musi uwzględnić

wzrost ilości strategii czystych gracza B oraz inne kombinacje wygranych brane do kalkulacji

wartości oczekiwanej wypłat graczy. Na przykład, wynik gry dla kombinacji strategii [a

1

,b

5

]

będzie następujący u

a

([a

1

,b

5

])=0,4·10+0,6·42=29,2 i u

b

([a

1

,b

5

])=0,4·20+0,6·18=18,8.

Los

Audioslave

Broadcast

mały rynek
p

m

=0,4

duży rynek
p

d

=0,6

a

1

a

1

a

2

a

2

b

2

b

2

b

2

b

2

b

1

b

1

b

1

b

1

(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)

Schemat 1.2. Dendryt gry „A przeciw B”

Ź

ródło: opracowanie własne na podstawie [Kreps, 1990]

background image

12

Tabela 1.3. Macierz gry „A przeciw B”

Audioslave

u

a

a

1

a

2

b

3

35,0

24,4

b

4

35,0

29,6

b

5

29,2

24,4

Broadcast

b

6

29,2

29,6

Audioslave

u

b

a

1

a

2

b

3

13,0

23,6

b

4

13,0

18,4

b

5

18,8

23,6

Broadcast

b

6

18,8

18,4

Ź

ródło: opracowanie własne

Macierze gier „A vs B” i „A przeciw B” różnią się ze względu na pojawienie się

nowych wierszy b

4

i b

5

. Nowa macierz podległa istotnemu rozbudowaniu. Zmiany postaci

ekstensywnej gry nie są tak ewidentne. W niej, zmianie ulega tylko zakres zbioru

informacyjnego jednego gracza. Oczywiście to nie zmienia faktu, że obydwie postacie

przedstawiają tą samą grę.

Przykład wpływu zmiany zbiorów informacyjnych w grze „A przeciw B” ilustruje

dobrze metamorfozę, jaką przechodzi obraz gry od postaci ekstensywnej do macierzowej.

Wpływ czynnika losowego, który rozgałęział dendryt gry zostaje zredukowany do udziału

prawdopodobieństw w liczeniu wartości oczekiwanych wypłat graczy. Każdy możliwy

przebieg gry, czyli partia gracza zostaje zredukowana do postaci jednej strategii czystej i

jednego ruchu. Konstrukcja strategii nie wymaga jakiejkolwiek wiedzy o decyzjach

przeciwnika. Dopiero jej wybór, połączony ze znajomością decyzji przeciwnika, w sposób

automatyczny dobiera wygrane do policzenia odpowiedniej wartości oczekiwanej. Opisana

procedura to „redukcja każdej gry do prostej postaci standardowej, zwanej postacią normalną

gry” [Luce, Raiffa, 1964, s. 58]. Postać normalna, o której mowa, różni się od postaci

macierzowej jedynie szczegółami technicznymi dotyczącymi konstrukcji tabeli.

Idąc dalej w przemianach zakresu informacji graczy, możemy zbudować kolejną grę.

Zmiana zbiorów informacyjnych gracza A powinna pociągnąć za sobą zwiększenie się liczby

jego strategii czystych.

Gra „A kontra B”

background image

13

Przyjmijmy wszystkie reguły gry „A przeciw B” zmieniając tylko jedną. Firma

Audioslave zamówiła badanie rynku i poznała jego rozmiar przed podjęciem decyzji o profilu

produktu. Firma Broadcast wie, że badania zostały przeprowadzone, ale nie zna ich wyniku.

Postać rozwinięta gry „A kontra B” zmieni się w stosunku do poprzedniej wersji

analizowanej sytuacji rynkowej w zakresie zbioru informacyjnego gracza A. Wiedza o

rozmiarach rynku sprawi podzieli się on na dwa reprezentujące odpowiednio informacje:

„rynek jest duży” lub „rynek jest mały”.

W porównaniu z grą „A przeciw B”, zbiór strategii gracza B nie ulegnie zmianie.

Zbiór strategii gracza A musi zostać zbudowany z uwzględnieniem zmian w zakresie

informacji. Nowe strategie budowane są przed zdobyciem wiedzy o rozmiarach rynku, ale w

swojej istocie muszą ją uwzględniać. W obecnej postaci gry, gracz A ma do wyboru cztery

strategie:

a

3

– niezależnie od rozmiarów rynku wybierać odtwarzacz tańszy („mT;dT”),

a

4

– wybrać tańszy na mały rynek i droższy na duży („mT;dD”),

a

5

– wybrać droższy na mały rynek i tańszy na duży („mD;dT”),

a

6

– zawsze wybierać odtwarzacz droższy („mD;dD”).

Nie potrzeba głębszej analizy, aby zauważyć, że najniższe wygrane powinna przynosić

strategia a

4

. Polega ona na wejściu z tanim odtwarzaczem na mały rynek, na którym dominują

audiofile lub z drogim odtwarzaczem na rynek duży, który oczekuje tzw. „sprzętu dla

Los

Audioslave

Broadcast

mały rynek
p

m

=0,4

duży rynek
p

d

=0,6

a

1

a

1

a

2

a

2

b

2

b

2

b

2

b

2

b

1

b

1

b

1

b

1

(20,10) (10,20) (25,5) (20,10) (45,15) (42,18) (24,36) (36,24)

Schemat 1.3. Dendryt gry „A kontra B”

Ź

ródło: opracowanie własne na podstawie [Kreps, 1990]

background image

14

każdego”. Najwyższe wygrane powinien, zatem przynieść graczowi A wybór strategii a

5

.

Zapis macierzowy gry „A kontra B” potwierdza te przypuszczenia.

Tabela 1.4. Macierz gry "A kontra B"

Audioslave

u

a

a

3

a

4

a

5

a

6

b

3

35,0

22,4

37,0

24,4

b

4

35,0

29,6

35,0

29,6

b

5

29,2

18,4

35,2

24,4

Broadcast

b

6

29,2

25,6

33,2

29,6

Audioslave

u

b

a

3

a

4

a

5

a

6

b

3

13,0

25,6

11,0

23,6

b

4

13,0

18,4

13,0

18,4

b

5

18,8

29,6

12,8

23,6

Broadcast

b

6

18,8

22,4

14,8

18,4

Ź

ródło: opracowanie własne

Podobnie, jak w przypadku przejścia od gry „A vs B” do gry „A przeciw B” macierz

gry „A kontra B” różni się od poprzedniej pojawieniem się dwóch dodatkowych kolumn a

4

i

a

5

9

. Gdybyśmy z tej macierzy usunęli wszystkie komórki poza narożnikowymi,

otrzymalibyśmy macierz gry, od której zaczynaliśmy („A vs B”).

1.

Gry o sumie zerowej

1.1.4.

Punkt siodłowy jako rozwiązanie w strategiach czystych

Natura gier o sumie zerowej

10

przejawia się w ich ściśle konkurencyjnym charakterze

[Luce, Raiffa, 1964, s. 64]. Jest on widoczny w czystej postaci, jeśli mamy do czynienia z grą

dwuosobową. Zwiększenie ilości graczy do n>2 stwarza możliwość dla budowania koalicji,

co zmienia naturę sytuacji strategicznych opisywanych grami o sumie zerowej. Ścisły konflikt

interesów ustępuje miejsca wyborowi między koalicjami. Oczywiście suma wygranych

koalicji i jej dopełnienia nadal jest zerowa, ale sytuacja pojedynczego gracza jest inna niż w

przypadku gry dwuosobowej. Z tej przyczyny, oraz ze względu na przedmiot zainteresowania

zasadniczej części pracy uwaga zostanie skoncentrowana na grach dwuosobowych.

Ś

cisły konflikt interesów połączony z dokonywaniem wyborów w warunkach

niepewności przynosi szczególną konstrukcję sytuacji decyzyjnej. Dążąc do maksymalnej

9

Strategia a

3

jest tożsama z a

1

a a

6

z a

2

. Analogicznie jak w przypadku gracza B.

10

Przypomnijmy, że prawie wszystkie obserwacje dotyczące tej klasy gier można rozciągnąć na szerszą

kategorię gier o sumie stałej.

background image

15

wygranej gracz może doprowadzić do bardzo niepożądanego wyniku. Dokonując wyborów

strategii każdy z graczy musi mieć świadomość tego, że przeciwnik pośrednio ma na celu

minimalizację jego wygranej. Racjonalnym jest zatem dokonywanie takich wyborów, które

uchronią od jak najwyższych przegranych. Gdyby posłużyć się terminologią wojskową, w

grach o sumie zerowej należy stosować strategie minimalizacji strat. Przyjrzyjmy się

przykładowi następującej gry.

„Walka o rynek 1”

Dwa przedsiębiorstwa walczą o udział w rynku lokalnym. Każde z nich ma do wyboru

trzy strategie tzw. mixu marketingowego. W zależności od tego, jakie wybiorą strategie,

mogą stracić lub zyskać kosztem konkurenta określoną część rynku mierzoną w punktach

procentowych. Wyniki przyporządkowania wygranych graczy parom strategii przedstawia

Tabela 1.5.

Tabela 1.5. Macierz gry "Walka o rynek 1"

u

b

a

1

a

2

a

3

b

1

2%

1%

2%

b

2

-4%

-1%

3%

b

3

2%

-2%

-1%

Ź

ródło: opracowanie własne

Gdyby gracz B postawił sobie za cel odebranie konkurentowi największej, możliwej w

tej grze, części rynku (u

b

=3%), musiałby wybrać strategię b

2

. Jednak, jeśli jednocześnie gracz

A wybierze strategię a

1

, udziałem B stanie się maksymalna możliwa utrata części rynku, czyli

u

b

=-4%. Gdyby podobnym dążeniem kierował się gracz A, mogłoby się skończyć utratą 2%

rynku. Teoria gier nie daje odpowiedzi jak powinien postąpić gracz, aby osiągnąć jak

najwyższą wygraną w grze o sumie zerowej. Może jednak wskazać sposób wyboru strategii,

który zapewni pewien minimalny poziom wygranej, lub patrząc z innego punktu widzenia,

maksymalny poziom przegranej.

Już von Neumann i Morgenstern w swoim kanonicznym dziele sformułowali

postulaty, których spełnienie powinno towarzyszyć odnajdywaniu rozwiązań w grach o sumie

zerowej. Jednym z nich jest dominacja strategii. Jeśli strategia

11

a

d

przynosi, co najmniej,

takie same wygrane jak inna strategia a

z

, niezależnie od wyboru pozostałych graczy, a

11

Von Neumann i Morgenstern definiując dominację posłużyli się terminem „imputacja” czyli n-wymiarowy

wektor wypłat wszystkich graczy spełniający kryteria indywidualnej i zbiorowej racjonalności w grach n-
osobowych. W wielu pracach powstałych później, w przypadku gier dwuosobowych, operuje się definicją
dominacji strategii [Owen, 1975, s. 31] [Straffin,2001, s. 7] i to podejście zostało przyjęte przez autora.

background image

16

przynajmniej w jednym wypadku wyższą to, możemy powiedzieć, że a

d

dominuje a

z

, lub a

z

jest zdominowane przez a

d

[von Neumann, Morgenstern, 1944, s. 37]. W przypadku gier

dwuosobowych, opisana dominacja ma miejsce wtedy, i tylko wtedy, gdy dla każdego

b

j

M

b

:

])

b

,

a

([

u

]

b

,

a

([

u

j

z

a

j

d

a

,

[1.13]

i istnieje co najmniej jedno b

k

M

b

, że:

])

b

,

a

([

u

]

b

,

a

([

u

k

z

a

k

d

a

>

.

[1.14]

Analogicznie moglibyśmy zdefiniować dominację w obrębie zbioru strategii gracza B.

Racjonalnie zachowujący się gracz nigdy nie wybierze strategii zdominowanej

12

. Postulat

dominacji pozwala na ograniczenie zbioru strategii podczas poszukiwania rozwiązania gry.

Można z niego usunąć wszystkie strategie zdominowane.

Tabela 1.6. Wyznaczanie wartości gry "Walka o rynek 1"

u

b

a

1

a

2

a

3

a

M

i

a

min

b

1

2%

1%

2%

1%

b

2

-4%

-1%

3%

-4%

a

M

i

a

b

M

j

b

min

max

b

3

2%

-2%

-1%

-2%

1%

b

M

bj

max

2%

1%

3%

b

M

j

b

a

M

i

a

max

min

1%

Ź

ródło: opracowanie własne

Postulowany sposób rozwiązywania gier wykorzystuje pojęcie maksyminu

13

[von

Neumann, Morgenstern, 1944, s. 89-93]. Maksyminem gry dwuosobowej o sumie zerowej

nazywamy, taką wartość v

b

, że:

])

b

,

a

([

u

min

max

v

j

i

b

a

M

i

a

b

M

j

b

b

=

[1.15]

Maksymin gry jest wskazaniem strategii gracza B przynoszącym najwyższą z najniższych

wygranych, jakie poszczególne strategie tego gracza mogą przynieść. Innymi słowy, dla

każdej strategii gracza B odnajdujemy najniższą wartość, zakładając, że gracz A będzie

odpowiadał w sposób najkorzystniejszy dla siebie. Spośród wszystkich, tak wskazanych

minimów, wybieramy największe. W grze „Walka o rynek 1” maksyminem jest

12

Niektórzy autorzy dzielą dominacje na słabą, zgodną z nierównością [1.13] i ostrą, w przypadku której ta

nierówność przybiera postać ostrą [Drabik, 2005, s. 34]. Nie zmienia to praktycznego wymiaru dominacji.
Strategia zdominowana nie wejdzie w skład rozwiązania niezależnie od tego, czy jest to nierówność ostra czy
nieostra.

13

Matematyczną koncepcję maksyminu przedstawił po raz pierwszy E. Borel [Borel, 1921]. Von Neumannowi

przypisuje się jej pionierskie wykorzystanie w sformułowaniu twierdzenia maksyminowego dla gier o sumie
zerowej [von Neumann, 1928].

background image

17

v

b

=u

b

([a

2

,b

1

])=1%. Gracz B, wybierając strategię b

1

, czyli swoją strategię maksyminową,

zapewnia sobie, że wygra, co najmniej, 1% rynku.

Z punktu widzenia gracza A, interesująca jest inna postać tej samej kategorii teorii

gier. śeby zapewnić sobie minimalny poziom wygranej A musi wybierać strategię tak, aby

gracz B wybierając najkorzystniej dla siebie, osiągnął najniższą z najwyższych wygranych.

Gracz A powinien się kierować kryterium minimaksu. Minimaksem gry dwuosobowej jest

taka wartość gry v

a

, że:

])

b

,

a

([

u

max

min

v

j

i

b

b

M

j

b

a

M

i

a

a

=

[1.16]

W grze „Walka o rynek 1”, minimaksem gry jest v

a

=u

b

([a

2

,b

1

])=1%. Gracz A

wybierając strategię minimaksową a

2

gwarantuje sobie, że nie przegra więcej niż 1% rynku.

Wyznaczenie maksyminu i minimaksu gry pozwala wyznaczyć poziomy bezpieczeństwa

obydwu graczy. Strategia maksyminowa jest nazywana również strategią bezpieczeństwa

[Luce, Raiffa, 1964, s. 70]. Wybierając ją, gracz zapewnia sobie bezpieczeństwo

maksymalizacji minimalnego poziomu wygranej równego v

b

. Wygrane v

a

i v

b

nazywane są

również, odpowiednio dolną i górną wartością gry [Drabik, 2005, s. 31-32].

Łatwo udowodnić, że minimaks gry dwuosobowej o sumie zerowej jest równy, co do

bezwzględnej wartości i przeciwny, co do znaku, jej maksyminowi na wygranych drugiego

gracza [von Neumann, Morgenstern, 1944, s. 109]:

])

b

,

a

([

u

min

max

])

b

,

a

([

u

max

min

v

j

i

a

a

M

i

a

b

M

j

b

j

i

b

b

M

j

b

a

M

i

a

a

=

=

,

[1.17]

])

b

,

a

([

u

max

min

])

b

,

a

([

u

min

max

v

j

i

a

b

M

j

b

a

M

i

a

j

i

b

a

M

i

a

b

M

j

b

b

=

=

.

[1.18]

Gra „Walka o rynek 1” jest przykładem konfliktu interesów, w którym maksymin

zrównuje się z minimaksem:

v

v

])

b

,

a

([

u

max

min

])

b

,

a

([

u

min

max

v

a

j

i

b

b

M

j

b

a

M

i

a

j

i

b

a

M

i

a

b

M

j

b

b

=

=

=

=

[1.19]

Jeśli mamy do czynienia z taką sytuacją, oznacza to, że gra posiada punkt siodłowy

[von Neumann, Morgenstern, 1944, s. 95]. Jednocześnie taką grę można określić jako ściśle

określoną [von Neumann, Morgenstern, 1944, s. 106]. Punkt siodłowy w grach

dwuosobowych o sumie zerowej to taka para strategii, przy której zachodzi warunek [1.19].

Wygrana „v” w punkcie siodłowym nazywana jest wartością gry. Jest ona jednocześnie równa

lub wyższa od pozostałych w kolumnie i niższa lub równa od pozostałych w wierszu

14

. Punkt

siodłowy w grach o sumie zerowej traktujemy jako rozwiązanie gry w strategiach czystych, a

14

Oczywiście mówimy o macierzy wygranych gracza, którego strategie stanowią nagłówki wierszy.

background image

18

strategię nań się składające jako optymalne strategie czyste graczy. Niektórzy autorzy

definiują rozwiązanie dwuosobowej gry o sumie zerowej jako trzyelementowy zbiór: wartość

gry oraz optymalne strategie graczy [Straffin, 2001, s. 17].

Wróćmy na moment do gry „A przeciw B”, którą pozostawiliśmy bez rozwiązania.

Jest to gra o sumie stałej tożsama liniowo z grą o sumie zerowej opisaną Tabelą 1.7, która ma

punkt siodłowy w strategiach [a

1

,b

5

] (Audioslave produkuje odtwarzacz tańszy a Broadcast

wybiera inaczej od konkurenta). W tym rozwiązaniu gracze dzielą się oczekiwaną wartością

rynku w sposób następujący: u

a

([a

1

,b

5

])=29,2 i u

b

([a

1

,b

5

])=18,8. Te same wygrane staną się

udziałem graczy, jeśli wybiorą strategie [a

1

,b

6

]. Nie jest to jednak punkt siodłowy,

u

b

’([a

1

,b

6

])=-5,2 nie jest wartością najniższą w wierszu i najwyższą w kolumnie. Ponadto,

jeśli przed wyznaczeniem maksyminu i minimaksu wykorzystamy kryterium dominacji to

okaże się, że strategia b

5

dominuje wszystkie pozostałe, co czyni wybór gracza B trywialnym.

Gracz A zna macierz wygranych, zatem pozostaje mu wybór najlepszej odpowiedzi na b

5

,

czyli a

1

.

Tabela 1.7. Wyznaczenie punktu siodłowego gry "A przeciw B"

u

b

a

1

a

2

a

M

i

a

min

b

3

-11

-0,4

-11

b

4

-11

-5,6

-11

b

5

-5,2

-0,4

-5,2

a

M

i

a

b

M

j

b

min

max

b

6

-5,2

-5,6

-5,6

-5,2

b

M

bj

max

-5,2

-0,4

b

M

j

b

a

M

i

a

max

min

-5,2

Ź

ródło: opracowanie własne

Aby dopełnić powinności wyznaczenia punktu siodłowego w grze, która była

rozwinięciem „A przeciw B” ponownie dokonano przekształcenia liniowego macierzy

wygranych z Tabeli 4. Powstała gra o sumie zerowej ma jeden punkt siodłowy w strategiach

[a

5

,b

6

]. Wartością gry jest:

2

,

9

])

b

a

([

'

u

])

b

,

a

([

'

u

max

min

])

b

,

a

([

'

u

min

max

v

6

,

5

b

j

i

b

b

M

j

b

a

M

i

a

j

i

b

a

M

i

a

b

M

j

b

=

=

=

=

[1.20]

Taka wartość gry oznacza podział rynku: u

a

([a

5

,b

6

])=33,2 i u

b

([a

5

,b

6

])=14,8.

Wykorzystanie kryterium dominacji prowadzi, tym razem, gracza A do

jednoznacznego wyboru strategii a

5

, która dominuje wszystkie pozostałe. Graczowi B

pozostaje wybrać b

6

, która jest jego najlepszą odpowiedzią na a

5

. Znalezione rozwiązania gier

„A przeciw B” i „A kontra B” wskazują, że graczowi A, czyli firmie Audioslave, opłaca się

background image

19

zapłacić za badania rynku tylko wtedy, gdy ich cena nie będzie większa od czterech

(u

a

([a

5

,b

6

])-u

a

([a

1

,b

5

])=33,2-29,2=4).

Tabela 1.8. Wyznaczenie punktu siodłowego w grze "A kontra B"

u

b

a

3

a

4

a

5

a

6

a

M

i

a

min

b

3

-11

1,6

-13

-0,4

-13

b

4

-11

-5,6

-11

-5,6

-11

b

5

-5,2

5,6

-11,2

-0,4

-11,2

a

M

i

a

b

M

j

b

min

max

b

6

-5,2

-1,6

-9,2

-5,6

-9,2

-9,2

b

M

bj

max

-5,2

5,6

-9,2

-0,4

b

M

j

b

a

M

i

a

max

min

-9,2

Ź

ródło: opracowanie własne

Zdarza się, że w grach dwuosobowych o sumie zerowej są dwa punkty siodłowe. Taka

sytuacja oczywiście może mieć miejsce, ale zawsze są to rozwiązania ekwiwalentne i

zamienne. „Każde dwa punkty siodłowe tej samej gry, mają tą samą wartość. Jeśli zarówno

gracz A jak i gracz B wybiorą strategie zawierające punkty siodłowe, to wynik gry zawsze

będzie punktem siodłowym” [Straffin, s. 10].

Tabela 1.9. Wyznaczanie wartości gry "Walka o rynek 2"

u

b

a

1

a

2

a

3

a

M

i

a

min

b

1

3%

1%

2%

1%

b

2

-4%

-1%

4%

-4%

a

M

i

a

b

M

j

b

min

max

b

3

2%

1%

3%

1%

1%

b

M

bj

max

3%

1%

4%

b

M

j

b

a

M

i

a

max

min

1%

Ź

ródło: opracowanie własne

Poszukiwanie punktu siodłowego w grze „Walka o rynek 2”

15

przyniosło podwójne

wskazanie. Niezmieniona, w porównaniu z grą „Walka o rynek 1”, wartość gry v=1% pojawia

się dla dwóch par strategii:

%

1

])

b

a

([

u

])

b

a

([

u

])

b

,

a

([

u

max

min

])

b

,

a

([

u

min

max

v

3

,

2

b

1

,

2

b

j

i

b

b

M

j

b

a

M

i

a

j

i

b

a

M

i

a

b

M

j

b

=

=

=

=

=

[1.21]

Gra „Walka o rynek 2” ma dwa punkty siodłowe. Zgodnie z twierdzeniem o ekwiwalentności

i zamienności, graczom obojętne jest, w którym z punktów siodłowych przyjdzie im się

znaleźć.

15

„Walka o rynek 2” różni się od pierwszej wersji tylko macierzą wypłat.

background image

20

Oczywiście, liczba punktów siodłowych równa dwa nie jest limitem ich liczebności w

jednej grze. Wystarczy wyobrazić sobie grę, w której nieparzyste wiersze macierzy

zawierałyby wyłącznie wypłaty większe od v w nieparzystych kolumnach lub równe v w

parzystych. Parzyste wiersze zaś powinny zawierać wyłącznie wygrane niższe od v. Liczba

punktów siodłowych

Ψ

, jakie posiada ta gra można byłoby określić wzorem:

)

(

E

)

(

E

)

n

,

m

(

2

1

n

2

m

+

=

Ψ

,

[1.22]

gdzie m to liczba strategii gracza A (kolumny) a n to ilość strategii gracza B (wiersze), E zaś

jest funkcją przyporządkowującą każdej liczbie rzeczywistej jej część całkowitą.

Wystarczyłoby, żeby tylko jedna z liczby strategii zmierzała do nieskończoności, a taka gra

miałaby nieskończoną ilość punktów siodłowych.

1.1.5.

Rozwiązanie w strategiach mieszanych; twierdzenie maksyminowe

W praktyce możemy mówić o dużym szczęściu, jeśli uda się znaleźć, chociaż jeden

punkt siodłowy. Większość gier, z jakimi mamy do czynienia, nie ma żadnego punktu

siodłowego, tożsamego z rozwiązaniem w strategiach czystych. Z taką grą już mieliśmy do

czynienia. Przypomnijmy sobie grę „A vs B” w postaci macierzowej (Tabela 1.2). Odejmując

od wygranych obydwu graczy 24 (połowa wartości oczekiwanej rynku), otrzymamy grę o

sumie zerowej.

Warunek [1.19] nie jest spełniony w przypadku tej gry. Von Neumann i Morgenstern

zdefiniowali takie gry jako nie ściśle określone. W ich przypadku v

b

v

a

[von Neumann,

Morgenstern, 1944, s. 110]. To nie oznacza, że nie posiadają one rozwiązań. Należy ich

poszukiwać innymi metodami. Niezależnie od tego, jaką wybierzemy metodę, w skład

rozwiązania nie będzie już wchodzić para strategii czystych. Koniecznym będzie rozszerzenie

przynajmniej jednego zbioru strategii o ich mieszaną postać.

Tabela 1.10. Gra "A vs B" przekształcona liniowo

u

b

'

a

1

a

2

a

M

i

a

min

b

1

-11

-0,4

-11

a

M

i

a

b

M

j

b

min

max

b

2

-5,2

-5,6

-5,6

-5,6

b

M

bj

max

-5,2

-0,4

b

M

j

b

a

M

i

a

max

min

-5,2

Ź

ródło: obliczenia własne

background image

21

Znalezienie optymalnej strategii mieszanej, dla każdego z obydwu graczy, polega na

wyznaczeniu takiej, która spełniać będzie analogiczną rolę jak czysta strategia optymalna w

grach z punktem siodłowym. Aby tego dokonać należy wyznaczyć zbiór prawdopodobieństw,

który wyznaczy taką strategię mieszaną, że nie będzie można znaleźć innej, gwarantującej

wyższy poziom wygranej niezależnie od wyborów drugiego gracza.

Dowolna strategia mieszana gracza A zbudowana z m strategii czystych i rozkładu

prawdopodobieństwa p

j

={p

j1

,p

j2

,...,p

jk

,...,p

jm

} takiego, że 0≤p

jk

1 oraz

=

=

m

1

k

jk

1

p

, to

a

pj

=[p

j1

a

1

,p

j2

a

2

,...,p

jk

a

k

,...,p

jm

a

m

]. Analogicznie możemy zdefiniować postać ogólną strategii

mieszanej gracza B (b

qi

M

qb

) jako b

qi

=[q

i1

b

1

,q

i2

b

2

,...,q

il

b

l

,...,q

in

b

n

] (0≤q

il

1 oraz

=

=

n

1

l

il

1

q

).

Spośród wszystkich strategii mieszanych a

pj

M

pa

i b

qi

M

qb

, optymalnymi a

po

i b

qo

będą te,

które spełnią warunki:

])

b

,

a

([

u

inf

sup

])

b

,

a

([

u

v

qi

pj

b

pa

M

pj

a

qb

M

qi

b

qo

pj

b

qb

=

=

,

[1.23]

])

b

,

a

([

u

sup

inf

])

b

,

a

([

u

v

qi

pj

b

qb

M

qi

b

pa

M

pj

a

qi

po

b

pa

=

=

,

[1.24]

gdzie:

v

qb

– dolna wartość gry w strategiach mieszanych,

v

pa

– górna wartość gry w strategiach mieszanych,

sup – kres górny zbioru wypłat generowanych przez strategie mieszane,

inf – kres dolny zbioru wypłat generowanych przez strategie mieszane

16

.

Inaczej rzecz ujmując, możemy stwierdzić, że wyznaczenie optymalnej strategii

mieszanej polega na znalezieniu takich prawdopodobieństw losowania strategii, by drugi z

graczy nie mógł przekroczyć pewnego maksymalnego poziomu wygranej, niezależnie od

tego, jaką strategię czystą wybierze. I odwrotnie, gracz, którego wygrane opisane są macierzą

gry będzie szukał takich prawdopodobieństw, by zapewnić sobie minimalny poziom wypłaty

niezależnie od wyborów przeciwnika. Optymalna strategia mieszana wyznaczona w tym

drugim przypadku musi przynieść maksymalną v

qb

spełniającą układ warunków

przedstawiony niżej.

16

W ślad za E. Drabik zastąpiono pojęcia „max” i „min” by zaakcentować odmienność gier ściśle określonych

od gier nie ściśle określonych [Drabik, 2005, s. 36].

background image

22



=

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

1

q

0

1

q

...

q

...

q

q

v

])

b

,

([a

u

q

...

])

b

,

([a

u

q

...

])

b

,

([a

u

q

])

b

,

([a

u

q

...

v

])

b

,

([a

u

q

...

])

b

,

([a

u

q

...

])

b

,

([a

u

q

])

b

,

([a

u

q

...

v

])

b

,

([a

u

q

...

])

b

,

([a

u

q

...

])

b

,

([a

u

q

])

b

,

([a

u

q

v

])

b

,

([a

u

q

...

])

b

,

([a

u

q

...

])

b

,

([a

u

q

])

b

,

([a

u

q

il

in

il

i2

i1

qb

n

m

b

in

l

m

b

il

2

m

b

i2

1

m

b

i1

qb

n

k

b

in

l

k

b

il

2

k

b

i2

1

k

b

i1

qb

n

2

b

in

l

2

b

il

2

2

b

i2

1

2

b

i1

qb

n

1

b

in

l

1

b

il

2

1

b

i2

1

1

b

i1

[1.25]

Dwuosobowe gry o sumie zerowej, bez punktów siodłowych, o dwuelementowych

zbiorach

strategii

czystych,

możemy

zawsze

rozwiązać

wykorzystując

metodę

przyrównywania [Shubik, 1995, s. 222]. Wybierając swoją optymalną strategię mieszaną,

gracz zapewnia sobie, że przeciwnik nie odniesie żadnej korzyści z poznania jej [Straffin,

2001, s. 15]. Postawmy się na miejscu gracza B w grze „A vs B”. Musi on wybrać takie

prawdopodobieństwa q

1

i q

2

losowania strategii b

1

i b

2

, aby gracz A nie mógł odnieść korzyści

z wiedzy o jego wyborze strategii mieszanej. Dzieje się tak wtedy, gdy:



=

+

+

=

+

=

1

q

0

1

q

q

])

b

,

a

([

'

u

q

])

b

,

a

([

'

u

q

])

b

,

a

([

'

u

q

])

b

,

a

([

'

u

q

)

a

(

EV

)

a

(

EV

i

2

1

2

2

b

2

1

2

b

1

2

1

b

2

1

1

b

1

2

1

[1.26]

W analizowanej grze ten warunek daje się sprowadzić do równania:

)

q

1

(

6

,

5

q

4

,

0

)

q

1

(

2

,

5

q

11

1

1

1

1

=

,

[1.27]

którego rozwiązaniem jest

55

2

1

q

=

. Optymalną strategią mieszaną gracza B jest

b

qo

=[

55

2

b

1

,

55

53

b

2

]. Przynosi ona dolną wartość gry w strategiach mieszanych:

41

,

5

)

6

,

5

(

)

4

,

0

(

)

2

,

5

(

)

11

(

v

55

53

55

2

55

53

55

2

qb

=

+

=

+

=

.

[1.28]

Wybór optymalnej strategii przez gracza B oznacza podział wartości oczekiwanej

rynku, przy którym firma Audioslave osiąga przychód u

a

=29,41 a firma Broadcast u

b

=18,59.

Wybierając optymalną strategię mieszaną gracz B gwarantuje sobie, że osiągnie przychód, co

najmniej równy 18,59, niezależnie od wyboru strategii przez gracza A. Porównanie

uzyskanego wyniku z rozwiązaniem gry „A przeciw B” (u

b

=18,8) pokazuje, że znajomość

decyzji konkurenta pozwala firmie Broadcast zagwarantować sobie wygraną wyższą o 0,21.

background image

23

Wykres 1.1. Graficzna interpretacja metody przyrównań dla gry "A vs

B" przekształconej liniowo (v

qb

)

-12

-11

-10

-9

-8

-7

-6

-5

-4

-3

-2

-1

0

1

2

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

q

1

EV

EV(a

1

)

EV(a

2

)

2

/

55

v

qb

Ź

ródło: opracowanie własne na podstawie [Luce, Raiffa, 1964, s. 366]

Dolna wartość gry w strategiach mieszanych niesie z sobą podobną interpretację jak

maksymin w grach ściśle określonych. Jest to dobrze widoczne na wykresie obrazującym

działanie metody przyrównywania. Gracz A, znając wybraną przez B strategię mieszaną, dla

każdego q

1

55

2

, mógłby tak dobierać swoją strategię czystą, aby B osiągał wygrane mniejsze

od v

qb

=-5,41. Dla q

1

>

55

2

wybierałby a

1

, a gdy q

1

<

55

2

, a

2

. Tylko wybór optymalnej strategii

mieszanej, opartej na q

1

=

55

2

gwarantuje, że wygrana B nie będzie niższa niż v

qb

=-5,41.

Analogicznie wyznaczana jest górna wartość gry w strategiach mieszanych.

Optymalna strategia mieszana gracza musi spełniać warunek:



=

+

+

=

+

=

1

p

0

1

p

p

])

b

,

a

([

'

u

p

])

b

,

a

([

'

u

p

])

b

,

a

([

'

u

p

])

b

,

a

([

'

u

p

)

b

(

EV

)

b

(

EV

i

2

1

2

2

b

2

2

1

b

1

1

2

b

2

1

1

b

1

2

1

[1.29]

W grze „A vs B” warunek [1.29] przybiera postać:

)

p

1

(

6

,

5

p

2

,

5

)

p

1

(

4

,

0

p

11

1

1

1

1

=

,

[1.30]

którego rozwiązaniem jest

55

26

1

p

=

. Optymalną strategią mieszaną gracza A jest

a

po

=[

55

26

a

1

,

55

29

a

2

]. Przynosi ona dolną wartość gry w strategiach mieszanych:

41

,

5

)

6

,

5

(

)

2

,

5

(

)

4

,

0

(

)

11

(

v

55

29

55

26

55

29

55

26

pa

=

+

=

+

=

.

[1.31]

background image

24

Wykres 1.2. Graficzna interpretacja metody przyrównań dla gry "A vs

B" przekształconej liniowo (v

pa

)

-12

-11

-10

-9

-8

-7

-6

-5

-4

-3

-2

-1

0

1

2

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

p

1

EV

EV(b

1

)

EV(b

2

)

26

/

55

v

pa

Ź

ródło: opracowanie własne na podstawie [Luce, Raiffa, 1964, s. 366]

Grając swoją strategię optymalną A gwarantuje sobie, że B nie wygra więcej niż v

pa

,

niezależnie od tego czy wybierze b

1

czy b

2

.

Wyniki obliczeń przeprowadzonych dla gry „A vs B” są ilustracją twierdzenia

von Neumanna. Zgodnie z nim, w każdej dwuosobowej grze o sumie zerowej z pełną

informacją, można znaleźć rozwiązanie składające się z optymalnych strategii mieszanych

takich, że:

w

])

b

,

a

([

u

v

])

b

,

a

([

u

v

qi

po

b

pa

qo

pj

b

qb

=

=

=

=

,

[1.32]

gdzie w jest wartością gry w strategiach mieszanych [von Neumann, Morgenstern, 1944,

s. 123]. Jeśli rozszerzymy zbiory strategii graczy dopuszczając ich mieszanie, każda gra jest

ś

ciśle określona. Autorski dowód tego twierdzenia jest dość skomplikowany i opiera się na

twierdzeniu Brouwera o punkcie stałym. Wśród późniejszych wersji prostotą wyróżnia się

dowód Nasha [Luce, Raiffa, 1964, s. 362-364]. Niezależnie od sposobu dowodzenia,

twierdzenie minimaksowe von Neumanna ma fundamentalne znaczenie dla poszukiwania

rozwiązań w grach o sumie zerowej.

Wykres pokazujący metodę przyrównania, wykorzystaną w rozwiązaniu gry

dwuosobowej o sumie zerowej i macierzy wygranych 2x2, ma wyłącznie znaczenie

background image

25

ilustracyjne. Jeśli rozszerzymy rozmiar macierzy do nx2, okaże się, że graficzna ilustracja

ułatwia i przyspiesza analityczne wyznaczenie rozwiązania metodą przyrównania

17

.

Tabela 1.11. Poszukiwanie punktu siodłowego gry "Walka o rynek 3"

u

b

a

1

a

3

a

M

i

a

min

b

1

3%

2%

2%

b

2

-4%

4%

-4%

a

M

i

a

b

M

j

b

min

max

b

3

2%

3%

2%

2%

b

M

bj

max

3%

4%

b

M

j

b

a

M

i

a

max

min

3%

Ź

ródło: opracowanie własne

„Walka o rynek 3”

Wróćmy do gry „Walka o rynek 2” redukując ją. Okazało się, bowiem że ze względu

na wysokie koszty, gracz A na pewno nie wybierze strategii a

2

.

Nowa gra nie ma punktu siodłowego. Nie można też, zacząć od metody przyrównania

w postaci analitycznej ze względu na nierówną liczebność zbiorów strategii czystych obydwu

graczy. Wybór optymalnej strategii mieszanej gracza A poprzedźmy konstrukcją

odpowiedniego wykresu.

Wykres 1.3. Graficzna interpretacja metody

przyrównań dla gry "Walka o rynek 3"

-5%

-4%

-3%

-2%

-1%

0%

1%

2%

3%

4%

5%

0,0

0,2

0,4

0,6

0,8

1,0

p

1

EV

EV(b

2

)

EV(b

1

)

EV(b

3

)

Ź

ródło: opracowanie własne

17

Williams idzie dalej w uznaniu znaczenia interpretacji graficznej twierdząc, że istnieje autonomiczna metoda

graficzna rozwiązywania gier o macierzach wygranych 2xm [Williams, 1965, s. 88].

background image

26

Właściwy wykres, dla ułatwienia odczytu szukanych wartości należy uzupełnić tabelą,

która pokazuje jak zmieniają się wartości oczekiwane wygranych gracza B w zależności od

prawdopodobieństwa p

1

wyboru strategii a

1

przez gracza A.

Tabela 1.12. Wyznaczanie wartości gry "Walka o rynek 3" metodą przyrównania

p

1

0,0000

0,1429

0,2222

0,5000

1,0000

EV(b

1

)

2,000%

2,143%

2,222%

2,500%

3,000%

EV(b

2

)

4,000%

2,857%

2,222%

0,000%

-4,000%

EV(b

3

)

3,000%

2,857%

2,778%

2,500%

2,000%

Ź

ródło: opracowanie własne

Gracz A wie, że konkurent będzie dążył do osiągnięcia jak najwyższej wygranej przy

danym wyborze prawdopodobieństwa p

1

. Jeśli 0≤p

1

0,1429, B wybierze strategię b

2

, gdy

0,1429≤p

1

0,5 najwyższą wygraną przyniesie strategia b

3

i ostatecznie dla 0,5≤p

1

1

najlepszym wyborem B będzie strategia b

1

(zob. Wykres 1.3). Graczowi A pozostaje wybór

takiego prawdopodobieństwa p

1

, by „osadzić” B w najniższym punkcie, najkorzystniejszej dla

niego, łamanej. Zarówno z wykresu jak i z Tabeli 1.12 wynika, że najkorzystniej dla A będzie

wybrać p

1

=0,5, gwarantując sobie tym, że B nie wygra więcej niż v

pa

=2,5%.

W takiej sytuacji B, z pewnością nie wybierze b

2

. Aby wyznaczyć jego optymalną

strategię mieszaną, należy posłużyć się loterią strategii b

1

i b

3

. Musi ona zapewnić spełnienie

warunku [1.26], który w przypadku gry „Walka o rynek 3” daje się sprowadzić do postaci:

)

q

1

%(

3

q

%

2

)

q

1

%(

2

q

%

3

1

1

1

1

+

=

+

.

[1.33]

Rozwiązaniem tego równania jest q

1

=0,5. Dolna wartość gry w strategiach mieszanych

wynosi v

qb

=2,5%. Możemy już wskazać rozwiązanie gry „Walka o rynek 3”. Składają się na

nie:

a)

optymalna strategia gracza A: a

po

=[

2

1

a

1

,

2

1

a

3

],

b)

optymalna strategia gracza B: b

qo

=[

2

1

b

1

,0b

2

,

2

1

b

3

],

c)

wartość gry v

pa

=v

qb

=w=2,5%.

Porównanie rozwiązań gier „Walka o rynek 2” i „Walka o rynek 3” wskazuje, że

usunięcie strategii a

2

, jakkolwiek konieczne ze względu na wysokie koszty, było niekorzystne

dla gracza A. Wartość gry wzrosła z v=1% do w=2,5%. Można się tego było spodziewać,

wszak usunęliśmy strategię, która dominowała a

3

we wcześniejszej wersji gry. Jeśli zatem,

dodatkowe koszty związane z podjęciem realizacji strategii a

2

są niższe od wartości, jaką

może przynieść utrzymanie 1,5% rynku, gracz A powinien pozostać przy „Walce o rynek 2”.

Wyróżnienie gier o sumie zerowej zawdzięczać należy ich jednoznacznej naturze. W

grach tego typu konflikt interesów występuje w czystej postaci. „Główną ideą

background image

27

niekooperacyjnego podejścia jest, jednym słowem, ‘egoizm’, nie mizantropijny lub

windykacyjny, ale polegający na obojętności wobec dążeń innych. Gra n-osobowa rozpada się

na n problemów jednoosobowych rozwiązywanych jednocześnie” [Shubik, 1995, s. 217].

Jednoznaczności związanej z nieodłącznym brakiem aspektu kooperacyjnego

towarzyszy jednoznaczność towarzysząca rozwiązywaniu gier o sumie zerowej. Twierdzenie

minimaksowe von Neumanna niesie z sobą przesłanie pozwalające nam przystępować do ich

rozwiązywania z przekonaniem o ostatecznym sukcesie. „Z powodu swojego determinizmu

skończone gry o sumie zerowej mogą być uznane za ‘kompletne’, w sensie możliwości

wyznaczenia optymalnych strategii. Prawdopodobnie z tych względów, teoria gier

przyciągnęła żywe zainteresowanie, szczególnie w kręgach, w których problem wyznaczania

optymalnych decyzji w warunkach konfliktu lub konkurencji jest uznany za naczelny”

[Rapoport, 1989, s. 195]. Nawet, jeśli poziom rozbudowania bazy teoretycznej gier o sumie

zerowej można uznać za umiarkowany w porównaniu z ogólną teorią gier, trudno wyobrazić

sobie dzisiejszy obraz tej ostatniej bez podstaw, jakie zbudowali von Neumann i Morgenstern.

background image

15

1.3.

Niekooperacyjne gry o sumie różnej od zera

1.3.1.

Równowaga w strategiach czystych

Naturalnym dopełnieniem zbioru gier o sumie zerowej są gry o sumie różnej od zera

1

.

Jednocześnie można powiedzieć, że zarówno gry o sumie zerowej jak i gry o sumie różnej od

zera są rozłącznymi podzbiorami gier o sumie dowolnej. Gry n-osobowe o sumie różnej od

zera to te, w przypadku których istnieje przynajmniej jedno m

j

należące do M takie, że:

0

)

m

(

u

n

1

i

j

i

=

,

[1.34]

lub w przypadku gier dwuosobowych, istnieje przynajmniej jedno m

ij

należącego do M, takie,

ż

e:

u

a

(m

ij

)+u

b

(m

ij

)≠0.

[1.35]

W przypadku gier o sumie różnej od zera wygrane graczy w ramach określonego

zbioru wyników gry, przynajmniej w jednym przypadku, nie sumują się do zera. Powoduje to

niejednoznaczność sytuacji strategicznej. Może być tak, że zmiana wskazania strategii, przez

co najmniej jednego gracza zwiększy wygrane wszystkich uczestników gry, albo tak, że

wygrane części graczy zwiększają się, części zmniejszają a pozostałych nie zmieniają się.

Brak powszechności konfliktu interesów może w skrajnej sytuacji przybrać postać ich

pełnej zbieżności. W takiej sytuacji, każda zmiana strategii prowadzi do zmian wygranych

graczy o tym samym znaku. Z punktu widzenia teorii gier takie sytuacje są trywialne.

Ewentualność wystąpienia sytuacji, w której wszyscy gracze będą zainteresowani w

określonej zmianie strategii zdecydowanie wyróżnia gry o sumie różnej od zera. Istnieje

ważna klasa dwuosobowych gier o sumie różnej od zera zwana grami kooperacyjnymi. Ich

rozwiązanie polega na wyznaczeniu par strategii, co do przyjęcia których gracze podejmują

wiążące zobowiązanie i przynoszących obydwu wyższe wygrane niż przy niekooperacyjnym

wyborze strategii. Ich szczególne znaczenie sprawia, że wyznaczaniu rozwiązań

kooperacyjnych poświęcono odrębną część pracy.

W tej części pracy uwaga zostanie skoncentrowana na grach niekooperacyjnych. Są to

te gry o sumie zerowej, w przypadku których niedozwolone jest komunikowanie się graczy

przed grą i żaden z nich nie zna wyboru strategii konkurenta przed dokonaniem własnego. W

przypadku niekooperacyjnych gier n-osobowych niedopuszczalne jest tworzenie koalicji.

1

Oczywiście, to samo dotyczy relacji między grami o sumie stałej a grami o sumie zmiennej.

background image

16

Rozważania nad wyznaczaniem rozwiązań w grach niekooperacyjnych rozpocznijmy

od analizy prostej gry o nazwie „Ścisła”.

„Ścisła”

Dwa działające na tym samym rynku przedsiębiorstwa mają do wyboru po dwie

strategie rynkowe: typu 1 i 2. Wygranymi są ich zyski. Jeśli jednocześnie wybiorą strategie

typu 1, osiągną parę najniższych z osiągalnych wygranych. Gdy zgodny wybór padnie na

strategie typu 2, udziałem graczy będą najwyższe dostępne im wygrane. Mieszanie typów

strategii przynosi wygrane mieszczące się wewnątrz dostępnych przedziałów, a ten z graczy,

który wybierze typ o wyższej numeracji wygrywa mniej niż gdyby było odwrotnie.

Tabela 1.13. Macierze wygranych gry „Ścisła”

2

A

B

Strategia

a

1

Strategia

a

2

Strategia

b

1

5

5

8

0,5

Strategia

b

2

20

12

15

30

ź

ródło: opracowanie własne

Wyznaczenie pary strategii w tej grze nie nastręcza problemów nawet wtedy, gdy nie

miało się styczności z teorią gier. śadnemu z nich nie opłaca się grać strategii typu 1,

ponieważ, niezależnie od wyboru konkurenta, strategia typu 2 zawsze przyniesie wyższą

wygraną. Możemy zatem wykorzystać, znane z teorii gier o sumie zerowej kryterium

dominacji. Eliminacja zdominowanych strategii typu 1 prowadzi do rozwiązania [a

2

,b

2

] i

wygranych u

a

([a

2

,b

2

])=25 i u

b

([a

2

,b

2

])=30.

Spójrzmy na inny aspekt tego rozwiązania zakładając, że kryterium dominacji nie

może zostać zastosowane. Gracz A nie znając wyboru strategii przez konkurenta starać się

będzie znaleźć najlepsze na nie odpowiedzi. Zarówno na b

1

jak i na b

2

najlepszą odpowiedzią

jest a

2

. Analogicznie gracz B wybiera strategię b

2

. W ten sposób wyłonić się może para

strategii, która jest najlepszą odpowiedzią na siebie nawzajem. Taką parę strategii

definiujemy jako równowagę w grze. Równowaga jako wskazanie rozwiązania w grze

niekooperacyjnej została zaproponowana po raz pierwszy przez Johna Nasha. Po raz pierwszy

zdefiniował ją bez wskazywania konkretnej pary wartości użyteczności opierając się na

2

Ze względu na konieczność przedstawienia wygranych obydwu graczy, bardzo często dwuososbowe gry o

sumie różnej od zera określane są mianem dwumacierzowych [Drabik, 2005, s. 68], [Owen, 1975, s. 121].

background image

17

relacjach między strategiami [Nash, 1950b, 1951]. Każdy z n graczy ma do wyboru określoną

liczbę strategii M

i

={m

i1

,m

i2

,...,m

ij

,...,m

im

}. Niech wygraną gracza i, przy określonym

wektorze strategii m

k

(każdy z graczy wskazuje jedną), będzie u

i

([m

1k

,m

2k

,...,m

ik

,...,m

nk

]).

Określony wektor strategii m

r

=[m

1r

,m

2r

,...,m

ir

,...,m

nr

] nazwiemy równowagą wtedy, gdy dla

każdego gracza i:

u

i

([m

1r

,m

2r

,...,m

ir

,...,m

nr

])=

ij

m

max

u

i

([m

1r

,m

2r

,...,m

ij

,...,m

nr

]).

[1.36]

ś

aden z graczy nie może poprawić swojej sytuacji zmieniając swoją strategię m

ir

na

jakąkolwiek inną m

ij

, jeśli pozostali utrzymają wybory strategii, które złożyły się na

równowagę.

1.3.2.

Równowaga w strategiach mieszanych, twierdzenie Nasha

Nash, oprócz zdefiniowania równowagi w teorii gier, udowodnił, że każda gra o sumie

różnej od zera ma, co najmniej jeden punkt równowagi [Nash, 1951]. Dowód cechował się

„wyjątkową elegancją” [Luce, Raiffa, 1964, s. 105] i opierał się na twierdzeniu Brouwera o

punkcie stałym. Równowaga, której istnienie dowiódł Nash może opierać się zarówno na

wektorach strategii czystych jak i mieszanych. Znaczenie twierdzenia Nasha jest

porównywane do znaczenia twierdzenia minimaksowego von Neumanna. Niestety, jego

praktyczna przydatność dla wyznaczania rozwiązań gier jest mniejsza.

Powróćmy na chwilę do gier o sumie zerowej. Przywołanie definicji punktu

siodłowego pozwala na stwierdzenie, że jest on szczególnym przypadkiem równowagi dla tej

klasy gier. Idąc tym tropem Nash zaproponował równowagę jako rozwiązanie gier o sumie

różnej od zera. Związek z grami o sumie zerowej rozszerza się również na możliwość

poszukiwania rozwiązań w strategiach mieszanych. Jeśli gra nie ma równowagi w strategiach

czystych, istnieje możliwość wyznaczenia jej szukając optymalnych prawdopodobieństw

losowania strategii. W grach dwuosobowych o symetrycznych macierzach możemy posłużyć

się metodą przyrównania. Przyjrzyjmy się grze „Mix”

„Mix”

Dwa działające na tym samym rynku przedsiębiorstwa mają do wyboru po dwie

strategie rynkowe: typu 1 i 2. Wygranymi są ich zyski. Wygrane zmieniają się zgodnie z

zapisami Tabeli 1.14.

background image

18

Tabela 1.14. Macierze wygranych gry „Mix”

3

A

B

Strategia

a

1

Strategia

a

2

Strategia

b

1

34

18

0

8

Strategia

b

2

6

28

36

0

ź

ródło: opracowanie własne

Gra nie ma równowag w strategiach czystych. Znalezienie równowagi w strategiach

mieszanych polega na znalezieniu takich prawdopodobieństw losowania strategii przez gracza

A {p,1-p} i przez gracza B {q,1-q}, że żaden z nich nic nie zyska na zmianie swojej strategii

na inną. Innymi słowy, jeśli obydwaj gracze zastosują swoje optymalne strategie mieszane, to

ż

aden z nich nie może zwiększyć swojej wygranej zmieniając strategię. Wyznaczone

prawdopodobieństwa muszą spełniać warunki:

EVb

1

(p)=pu

b

([a

1

,b

1

])+(1-p)u

b

([a

2

,b

1

])=EVb

2

(p)=pu

b

([a

1

,b

2

])+(1-p)u

b

([a

2

,b

2

]),

[1.37]

EVa

1

(q)=qu

a

([a

1

,b

1

])+(1-q)u

a

([a

1

,b

2

])=EVa

2

(q)=qu

a

([a

2

,b

1

])+(1-q)u

a

([a

2

,b

2

]).

[1.38]

W grze “Mix” te warunki konkretyzują się do postaci:

18p+8(1-p)=28p,

[1.39]

34q+6(1-q)=36(1-q).

[1.40]

Rozwiązaniem równań [1.43] i [1.44] są p=

9

4

i q=

32

15

. Na równowagę w strategiach

mieszanych składają się a

r

=[

9

4

a

1

,

9

5

a

2

] i b

r

=[

32

15

b

1

,

32

17

b

2

]. Wartości wygranych w równowadze

to u

ar

=19

8

1

oraz u

br

=12

9

4

. Wybór optymalnych strategii mieszanych pozostających w

równowadze trudno uznać za satysfakcjonujący. Para strategii [a

1

,b

1

] przynosi wyższe

wygrane obydwu graczom.

Niestety gry podobne do „Mix” nie są jedynymi, w przypadku których trudno wskazać

równowagę jako rozwiązanie. Dzieje się tak również w przypadku równowag w strategiach

czystych. Kanonicznym przykładem jest „K lub P”. Jest to gra należąca do typu „dylemat

więźnia”

4

.

„K lub P”

3

Ze względu na konieczność przedstawienia wygranych obydwu graczy, bardzo często dwuososbowe gry o

sumie różnej od zera określane są mianem dwumacierzowych [Drabik, 2005, s. 68], [Owen, 1975, s. 121].

4

Szerzej o genezie i eksperymentalnej weryfikacji „dylematu więźnia” napisano w rozdziale poświęconym

historii zastosowania eksperymentów w ekonomii.

background image

19

Dwa przedsiębiorstwa

5

mają do wyboru strategię konkurencji (1) lub porozumienia

(2). Jednoczesny wybór strategii konkurencji [a

1

,b

1

] przynosi graczom niższe zyski niż

jednoczesny wybór strategii porozumienia [[a

1

,b

1

]. Jeśli jednak któryś z graczy zerwie

porozumienie i wybierze strategię konkurencji przy lojalnej postawie konkurenta, osiągnie

wyższy zysk niż gdyby go dochował. Jednocześnie drugi z graczy traci wygrywając mniej niż

przy zgodnym wyborze strategii konkurencji. Na przykład, gdy porozumienie zrywa A

u

a

([a

1

,b

2

])>u

a

([a

2

,b

2

]) i jednocześnie u

b

([a

1

,b

2

])<u

b

([a

1

,b

1

]).


Tabela 1.15. Macierze wygranych gry „K lub P”

A

B

Strategia

a

1

Strategia

a

2

Strategia

b

1

15

20

8

35

Strategia

b

2

30

12

25

30

ź

ródło: opracowanie własne

Najlepszą odpowiedzią A na dowolną strategię B jest a

1

. Analogiczną rolę spełnia b

1

.

Zgodnie z definicją para strategii opartych na konkurencji stanowi równowagę w tej grze

[a

r

,b

r

]=[a

1

,b

1

]. Widać jednak, że jednoczesna zmiana wyboru strategii na [a

2

,b

2

] podnosi zyski

obydwu graczy. To wskazanie, z kolei, pozostaje pod istotnym zagrożeniem jednostronnej

zmiany strategii na a

1

lub b

1

. Analizowana gra, podobnie jak inne reprezentujące typ „dylemat

więźnia”, jest najbardziej jaskrawym przykładem trudności, na jakie napotykamy podczas

wyznaczania rozwiązania gry niekooperacyjnej o sumie zerowej. Każdej propozycji

towarzyszy alternatywa korzystniejsza, przynajmniej dla jednego z graczy.

Przewaga pary strategii [a

2

,b

2

] nad [a

1

,b

1

], wynika z tego, że ta druga nie spełnia

kryterium optymalności, które łączy racjonalność indywidualną z racjonalnością zbiorową.

Opiera się ono postulacie sformułowanym ok. 1900 roku przez włoskiego ekonomistę

Vilfredo Pareto. Zgodnie z nim „nie powinien być akceptowany system ekonomiczny, jeśli

możliwy jest inny, korzystniejszy dla wszystkich uczestników” [Straffin, 2001, s. 86]. Ta

definicja może zostać zaadaptowana dla potrzeb teorii gier z jednoczesną zamianą ostrej

nierówności na nieostrą. Optymalny w sensie Pareto będzie każdy wektor strategii n graczy

5

Gra jest uproszczoną wersją duopolu Cournot’a, któremu więcej miejsca poświęcono w rozdziale dotyczącym

duopolu jako gry strategicznej.

background image

20

m

p

=[m

1p

,m

2p

,...,m

ip

,...,m

nr

] taki, że nie będzie można znaleźć innego dostępnego

m

k

=[m

1k

,m

2k

,...,m

ik

,...,m

nk

] takiego, że dla każdego gracza i:

u

i

([m

1p

,m

2p

,...,m

ip

,...,m

np

])≤u

i

([m

1k

,m

2k

,...,m

ik

,...,m

nk

]),

[1.41]

i przynajmniej dla jednego:

u

i

([m

1p

,m

2p

,...,m

ip

,...,m

np

])<u

i

([m

1k

,m

2k

,...,m

ik

,...,m

nk

]).

[1.42]

Kryterium optymalności w sensie Pareto możemy wykorzystać jako postulat, który

spełniać powinno rozwiązanie gry o sumie różnej od zera. Nie będziemy wówczas

przyjmować jako rozwiązań tych wektorów strategii, które nie przynoszą Pareto optymalnych

kombinacji wygranych. Spełnienie tego postulatu jest dobrze widoczne na graficznym obrazie

zbioru wyników gry, czyli obszarze wygranych. W przypadku dwuosobowych gier o sumie

różnej od zera jest to część przestrzeni euklidesowej składająca się z punktów opisujących

pary wygranych dla wszystkich możliwych par strategii (po jednej każdego z graczy),

zarówno czystych jak i mieszanych.

Ź

ródło: opracowanie własne

Ź

ródło: opracowanie własne

Wykres 1.4. Obszar wygranych gry

"Ścisła"

0

5

10

15

20

25

30

35

0

5

10

15

20

25

30

35

u

b

u

a

[a

1

,b

1

]

[a

1

,b

2

]

[a

2

,b

2

]

[a

2

,b

1

]

r

Wykres 1.5. Obszar wygranych gry "K lub P"

0

5

10

15

20

25

30

35

0

5

10

15

20

25

30

35

u

b

u

a

[a

1

,b

1

]

[a

2

,b

2

]

[a

2

,b

1

]

[a

1

,b

2

]

r

background image

21

Wykres 1.4 pokazuje, że w grze „Ścisła” jedyna równowaga jest jednocześnie

optymalna w sensie Pareto

6

. Jeżeli jedyna równowaga w grze o sumie różnej od zera jest

jednocześnie optymalna w sensie Pareto, to mówimy o rozwiązaniu w sensie ścisłym

[Straffin, 2001, s. 90]. Jest to niesłychanie rzadki przypadek jednoznaczności wyznaczenia

rozwiązania gry o sumie różnej od zera.

Wykres 1.5 przedstawia sytuację stojącą na przeciwnym krańcu osi jednoznaczności.

Równowaga w grze „K lub P” występuje w jedynym nie optymalnym w sensie Pareto

wierzchołku obszaru wygranych. Rekomendacja równowagi jako rozwiązania tej gry może

upaść pod zarzutem niespełnienia kryterium optymalności Pareto. Kontrowersja pomiędzy

kryterium równowagi i kryterium Pareto pojawiająca się w grach niekooperacyjnych

podzieliła w swoim czasie badaczy zajmujących się tą dziedziną. Nash obstawał przy swojej

propozycji nawet wtedy, gdy eksperymenty wskazywały na przewagę rozwiązania

optymalnego w sensie Pareto [Flood, 1958]. Poglądy innych były zgodne z wynikami tych

eksperymentów. Według nich, „na korzyść optymalności w sensie Pareto przemawia to, że

każdy z graczy zachowując się racjonalnie, przypisuje racjonalność drugiemu. Jeśli jest wynik

gry inny od równowagi, który podnosi wygraną jednego z graczy, co najmniej nie

zmniejszając wygranej drugiego, to równowaga nie stanie się racjonalnym wynikiem gry”

[Rapoport, 1989, s.221].

1.3.3.

Wybór rozwiązania spośród wielu równowag tej samej gry

Niejednoznaczność wskazania rozwiązania gry niekooperacyjnej może się pojawić

również wtedy, gdy mamy do czynienia z mnogością równowag optymalnych w sensie

Pareto. O ile rozwiązaniem w sensie ścisłym jest jedyna równowaga optymalna w sensie

Pareto, to ich większa liczba spełnia warunek ścisłości tylko wtedy, gdy są one ekwiwalentne

i wymienne [Straffin, 2001, s. 90]. Tak nie jest w przypadku gry „Dwie równowagi”.

„Dwie równowagi”

Dwa przedsiębiorstwa działające na tym samym rynku mają do wyboru po dwie

strategie rynkowe: typu 1 i 2. Wygranymi są ich zyski. Jeśli jednocześnie wybiorą strategie

typu 1, osiągną rozwiązanie najkorzystniejsze dla gracza A. Gdy zgodny wybór padnie na

strategie typu 2, najwyższą wygraną cieszyć się będzie gracz B. Mieszanie typów strategii

przynosi najniższą z dostępnych wygranych temu z przedsiębiorstw, które wybierze typ 2.

6

Na wykresach zbiór Pareto optymalny składa się z punktów zaznaczonych romboidalnym powiększonym

znacznikiem oraz odcinków łączących te punkty. Te właśnie odcinki są obrazem wektorów mieszanych strategii
optymalnych w sensie Pareto. Równowagi oznaczono małą literą r.

background image

22

Tabela 1.16. Macierze wygranych gry „Dwie równowagi”

A

B

Strategia

a

1

Strategia

a

2

Strategia

b

1

14

8

4

4

Strategia

b

2

6

-2

8

14

ź

ródło: opracowanie własne

Równowagi w tej grze to pary strategii [a

1

,b

1

] i [a

2

,b

2

]. Gracz A zdecydowanie

preferuje pierwszą z nich, gracz B drugą, nie są zatem ekwiwalentne i wymienne. Nawet jeśli

obydwie są optymalne w sensie Pareto, trudno przyjąć, że gracze zgodzą się na jedną z nich.

Konieczność wyboru między dwiema równowagami optymalnymi w sensie Pareto jest

naturalnym zaproszeniem do poszukiwania rozwiązania kooperacyjnego, o którym traktować

będzie następna część tego rozdział.

Wykres 1.6. Wielobok wygranych gry "Dwie

równowagi"

0

2

4

6

8

10

12

14

-4

-2

0

2

4

6

8

10

12

14

u

b

u

a

[a

1

,b

1

]

[a

2

,b

2

]

[a

2

,b

1

]

[a

1

,b

2

]

r

r

Ź

ródło: opracowanie własne

Bardzo istotną propozycję kryterium wyboru miedzy dwiema równowagami w ramach

gier niekooperacyjnych zgłosił John Harsanyi. Polegała ona na wykorzystaniu dwóch

kategorii: dominacji wypłat i dominacji ryzyka [Harsanyi, 1977, s. 274]. Pierwsze z nich

opiera się na wyborze tej równowagi, która przynosi wyższą wygraną przynajmniej jednemu z

graczy i nie niższą pozostałym. Racjonalność tego kryterium nie powinna budzić dyskusji,

wszak pokrywa się z kryterium optymalności Pareto.

background image

23

Drugie z kryteriów Harsanyi’ego jest inspirowane koncepcją Luce’a i Raiffy

„dominacji psychologicznej”, jaka może mieć miejsce w relacjach dwóch nieekwiwalentnych

i niewymiennych równowag [Luce, Raiffa, 1964, s. 108-109]. W pierwszym kroku należy

sprawdzić, czy optymalna strategia mieszana może zapewnić graczom wyższe wygrane, niż

gdyby wybrali strategię czystą korzystniejszą dla przeciwnika. Równowaga w strategiach

mieszanych w grze „Dwie równowagi” to para strategii a

r

=[

2

1

a

1

,

2

1

a

2

] i b

r

=[

6

1

b

1

,

6

5

b

2

]

przynosząca wygrane u

ar

=7

3

1

oraz u

br

=6. Taki wynik gry jest zdominowany przez obydwie

równowagi. Racjonalnie zachowujący się gracz nie wybierze równowagi w strategiach

mieszanych nawet, jeśli przyszłoby mu wybrać strategię czystą umożliwiającą ustalenie się

równowagi mniej korzystnej dla niego.

Następnym krokiem w wykorzystaniu kryterium dominacji ryzyka jest wyznaczenie

indeksów ryzyka towarzyszących obydwu równowagom [Harsanyi, 1977, s. 276]. Dla

każdego z graczy indeks zbudowany jest tak, że w liczniku znajduje się różnica jego

wygranych w alternatywnych równowagach liczona tak by zawsze miała znak dodatni, a w

mianowniku różnica jego wygranej w preferowanej równowadze i wygranej w sytuacji, gdy

przeciwnik odpowie najmniej korzystnie na próbę forsowania tej równowagi. W grze „Dwie

równowagi” odpowiednie indeksy będą miały następującą postać:

4

3

])

b

,

a

([

u

])

b

,

a

([

u

])

b

,

a

([

u

])

b

,

a

([

u

i

2

1

a

1

1

a

2

2

a

1

1

a

ar

=

=

[1.43]

8

3

])

b

,

a

([

u

])

b

,

a

([

u

])

b

,

a

([

u

])

b

,

a

([

u

i

2

1

b

2

2

b

1

1

b

2

2

b

br

=

=

[1.44]

Wyższa wartość indeksu oznacza, że równowaga preferowana przez gracza A ([a

1

,b

1

])

dominuje w zakresie ryzyka równowagę [a

2

,b

2

] i ona powinna być wskazana jako unikalne

rozwiązanie w tej grze. Wskazana zostaje ta równowaga, której ewentualne odrzucenie przez

konkurenta wiąże się z mniejszą względną szkodą. Niestety dominacja ryzyka pozostaje

bezużytecznym narzędziem wyboru równowagi w strategiach czystych w szczególnym

przypadku, w którym liczniki i mianowniki indeksów ryzyka są sobie równe. Dzieje się tak w

przypadku gry „Tchórz”.

„Tchórz”

Dwa przedsiębiorstwa utworzyły konsorcjum dla realizacji pewnego kontraktu. Każde

z nich ma do wyboru dwie strategie. Mogą wykonać kontrakt (1) lub nie podejmować

ż

adnych działań licząc na to, że druga strona wypełni go sama (2). Jeśli zgodnie kooperując

wykonają zlecone prace ([a

1

,b

1

]), osiągną zyski równe 2. Jeśli żadne z przedsiębiorstw nie

background image

24

podejmie wykonania kontraktu ([a

2

,b

2

]), wysokie kary umowne spowodują straty równe -8 u

obydwu. W sytuacji, gdy jeden wykona cały kontrakt a drugi osiągnie wypłatę bez ponoszenia

kosztów ([a

1

,b

2

] lub [a

2

,b

1

]), zyski wyniosą odpowiednio -4 i 6.


Tabela 1.17. Macierze wygranych gry „Tchórz”

A

B

Strategia

a

1

Strategia

a

2

Strategia

b

1

2

2

6

-4

Strategia

b

2

-4

6

-8

-8

ź

ródło: opracowanie własne

Gra „Tchórz” ma dwie, optymalne w sensie Pareto, równowagi w strategiach

czystych

7

. Przynoszą je pary strategii [a

1

,b

2

] (korzystniejsza dla B) i [a

2

,b

1

] (korzystniejsza dla

A). Można też w niej wyznaczyć równowagę w strategiach mieszanych. Jest nią para

a

r

=[

2

1

a

1

,

2

1

a

2

] i b

r

=[

2

1

b

1

,

2

1

b

2

], która przynosi wygrane u

ar

=u

br

=-1. Równowagi te nie są

ekwiwalentne ani wymienne. Nie można w tej grze skorzystać z kryterium dominacji wypłat.

ś

adna z równowag nie dominuje pozostałych.

Wykres 1.7. Wielobok wygranych gry "Tchórz"

-10

-8

-6

-4

-2

0

2

4

6

8

10

-10 -8

-6 -4

-2

0

2

4

6

8

10

u

b

u

a

[a1,b1]

[a2,b2]

[a2,b1]

[a1,b2]

r

r

Ź

ródło: opracowanie własne

7

Gra „Tchórz” jest modyfikacją archetypowej gry „Chicken” popularnej wśród amerykańskich nastolatków w

latach pięćdziesiątych ubiegłego stulecia. Dwa samochody jadą naprzeciw siebie z dużą prędkością. Kierowca,
który pierwszy zahamuje „traci twarz” i przegrywa. Gracze mają do wyboru dwie strategie, hamować lub nie
hamować [Straffin, 2001, s. 103]. W polskich tłumaczeniach książek dotyczących teorii gier, na ogół,
zachowana zostaje oryginalna nazwa tej gry, choć zdarzają się jej tłumaczenia nie oddające istoty rzeczy (np.
„kurczak” [Leibenstein, 1988, s. 301]).

background image

25

Kryterium dominacji ryzyka również nie posłuży wskazaniu unikalnej równowagi w

strategiach czystych. Wyznaczenie indeksów ryzyka przynosi rezultat i

ar

=i

br

=

7

5

. Dramatyczny

brak możliwości wyznaczenia rozwiązania w strategiach czystych w grze „Tchórz” można

wytłumaczyć następująco: „im bardziej jesteś przekonany do wyboru stchórzenia, tym

bardziej kusząca jest strategia przeciwna” [Raiffa, Metcalfe, Richardson, 2002, s. 69]. Jedynie

równowaga w strategiach mieszanych może zostać wskazana jako rozwiązanie ze względu na

dominację ryzyka. Ten wybór jest oparty na tożsamości indeksów ryzyka równowag w

strategiach czystych.

1.3.4.

Gry o sumie różnej od zera z asymetrią informacji

Wyznaczenie rozwiązania w grze „Tchórz” może się stać trywialne, jeśli zmienimy

zakresy informacji, jakimi dysponują gracze. W pierwotnej wersji gry żaden z nich nie wie,

co wybierze przeciwnik (zbiory informacyjne zaznaczone linią kreskowaną na Schemacie

1.5). Wybory strategii są dokonywane jednocześnie. Wyobraźmy sobie jednak, że jeden z

graczy decyduje jako drugi i wie, jaką strategię wybrał rywal. Załóżmy, że A wybiera

strategię jako pierwszy (zbiory informacyjne zaznaczone linią kropkowaną).

Pełen zakres informacji gracza B stwarza możliwość przedstawienia jeszcze jednej z

metod szukania rozwiązań w grach o sumie dowolnej. Metoda ta wykorzystuje ich postać

rozwiniętą. Polega na odrzucaniu przez gracza tych gałęzi, które przynoszą mu mniejsze

wygrane. Lewy węzeł, będący jednocześnie lewym zbiorem informacyjnym, zostanie

zredukowany przez gracza B o wybór b

1

(6>2). W przypadku prawego węzła odrzucona

zostanie gałąź b

2

(-4>-8). Gracz B wybierze więc strategię: „wybierać zawsze inaczej niż

przeciwnik”. Jeśli gracz A zakłada, że ma do czynienia z racjonalnym przeciwnikiem łatwo

A

B

a

1

a

2

b

2

b

2

b

1

b

1

(2,2)

(-4,6)

(6,-4)

(-8,-8)

Schemat 1.4. Dendryt gry „Tchórz”

Ź

ródło: opracowanie własne

background image

26

może zidentyfikować jego wybór. Najlepszą odpowiedzią A na strategię gracza B „wybierać

zawsze inaczej niż przeciwnik” będzie wybór strategii a

2

(6>-4). „Taka metoda znajdowania

dobrych strategii poprzez analizę drzewka gry od końca nazywa się indukcją wsteczną”

[Malawski, Wieczorek, Sosnowska, 1997, s. 30].

Gracz A wiedząc, że przeciwnik będzie podejmował decyzję znając jego wybór,

wybierze strategię biernego oczekiwania na zrealizowanie kontraktu przez gracza B.

Dokonywanie wyboru strategii w pierwszej kolejności przynosi przewagę w grze w

„Tchórza”. Jednocześnie większy zakres informacji stawia gracza B w mniej korzystnej

sytuacji. Sprawa ma się tutaj odwrotnie niż w przypadku gry „A przeciw B”, w której

znajomość decyzji rywala przyniosła firmie B wzrost wygranej w punkcie siodłowym.

Możliwość wyboru strategii w pierwszej kolejności stworzyła sytuację, w której gracz

A swoją decyzją może sformułować skuteczną groźbę. Wybierając jako pierwszy bierne

oczekiwanie na wykonanie kontraktu przez partnera, wymusza na nim reakcję obronną w

postaci wyboru strategii „wykonanie kontraktu”. O groźbach mówimy wtedy, gdy:” (i) gracz

A deklaruje, że w wypadku jakiegoś działania gracza B sam podejmie określone działanie,

które (ii) będzie niekorzystne dla B, oraz (iii) będzie niekorzystne także dla niego samego”

[Straffin, 2001, s. 111]. Załóżmy, że w grze „Tchórz” dopuszczamy możliwość kontaktu

między graczami przed jednoczesnym wyborem strategii. Każdy z nich może sformułować

wówczas groźbę: „jeśli ty zagrasz swoją strategię (2) to ja zrobię to samo”. Wystosowanie

groźby rodzi problem wiarygodności. Ze względu na warunek (iii) adresat ma prawo wątpić

w jej realizację. Gdy dokona on swojego wyboru, wykonanie groźby nie przynosi już żadnej

korzyści jej autorowi. Próba rozwiązania tego problemu może pojawić się w powtarzanej

wersji gry, w której dla uwiarygodnienia groźby gracz może pozwolić sobie na niższe

wygrane w kilku pierwszych turach.

Tabela 1.18. Macierz gry „Tchórz: różnica wygranych”

Wygrane B = u

b

a

1

a

2

b

1

0

-10

b

2

10

0

Ź

ródło: opracowanie własne

Optymalne strategie gróźb są najlepszą odpowiedzią na siebie nawzajem.

Wyznaczamy je jako punkt siodłowy gry powstałej w wyniku odjęcia od siebie wygranych z

wyjściowej gry o sumie różnej od zera:

u

a

’([a

i

,b

j

])=u

a

([a

i

,b

j

])-u

b

([a

i

,b

j

] oraz u

b

’([a

i

,b

j

])=u

b

([a

i

,b

j

])-u

a

([a

i

,b

j

])).

[1.45]

W przypadku gry „Tchórz” punktem siodłowym takiej gry jest para strategii [a

2

,b

2

].

background image

27

Każdy z graczy deklarując brak jakiegokolwiek działania na rzecz wykonania

kontraktu, formułuje groźbę, która jest najlepszą odpowiedzią na groźbę przeciwnika.

Optymalne groźby pozostają w równowadze. Pamiętać należy jednak, że ich realizacja

przynosi jedyny wynik, który nie jest Pareto optymalny w zbiorze strategii czystych. Para

optymalnych strategii gróźb nie może być traktowana jako propozycja rozwiązania gry o

sumie różnej od zera. Groźby stanowią jedynie narzędzie służące osiągnięciu pożądanego

wyniku gry. Ich przydatność widoczna jest w przypadku gier powtarzanych oraz przy

wyznaczaniu rozwiązań kooperacyjnych, o czym szerzej przeczytać będzie można w

następnej części pracy.

1.3.5.

Poziomy bezpieczeństwa, wykorzystanie kryterium maksyminowego

Trudności w wyborze jednoznacznego rozwiązania gier o sumie różnej od zera

stwarzają pokusę wykorzystania narzędzi służących wyznaczaniu optymalnego rozwiązania

gier o sumie zerowej. Ulegnięcie tej pokusie prowadzi nas do wyznaczenia optymalnych

strategii w grach o sumie różnej od zera zwanych strategiami bezpieczeństwa. Wartość gry

uzyskana w ten sposób to poziom bezpieczeństwa gracza. Z praktycznego punktu widzenia,

wyznaczenie poziomów bezpieczeństwa polega na znalezieniu maksyminów w grach o

wygranych każdego z graczy z osobna. Macierze wygranych w grze o sumie różnej od zera

traktowane są jak macierze gry o sumie zerowej. Zakładamy tym samym, że wygrana

każdego z graczy jest jednocześnie przegraną drugiego. Wyborowi strategii przyświeca

przekonanie, że przeciwnik jest zainteresowany w minimalizacji naszej wygranej.

Tabela 1.19. Gra "Tchórz: suma zero B"

u

b

a

1

a

2

a

M

i

a

min

b

1

2

-4

-4

a

M

i

a

b

M

j

b

min

max

b

2

6

-8

-8

-4

b

M

bj

max

6

-4

b

M

j

b

a

M

i

a

max

min

-4

Ź

ródło: obliczenia własne

Pozostańmy przy najczęściej analizowanej ostatnio grze w „Tchórza”. Macierz gry o

sumie zerowej na wygranych gracza B ma punkt siodłowy w strategiach czystych. Jest nim

para strategii [a

2

,b

1

]. Wartość tej gry to v=-4 i taki jest właśnie poziom bezpieczeństwa gracza

B. Niezależnie od wyboru przeciwnika, wybierając strategię b

1

, gwarantuje on sobie, że

wygra, co najmniej -4.

background image

28

Wyznaczony analogicznie poziom bezpieczeństwa gracza A wynosi również -4 i

gwarantowany jest wyborem strategii a

1

. Zwróćmy uwagę, że obustronny wybór strategii

bezpieczeństwa w grze „Tchórz” przynosi wynik gry, który nie jest równowagą, ale spełnia

kryterium optymalności Pareto. Wiedza o wyborze strategii bezpieczeństwa może jednak

zostać wykorzystana przez przeciwnika, który ma sposobność wybrać strategię

kontrbezpieczną, czyli najlepszą na nią odpowiedź. Strategią kontrbezpieczną gracza A jest a

2

a gracza B b

2

. Wykorzystanie strategii bezpieczeństwa jako wskazania rozwiązania w grach o

sumie zerowej ma, jak widać, jedną podstawową wadę. Strategie bezpieczeństwa nie są w

równowadze i nie przynoszą rozwiązania stabilnego.

Tabela 1.20. Alternatywy dla równowag w grze „Tchórz”

Strategie A

Strategie B

u

a

u

b

bezpieczna

bezpieczna

2

2

bezpieczna

kontrbezpieczna

-4

6

kontrbezpieczna

bezpieczna

6

-4

kontrbezpieczna

kontrbezpieczna

-8

-8

Ź

ródło: opracowanie własne na podstawie [Straffin, 2001]

Wybierając swoje strategie bezpieczeństwa, każdy z graczy umożliwia przeciwnikowi

osiągnięcie równowagi bardziej korzystnej dla niego. Nie można zatem zaryzykować tezy o

przydatności narzędzi wyznaczania rozwiązań gier o sumie zerowej dla rozwiązywania gier o

sumie różnej od zera.

Wszechstronne próby znalezienia rozwiązania w grze „Tchórz” przyniosły jedynie

wskazanie równowagi w strategiach mieszanych a

r

=[

2

1

a

1

,

2

1

a

2

] i b

r

=[

2

1

b

1

,

2

1

b

2

]. Przy

nieskończonej liczbie powtórzeń przyniesie ona wygrane u

ar

=u

br

=-1. Nie zapominajmy jednak

o sytuacji, jaka stoi za analizowaną grą. Jeśli w którymś z powtórzeń wylosowana zostanie

para strategii [a

2

,b

2

], nie będzie już kolejnego kontraktu do zrealizowania. Podobnie może być

również wtedy, gdy losowanie strategii przyniesie którąkolwiek z równowag w strategiach

czystych. Konsorcjum rozpadnie się z przyczyn oczywistych.

Wskazanie równowagi jako rozwiązania gry o sumie różnej od zera ma dwie zalety.

Po pierwsze, jest to propozycja wyróżniająca się tym, że pojedynczy gracz nie może poprawić

swojej sytuacji wyłącznie swoimi działaniami. Po drugie, jak dowiódł Nash, w każdej grze

można wskazać równowagę. Niestety, gdy mamy do czynienia z liczbą nie ekwiwalentnych i

nie wymiennych równowag większą niż jeden, pojawia się problem wskazania tej właściwej.

Harsanyi zaproponował wykorzystanie kryteriów dominacji wypłat i dominacji ryzyka. Ich

zastosowanie umożliwia wskazanie unikalnej równowagi jako rozwiązania gry. Jednak w

background image

29

niektórych przypadkach uzyskane rozwiązanie w strategiach mieszanych nie spełnia

oczekiwań graczy. Są bowiem gry, w których praktyczny aspekt mieszania strategii kłóci się z

naturą sytuacji strategicznej.

Podjęcie próby wykorzystania narzędzi poszukiwania punktów siodłowych w grach o

sumie zerowej również nie przyniosło pożądanych rezultatów. Pomijając trudności związane

z naturą poszczególnych przypadków, wystarczy powiedzieć, że strategie bezpieczeństwa

wyznaczone metodą maksyminu nie sprawdzą się w grach o sumie różnej od zera, ponieważ

nie są w równowadze.

Widać teraz, jak błahe były problemy, które pojawiały się podczas rozwiązywania gier

o sumie zerowej. Rozwiązując grę o sumie różnej od zera pozostaje nam jedynie zatęsknić za

jednoznacznością jej być może mniej wyrafinowanej, ale jakże wdzięczniejszej siostry.

1.4.

Teoria gier powtarzalnych

1.4.1.

Natura gier iterowanych

Powtarzalność gry rodzi istotne konsekwencje strategiczne. Wybory graczy w

kolejnych turach pozostają pod wpływem znanych im wyników poprzednich iteracji. Gracza

poznają się i z czasem ich wybory uwzględniają „dopasowanie” do postawy przeciwnika.

Dodatkowo pojawia się czynnik uczenia się obejmujący nie tylko zachowania innych graczy,

ale również istotę i dynamikę gry. Wszystkie te względy przesuwają zainteresowanie badacza

w kierunku pozytywnej analizy zachowań graczy. Jest ona domeną empirycznych badań nad

zachowaniami podmiotów gospodarczych oraz przedmiotem ekonomii eksperymentalnej. W

tym rozdziale uwaga zostanie skoncentrowana na normatywnym aspekcie gier powtarzalnych.

Przedstawione zostaną próby wyznaczenia racjonalnych sposobów postępowania w tych

grach. Elementy analizy pozytywnej obejmujące skutki porozumiewania się graczy, ich

indywidualnych charakterystyk oraz wzajemnych przewidywań, co do kolejnych ruchów

pojawią się tylko wtedy, gdy będzie to konieczne.

Celem graczy w grze powtarzalnej jest uzyskanie maksymalnej sumy użyteczności

wygranych. Spełnienie założenia o tym, że użyteczność sumy wygranych jest równa sumie

użyteczności jej składników jest możliwe tylko przy liniowej postaci tej funkcji. Formułując

bazowe założenia dla modeli budowanych w tej pracy, taką właśnie funkcję przyjęto. To

daleko idące uproszczenie będzie przydatne jeszcze niejednokrotnie. Można też przyjąć inne

podejście zakładając, że gracze są „zainteresowani jedynie w maksymalizacji swych własnych

background image

30

oczekiwanych wypłat pieniężnych, i niech wtedy liczby macierzy wypłat przedstawiają

wypłaty pieniężne” [Luce, Raiffa, 1964, s. 98].

1.4.2.

Powtarzanie jako metoda rozwiązywania gier o sumie zerowej

Powtarzanie gry o sumie zerowej przynosi supergrę o tej samej charakterystyce.

Każda powtarzalna gra o sumie zerowej, tak jak jej składowa, jest ściśle konkurencyjna. Jej

rozwiązaniem będzie wybór strategii maksyminowej w każdej iteracji. Gry ściśle

konkurencyjne w wersji powtarzanej nie stwarzają istotnych problemów z teoretycznego

punktu widzenia. Możemy nawet stwierdzić, że stworzenie fikcyjnej gry, poprzez

powtarzanie bazowej gry o sumie zerowej, może przynieść nową metodę jej rozwiązywania.

„Ekspansja”

8

Dwa przedsiębiorstwa produkują ten sam wyrób. Przedsiębiorstwo A charakteryzuje

się mniejszym udziałem w rynku i wyższymi kosztami marginalnymi niż przedsiębiorstwo B.

Otwierają się przed nimi dwa nowe rynki. Jeśli obydwa wejdą na ten sam rynek ([a

1

,b

1

] lub

[a

2

,b

2

]), słabsze przedsiębiorstwo A przegrywa zyski równe jedności na rzecz konkurenta.

Odwrotnie dzieje się wtedy, gdy wybierają różne rynki ([a

1

,b

2

] lub [a

2

,b

1

]), ponieważ A może

wzmocnić się nie będąc atakowane przez konkurenta.

Tabela 1.21. Gra "Ekspansja"

u

b

a

1

a

2

a

M

i

a

min

b

1

-1

1

-1

a

M

i

a

b

M

j

b

min

max

b

2

1

-1

-1

-1

b

M

bj

max

1

1

b

M

j

b

a

M

i

a

max

min

1

Ź

ródło: obliczenia własne na podstawie [Shubik, 1995]

Gra nie ma punktu siodłowego w strategiach czystych, ale sprawdźmy, jak będzie się

zmieniać sytuacja, jeśli będzie powtarzana. Załóżmy, że gracze zaczynają od jednoczesnego

wyboru drugiego rynku. Przez cały czas, gracze monitorują częstość wyboru strategii przez

przeciwnika. W następnych turach wybierają odpowiednią strategię tak długo, dopóki drugi z

graczy nie zacznie częściej wybierać strategii, na którą najlepszą odpowiedzią będzie zmiana

własnej strategii. Gracz B powinien zmienić strategię już w drugiej turze, ponieważ najlepszą

8

Gra jest odmianą archetypowej gry „Matching Pennies” polegającej na jednoczesnym wskazaniu jednej z

dwóch stron monety przez dwóch graczy. Jeśli wskażą tą samą stronę wygrywa jeden, jeśli różne wygrywa
drugi. Wygraną jest pokazywana moneta.

background image

31

odpowiedzią na a

2

jest b

1

. Gracz A zmienia strategię na a

1

w turze czwartej, zaraz po tym jak

okazuje się, że gracz B zaczął częściej grać b

1

.

Tabela 1.22. Gra "Ekspansja" rozgrywana wielokrotnie

Wybór A

Częstość wyboru A

Wybór B

Częstość wyboru B

Tura

a

1

a

2

a

1

a

2

b

1

b

2

b

1

b

2

1

1

0,0000

1,0000

1

0,0000

1,0000

2

1

0,0000

1,0000

1

0,5000

0,5000

3

1

0,0000

1,0000

1

0,6667

0,3333

4

1

0,2500

0,7500

1

0,7500

0,2500

5

1

0,4000

0,6000

1

0,8000

0,2000

6

1

0,5000

0,5000

1

0,8333

0,1667

7

1

0,5714

0,4286

1

0,8571

0,1429

8

1

0,6250

0,3750

1

0,7500

0,2500

9

1

0,6667

0,3333

1

0,6667

0,3333

10

1

0,7000

0,3000

1

0,6000

0,4000

11

1

0,7273

0,2727

1

0,5455

0,4545

Ź

ródło: obliczenia własne na podstawie [Shubik, 1995]

Zgodnie z tą dynamiką gra może się toczyć w nieskończoność. Robinson [1951]

udowodnił, że częstości wyboru strategii zmierzają w niej do wartości optymalnych

prawdopodobieństw mieszania strategii. W grze „Ekspansja” punkt siodłowy w strategiach

mieszanych to para a

r

=[

2

1

a

1

,

2

1

a

2

] i b

r

=[

2

1

b

1

,

2

1

b

2

] przynosząca wartość gry v=0. Już przy 250

powtórzeniach średnia wypłata gracza B wynosi 0,02. Zdaniem Robinsona, analizując grę o

sumie zerowej poprzez dokonywanie powtórzeń, możemy wyznaczyć optymalne strategie

mieszane graczy i jej wartość.

Wykres 1.8. Częstość wyboru strategii a

1

w powtarzanej grze "Ekspansja"

0,0

0,3

0,5

0,8

1,0

1,3

1

26

51

76

101

126

151

176

201

226

tury

Ź

ródło: opracowanie własne

background image

32

Wykres 1.8 pokazuje jak wygasają oscylacje częstości wybierania strategii wokół

optymalnego prawdopodobieństwa jej losowania. W miarę, jak przyrasta ilość iteracji, ich

odchylenie od p=0,5 jest coraz mniejsze. Podobnie będzie wyglądać wykres dla każdej z

pozostałych strategii czystych dostępnych graczom. Co prawda, wraz z gaśnięciem oscylacji

wydłuża się jej okres, ale nie zmienia to faktu, że częstość wyboru strategii zmierza do

optymalnego prawdopodobieństwa jej losowania.

1.4.3.

Powtarzane gry o sumie różnej od zera

Niestety metoda Robinsona nie znajduje zastosowania w grach o sumie różnej od zera.

Zbudowanie normatywnego modelu wskazującego na najlepszą strategię każdego z graczy

wymaga przyjęcia szeregu założeń upraszczających. Badacze chętniej zajmują się

konkretnymi przykładami gier niż uniwersalną teorią powtarzalnych gier o sumie niezerowej.

Najczęściej przedmiotem ich zainteresowania był „dylemat więźnia”. Zbiega się to

szczęśliwie z powinowactwem gier tego typu z modelem duopolu, którego uproszczoną

postacią była gra „K lub P”.

Zanim zajmiemy się metodami znajdowania rozwiązań w powtarzanym dylemacie

więźnia, przedstawmy ogólną postać tego typu gry w wersji jednoetapowej. Każdy z graczy

ma do wyboru dwie strategie: zdrada (z) lub kooperacja (k). Załóżmy, że macierze wygranych

obydwu graczy będą symetryczne. Nie będzie to miało wpływu na naturę wyznaczonego

rozwiązania.

Tabela 1.23. Macierze wygranych gry „Dylemat więźnia”

A

B

Strategia

a

1

Strategia

a

2

Strategia

b

1

z

z

f

c

Strategia

b

2

c

f

k

k

ź

ródło: opracowanie własne

Relacja pomiędzy wygranymi zawsze układać się będzie zgodnie z nierównościami

c>k>z>f oraz

2

f

c

k

+

. Przypomnijmy, że równowaga w tej grze to para strategii [a

z

,b

z

].

Jednocześnie jest to jedyny wynik gry w strategiach czystych, który nie jest optymalny w

sensie Pareto.

background image

33

Załóżmy, że gracze znają ilość powtórzeń, jaką przyjdzie im rozegrać. Analizując grę

z perspektywy ostatniej iteracji, uznają za racjonalne wybranie w niej strategii zdrady, która

dominuje kooperację. Wybór jest oczywisty, bowiem więcej powtórzeń nie będzie. To z kolei

sprawia, że tura przedostania, ze strategicznego punktu widzenia, upodabnia się do ostatniej.

Ponownie najbardziej racjonalnym wyborem dla obydwu graczy będzie zdrada. „Szanse na

kooperacje upadają jak kostki domina – również pierwszym wynikiem musi być para strategii

zdrady” [Straffin, 2001, s. 96]. Zgodnie z tą logiką równowaga w dylemacie więźnia jest

równocześnie równowagą w jego powtarzanej określoną ilość razy wersji. Jednak

doświadczenie uczy, że gracze nie zawsze z żelazną konsekwencją stosują opisany sposób

myślenia, a i w teorii znaleziono sposób na odejście od tego zdeterminowanego rozwiązania.

Polega on na założeniu, że gracze nie znają ilości powtórzeń, jaka będzie ich udziałem. Nie

znają ostatniej tury, więc nie mogą rozpocząć wstecznego odliczania strategii zdrady w

kolejnych powtórzeniach.

W literaturze wymienia się cztery metody wyboru strategii w przypadku dylematu

więźnia powtarzanego nieokreśloną ilość razy [Shubik, 1970]:

wprowadzenie dodatniego prawdopodobieństwa zakończenia gry na każdym jej etapie,

wprowadzenie dodatniego współczynnika dyskontującego,

zastąpienie gry jej skończoną wersją z funkcją wartości końcowej,

optymalizacja średniej wypłaty dla pojedynczej iteracji.

Pierwszy ze sposobów zakłada, że każda tura, następna po pierwszej, zostanie

rozegrana z prawdopodobieństwem 0≤p≤1 [Shubik, 1970]. Gdyby każdy z graczy zawsze

wybierał strategię kooperacji, jego suma wygranych wyniosłaby:

p

1

k

k

p

k

p

pk

k

3

2

=

+

+

+

+

L

[1.46]

Mógłby jednak zdecydować się na zagranie zdrady w m-tej iteracji. Przeciwnik odpowie tą

samą zmianą w turze m+1 i dalej wybrane strategie pozostaną w równowadze. Suma

wygranych tego, który zdradzi pierwszy przybiera postać:

p

1

z

p

c

p

)

p

1

(

)

p

1

(

k

z

p

z

p

c

p

k

p

k

p

pk

k

m

1

m

1

m

1

m

m

1

m

2

m

2

+

+

=

+

+

+

+

+

+

+

+

+

L

L

[1.47]

Nie będzie się opłacało zdradzić, jeśli [1.50] będzie większe od [1.51].

p

1

z

p

c

p

)

p

1

(

)

p

1

(

k

p

1

k

m

1

m

1

m

+

+

>

[1.48]

Przekształcając tą nierówność otrzymujemy:

background image

34

z

c

k

c

p

>

[1.49]

Gracze powinni grać kooperacyjnie pod warunkiem, że prawdopodobieństwo rozegrania

kolejnego powtórzenia jest większe od ilorazu różnic wygranych z nierówności [1.49].

Warunek jest niezależny od tego, w którym powtórzeniu może pojawić się zdrada.

Powróćmy na chwilę do gry „K lub P”. W przypadku obydwu graczy graniczna

wartość prawdopodobieństwa wynosi p=

3

1

. Jeśli w tej grze o wystąpieniu kolejnej iteracji

decydować będzie rzut monetą, zdrada nie będzie się opłacała żadnemu z graczy. Na

przykład, stałe granie kooperacji przez gracza A przynosi mu oczekiwaną wartość sumy

wygranych równą 50. Jednocześnie ta sama suma osiąga wartość 48,75 w wypadku zdrady w

czwartym powtórzeniu. Jeśli w odmiennej sytuacji, o kolejnym powtórzeniu będzie

decydować wyrzucenie szóstki przy pomocy kości do gry, to stałe wybieranie kooperacji

przez obydwu graczy przynosi oczekiwaną wartość sumy wygranych równą 30, a zdrada w

czwartej iteracji przyniesie jej wzrost do 30,0139.

Druga z przedstawionych metod jest modyfikacją pierwszej. Prawdopodobieństwo

rozegrania kolejnej iteracji zostaje zastąpione przez współczynnik dyskontujący. Gracze,

oczekując na wygrane w kolejnych turach, ponoszą koszty alternatywne związane z

odroczeniem wypłaty w czasie. Ich miarą jest stopa dyskontowa d. Jeśli pierwsza tura

rozgrywana jest dziś, a kolejne z interwałem rocznym, to wartość obecna wygranej gracza A

otrzymanej w etapie m jest warta:

1

m

am

am

m

)

d

1

(

u

)

u

(

PV

+

=

[1.50]

Nierówność [1.52] przybiera teraz postać:

1

m

1

m

2

m

)

d

1

(

d

1

z

)

d

1

(

1

c

)

d

1

(

d

1

d

1

1

k

d

1

1

k

+

+

+

+



+

+

>

+

,

[1.51]

a nierówność [1.53]:

k

c

z

k

d

<

[1.52]

W grze „K lub P” górną granicą wartości stopy dyskontowej, poniżej której nie opłaca

się zdradzać, jest d=200%. Jest to na tyle duża wartość, że można być spokojnym o trwałość

kooperacji. Przy zdecydowanie częściej spotykanej d=10%, strategia trwałej kooperacji

background image

35

przynosi graczowi A wartość oczekiwaną sumy wygranych równą 275, a zdrada w czwartym

powtórzeniu to jedynie 203,6

9

.

Graniczne prawdopodobieństwo rozegrania kolejnej tury i maksymalna stopa

dyskontowa są koncepcjami wskazującymi warunki dla opłacalności zdrady w dowolnym

powtórzeniu gry w przyszłości. Trzeba jednak pamiętać o ograniczonym zastosowaniu tych

propozycji. Opierają się one na daleko idących założeniach upraszczających. Gracze

zaczynają od jednoczesnego wyboru kooperacji, a zdrada jednego z graczy przynosi mu

jednorazową korzyść i od następnego powtórzenia prowadzi do trwałego wyboru zdrady

przez obydwu. Nie trzeba specjalnie wysilać wyobraźni, by dostrzec możliwość pojawienia

się ponownie odmiennego scenariusza, na przykład kooperacji po paru kolejnych

obustronnych wyborach zdrady.

Trzecia z wymienionych przez Shubika metod wyboru strategii w powtarzanym

dylemacie więźnia polega na wyznaczeniu wartości końcowej. „Pozwala ona na zamianę

nieskończonego horyzontu czasowego gry możliwością jej zakończenia przez gracza „i” w

okresie T i uzyskania wypłaty końcowej Q

i

, która ma zrekompensować mu odstąpienie

uczestnictwa sukcesorowi. Q

i

może być dowolną ogólną funkcją gry do etapu T” [Shubik,

1995, s. 289]. Technika wyznaczania wartości końcowej opiera się na takim modelowaniu

gry, że konkretną rolę spełnia w niej określona sekwencja graczy, w której każdy odstępuje

od gry w zamian za opłatę końcową. Horyzont czasowy gry kolejnych graczy jest, tym

samym, skończony. „Wartość końcowa dla każdego z nich może być określona przez

czynniki introspektywne takie jak, altruizm lub skłonność do pozostawienia spuścizny, albo

zewnętrzne takie jak, podatki, subsydia, prawa i zwyczaje [Shubik, 1980, 1981].

Wróćmy ponownie do gry „K lub P”. Załóżmy, że dodatkowy bonus o wartości 25 jest

wypłacany graczowi A w wypadku jednoczesnego wyboru kooperacji w powtórzeniu T.

9

Graniczna wartość stopy dyskontowej d=10% występuje w tych wariantach dylematu więźnia, w których

różnica wygranych między zgodnymi wyborami zdrady i kooperacji jest dziesięciokrotnie mniejsza od
relatywnej korzyści ze zdrady partnera wybierającego kooperację:

Wygrane A = u

a

a

z

a

k

b

z

21,8

10,0

b

k

35,0

23,0

Wygrane B = u

b

a

z

a

k

b

z

21,8

35,0

b

k

10,0

23,0

Ź

ródło: opracowanie własne

Obustronny wybór strategii kooperacji przynosi relatywnie niewielki przyrost wygranych w stosunku do
równowagi w tej grze. Zdrada partnera gotowego do współpracy jest dalece korzystniejsza. Dodać należy, że
minimalną wartością prawdopodobieństwa rozegrania kolejnej tury w tej grze gwarantującą trwałość kooperacji
jest p=10/11.

background image

36

Gracz B, w tej samej sytuacji, otrzymuje wypłatę końcową równą 30. Każda inna para

strategii sprawia, że wypłata końcowa wynosi -23 dla gracza B i -22 dla gracza A. Takie

ustalenie sprawia, że para strategii [a

k

,b

k

] staje się równowagą w iterowanej wersji gry „K lub

P”. Dodatkowo powoduje to zmniejszenie się prawdopodobieństwa wystąpienia wyniku

[a

z

,b

z

], który jest równowagą w jednoetapowej wersji gry. Zwróćmy uwagę, że ustanowienie

wypłaty końcowej w powtarzanym dylemacie więźnia umożliwia wyznaczenie rozwiązania

bez konieczności przejścia do sfery gier kooperacyjnych.

Czwarta z wyróżnionych przez Shubika metod, optymalizacja średniej wygranej z

jednego powtórzenia polega na takim skonstruowaniu optymalnej strategii by uzyskać

możliwie najwyższą granicę, do której zmierzać będzie średnia wypłata przy nieskończonej

ilości powtórzeń. Jeśli wygrane w każdym powtórzeniu są mniejsze od stałej C, to ich średnia

wartość również. Ta metoda, zaproponowana przez Aumanna [1959], prowadzi do uzyskania

nowej gry, w której wygranymi są średnie z nieskończonej ilości powtórzeń, a strategiami

sekwencje dostępnych strategii czystych. Rozwiązaniem będzie równowaga tak zbudowanej

gry.

Propozycje rozwiązań gier powtarzanych swoją poprawność formalną opierają na

założeniach upraszczających, które często budzą wątpliwości u autorów zajmujących się tą

dziedziną

10

. W sposób naturalny pojawiła się potrzeba eksperymentalnej weryfikacji

zachowań podmiotów decyzyjnych w grach typu „dylemat więźnia” lub podobnych. Wiele

studiów o tym charakterze istotnie uzupełniło naszą wiedzę. O ich wynikach będzie można

przeczytać w rozdziale 3.5.2.

10

Poza przedstawionymi dobrym przykładem jest wskazanie rozwiązania w dylemacie więźnia poprzez

odwołanie do metagry drugiego stopnia. Idea ta, znana wcześniej, została sformalizowana przez Howarda
[1971]. Wymaga się w niej, aby jeden z graczy wybierał spośród strategii uwzględniających trafne
przewidywanie wyboru zdrady lub kooperacji przez drugiego. Jednocześnie ten drugi wybiera spośród strategii
zakładających, że trafnie przewiduje jak wybierze pierwszy opierający się na własnej antycypacji. Na przykład,
gracz A może wybrać strategię „zz”, czyli zdradę niezależnie od tego, co zagra gracz B. Gracz B natomiast, ma
do wyboru między innymi, strategię „zzzk” czyli wybór zdrady gdy A wybiera „zz” i kooperacji w pozostałych
przypadkach. Za wyborem rozwiązania metodą metagry drugiego stopnia stoi założenie o zdolności graczy do
trafnego przewidywania wyborów przeciwnika. Jego realność wydaje się, co najmniej, dyskusyjna.


Wyszukiwarka

Podobne podstrony:
EKONOMIA MENEDŻERSKA wykłady Sylabus 1202 2013 r WSM
EKONOMIA MENEDŻERSKA, Ekonomia menedżerska wykłady
EKONOMIA MENEDŻERSKA wykłady Sylabus 1202 2013 r WSM
Ekonomia menedżerska wykłady
EKONOMIA MENEDŻERSKA wykłady Sylabus9 03 2009 r, Ekonomia menedżerska, Gruchelski
EKONOMIA MENEDŻERSKA wykłady Sylabus 1202 2013 r WSM
Ekonomia menedżerska wykład 7
Wprowadzenie do ekonomii menedżerskiej wykład nr 1
EKONOMIA MENADŻERSKA notatki z wykładów, ekonomia menedżerska
3 ekonomia menedzerska id 33642 Nieznany
20 (poprawka) Wykład - Prawo Handlowe, ● STUDIA EKONOMICZNO-MENEDŻERSKIE (SGH i UW), prawo handlowe
Opracowanie wykładu Mikroekonomia II, ● STUDIA EKONOMICZNO-MENEDŻERSKIE (SGH i UW), mikroekonomia
wykłady dodatkowo- nowe, Ekonomia, Studia, I rok, Finanase publiczne, Wykłady-stare, Wykłady
Prognozowanie i Symulacje - Wyklady - Jankiewicz-Siwek - 2003 (25), ● STUDIA EKONOMICZNO-MENEDŻERSKI
wykłady EKONOMIA MENEDŻERSKA
WYKLADY ekonomia matematyczna cz1, ● STUDIA EKONOMICZNO-MENEDŻERSKIE (SGH i UW), ekonomia matematycz

więcej podobnych podstron