Teresa Kamińska Teoria gier
1
TEORIA GIER
Teoria gier – definiowana jako teoria podejmowania decyzji w warunkach
interaktywnych (gry strategicznej) lub inaczej matematyczna teoria sytuacji
konfliktowych - została stworzona przez J. von Neumanna, który stwierdził, że
istota tej gry nie polega na próbie odgadnięcia intencji gracza, lecz na skrywaniu
własnych zamiarów. Podstawowym założeniem teorii gier jest racjonalne
działanie wszystkich podmiotów decyzyjnych (graczy). Podstawowymi
elementami każdej sytuacji, w której występuje zjawisko konkurencji są:
1. Gracze i ich posunięcia. Na rynku występuje przynajmniej dwóch
graczy i ich działania inwestycyjne, marketingowe oraz produkcyjno – cenowe
są wzajemnie uzależnione.
2. Wyniki i wypłaty. Działania wszystkich graczy określają wynik walki
konkurencyjnej (zwany wartością gry). Każdemu możliwemu wynikowi
odpowiada określona wypłata, która jest miarą stopnia osiągnięcia celu każdego
z rywali; najczęściej wyrażona pieniężnie, gdy mowa o przedsiębiorstwie, a w
wartościach użyteczności, gdy dotyczy konsumenta.
3. Reguły gry. Postępowaniem graczy rządzą formalne i nieformalne
reguły gry. Mogą to być przepisy prawne, powszechnie uznane zasady
konkurencji i nieuczciwe praktyki lub wrogie przejęcia, a także zasób wiedzy
analitycznej umożliwiającej śledzenie zachowań konkurencyjnych.
Punktem wyjścia w każdej analizie konkurencji, odwołującej się do
dorobku teorii gier, jest opis graczy, stosowanych przez nich strategii,
rozumianych jako plan działań, uwzględniający wszystkie ewentualności oraz
uzyskanych przez każdego z nich wypłat.
Walka konkurencyjna może mieć charakter jednorazowego posunięcia lub
wielu działań rozłożonych w czasie (konkurencja sekwencyjna i powtarzalna).
Teresa Kamińska Teoria gier
2
Gry mogą występować w wersji strategicznej i ekstensywnej.
Skończoną grę strategiczną od strony formalnej można zdefiniować:
¾
zbiór graczy: I = {1,…, N},
¾
zbiór działań (posunięć): A = {A
1
, …, A
N
}, gdzie każdy element
A
i
= {a
i
1
, …, a
i
k
} jest zbiorem posunięć dostępnych dla i-tego
gracza. Każdy gracz ma potencjalnie inny ich zbiór, stąd liczba
dostępnych działań, k
i
w ogólnym przypadku jest różna
względem i,
¾
zbiór funkcji wypłat:
∏
= {
π
1
, …,
π
N
}, gdzie każdy element
π
i
przyporządkowuje wartość liczbową wynikowi gry. Jeśli wynik
gry oznacza działania podjęte przez graczy: a = (a
1
, …, a
N
).
Element tego zbioru (profilu), a
i
∈
A
i
, oznacza konkretne
dokonane posunięcie (decyzję) gracza i.
Strategia dominująca to najlepsza możliwa reakcja na dowolną strategię
zastosowaną przez konkurenta. Jej logika nieuchronnie prowadzi do pogorszenia
wyniku, gdy gra ma charakter niekooperacyjny.
Teresa Kamińska Teoria gier
3
Historycznym przykładem gry niekooperacyjnej jest dylemat więźnia.
Problem decyzji aresztowanego A
D z i a ł a n i a A
D z i a ł a n i a B
Nie przyznawać się wsypać kompana
Nie przyznawać się
1 rok
10 lat
Wsypać kompana
0 lat
5 lat
Problem decyzji aresztowanego B
D z i a ł a n i a B
D z i a ł a n i a A
Nie przyznawać się wsypać kompana
Nie przyznawać się
1 rok
10 lat
Wsypać kompana
0 lat
5 lat
Gra dwuosobowa aresztowanych
D z i a ł a n i a A
D z i a ł a n i a B
Nie przyznawać się wsypać kompana
Nie przyznawać się
1 rok 1 rok
10 lat 0 lat
Wsypać kompana
0 lat 10 lat
5 lat 5 lat
Formalnie grę dwuosobową aresztowanych zapisuje się następująco: I =
{1, 2}, A={A
1
, A
2
}, A
1
= {nie przyznać się, wsypać kompana}= {NPrz, Ws} = A
2
.
Wynikiem gry są kombinacje działań obu aresztowanych, tj. a = (Ws, Ws), b =
(Ws, NPrz), c = (N Prz, Ws), d = (NPrz, Prz), a funkcje wypłat
∏
= {
π
1
,
π
2
}.
Funkcja wypłat przypisuje wartości liczbowe każdemu wynikowi. Przykładowo,
π
1
(a) = 5,
π
2
(c) = 0. Interpretacja wyników wykracza niejednokrotnie poza
zagadnienia ekonomii.
Strategie zapewniające równowagę (gry o wejście na rynek, udział w
rynku) powinny być stosowane, gdy konkurenci podejmują decyzje niezależnie
od siebie (brak zmowy). Wówczas są odzwierciedleniem optymalnej reakcji obu
graczy, czyli pozwalają one zmaksymalizować wielkość wypłaty każdego z nich
w warunkach, określonych przez wybór strategii, dokonany przez przeciwnika
(równowaga Nasha).
Teresa Kamińska Teoria gier
4
Najlepszym wynikiem, jakiego może oczekiwać gracz uczestniczący w
grze o sumie zerowej przeciwko jednakowo nastawionemu rywalowi, jest
osiągnięcie stanu równowagi. Gdyby któryś z graczy odstąpił od realizacji
strategii prowadzącej do równowagi, ograniczyłby wielkość własnych wypłat i
pozwoliłby na zwiększenie wypłat rywala.
Równowaga Nasha jest uogólnieniem równowagi Cournota, która zachodzi, gdy każda
firma maksymalizuje zyski przy danym zachowaniu drugiej firmy.
Równowagę Nasha zapisuje się następująco:
Profil (element zbioru) strategii graczy s* = (s
1
*
, …, s
N
*
) jest równowagą
Nasha w grze
Γ
S
= [I, A,
∏
], jeśli zachodzi:
∀
i
∈
I,
∀
s
i
∈
S
i
π
(s
i
*
, s
-i
*
)
≥
π
(s
i
, s
-i
*
),
Prostym przykładem gry, ilustrującej koncepcję równowagi Nasha, w której
przynajmniej dwaj gracze dokonują jednego, jednoczesnego ruchu, dotyczącego
podjęcia jednej decyzji, jest konkurencja między Hondą i Toyotą w Ameryce
Północnej pod koniec lat 90. związana z budową nowych zakładów
produkcyjnych
Gra o udział w rynku między Toyotą i Hondą
T
o
y
o
t
a
Budować nową wytwórnię Nie budować
Budować nową wytwórnię
H o n d a
Nie budować
Wartości gry są podane w mln dolarów.
Z opisanego przykładu wynika, że jeśli gracze oczekują racjonalnego
zachowania się przeciwnika, to obaj optymalizując wybór, osiągają równowagę
Nasha.
Przeciwieństwem strategii dominującej jest strategia zdominowana, która występuje,
kiedy gracz posiada strategię dającą mu wyższą wypłatę bez względu na to, jak zagra
konkurent. Gdy gracz wśród posiadanych dwóch strategii ma dominującą, to druga musi być
zdominowana; gdy posiada więcej niż dwie strategie, to znajdują się wśród nich jedynie
zdominowane. Strategie zdominowane mogą być pomocne w określeniu równowagi Nasha,
gdy żaden gracz nie posiada strategii dominującej.
Gdyby wzbogacić przykład budowy nowego zakładu przez Hondę i Toyotę o trzecią
strategię, tj. nie budować, zbudować mały zakład i zbudować duży zakład, to realizowane
zyski przedstawiałyby się następująco:
16 16 20 15
15 20 18 18
Teresa Kamińska Teoria gier
5
T o y o t a
Duży zakład Mały zakład Nie
budować
Duży zakład
0 0
12 8
18 9
Mały zakład
8 12
16 16
20 15
H
o
n
d
a
Nie budować 9 18
15 20
18 18
Powyższe wypłaty wskazują zarówno na brak strategii dominującej, jak i na
odrzucenie budowy dużego zakładu przez obu graczy bez względu na decyzję konkurenta
(strategia zdominowana). Znalezienie równowagi Nasha będzie możliwe dopiero po
wyeliminowaniu strategii pierwszej. Wówczas cokolwiek postanowi którakolwiek z firm,
druga zbuduje mały zakład (strategia dominująca).
Występowanie kilku stanów równowagi to przypadek nawet
najprostszych negocjacji, których rezultatem może być dowolny podział zysków
wskutek przyjęcia konkretnego stanu równowagi.
Firma 2
niska średnia wysoka
cena cena cena
niska
cena
1
1
1
0
1
0
średnia
cena
0
1
2
2
2
0
Firma 1
wysoka
cena
0
1
0
2
3
3
Nie można wyeliminować żadnej strategii żadnej z firm. Nie ma też strategii
dominującej. Istnieją trzy równowagi.
Teresa Kamińska Teoria gier
6
Wnioski:
1.
Jeśli w jakiejkolwiek grze obaj gracze posiadają strategię
dominującą, to stanowią one równowagę Nasha
2.
Jeśli jeden gracz posiada strategię dominującą, to ona wyznaczy
równowagę Nasha tego gracza. Równowagę Nasha drugiego
gracza wskaże najlepsza odpowiedź na strategię dominującą
pierwszego
3.
Jeśli żaden z graczy nie dysponuje strategią dominującą, lecz
obaj posiadają strategię zdominowaną, równowagę Nasha osiąga
się poprzez kolejne wyeliminowanie strategii zdominowanej obu
partnerów. Wykluczenie strategii zdominowanej upraszcza
analizę gry.
Strategie zawierające połączenie elementów konkurencji i kooperacji
(walka płci w małżeństwie), w których przedsiębiorstwa konkurują za pomocą
cen, patentów, rozbudowy potencjału produkcyjnego kooperując jednocześnie
przy tworzeniu standardów jakościowych, fuzji i barier wejścia. Istotą tych
strategii jest starcie dwóch interesów (racji) przy jednakowo sformułowanym
celu, w rezultacie powstają dwa punkty równowagi, a ewentualny wybór
następuje w procesie negocjacji.
W wielu rzeczywistych sytuacjach rywale odpowiadają
kontrposunięciami na swoje działania. W grze sekwencyjnej uczestnicy
wykonują swe ruchy po kolei (drzewo gier).
Odstraszanie od wejścia
utrzymać cenę
4, 6
wejść
obniżyć cenę
- 4, 4
nie wchodzić 0, 12
O
M
Teresa Kamińska Teoria gier
7
wejść
4, 6
utrzymać cenę
nie
wchodzić
0, 12
wejść
- 4, 4
obniżyć cenę
nie
wchodzić
0, 9
Ten problem można ująć jako skończoną grę ekstensywną, której obraz
formalny przyjmuje postać:
¾
zbiór graczy; I = {1, .., N},
¾
zbiór strategii: S = {S
1
, …, S
N
}, gdzie
każdy element S
i
= {s
i
1
,…,
s
i
ki
}jest zbiorem posunięć dostępnych dla i-tego gracza. Każdy
gracz ma potencjalnie inny ich zbiór, stąd liczba dostępnych
działań k
i
w ogólnym przypadku jest różna względem i,
¾
zbiór funkcji wypłat:
∏
= {
π
1
, …,
π
N
}, gdzie każdy element
π
i
przyporządkowuje wartość liczbową wynikowi gry. Jeśli wynik
gry oznacza strategie przyjęte przez graczy: s = (s
1
, …, s
N
).
Element tego zbioru (profilu), s
i
∈
S
i
, oznacza konkretną
strategię przyjętą przez gracza i.
¾
drzewo gry składające się z wierzchołka początkowego,
wierzchołków decyzyjnych, wierzchołków końcowych i gałęzi
łączących wierzchołek z jego następnikami,
¾
reguły określające, który gracz podejmuje decyzje w danym
wierzchołku decyzyjnym i jakie akcje są dla niego dostępne,
jaką wypłatę otrzymują gracze w danym wierzchołku
końcowym.
Niekooperacyjna gra ekstensywna
Γ
e
jest zapisywana jako
Γ
e
= [I, S,
∏].
M
O
O
Teresa Kamińska Teoria gier
8
Zatem odstraszenie od wejścia można przedstawić również jako strategię
ekstensywną. Istnienie potencjalnej konkurencji wymusza reakcję obronną
dotychczasowego monopolisty, a potencjalny konkurent musi brać ją pod
uwagę.
Potencjalny konkurent
•
pozostanie poza rynkiem
wejście
• • przedsiębiorstwo istniejące na rynku
=
2
0
I
K
π
π
wojna cenowa
przystosowanie
• •
−
−
1
3
1
2
przedsiębiorstwo istniejące na rynku
wojna cenowa przystosowanie
w e j ś ć
p o z o s t a ć
p o z a
Informacja, na której opierają się działania i strategie może być doskonała lub
niedoskonała. Gdy pomija się czas w działaniu, tj. gracze podejmują decyzje jednocześnie nie
znając stanowiska przeciwnika, to gra jest
symultaniczna, gdyż rywale dysponują
niedoskonałą informacją, lecz pełną odnośnie do reguł gry, wyników gry i wypłat im
przyporządkowanych.
Zbiorem informacyjnym
H
i
jest zbiór wierzchołków, w których gracz i podejmuje
decyzję, lecz nie ma pewności, w którym wierzchołku się znajduje.
W przypadku gry rynkowej dwóch przedsiębiorstw dotyczącej decyzji o wysokości
cen homogenicznego produktu – zgodnie z prawem popytu – konsumenci wybiorą produkt o
niższej cenie. Na rysunku drzewa gry ekstensywnej zaznaczono zbiór informacyjny firmy 2,
co odzwierciedla strukturę informacyjną gry. Dwojakiego rodzaju decyzje cenowe (niska lub
wysoka cena) są podejmowane jednocześnie, więc zachowanie konkurenta nie jest znane w
potencjalny
konkurent
-3 -1 2 1
0 2 0 2
Teresa Kamińska Teoria gier
9
momencie podejmowania decyzji przez rywala. Firma 1 ma dwie strategie
S
1
= {niska cena,
wysoka cena}. Firma 2 ma również dwie strategie S
2
= {niska cena, wysoka cena}. Każda
może wybrać dowolną strategię, lecz wypłaty są im znane. Gra spełnia warunki
gry o pełnej,
ale niedoskonałej informacji.
Firma 1
•
W N
• Firma 2 •
W N W N
• • • •
=
2
2
2
1
π
π
3
0
0
3
1
1
Alternatywą jednoczesności podejmowania decyzji jest ich sekwencyjność, czyli
zdynamizowanie tego procesu w czasie.
Jeśli reguły gry są takie same, jak w poprzednim przykładzie, a wszystkie zbiory
informacyjne są jednoelementowe i decyzje cenowe są podejmowane sekwencyjnie, to
zachowanie konkurenta jest znane w momencie podejmowania decyzji (pełna i doskonała
informacja).
Firma 1
•
W N
• Firma 2 •
W N W N
• • • •
=
2
2
2
1
π
π
3
0
0
3
1
1
Liczba strategii dostępnych każdej firmie jest niejednakowa: S
1
= {niska
cena, wysoka cena}. Firma 2 ma po dwie strategie w zależności od strategii
podjętej przez konkurenta, czyli S
2
= {niska cena, jeśli cena rywala jest niska,
Teresa Kamińska Teoria gier
10
wysoka cena, jeśli cena rywala jest niska, niska cena, jeśli cena rywala jest
wysoka, wysoka cena, jeśli cena rywala jest wysoka}.
Liczba strategii gracza i
Ψ(S
i
) wynosi:
∏
=
=
Ψ
m
k
k
i
l
S
1
)
(
,
gdzie: m – liczba zbiorów informacyjnych gracza i w grze ekstensywnej
Γ
e
H
k
– liczba dostępnych działań w danym zbiorze informacyjnym,
gdzie: k = 1,…,m oznaczana jest symbolem l
k
.
Przykład konfliktu w Zatoce Świń (1963 rok?).
CHRUSZCZOW
rozmieszczać rakiety nie rozmieszczać rakiet
KENNEDY
nie robić nic
blokada zniszczyć rakiety
CHRUSZCZOW CHRUSZCZOW
ustąpić odwet ustąpić odwet
A. Nie rozmieszczać rakiet
B. Rozmieścić rakiety. W przypadku jakiejkolwiek agresywnej reakcji
Kennedy’ego ustąpić
C. Rozmieścić rakiety. W przypadku blokady ustąpić, w przypadku zniszczenia
rakiet zastosować środki odwetowe
D. Rozmieścić rakiety. W przypadku blokady zastosować środki odwetowe, w
przypadku zniszczenia rakiet ustąpić
E. Rozmieścić rakiety. W przypadku jakiejkolwiek agresywnej reakcji
Kennedy’ego zastosować środki odwetowe.
A. Blinder przedstawił grę, której stronami są władze monetarne FED (niewybieralne,
kadencja 14 lat, a prezesów do emerytury) i politycy, którzy muszą starać się o reelekcję.
Pierwsi skłonni do polityki restrykcyjnej – drudzy do ekspansywnej. Celem gry jest
Teresa Kamińska Teoria gier
11
skłonienie przeciwnika do podjęcia decyzji, której nie chce podjąć z własnej woli. FED
preferuje nadwyżkę przychodów budżetu nad wydatkami rządowymi (brak deficytu).
Rezerwa Federalna
Restrykcyjność Bierność Ekspansywność
3
9
1
6
4
4
2
8
5
5
6
1
7
7
8
3
9
2
Politycy
Ek
spa
n
sy
wno
ść
Biern
ość
R
estry
kcyjn
ość
Teresa Kamińska Teoria gier
12
Przykładem gier z więcej niż jedną równowagą Nasha jest gra w tchórza, w której
dwóch nastolatków najeżdża na siebie samochodami po jednopasmowej drodze. Pierwszy,
który zjedzie z drogi zostaje tchórzem, drugi – bohaterem. Jeżeli obaj zjadą z drogi, to obaj
zostają tchórzami. Jeżeli żaden nie zjedzie – obaj lądują w szpitalu.
J A N E K
zjechać
nie zjechać
zjechać
1 1
1 2
I
R
E
K
nie zjechać
2 1
0 0
Nie występują strategie dominujące, lecz dwie równowagi Nasha. Ekonomistów
zawsze intrygowało poszukiwanie w życiu gospodarczym przykładów zachowań, które
odpowiadałyby postawom brawurowych graczy. Wydaje się, że najbardziej zbliżona jest
sytuacja monopolu naturalnego, w którym wysokie koszty wejścia i malejące koszty
przeciętne nie pozwalają realizować rentowności umożliwiającej funkcjonowanie na rynku
dwóch przedsiębiorstw.
Telewizja kablowa jest branżą wymagającą wysokich nakładów kapitału (kosztów
stałych) i relatywnie niskich kosztów krańcowych wraz z podłączeniem następnego
subskrybenta do odbioru programów. Zatem próg rentowności wymaga znacznej liczby
odbiorców (gospodarstw domowych). Ponieważ rynek telewizji satelitarnej w Wielkiej
Brytanii na przełomie lat 90. XX. wieku wydawał się potencjalnie ogromny, więc dwie firmy
postanowiły go podbić. Specyfikę sytuacji kształtowała odmienna, niekompatybilna
technologia obu konkurentów zniechęcająca odbiorców do opłacenia 200 funtów opłaty
wstępnej z ryzykiem braku możliwości wykorzystania sprzętu, gdyby zaszła konieczność
przestawienia się na odbiór proponowany przez inną firmę. Ponadto, firma Sky Television
planowała wziąć w leasing już krążącego w przestrzeni satelitę, a British Satellite
Broadcasting (BSB) zamierzała umieścić w przestrzeni własnego satelity, co znacznie
podnosiło jej koszty.
W tabeli zamieszczono szacunek wartości zaktualizowanej wartości netto NPV za lata
1989 – 1999 uwzględniającej koszty satelitów, oprogramowania, reklamy, sprzedaży i
kosztów administracyjnych w warunkach dwóch strategii każdej z firm (wejścia na rynek i
pozostania poza nim).
B S B
wejść nie
wchodzić
wejść
- 118 - 747
673 0
S
K
Y
nie wchodzić
0 137
0 0
Układ efektów (wypłat) wskazuje, że występuje podwójna równowaga Nasha. Teoria
gier nie podpowiada, która równowaga jest lepsza. To zależy od uwzględnienia dodatkowych
informacji (szczegółów). W opisywanym przypadku nie ma miejsca na rynku dla dwóch
przedsiębiorstw. Ze względu na opóźnienie techniczne w wystrzeleniu satelity i wysoki
poziom dziennych strat z tego tytułu doprowadziły do przejęcia BSB przez Sky. W rezultacie
od 1993 roku brytyjski rynek telewizji kablowej jest znacząco rentownym monopolem.
Teresa Kamińska Teoria gier
13
OPTYMALNA ALOKACJA ZASOBÓW W GOSPODARCE
Pareto – optymalna (efektywność alaokacyjna)
Y
MRT = MRS = P
X
/P
Y
Y
E
E
U
5
U
4
U
3
U
2
U
1
0 X
E
X
Teresa Kamińska Teoria gier
14
Zadanie
Co tydzień Polityka i Wprost muszą wybrać temat tygodnia na okładkę.
Załóżmy, że w tym tygodniu może to być zamach na przywódcę Hamasu
lub upadek polskiego rządu. Redaktorzy obu tygodników kierują się
maksymalizacją liczby czytelników, a ona jest funkcją tematu tygodnia
(macierz wypłat w mln osób)
Wybór WPROST
zamach
upadek
zamach
10 6
9 7
upadek
9 6
8 5
a) Czy Polityka ma swoją strategię dominującą, jeśli tak, to jaką?
b) Czy Wprost ma swoją strategię dominującą, jeśli tak to jaką?
c) Gdybyś był redaktorem Polityki, to który temat umieściłbyś na
okładce? Dlaczego?
d) Znając odpowiedź na pytanie c) jakiego dokonałbyś wyboru jako
redaktor Wprost?
P
O
L
I
T
Y
K
A