TEORIA GIER
Teoria gier - definiowana jako teoria podejmowania decyzji w warunkach interaktywnych (gry strategicznej) lub inaczej matematyczna teoria sytuacji konfliktowych - została stworzona przez J. von Neumanna, który stwierdził, że istota tej gry nie polega na próbie odgadnięcia intencji gracza, lecz na skrywaniu własnych zamiarów. Podstawowym założeniem teorii gier jest racjonalne działanie wszystkich podmiotów decyzyjnych (graczy).
Podstawowymi elementami każdej sytuacji, w której występuje zjawisko konkurencji są:
1. Gracze i ich posunięcia. Na rynku występuje przynajmniej dwóch graczy i ich działania inwestycyjne, marketingowe oraz produkcyjno - cenowe są wzajemnie uzależnione.
2. Wyniki i wypłaty. Działania wszystkich graczy określają wynik walki konkurencyjnej (zwany wartością gry). Każdemu możliwemu wynikowi odpowiada określona wypłata, która jest miarą stopnia osiągnięcia celu każdego z rywali; najczęściej wyrażona pieniężnie, gdy mowa o przedsiębiorstwie, a w wartościach użyteczności, gdy dotyczy konsumenta.
3. Reguły gry. Postępowaniem graczy rządzą formalne i nieformalne reguły gry. Mogą to być przepisy prawne, powszechnie uznane zasady konkurencji i nieuczciwe praktyki lub wrogie przejęcia, a także zasób wiedzy analitycznej umożliwiającej śledzenie zachowań konkurencyjnych.
Punktem wyjścia w każdej analizie konkurencji, odwołującej się do dorobku teorii gier, jest opis graczy, stosowanych przez nich strategii, rozumianych jako plan działań, uwzględniający wszystkie ewentualności oraz uzyskanych przez każdego z nich wypłat.
Walka konkurencyjna może mieć charakter jednorazowego posunięcia lub wielu działań rozłożonych w czasie (konkurencja sekwencyjna i powtarzalna).
Gry mogą występować w wersji strategicznej i ekstensywnej.
Skończoną grę strategiczną od strony formalnej można zdefiniować:
zbiór graczy: I = {1,…, N},
zbiór działań (posunięć): A = {A1, …, AN}, gdzie każdy element Ai = {ai1, …, aik} jest zbiorem posunięć dostępnych dla i-tego gracza. Każdy gracz ma potencjalnie inny ich zbiór, stąd liczba dostępnych działań, ki w ogólnym przypadku jest różna względem i,
zbiór funkcji wypłat: ∏ = {π1, …, πN}, gdzie każdy element πi przyporządkowuje wartość liczbową wynikowi gry. Jeśli wynik gry oznacza działania podjęte przez graczy: a = (a1, …, aN). Element tego zbioru (profilu), ai ∈ Ai, oznacza konkretne dokonane posunięcie (decyzję) gracza i.
Strategia dominująca to najlepsza możliwa reakcja na dowolną strategię zastosowaną przez konkurenta. Jej logika nieuchronnie prowadzi do pogorszenia wyniku, gdy gra ma charakter niekooperacyjny.
Przeciwieństwem strategii dominującej jest strategia zdominowana, która występuje, kiedy gracz posiada strategię dającą mu wyższą wypłatę bez względu na to, jak zagra konkurent.
Historycznym przykładem gry niekooperacyjnej jest dylemat więźnia.
Problem decyzji aresztowanego A
D z i a ł a n i a A |
D z i a ł a n i a B Nie przyznawać się wsypać kompana |
|
Nie przyznawać się |
1 rok |
10 lat |
Wsypać kompana |
0 lat |
5 lat |
Problem decyzji aresztowanego B
D z i a ł a n i a B |
D z i a ł a n i a A Nie przyznawać się wsypać kompana |
|
Nie przyznawać się |
1 rok |
10 lat |
Wsypać kompana |
0 lat |
5 lat |
Gra dwuosobowa aresztowanych
D z i a ł a n i a A |
D z i a ł a n i a B Nie przyznawać się wsypać kompana |
|
Nie przyznawać się |
1 rok 1 rok |
10 lat 0 lat |
Wsypać kompana |
0 lat 10 lat |
5 lat 5 lat |
Formalnie grę dwuosobową aresztowanych zapisuje się następująco: I = {1, 2}, A={A1, A2}, A1 = {nie przyznać się, wsypać kompana}= {NPrz, Ws} = A2. Wynikiem gry są kombinacje działań obu aresztowanych, tj. a = (Ws, Ws), b = (Ws, NPrz), c = (N Prz, Ws), d = (NPrz, Prz), a funkcje wypłat ∏ = {π1, π2}. Funkcja wypłat przypisuje wartości liczbowe każdemu wynikowi. Przykładowo, π1 (a) = 5, π2(c) = 0. Interpretacja wyników wykracza niejednokrotnie poza zagadnienia ekonomii.
Strategie zapewniające równowagę (gry o wejście na rynek, udział w rynku) powinny być stosowane, gdy konkurenci podejmują decyzje niezależnie od siebie (brak zmowy). Wówczas są odzwierciedleniem optymalnej reakcji obu graczy, czyli pozwalają one zmaksymalizować wielkość wypłaty każdego z nich w warunkach, określonych przez wybór strategii, dokonany przez przeciwnika (równowaga Nasha).
Najlepszym wynikiem, jakiego może oczekiwać gracz uczestniczący w grze o sumie zerowej przeciwko jednakowo nastawionemu rywalowi, jest osiągnięcie stanu równowagi. Gdyby któryś z graczy odstąpił od realizacji strategii prowadzącej do równowagi, ograniczyłby wielkość własnych wypłat i pozwoliłby na zwiększenie wypłat rywala.
Równowaga Nasha jest uogólnieniem równowagi Cournota, która zachodzi, gdy każda firma maksymalizuje zyski przy danym zachowaniu drugiej firmy.
Równowagę Nasha zapisuje się następująco:
Profil (element zbioru) strategii graczy s* = (s1*, …, sN*) jest równowagą Nasha w grze ΓS = [I, A, ∏], jeśli zachodzi:
∀i∈I,∀si ∈ Si π(si*, s-i*) ≥ π(si, s-i*).
Prostym przykładem gry, ilustrującej koncepcję równowagi Nasha, w której przynajmniej dwaj gracze dokonują jednego, jednoczesnego ruchu, dotyczącego podjęcia jednej decyzji, jest konkurencja między Hondą i Toyotą w Ameryce Północnej pod koniec lat 90. związana z budową nowych zakładów produkcyjnych
Gra o udział w rynku między Toyotą i Hondą
T o y o t a
Budować nową wytwórnię Nie budować
Budować nową wytwórnię
H o n d a
Nie budować
Wartości gry są podane w mln dolarów.
Z opisanego przykładu wynika, że jeśli gracze oczekują racjonalnego zachowania się przeciwnika, to obaj optymalizując wybór, osiągają równowagę Nasha.
Gdyby wzbogacić przykład budowy nowego zakładu przez Hondę i Toyotę o trzecią strategię, tj. nie budować, zbudować mały zakład i zbudować duży zakład, to realizowane zyski przedstawiałyby się następująco:
H o n d a |
T o y o t a |
|||
|
|
Duży zakład |
Mały zakład |
Nie budować |
|
Duży zakład |
0 0 |
12 8 |
18 9 |
|
Mały zakład |
8 12 |
16 16 |
20 15 |
|
Nie budować |
9 18 |
15 20 |
18 18 |
Powyższe wypłaty wskazują zarówno na brak strategii dominującej, jak i na odrzucenie budowy dużego zakładu przez obu graczy bez względu na decyzję konkurenta (strategia zdominowana). Znalezienie równowagi Nasha będzie możliwe dopiero po wyeliminowaniu strategii pierwszej. Wówczas cokolwiek postanowi którakolwiek z firm, druga zbuduje mały zakład (strategia dominująca).
Występowanie kilku stanów równowagi to przypadek nawet najprostszych negocjacji, których rezultatem może być dowolny podział zysków wskutek przyjęcia konkretnego stanu równowagi.
Firma 2
niska średnia wysoka
cena cena cena
Firma 1 |
niska cena |
1 1 |
1 0 |
1 0 |
|
średnia cena |
0 1 |
2 2 |
2 0 |
|
wysoka cena |
0 1 |
0 2 |
3 3 |
Nie można wyeliminować żadnej strategii żadnej z firm. Nie ma też strategii dominującej. Istnieją trzy równowagi.
Wnioski:
Jeśli w jakiejkolwiek grze obaj gracze posiadają strategię dominującą, to stanowią one równowagę Nasha
Jeśli jeden gracz posiada strategię dominującą, to ona wyznaczy równowagę Nasha tego gracza. Równowagę Nasha drugiego gracza wskaże najlepsza odpowiedź na strategię dominującą pierwszego
Jeśli żaden z graczy nie dysponuje strategią dominującą, lecz obaj posiadają strategię zdominowaną, równowagę Nasha osiąga się poprzez kolejne wyeliminowanie strategii zdominowanej obu partnerów. Wykluczenie strategii zdominowanej upraszcza analizę gry.
GRY SEKWENCYJNE
Strategie zawierające połączenie elementów konkurencji i kooperacji (walka płci w małżeństwie), to strategie w których przedsiębiorstwa konkurują za pomocą cen, patentów, rozbudowy potencjału produkcyjnego kooperując jednocześnie przy tworzeniu standardów jakościowych, fuzji i barier wejścia. Istotą tych strategii jest starcie dwóch interesów (racji) przy jednakowo sformułowanym celu, w rezultacie powstają dwa punkty równowagi, a ewentualny wybór następuje w procesie negocjacji.
W wielu rzeczywistych sytuacjach rywale odpowiadają kontrposunięciami na swoje działania. W grze sekwencyjnej uczestnicy wykonują swe ruchy po kolei (drzewo gier).
Odstraszanie od wejścia
utrzymać cenę 4, 6
wejść
obniżyć cenę - 4, 4
nie wchodzić 0, 12
wejść 6, 4
utrzymać cenę
nie wchodzić
12, 0
wejść 4, - 4
obniżyć cenę
nie wchodzić 9, 0
Ten problem można ująć jako skończoną grę ekstensywną, której obraz formalny przyjmuje postać:
zbiór graczy; I = {1, .., N},
zbiór strategii: S = {S1, …, SN}, gdzie każdy element Si = {si1,…, siki}jest zbiorem posunięć dostępnych dla i-tego gracza. Każdy gracz ma potencjalnie inny ich zbiór, stąd liczba dostępnych działań ki w ogólnym przypadku jest różna względem i,
zbiór funkcji wypłat: ∏ = {π1, …, πN}, gdzie każdy element πi przyporządkowuje wartość liczbową wynikowi gry. Jeśli wynik gry oznacza strategie przyjęte przez graczy: s = (s1, …, sN). Element tego zbioru (profilu), si ∈ Si, oznacza konkretną strategię przyjętą przez gracza i.
drzewo gry składające się z wierzchołka początkowego, wierzchołków decyzyjnych, wierzchołków końcowych i gałęzi łączących wierzchołek z jego następnikami,
reguły określające, który gracz podejmuje decyzje w danym wierzchołku decyzyjnym i jakie akcje są dla niego dostępne, jaką wypłatę otrzymują gracze w danym wierzchołku końcowym.
Niekooperacyjna gra ekstensywna Γe jest zapisywana jako Γe = [I, S, ∏].
Zatem odstraszenie od wejścia można przedstawić również jako strategię ekstensywną. Istnienie potencjalnej konkurencji wymusza reakcję obronną dotychczasowego monopolisty, a potencjalny konkurent musi brać ją pod uwagę.
Potencjalny konkurent
•
pozostanie poza rynkiem
wejście
• • Przedsiębiorstwo istniejące na rynku
wojna cenowa
przystosowanie
• •
przedsiębiorstwo istniejące na rynku
wojna cenowa przystosowanie
w e j ś ć
p o z o s t a ć
p o z a
DOSKONAŁA I NIEDOSKONAŁA INFORMACJA
Informacja, na której opierają się działania i strategie może być doskonała lub niedoskonała. Gdy pomija się czas w działaniu, tj. gracze podejmują decyzje jednocześnie nie znając stanowiska przeciwnika, to gra jest symultaniczna, gdyż rywale dysponują niedoskonałą informacją, lecz pełną odnośnie do reguł gry, wyników gry i wypłat im przyporządkowanych.
Zbiorem informacyjnym Hi jest zbiór wierzchołków, w których gracz i podejmuje decyzję, lecz nie ma pewności, w którym wierzchołku się znajduje.
W przypadku gry rynkowej dwóch przedsiębiorstw dotyczącej decyzji o wysokości cen homogenicznego produktu - zgodnie z prawem popytu - konsumenci wybiorą produkt o niższej cenie. Na rysunku drzewa gry ekstensywnej zaznaczono zbiór informacyjny firmy 2, co odzwierciedla strukturę informacyjną gry. Dwojakiego rodzaju decyzje cenowe (niska lub wysoka cena) są podejmowane jednocześnie, więc zachowanie konkurenta nie jest znane w momencie podejmowania decyzji przez rywala. Firma 1 ma dwie strategie S1 = {niska cena, wysoka cena}. Firma 2 ma również dwie strategie S2 = {niska cena, wysoka cena}. Każda może wybrać dowolną strategię, lecz wypłaty są im znane. Gra spełnia warunki gry o pełnej, ale niedoskonałej informacji.
Firma 1
•
W N
• Firma 2 •
W N W N
• • • •
Alternatywą jednoczesności podejmowania decyzji jest ich sekwencyjność, czyli zdynamizowanie tego procesu w czasie.
Jeśli reguły gry są takie same, jak w poprzednim przykładzie, a wszystkie zbiory informacyjne są jednoelementowe i decyzje cenowe są podejmowane sekwencyjnie, to zachowanie konkurenta jest znane w momencie podejmowania decyzji (pełna i doskonała informacja).
Firma 1
•
W N
• Firma 2 •
W N W N
• • • •
Liczba strategii dostępnych każdej firmie jest niejednakowa: S1 = {niska cena, wysoka cena}. Firma 2 ma po dwie strategie w zależności od strategii podjętej przez konkurenta, czyli S2 = {niska cena, jeśli cena rywala jest niska, wysoka cena, jeśli cena rywala jest niska, niska cena, jeśli cena rywala jest wysoka, wysoka cena, jeśli cena rywala jest wysoka}.
Liczba strategii gracza i Ψ(Si) wynosi:
,
gdzie: m - liczba zbiorów informacyjnych gracza i w grze ekstensywnej Γe
Hk - liczba dostępnych działań w danym zbiorze informacyjnym,
gdzie: k = 1,…,m oznaczana jest symbolem lk.
GRA W TCHÓRZA
Przykładem gier z więcej niż jedną równowagą Nasha jest gra w tchórza, w której dwóch nastolatków najeżdża na siebie samochodami po jednopasmowej drodze. Pierwszy, który zjedzie z drogi zostaje tchórzem, drugi - bohaterem. Jeżeli obaj zjadą z drogi, to obaj zostają tchórzami. Jeżeli żaden nie zjedzie - obaj lądują w szpitalu.
I R E K |
J A N E K |
||
|
zjechać |
zjechać |
nie zjechać |
|
|
1 1 |
1 2 |
|
nie zjechać |
2 1 |
0 0 |
Nie występują strategie dominujące, lecz dwie równowagi Nasha. Ekonomistów zawsze intrygowało poszukiwanie w życiu gospodarczym przykładów zachowań, które odpowiadałyby postawom brawurowych graczy. Wydaje się, że najbardziej zbliżona jest sytuacja monopolu naturalnego, w którym wysokie koszty wejścia i malejące koszty przeciętne nie pozwalają realizować rentowności umożliwiającej funkcjonowanie na rynku dwóch przedsiębiorstw.
Telewizja kablowa jest branżą wymagającą wysokich nakładów kapitału (kosztów stałych) i relatywnie niskich kosztów krańcowych wraz z podłączeniem następnego subskrybenta do odbioru programów. Zatem próg rentowności wymaga znacznej liczby odbiorców (gospodarstw domowych). Ponieważ rynek telewizji satelitarnej w Wielkiej Brytanii na przełomie lat 90. XX. wieku wydawał się potencjalnie ogromny, więc dwie firmy postanowiły go podbić. Specyfikę sytuacji kształtowała odmienna, niekompatybilna technologia obu konkurentów zniechęcająca odbiorców do opłacenia 200 funtów opłaty wstępnej z ryzykiem braku możliwości wykorzystania sprzętu, gdyby zaszła konieczność przestawienia się na odbiór proponowany przez inną firmę. Ponadto, firma Sky Television planowała wziąć w leasing już krążącego w przestrzeni satelitę, a British Satellite Broadcasting (BSB) zamierzała umieścić w przestrzeni własnego satelity, co znacznie podnosiło jej koszty.
W tabeli zamieszczono szacunek wartości zaktualizowanej wartości netto NPV za lata 1989 - 1999 uwzględniającej koszty satelitów, oprogramowania, reklamy, sprzedaży i kosztów administracyjnych w warunkach dwóch strategii każdej z firm (wejścia na rynek i pozostania poza nim).
S K Y |
B S B |
||
|
|
Wejść |
nie wchodzić |
|
wejść |
- 118 - 747 |
673 0 |
|
nie wchodzić |
0 137 |
0 0 |
Układ efektów (wypłat) wskazuje, że występuje podwójna równowaga Nasha. Teoria gier nie podpowiada, która równowaga jest lepsza. To zależy od uwzględnienia dodatkowych informacji (szczegółów). W opisywanym przypadku nie ma miejsca na rynku dla dwóch przedsiębiorstw. Ze względu na opóźnienie techniczne w wystrzeleniu satelity i wysoki poziom dziennych strat z tego tytułu doprowadziły do przejęcia BSB przez Sky. W rezultacie od 1993 roku brytyjski rynek telewizji kablowej jest znacząco rentownym monopolem.
Przykład konfliktu w Zatoce Świń.
CHRUSZCZOW
rozmieszczać rakiety nie rozmieszczać rakiet
KENNEDY
nie robić nic
blokada zniszczyć rakiety
CHRUSZCZOW CHRUSZCZOW
ustąpić odwet ustąpić odwet
A. Nie rozmieszczać rakiet
B. Rozmieścić rakiety. W przypadku jakiejkolwiek agresywnej reakcji Kennedy'ego ustąpić
C. Rozmieścić rakiety. W przypadku blokady ustąpić, w przypadku zniszczenia rakiet zastosować środki odwetowe
D. Rozmieścić rakiety. W przypadku blokady zastosować środki odwetowe, w przypadku zniszczenia rakiet ustąpić
E. Rozmieścić rakiety. W przypadku jakiejkolwiek agresywnej reakcji Kennedy'ego zastosować środki odwetowe.
A. Blinder przedstawił grę, której stronami są władze monetarne FED (niewybieralne, kadencja 14 lat, a prezesów do emerytury) i politycy, którzy muszą starać się o reelekcję. Pierwsi skłonni do polityki restrykcyjnej - drudzy do ekspansywnej. Celem gry jest skłonienie przeciwnika do podjęcia decyzji, której nie chce podjąć z własnej woli. FED preferuje nadwyżkę przychodów budżetu nad wydatkami rządowymi (brak deficytu).
Rezerwa Federalna
Restrykcyjność Bierność Ekspansywność
3
9
|
1
6 |
4
4 |
2
8
|
5
5 |
6
1 |
7
7
|
8
3 |
9
2 |
GRY Z NATURĄ
Gra ekonomiczna nie zawsze musi oznaczać rywalizację/współpracę ze świadomie dokonującymi wyboru podmiotami. Często jest tak, że o powodzeniu przedsięwzięcia decydują okoliczności niezależne od podmiotów rynkowych, np. pogoda w działalności turystycznej.
Zasady (wybrane), według których może postąpić gracz, wybierając strategię w grze z naturą:
zasada maksiminu (reguła Walda),
zasada minimaksu (reguła Savage'a),
wskaźnik pesymizmu-optymizmu (reguła Hurwicza),
zasada równych prawdopodobieństw (reguła Laplace'a-Bayesa).
OPTYMALNA ALOKACJA ZASOBÓW W GOSPODARCE
Pareto - optymalna (efektywność alaokacyjna)
Y
MRT = MRS = PX/PY
YE E
U5
U4
U3
U2
U1
0 XE X
1
16 16 20 15
15 20 18 18
M
O
O
M
O
-3 -1 2 1
0 2 0 2
potencjalny konkurent
Politycy
Ekspansywność Bierność Restrykcyjność