Ekonomia menedżerska wykład 7


Ekonomia Menedżerska - wykład 7. Podstawy teorii gier

Rozwój teorii gier i jej zasady wykorzystywane we współczesnej ekonomii zostały opracowane w XX w. John von Neumann (1903-1957) był twórcą ogólnych zasad gier sekwencyjnych. Według Neumanna, istota gry polega na ukrywaniu własnych zamiarów uczestników, a nie na odgadywaniu intencji (posunięć) przeciwników. Neumann wraz z Oskarem Morgensternem (1902-1977) starali się udowodnić kardynalną teorię użyteczności, dzięki określeniu wszystkich możliwych do uzyskania wypłat przy założeniu możliwości ich transferowania. Ich wkładem w teorię gier było także sformułowanie zasady minimaksu.

Teorię gier analizowali również: John Nash (laureat ekonomicznego Nobla w 1994 r.), William Vickrey i James Mirless (laureaci ekonomicznego Nobla w 1996 r.), Robert Aumann i Thomas Schelling (laureaci ekonomicznego Nobla w 2005 r.), Leonid Hurwicz, Roger Myerson i Eric Maskin (laureaci ekonomicznego Nobla w 2007 r.).

W analizie wielu zachowań społecznych i gospodarczych można posłużyć się matematyczną teorią konfliktu i kooperacji, zwaną TEORIĄ GIER. W tym ujęciu, GRA jest pojęciem szerszym niż w języku potocznym i oznacza dowolną sytuację konfliktową.

O grze można mówić, gdy wystąpi w niej przynajmniej dwóch uczestników. Liczba graczy (uczestników) stanowi istotną cechę gry, gdyż przy większej niż dwóch liczbie graczy istnieje możliwość zmów. Graczem może być pojedyncza osoba, grupa osób, przedsiębiorstwo.

Gry różnią się między sobą:

W części gier gracze muszą dokonywać wyborów (podejmować decyzje), nie znając w pełni sytuacji. Wiedza graczy o sytuacji jest niekompletna lub całkowicie niedostępna (występuje zjawisko asymetrii informacji).

Opis gry powinien zawierać wykaz stanów końcowych, z którymi każdy z uczestników (graczy) może spotkać się po zakończeniu gry. Każda z tych sytuacji prowadzi zaś do określonych konsekwencji dla wszystkich uczestników gry. - WYPŁAT. Najczęstszą formą wypłaty są pieniądze, gdy mowa o przedsiębiorstwie lub wartości użyteczności - w przypadku klientów.

Każdy z uczestników gry (GRACZ) wybiera pewną STRATEGIĘ postepowania, opisującą jakie kroki będzie podejmować w każdej możliwej sytuacji, a ostateczny wynik działania zależy nie tylko od jego własnych decyzji, ale i od strategii pozostałych uczestników gry. Wszystkim możliwym wynikom gry przyporządkowywane są określone wartości liczbowe, nazywane WYPŁATAMI. Teoria gier bada, jakie decyzje powinni podejmować racjonalnie zachowujący się gracze, dążący do osiągnięcia najlepszego dla siebie wyniku (np. zysku, użyteczności).

Grę pomiędzy dwoma uczestnikami można przedstawić w postaci tabeli, zwanej MACIERZĄ WYPŁAT.

Rysunek. Macierz wypłat

GRACZ B

STRATEGIA E

STRATEGIA F

GRACZ A

STRATEGIA C

a,b

c,d

STRATEGIA D

e,f

g,h

a, c, e, g - wypłaty dla gracza A

b, d, f, h - wypłaty dla gracza B

Wiersze reprezentują strategie gracza A, kolumny - gracza B. W komórkach tabeli przedstawiono możliwe wyniki. Każdy wynik reprezentuje para liczb, z których pierwsza oznacza wypłatę dla gracza A, druga - dla gracza B. każdy z graczy wybiera strategię, która zapewnia mu osiągnięcie najlepszej wypłaty, w zależności od decyzji przeciwnika. Przy założeniu, że obu graczom zależy na maksymalizacji wyniku, optymalne strategie przedstawiają się w następujący sposób:

  1. Decyzje GRACZA A

    1. Jeżeli gracz B wybierze strategię E, gracz A powinien wybrać:

- strategię C, jeżeli a > e,

- strategię D, jeżeli e > a,

    1. Jeżeli gracz B wybierze strategię F, gracz A powinien wybrać:

- strategię C, jeżeli c > g,

- strategię D, jeżeli g > c,

  1. Decyzje GRACZA B

    1. Jeżeli gracz A wybierze strategię C, gracz B powinien wybrać:

- strategię E, jeżeli b > d,

- strategię F, jeżeli d > b,

    1. Jeżeli gracz A wybierze strategię D, gracz B powinien wybrać:

- strategię E, jeżeli f > h,

- strategię F, jeżeli h > f.

W sytuacji, gdy gracz A zawsze wybiera strategię C, niezależnie od tego, co zrobi przeciwnik (gracz B), czyli gdy a > e i c > g, taka strategia nosi nazwę DOMINUJĄCEJ. Podobnie, gracz B może mieć strategię dominującą, jeżeli istnieje strategia lepsza od innej bez względu na decyzję gracza A. W danej grze uczestnicy nie muszą mieć jednak strategii dominującej.

Biorąc pod uwagę kryterium sumy wypłat uczestników, wyróżnia się dwa typy gier:

Biorąc pod uwagę kryterium ilości informacji, którą dysponują gracze, można wyróżnić następujące rodzaje gier:

Gry można podzielić również, biorąc pod uwagę liczbę możliwych strategii, którymi mogą posługiwać się gracze. Wówczas wyróżnić można:

Zgodnie z teorią gier, nie jest celem rozpatrywanie problemów, co jest lepsze (wygrana czy przegrana, zdrada czy uczciwość) - takie rozstrzygnięcia pozostawia się graczowi. Przedmiotem gry jest określenie, co ludzie cenią wyżej (wygraną czy przegraną). W teorii gier zakłada się, iż każdy z graczy ma określone preferencje co do wyniku uzyskanego z gry, który może być mierzony.

Jednym z klasycznych problemów rozpatrywanych przez teorię gier jest DYLEMAT (PARADOKS) WIĘŹNIA. Gra została wymyślona przez Melvina Dreshera i Merilla Flooda w 1950, a sformułowana została przez Alberta Tuckera.

Przykładowa treść gry Dylemat Więźnia

Policja złapała dwóch przestępców. Nie można im było udowodnić poważnych przestępstw, a jedynie drobne przewinienia, za które sąd wymierzyłby maksymalną karę jednego roku więzienia dla każdego z przestępców. Przestępcy zostali osadzeni w oddzielnych celach. Każdy z nich dostał następują „propozycję” od policji: „Jeżeli się przyznasz i pomożesz organom ścigania - zostaniesz puszczony wolno, ale twój wspólnik zostanie skazany przez sąd na 20 lat więzienia. Jeżeli twój wspólnik (podobnie jak ty) postanowi zeznawać, to obaj spędzicie w więzieniu po 8 lat każdy, gdyż uniknie się kosztownego postępowania dowodowego. Jeżeli żaden z was nic nie powie, dostaniecie po roku więzienia za drobne przewinienia. Twojemu partnerowi zostały przedstawione takie same warunki.

Grę dylemat więźnia można przedstawić za pomocą poniższej macierzy wypłat możliwych do uzyskania wyników przy zastosowaniu danej strategii postępowania.

WIĘZIEŃ A

milczeć

zeznawać

WIĘZIEŃ B

milczeć

1 1

20 0

zeznawać

0 20

8 8

Liczby macierzy oznaczają możliwe wypłaty (długość wyroku) dla każdego z graczy (więźniów) w zależności od tego, jaką podejmą decyzję (milczeć czy zeznawać). W grze możliwe są cztery rozwiązania (wypłaty), które odpowiadają czterem polom w macierzy. Liczba umieszczona w polu macierzy po lewej stronie oznacza wypłatę (wyrok) dla więźnia A, liczba po prawej stronie - wypłatę (wyrok) dla więźnia B.

Wypłaty należy interpretować w następujący sposób:

W przypadku obu graczy (więźniów) strategią dominującą będzie „zeznawać”, a zdominowaną „milczeć”. Pole w macierzy, w którym obaj gracze realizują swoje strategie dominujące, określane jest mianem RÓWNOWAGI NASHA.

W tej grze jest to pole z wypłatami (wyrokami) po 8 lat dla każdego z graczy (więźniów). Równowaga ta jest stabilna, gdyż jakakolwiek zmiana strategii przez danego gracza prowadzi do gorszej wypłaty niż istniejąca.

Równowaga Nasha nazywamy taką parę strategii graczy, dla której żaden z nich nie może zyskać przez zmianę swojej strategii podczas gdy drugi gracz swojej nie zmieni. W stanie równowagi, każdy z graczy wybiera strategią, która jest najlepszą odpowiedzią na wybory innych graczy.

Należy podkreślić, że równowaga w ujęciu Nasha nie zawsze oznacza sytuację najlepszą, analizując pod względem KRYTERIUM PARETO. Równowaga w ujęciu Pareto występuje, gdy żaden z graczy nie może poprawić swojej sytuacji bez pogarszania sytuacji pozostałych uczestników gry. W powyżej analizowanym przypadku optimum Pareto występuje w przypadku przyjęcia strategii milczenia przez obu więźniów. Wówczas każdy z nich dostaje wyrok jednego roku więzienia. Jednakże taka równowaga jest niestabilna, ponieważ każdy z graczy może poprawić swoją sytuację (zeznając).

Podsumowując, dylemat więźnia jest grą:

Dylemat więźnia można wykorzystać w decyzjach podejmowanych przez menedżerów i może to być wybór między uczciwością a oszustwem w stosunku do partnera.

Przykład kartelu

Dwie firmy stworzyły kartel, który przynosi łączne zyski wynoszące 6 mln zł (każda z firm uzyskuje zysk z tego tytułu równy 3 mln zł). Menedżerowie obu przedsiębiorstw wiedzą, że jeżeli partner (rywal) zostanie wierny tej nielegalnej umowie, a on nie , to jego zyski wzrosną do poziomu 3,5 mln zł, a partnera (rywala) spadną do 1,5 mln zł. Jeżeli oba przedsiębiorstwa będą wobec siebie nielojalne (zaczną oszukiwać partnera kartelu), to ich łączne zyski spadną do poziomu 4 mln zł (po 2 mln zł dla każdego z przedsiębiorstw).

Macierz wypłat

FIRMA A

oszukać partnera

pozostać wiernym

FIRMA B

oszukać partnera

2 2

3,5 1,5

pozostać wiernym

1,5 3,5

3 3

Największy zysk osiągną obie firmy, jeżeli będą pozstępowały zgodnie z umową (zmową). Najniższy - gdy zaczną oszukiwać się wzajemnie. Jednakże równowaga będzie miała miejsce w sytuacji, gdy oba przedsiębiorstwa dostrzegą możliwość zwiększania swojego zysku dzięki nielojalności wobec partnera kartelu.

Innym przykładem gry może być gra, w której występuje więcej niż jeden stan równowagi.

Przykład korporacji Alfa i Beta

Dwie korporacje, Alfa i Beta, zamierzają rozpocząć działalność w pewnym kraju. Rynek ten jest jednak zbyt mały, by obie mogły w nim funkcjonować, osiągając zyski. Jeżeli obie korporacje zdecydują się wejść na ten rynek, poniosą straty w wysokości 2 mln $ każda. Jeżeli któraś firma rozpocznie działalność, a jej rywal wycofa się z planów wejścia na ten rynek, wówczas zarobi 4 mln $. Czy występuje równowaga Nasha? Czy firmy posiadają strategie dominujące?

BETA

wejść na rynek

nie wejść na rynek

ALFA

wejść na rynek

-2 -2

4 0

nie wejść na rynek

0 4

0 0

Rozwiązanie

BETA

wejść na rynek

nie wejść na rynek

ALFA

wejść na rynek

-2 -2

4 0

nie wejść na rynek

0 4

0 0

W grze występują dwa stany równowagi Nasha. Żadna z firm nie ma strategii dominującej - decyzje każdej z nich zależą od tego, co zrobi konkurent.

Innym rodzajem gry jest sytuacja, w której gracze mogą podejmować decyzje nie jednocześnie (symultanicznie), lecz sekwencyjnie, jeden po drugim. Taką grę można przedstawić w postaci drzewa, w którym kolejne węzły decyzyjne prezentują decyzje podejmowane na przemian przez poszczególnych graczy. Analizę optymalnych strategii prowadzi się metodą indukcji wstecznej (od końca). Każdy gracz antycypuje reakcję swego konkurenta na swe posunięcia i wybiera tę strategię, która zapewnia mu największą wypłatę.

Przykład. Liberalizacja rynku monopolistycznego

Po zliberalizowaniu rynku monopolistycznego, nowa firma (zwana przybyszem) zastanawia się nad wejściem na rynek. Jeżeli nie wejdzie, dotychczasowy monopolista (przedsiębiorstwo zasiedziałe) zachowa dotychczasowe zyski równe 20 mln zł. Jeżeli przybysz wejdzie, zasiedziała firma może utrzymać dotychczasową cenę produktu, skutkiem czego jego zyski zmniejszą się do 15 mln zł, a przybysz uzyska zysk równy 10 mln zł. Alternatywną strategią dla firmy zasiedziałej jest obniżenie ceny w celu zapobieżenia przejęcia części rynku przez przybysza. W takiej sytuacji zarobi ono 12 mln z. a przybysz poniesie stratę 10 mln zł. Jaką decyzję powinien podjąć przybysz?

utrzymuje cenę

wynik: (10 , 15)

Firma zasiedziała

wchodzi

Przybysz

obniża cenę

wynik: (-10 , 12)

nie wchodzi

wynik: (0 , 20)

Rysowanie drzewa decyzyjnego rozpoczyna się od węzła reprezentującego krok przybysza. Jeżeli przybysz wejdzie na rynek, kolejną decyzję podejmuje dotychczasowy monopolista. Przy węzłach końcowych umieszczono wielkość zysków - pierwsza liczba z każdej pary oznacza wynik przybysza, druga - firmy zasiedziałej.

utrzymuje cenę

wynik: (10 , 15)

Firma zasiedziała

wchodzi

Przybysz

obniża cenę

wynik: (-10 , 12)

nie wchodzi

wynik: (0 , 20)

Rozumowanie przybysza jest następujące: jeżeli wejdzie na rynek, jego konkurent (firma zasiedziała) mając do wyboru wynik finansowy 15 mln zł lub 12 mln zł, zdecyduje się na większy zysk, a więc utrzyma cenę na dotychczasowym poziomie. Można więc wyeliminować środkową gałąź drzewa (obniżenie ceny przez firmę zasiedziałą). Teraz przybysz decyduje czy wejść na rynek i osiągnąć zysk na poziomie 10 mln zł, czy zrezygnować z wejścia, co oznacza brak zysków.

Stąd, najlepszym rozwiązaniem dla przybysza jest wejść na rynek.

Kolejnymi przykładami zastosowania teorii gier mogą być:

Przykład producenta letniej odzieży sportowej (kryterium pesymizmu Walda)

Firma wytwarzająca letnią odzież sportową ma podjąć decyzję co do wielkości produkcji. Popyt na wyroby uzależniony jest od pogody, której nie da się przewidzieć, a wielkość produkcji trzeba określić odpowiednio wcześniej. Menedżer zna średnie ceny rynkowe, ma doświadczenie w kształtowaniu popytu i może oszacować wielkość zysków lub strat spowodowanych zmianami pogody. Na podstawie zdobytej wiedzy sporządza macierz wypłat.

Poziom produkcji

Wynik finansowy, w zależności od pogody

lato upalne

lato ciepłe

lato zimne

wysoka (W1)

60000

20000

-40000

średnia (W2)

40000

30000

-20000

niska (W3)

20000

20000

5000

Z powyższej macierzy wypłat można wywnioskować, że producent powinien przyjąć wariant produkcji na poziomie minimalnym (produkcja niska - W3), gdyż tylko w przypadku tej strategii nie ponosi strat. Decydent myśląc pesymistycznie, zakłada, że natura jest złośliwa i aura przybierze stan najgorszy z możliwych dla producenta letniej odzieży sportowej (zimne lato). Zastosowanie reguły największego bezpieczeństwa wskazuje na przyjęcie wariantu, który gwarantuje możliwą najmniejszą stratę lub najwyższy minimalny zysk.

Przykład producenta letniej odzieży sportowej (kryterium Hurwicza)

Firma wytwarzająca letnią odzież sportową ma podjąć decyzję co do wielkości produkcji. Popyt na wyroby uzależniony jest od pogody, której nie da się przewidzieć, a wielkość produkcji trzeba określić odpowiednio wcześniej. Menedżer zna średnie ceny rynkowe, ma doświadczenie w kształtowaniu popytu i może oszacować wielkość zysków lub strat spowodowanych zmianami pogody. Na podstawie zdobytej wiedzy sporządza macierz wypłat.

Poziom produkcji

Wynik finansowy, w zależności od pogody

lato upalne

lato ciepłe

lato zimne

wysoka (W1)

60000

20000

-40000

średnia (W2)

40000

30000

-20000

niska (W3)

20000

20000

5000

Rozwiązanie tego samego problemu, przy wykorzystaniu kryterium Hurwicza przedstawia się w sposób następujący.

Menedżer nie ma podstaw do przyjmowania postawy skrajnie pesymistycznej, ponieważ wszystko dzieje się w warunkach niepewności i może on również przyjąć postawę skrajnie optymistyczną. Określa się wówczas współczynnik optymizmu-pesymizmu. Możliwe poziomy wypłat (w tym przypadku zysku) zamienia się na wartość z przedziału [0,1], gdzie wartość jeden przypisuje się najwyższej możliwej do osiągnięcia wypłacie (w tym przypadku 60000 tys. zł), a zero - najniższej wypłacie (tutaj, najwyższej stracie -40000 tys. zł. Pewna korzyść 5000 tys. zł przyjmie na tej skali wartość 0,45 i będzie stanowić jednocześnie wartość współczynnika optymizmu. Współczynnik pesymizmu będzie równy 0,55 (1-współczynnik optymizmu).

W1 = 60000 x 0,45 + (-40000) x 0,55 = 5000 tys. zł,

W2 = 40000 x 0,45 + (-20000) x 0,55 = 7000 tys. zł,

W3 = 20000 x 0,45 + 5000 x 0,55 = 11750 tys. zł.

Analizując powyższe, menedżer powinien przyjąć wariant trzeci, który zapewni mu najwyższy zysk bez względu na pogodę.

Przykład producenta letniej odzieży sportowej (kryterium Savage'a)

Firma wytwarzająca letnią odzież sportową ma podjąć decyzję co do wielkości produkcji. Popyt na wyroby uzależniony jest od pogody, której nie da się przewidzieć, a wielkość produkcji trzeba określić odpowiednio wcześniej. Menedżer zna średnie ceny rynkowe, ma doświadczenie w kształtowaniu popytu i może oszacować wielkość zysków lub strat spowodowanych zmianami pogody. Na podstawie zdobytej wiedzy sporządza macierz wypłat.

Poziom produkcji

Wynik finansowy, w zależności od pogody

lato upalne

lato ciepłe

lato zimne

wysoka (W1)

60000

20000

-40000

średnia (W2)

40000

30000

-20000

niska (W3)

20000

20000

5000

Kryterium Savage'a, określane mianem reguły najmniejszego zawodu, stanowi różnicę między korzyścią oczekiwaną a tą, którą mógłby uzyskać menedżer, gdyby znał z góry stan pogody (jaki wariant wypłaty wystąpi). Metoda polega na analizie utraconych korzyści czyli odejmowaniu od najwyższej możliwej korzyści przy danym stanie pogody tej, którą uzyska w danym wariancie.

Poziom produkcji

Wynik finansowy, w zależności od pogody

lato upalne

lato ciepłe

lato zimne

wysoka (W1)

60000 - 60000 = 0

30000 - 20000 = 10000

5000 - (-40000) = 45000

średnia (W2)

60000 - 40000 = 20000

30000 - 30000 = 0

5000 - (-20000) = 25000

niska (W3)

60000 - 20000 = 40000

30000 - 20000 = 10000

5000 - 5000 = 0

Menedżer, przy podejmowaniu decyzji, musi porównać wartości największych „zawodów”, jakie go spotkają w przypadku poszczególnych działań (wyboru poszczególnego poziomu produkcji). Sytuacja przedstawia się w sposób następujący:

Najmniejszy zawód spotka menedżera, kiedy wybierze produkcję na poziomie średnim (W2).

Przykład producenta letniej odzieży sportowej (kryterium Laplance'a)

Firma wytwarzająca letnią odzież sportową ma podjąć decyzję co do wielkości produkcji. Popyt na wyroby uzależniony jest od pogody, której nie da się przewidzieć, a wielkość produkcji trzeba określić odpowiednio wcześniej. Menedżer zna średnie ceny rynkowe, ma doświadczenie w kształtowaniu popytu i może oszacować wielkość zysków lub strat spowodowanych zmianami pogody. Na podstawie zdobytej wiedzy sporządza macierz wypłat.

Poziom produkcji

Wynik finansowy, w zależności od pogody

lato upalne

lato ciepłe

lato zimne

wysoka (W1)

60000

20000

-40000

średnia (W2)

40000

30000

-20000

niska (W3)

20000

20000

5000

Analizowaną sytuację można rozpatrzeć również za pomocą reguły Laplance'a (kryterium braku dostatecznej racji). Metoda ta zakłada, że prawdopodobieństwo wystąpienia któregokolwiek z analizowanych w zadaniu stanów pogody wynosi zawsze jedną trzecią (może wystąpić lato upalne, lato ciepłe, lato zimne). Następnie należy pomnożyć oczekiwane korzyści przez współczynnik prawdopodobieństwa (w tym przypadku 1/3) i wybrać wariant, w którym wystąpi najwyższa wartość.

W1: 60000 x 1/3 +20000 x 1/3 + (-40000) x 1/3 = 13333,33 tys. zł,

W1: 40000 x 1/3 +30000 x 1/3 + (-20000) x 1/3 = 16666,67 tys. zł,

W1: 20000 x 1/3 +20000 x 1/3 + 5000 x 1/3 = 15000,00 tys. zł.

Na podstawie przeprowadzonych obliczeń należy wybrać wariant drugi (średnia produkcja W2), gdyż wartość oczekiwana w przypadku tego wariantu jest najwyższa.

UWAGA: Wykonanie obliczeń różnymi metodami nie daje jednoznacznej odpowiedzi. Można stwierdzić, że wykonane obliczenia jedynie ułatwiają podjęcie decyzji, czy podpowiadają możliwe zachowanie, ale to sam menedżer musi dokonać ostatecznego wyboru.



Wyszukiwarka

Podobne podstrony:
EKONOMIA MENEDŻERSKA wykłady Sylabus 1202 2013 r WSM
EKONOMIA MENEDŻERSKA, Ekonomia menedżerska wykłady
EKONOMIA MENEDŻERSKA wykłady Sylabus 1202 2013 r WSM
Ekonomia menedzerska wyklady dodatkowe id 155947
Ekonomia menedżerska wykłady
EKONOMIA MENEDŻERSKA wykłady Sylabus9 03 2009 r, Ekonomia menedżerska, Gruchelski
EKONOMIA MENEDŻERSKA wykłady Sylabus 1202 2013 r WSM
Wprowadzenie do ekonomii menedżerskiej wykład nr 1
EKONOMIA MENADŻERSKA notatki z wykładów, ekonomia menedżerska
20 (poprawka) Wykład - Prawo Handlowe, ● STUDIA EKONOMICZNO-MENEDŻERSKIE (SGH i UW), prawo handlowe
Opracowanie wykładu Mikroekonomia II, ● STUDIA EKONOMICZNO-MENEDŻERSKIE (SGH i UW), mikroekonomia
Prognozowanie i Symulacje - Wyklady - Jankiewicz-Siwek - 2003 (25), ● STUDIA EKONOMICZNO-MENEDŻERSKI
wykłady EKONOMIA MENEDŻERSKA
WYKLADY ekonomia matematyczna cz1, ● STUDIA EKONOMICZNO-MENEDŻERSKIE (SGH i UW), ekonomia matematycz
DECYZJE PRODUKCYJNE wykład 4 ekonomia menedżerska
Wykład 3 ekonomia menedżerska

więcej podobnych podstron