Wyklad dylemat wiŚÖ Śnia


Teoria Decyzji
Wykład 11
Dwuosobowe gry kooperacyjne - Dylemat eksploatacji zasobów.
Dylemat więznia.
Na poprzednim wykładzie omawialiśmy własności gier nieściśle konkurencyjnych na
przykładzie walki płci. Innym przykładem gry o sumie niezerowej jest gra znana pod nazwą
dylematu więznia. Państwo zapoznali się z nią na wykładach ubiegłorocznych. Macierz
wypłat tej gry mo\e wyglądać następująco:
(9, 9) (0, 10)
ł łł
ł śł
(10, 0) (1, 1)
ł ł
Ró\norodne problemy rzeczywiste prowadzą do takiej macierzy wypłat. Opis jednego
z nich (tłumaczący nazwę) mo\e być następujący. Dwu podejrzanych  złapanych w
samochodzie, którym uciekli z banku rabusie - zostaje zamkniętych w areszcie i
odseparowanych. Prokurator jest pewny, \e są oni winni napadu, a nie ma dostatecznych
dowodów dla sądowego uznania ich winnymi  twierdzą, \e samochód stał opodal i się nim
zainteresowali bo był otwarty. Prokurator w tę bajeczkę nie wierzy -
ale mo\e im udowodnić tylko kradzie\ samochodu. Tłumaczy
ka\demu więzniowi, \e mają dwie alternatywy: przyznać się do
przestępstwa, co do którego jest przekonany, \e je popełnili, albo nie
przyznać się. Je\eli obydwaj się nie przyznają dostaną relatywnie
niską karę - za kradzie\. Je\eli obydwaj się przyznają, to zostaną
skazani sądownie, ale wyrok będzie złagodzony  sąd uwzględni ich
współpracę z policją. Je\eli jednak jeden z nich się przyzna, a drugi
nie, to ten który się przyzna będzie traktowany łagodnie, bo inaczej będzie się tłumaczyło
materiał dowodowy, podczas gdy drugi będzie miał spraw przegraną w zupełności.
Wyra\ając to w latach więzienia, problem strategiczny mo\na przedstawić tabelką:
Więzień 2
Nie przyznać się Przyznać się
Nie przyznać się więzień 1: 2 lata więzień 1: 10 lat
więzień 2: 3 miesiące
Więzień 1
więzień 2: 2 lata
Przyznać się więzień 1: 3 miesiące więzień 1: 8 lat
więzień 1: 8 lat
więzień 2: 10 lat
Je\eli przez a1 i b1 będziemy rozumieli strategie  nie przyznać się , a przez a2 i b2
 przyznać się , to pod warunkiem, \e \aden z podejrzanych nie ma skrupułów moralnych ani
nie obawia się zdrady, wy\ej podana macierz wypłat u\yteczności dobrze oddaje dylemat
więznia. Zagadnienie dla ka\dego więznia polega na tym, czy się przyznać, czy nie. Prowadzi
to do wcześniej podanej macierzy wypłat. Oczywiście, gdyby oprócz kary więzienia tak\e
 wypłaty uboczne typu kara za brak lojalności ze strony pozostałych członków grupy
przestępczej miały zostać uwzględnione, to problem byłby inny, najbardziej interesujący jest
jednak w omawianej postaci. Wszak nie chodzi nam o model zachowań aresztantów, ale o
pewne wa\ne i ciekawe implikacje sytuacji opisanej przez nasza grę.
Rozpatrzmy najpierw grę z punktu widzenia gracza I. Niezale\nie od tego czy gracz II
wybierze b1 czy b2, dla gracza I bardziej u\yteczna jest strategia a2, poniewa\ 10 jest większe
ni\ 9 w przypadku pierwszym, a 1 jest większe od 0 w przypadku drugim. Wobec tego a2
dominuje ściśle a1. Podobnie b2 dominuje dokładnie b1. poniewa\ ka\dy gracz chce
maksymalizować u\yteczność, dlatego a2 i b2 są ich wyborami rozsądnymi.
Jest trochę niewygodne dla naszej intuicji, \e dwaj gracze  nierozsądni będą w
lepszej sytuacji ni\ gracze  rozsądni . Widzimy, \e gdyby obaj zagrali swoje pierwsze
strategie to dostaliby wypłatę po 9 zamiast po 1. Zastanówmy się jednak czy przy takim
modelu i takich wypłatach jest mo\liwa kooperacja w celu uzyskania wypłat po 9. Ktoś powie
nic prostszego. Załó\my, \e gracze gry G mogą współpracować. naturalnie porozumieliby się
co do trzymania się (a1, b1), poniewa\ jedyną alternatywą jest (a2, b2), której \aden z nich nie
chce. Na przykład spotykają się na korytarzu  wyobrazmy sobie - i umawiają, \e do końca,
bez względu na wszystko, będą zaprzeczać, \e brali udział w napadzie. Wyobrazmy sobie
zatem co dalej. Idą do swoich cel i myślą: tak, ja będę zaprzeczał, a on? Czy mo\na mu ufać?
Ha, nie wiadomo, zatem lepiej zrobię przyznając się! Nie dam się zrobić. Hm, jeśli on
dotrzyma umowy, to trudno - sam sobie frajer winien.
Po prostu strategia (a1, b1) nie jest w równowadze, a to znaczy, \e ka\dy z graczy
mo\e mieć słuszne powody do zerwania umowy. Powody są następujące: je\eli któryś z
graczy zerwie umowę, a przeciwnik nie, to traci gracz I więcej ni\ wtedy, gdyby obydwaj nie
dotrzymali umowy.
I tak dochodzimy do strategii wcześniej wybranej  po prostu pozostanie prawdą, \e
gracz rozsądny wychodzi zawsze lepiej ni\ gracz nierozsądny. Jako dalsze uzasadnienie tych
wyborów strategii mo\na powiedzieć, \e (a2, b2) jest w tej grze jedyną parą strategii w
równowadze oraz, \e a2 i b2 są równie\ jedynymi strategiami maksymiowymi odpowiednio
dla graczy I i II. Wa\nym faktem jest to, \e a2 ściśle dominuje nad a1, a b2 nad b1.
Na zakończenie tej bajeczki mo\na jeszcze raz powrócić do kontekstu kryminalnego,
w którym takie  oszustwo mo\e spowodować powa\ne represje i wobec tego mo\na by
argumentować, \e gra nie jest warta świeczki. To jednak zaprzecza interpretacji
u\yteczności, jaką daliśmy liczbom. Je\eli zignorowaliśmy tego rodzaju rozwa\ania, to
znaczy, \e w tym przypadku te konsekwencje nie odgrywaja roli. Gdyby było inaczej to
uczynilibyśmy lepiej, gdybyśmy zawarli fakt łamania wią\ącego układu jako integralną część
gry rozszerzonej, która miałaby na celu odzwierciedlić ten konflikt interesów. Oczywiście
wtedy nie byłaby to gra zwana dylematem więznia!
Na temat tego problemu napisano wiele artykułów  wynika to z tego, \e opisuje on
wiele sytuacji z rzeczywistości społeczno  gospodarczej. W takim kontekście problemy te
nazywamy dylematem eksploatacji wspólnych zasobów. Oto kolejny przykład.
Dylemat eksploatacji zasobów
Rozwa\my sytuację związaną z rynkiem pewnego dobra. Aby nawiązać do klimatu
przykładu poprzedniego wyobrazmy sobie, \e chodzi o produkcję i sprzeda\ whisky w
okresie prohibicji. W pewnym mieście  nazwijmy je Buffalo - cały rynek tego produktu
zaspakajany jest przez czterech otrębnych producentów prowadzących tzw. interes rodzinny.
Wiadomo, \e cena produktu dla takiego rynku na którym funkcjonuje oligopol mo\e
być wyra\ona w postaci:
cena = A - k (łączna poda\)
gdzie stała A reprezentuje hipotetyczną cenę dobra w sytuacji całkowitego braku dostępu do
niego (nie ma whisky, a gdyby się pojawiła to ile byś dał, \eby ją kupić?), k to pewien
współczynnik mówiący jak szybko spada cena w związku ze wzrostem dostępności do dobra
(na skutek zwiększania poda\y)
Niech xi - poda\ i-tego producenta, wtedy
Przychód= wielkość produkcji .cena =xi cena = xi [A - k (łączna poda\)]
oznacza przychód (utarg) i-tego producenta. Zakładamy, \e w warunkach ograniczonej
dostępności do dobra całość wyprodukowanego dobra znajdzie nabywców. Pomijając koszty
 jedynie dla uproszczenia rachunków, istota problemu się nie zmienia - mo\emy uznać utarg
producenta za proporcjonalny do jego zysku.
Wielkość produkcji mo\na wyrazić w rozmaitych jednostkach  my dla uproszczenia
zapisu uto\samiamy wielkość poda\y dobra pochodzącą od danego producenta z liczbą
uruchomianych przez niego linii produkcyjnych. Dalej, dla konkretyzacji przykładu
przyjmiemy konkretne wielkości poszczególnych stałych. Niech na przykład:
cena = 30 - 2 ( łączna poda\)
Przyjmijmy, \e ka\dy z czterech producentów mo\e uruchomić co najwy\ej 3 linie o
zbli\onej wydajności. Prowadzi to do gry symetrycznej - takiej samej dla ka\dego z graczy-
producentów. Ka\dy z ich ma podjąć decyzję o wielkości produkcji, czyli ile linii
produkcyjnych uruchomić. Ma zatem cztery strategie : 0,1,2,3. Ich wypłaty są proporcjonalne
do zysków (czyli do utargu). Zgodnie z przyjętym modelem rynku wielkość tej wypłaty
zale\y od tego ile uruchomi producent linii ale te\ od tego ile linii łącznie uruchomią
pozostali. Zatem w funkcji wypłaty i-tego gracza nie musimy odrębnie traktować graczy
pozostałych. Zatem ka\dy z graczy ma przed sobą następującą macierz gry:
Aączna liczba linii uruchomionych przez pozostałych producentów
0 1 2 3 4 5 6 7 8 9
strategie 0 0 0 0 0 0 0 0 0 0 0
i-tego
1 28 26 24 22 20 18 16 14 12 10
producenta
2 52 48 44 40 36 32 28 24 20 16
3 72 66 60 54 48 42 36 30 24 18
Zauwa\my, \e strategia uruchom 3 linie produkcyjne dominuje wszystkie pozostałe 
niezale\nie od tego co zrobią pozostali gracze, gracz i-ty ma najwięcej uruchamiając
maksymalizując produkcję. Ale to znaczy, \e ka\dy gracz powinien - we własnym interesie 
maksymalizować produkcję. Oznacza to, \e ka\dy uruchomi po 3 linie, czyli ka\dy otrzyma
wypłatę 18 odpowiadającą sytuacji gdy producent uruchamia 3 linie a pozostali łącznie 9
(ka\dy po 3). No i tu pojawia się problem, bo widzimy, \e gdyby ka\dy uruchomił po dwie
linie ( czyli i-ty 2 pozostali łącznie 6) to otrzymane przez nich wypłaty wynosiłyby 28 (!)
I znowu  podobnie jak w dylemacie więznia  mo\na zastanowić się nad tym, czy nie
mogliby kooperować. No tak, tylko, \e o ile kooperacja nie będzie wymuszona  tzn. o ile nie
zmieni się macierz wypłat - zawsze będzie się opłacało nie dotrzymać umowy!
Takich sytuacji jest w \yciu społecznym i gospodarczym wiele. Związane są one ze
wspólnym u\ytkowaniem ograniczonych zasobów. W naszym przykładzie tym zasobem był
rynek o ograniczonej zdolności wchłonięcia produkowanego dobra. Ale tym zasobem mogą
być np. ulice miast, woda w kranach, gaz w sieci energetycznej itp. Wyobrazmy sobie np.
miasto w którym jest za du\y ruch samochodowy i przejazd przez kilka skrzy\owań zajmuje
godziny. Burmistrz ogłasza apel o pozostawienie samochodów w domu i obiecuje uruchomić
bardzo tani transport komunalny. Ludzie myślą sobie: bardzo dobry pomysł  będą puste
ulice, autobusy zatem będą szybko jezdziły i wszystko się usprawni. Przychodzi ranek dnia w
którym samochody  stosownie do apelu  miały zostać w domu. I co myśli sobie Michał.
Ano myśli sobie  albo pojadę swoim samochodem albo zastosuję się do apelu burmistrza i
pojadę szybko autobusem. Hm, ale jeszcze szybciej swoim samochodem-wszak ulice są puste!
A jeśli inni tez pojadą samochodami i ulice nie będą puste? Ha, to tym bardziej bym wyszedł
na naiwniaka, gdybym poszedł na autobus, który jak zwykle nie dojedzie bo będą korki. No i
Michał jedzie swoim samochodem do miasta, a tam same korki!
Problem ten bywa określany jako konflikt między indywidualną racjonalnością a
interesem zbiorowym. Problem nie ma rozwiązania. Jedyne co mo\na zrobić by sytuację
rzeczywistą rozwiązać to zmienić warunki (reguły gry). Jedną z metod jest wprowadzenie
dodatkowych opłat za wykorzystanie zasobu tak, by zmienić strukturę wypłat na tyle, aby
nadmierne wykorzystanie zasobu przestało być indywidualnie opłacalne. W naszym
przykładowym mieście burmistrz zamiast ogłaszania apelu, mógłby ogłosić wprowadzenie
opłat za korzystanie z samochodów w określonych godzinach. Z kolei producenci whisky
mogliby się umówić, \e uruchamiają tylko i pod rygorem kar zwyczajowych (znamy je z
filmów z epoki) realizować umowę. Oczywiście musieliby jeszcze wprowadzić mechanizm
kontrolny (inspekcja). Jednym z takich mechanizmów przyjętych w społeczeństwach są
podatki. Przyjrzyjmy się temu rozwiązaniu, na przykładzie naszych producentów.
Rola podatków w problemach eksploatacji zasobów
Wyobrazmy sobie, \e w Buffalo wprowadzono podatek za uruchomienie trzeciej linii
w wysokości 20. Otrzymujemy wtedy grę:
Aączna liczba linii uruchomionych przez pozostałych producentów
0 1 2 3 4 5 6 7 8 9
0 0 0 0 0 0 0 0 0 0 0
Strategie i-tego
1 28 26 24 22 20 18 16 14 12 10
producenta
2 52 48 44 40 36 32 28 24 20 16
3 52 46 40 34 28 22 16 10 4 -2
Jak widzimy, wartości wypłat w ostaniem wierszu (odpowiadającym uruchomieniu 3
linii) zostały pomniejszone o wysokość podatku. W tym przypadku strategia 3 nie jest ju\
strategia dominującą. Natomiast dominującą strategią okazuje się w tej nowej grze strategia 2.
Przypomnijmy, ze prowadzi ona do  po\ądanej społecznie sytuacji, w której wypłaty
wynoszą po 28.
Podkreślmy jednak, \e w ten sposób nie rozwiązaliśmy dylematu eksploatacji
zasobów! To co zrobiliśmy, to tak zmieniliśmy problem, by dylemat ten nie występował! To
jest ró\nica.
Jak ju\ jesteśmy przy zmianie reguł gry, tak by rzeczywisty problem uczynić
rozwiązalnym, to zauwa\my, \e zmieniając wartość podatku, mo\emy sytuacje decyzyjną
uczynić ciekawsza pod wieloma względami. Przede wszystkim widzimy, \e podatek
proponowany powy\ej jest podatkiem zaporowym. Wypłaty graczy tak się zmieniają, \e nie
opłaca im się w \adnej sytuacji uruchomić linii trzeciej. Odejdzmy w tym miejscu od
filmowo-mafijnego tła naszej opowieści i zastanówmy się, czy w normalnych warunkach
gospodarczych taki podatek rzeczywiście musiałby zostać nało\ony by wymusić racjonalne
po\ądane dla danej społeczności zachowania. Otó\ , zakładając, \e podatek będzie
konsumowany przez zainteresowaną społeczność, uświadamiamy sobie, \e podatek zaporowy
nigdy nie będzie płacony, gdy\ nikt nie uruchomi trzeciej linii  byłoby to działanie bez
sensu! Zobaczmy, co się stanie, gdy zainteresowani zaproponują podatek 5 zamiast 20. Nową
grę prezentuje poni\sza tabelka.
Aączna liczba linii uruchomionych przez pozostałych producentów
0 1 2 3 4 5 6 7 8 9
0 0 0 0 0 0 0 0 0 0 0
Strategie
1 28 26 24 22 20 18 16 14 12 10
i-tego
2 52 48 44 40 36 32 28 24 20 16
producenta
3 67 61 55 49 43 37 31 25 19 13
Okazuje się, \e to czy warto uruchomić trzecią linię zale\y od tego co zrobią pozostali.
Zatem teraz, być mo\e, któryś z graczy podejmie ryzyko uruchomienia trzeciej linii i
zapłacenia podatku. Jeśli pozostali uruchomią po dwie to dostanie (po odliczeniu podatku) 31
zamiast 28! Ponadto w kasie społecznej znajdzie się 5 do podziału na wspólne cele! Z punktu
widzenia społeczności mo\e się zatem okazać, \e lepiej wprowadzić mniejszy podatek, i to
zarówno z punktu widzenia interesu indywidualnego (zmusza do zachowań korzystnych
indywidualnie) jak i interesu społecznego, bo prowadzi do bogatszego społeczeństwa (suma
wypłat uczestników gry) jak i większych wpływów do wspólnej kasy.
To tyle, jeśli chodzi o ten wa\ny przykład gry nieściśle antagonistycznej. Podkreślmy
na zakończenie, \e to teorio-growa analiza pokazuje, \e częstokroć tzw. aspołeczne postawy
są po prostu bardzo racjonalne i \e odwoływanie się  co niekiedy się dzieje - do  rozumu
ludzi po to, by tak aspołecznie nie postępowali jest samo przez się pozbawione racjonalnych
podstaw. Ci co w takich przypadkach do rozumu się odwołują, sami wykazują w tym zakresie
pewne braki! W takich przypadkach trzeba po prostu zmieniać reguły gry.
Na następnym wykładzie przejdziemy do problemów decyzyjnych nazywanych grami
n-osobowymi.


Wyszukiwarka

Podobne podstrony:
Sieci komputerowe wyklady dr Furtak
Wykład 05 Opadanie i fluidyzacja
WYKŁAD 1 Wprowadzenie do biotechnologii farmaceutycznej
ARTYKUŁY ZWIĄZEK DYLEMATY WYBORU
mo3 wykladyJJ
ZARZĄDZANIE WARTOŚCIĄ PRZEDSIĘBIORSTWA Z DNIA 26 MARZEC 2011 WYKŁAD NR 3
Wyklad 2 PNOP 08 9 zaoczne
Wyklad studport 8
Kryptografia wyklad
Budownictwo Ogolne II zaoczne wyklad 13 ppoz
wyklad09
Sporzadzanie rachunku przepływów pienieżnych wykład 1 i 2
fcs wyklad 5

więcej podobnych podstron