Wykłady z Teorii Gier i Decyzji
Teoria użyteczności
Definiując problem decyzyjny jako trójkę elementów wskazaliśmy
jako trzeci z nich relację preferencji na zbiorze stanów natury. Właśnie tej
relacji i konsekwencjom jej istnienia poświęcimy najbliższe rozważania.
Analityczne badanie problemów decyzyjnych wymaga przyjęcia
pewnej struktury matematycznej, umożliwiającej przedstawienie porządku w
zbiorze różnych możliwych następstw działań podejmowanych w obliczu
konkretnego stanu przyrody. Te różne następstwa, czyli możliwe warianty
przyszłego przebiegu wydarzeń (lub inaczej perspektywy), są w wyniku
takiego uporządkowania ustawiane w ciąg, którego początek możemy
umownie kojarzyć z pożądanymi następstwami działania — zyskami,
nagrodami, szczęściem, wartościami użytkowymi, a koniec — z
następstwami niepożądanymi, jak straty, koszty, porażki, klęski. Dysponując
takim uporządkowaniem zbioru perspektyw, podejmujący decyzję dąży do
osiągnięcia wyniku, który będzie w pewnym sensie maksymalny, to jest jak
najbliższy początkowi ciągu, gdzie umownie zebrane są następstwa
najkorzystniejsze. (Wynika to zresztą z interpretacji słów
„pożądany", ,,atrakcyjny" itp., potocznie używanych w odniesieniu do
korzystnych następstw działania).
Mówiąc o konsekwencjach decyzji podjętej użyliśmy wcześniej
terminu następstwo, ponieważ nowa sytuacja została częściowo
spowodowana przez podjęcie decyzji. Omawiając pojęcie użyteczności
będziemy natomiast woleli używać terminu perspektywa, gdyż termin ten nie
implikuje konieczności, by przyszły bieg wydarzeń był spowodowany przez
naszą decyzję. Istnienie jakiejś zależności przyczynowo-skutkowej między
decyzją a przyszłym biegiem wydarzeń jest założeniem podstawowym w
teorii podejmowania decyzji, ale w teorii użyteczności założenie to nie jest
Strona 1
Wykłady z Teorii Gier i Decyzji
ogólnie konieczne.
Analiza matematyczna problemu decyzyjnego jest prostsza, gdy
możliwe jest nie tylko uporządkowanie perspektyw, ale również
rozmieszczenie ich na skali liczbowej. to jest przyporządkowanie każdej
perspektywie jej miary liczbowej. Funkcja taka, o ile istnieje, nosi nazwę
użyteczności. Użyteczność jest zatem funkcją określoną na zbiorze różnych
perspektyw (lub następstw), przed którymi staje podejmujący decyzję,
mierzącą na skali liczbowej względne atrakcyjności tych perspektyw.
Chociaż można wykazać matematycznie, że funkcja taka istnieje, jeśli tylko
podejmujący decyzję zachowuje się zgodnie z pewnym typem racjonalności,
to w istocie nie zawsze łatwo jest określić postać tej funkcji w konkretnym
przypadku. Uważa się czasem, że trudność ta poważnie umniejsza
stosowalność tej teorii. Ale choć rzeczywiście, w wielu konkretnych
sytuacjach decydent nie zna swojej funkcji użyteczności, to fakt ten nie
zawsze przeszkadza w znalezieniu dobrych (najlepszych) decyzji. Często
wystarczy wiedza, że taka funkcja istnieje i znajomość jej własności. Ponadto
znaczenie istnienia funkcji użyteczności dalece wybiega poza zastosowania
do rozwiązywania konkretnych problemów decyzyjnych – jest ona podstawą
szeregu ważnych wyników teoretycznych związanych z samym
modelowaniem problemów decyzyjnych i analizą własności ich rozwiązań, w
konsekwencji dając np. informacje o możliwych do spełnienia oczekiwaniach
czy pojęcie o tym czy dany sposób postępowania w ogóle ma sens. W
dalszym ciągu wykładu wrócimy jeszcze do tych uwag. Ponadto pozwala na
zrozumienie istoty i sensowności intuicyjnych zachowań decydentów w
pewnych sytuacjach.
1. Relacja preferencji perspektyw (wyników, stanów natury)
Każda konstrukcja matematyczna jest oparta na aksjomatach
Strona 2
Wykłady z Teorii Gier i Decyzji
(pewnikach), czyli na zdaniach tak podstawowych i elementarnych, że ich
prawdziwości nie dowodzimy. Przyjęcie określonego układu aksjomatów
zobowiązuje nas za pośrednictwem reguł logiki, do przyjmowania z kolei
całego ciągu twierdzeń, czyli wniosków wynikających z aksjomatów.
Przedstawiane tu aksjomaty dotyczące preferencji będą implikować istnienie
funkcji użyteczności, dostarczającej skali liczbowej do mierzenia wyników
działań.
Wprowadzimy pojęcie preferencji, czyli względnej atrakcyjności
perspektyw w sytuacji wyboru między nimi. W szczególności za podstawową
relację dwuczłonową przyjmiemy relację co najmniej tak atrakcyjny jak
zapisywaną za pomocą symbolu ≥. Czyli jeśli chcemy zapisać że
perspektywa A jest co najmniej tak atrakcyjna jak B to piszemy A ≥ B. Jeśli
perspektywa A jest przedkładana nad perspektywę B to piszemy A > B.
Mówimy wtedy też, że A jest bardziej atrakcyjna od B. Wprowadzamy
ponadto relację indyferencji. Mówimy, że perspektywy A i B są indyferentne
jeśli są równie atrakcyjne, co zapisujemy A~B. Relację „ ≥ „ nazywamy
relacją preferencji, zaś relację „ > „ relacją mocnej preferencji.
Dla sprecyzowania wymagań jakie powinny spełniać preferencje
decydentów musimy również wprowadzić pojęcie mieszanki perspektyw
(loterii)
2. Mieszanka perspektyw - loterie
Przypomnijmy, że podejmowanie decyzji w warunkach ryzyka, to taki
problem decyzyjny w którym danej akcji a przyporządkowany jest dany
(znany) rozkład prawdopodobieństwa na zbiorze wyników
. Właśnie tan
dany rozkład na wynikach nazywamy mieszanką perspektyw. Taką
mieszankę nazywamy też często loterią.
Strona 3
Wykłady z Teorii Gier i Decyzji
Loterię w której perspektywy w1, w2 ,..., wn są realizowane z
prawdopodobieństwami p1, p2,..., pn oznaczać będziemy:
[w1,w2,...,wn]
(p1,p2,...,pn)
Przykład 1. Przypuśćmy, że student na egzaminie losuje jeden z
sześciu zestawów pytań egzaminacyjnych rzucając sześcienną kością do gry.
Jeśli symbole Z1, Z2,...,Z6 oznaczają poszczególne zestawy to student stoi w
obliczu loterii, którą zapiszemy w postaci
[Z1,Z2, Z3, Z4, Z5, Z6]
(1/6 , 1/6 , 1/6 , 1/6 , 1/6 , 1/6)
Przykład 2. Student, który za pomocą rzutu monetą postanowił
wybrać pomiędzy spędzeniem weekendu na nauce w bibliotece a wyjazdem
na narty zdecydował się na mieszankę perspektyw, którą zapisujemy
[ narty
,
biblioteka ]
(½, ½)
W swych rozważaniach dopuszczamy oczywiście także sytuację, gdy
zbiór wyników jest nieskończony. Na naszym wykładzie ważną role odegra
mieszanka przeliczalnie wielu perspektyw, którą możemy oznaczyć
analogicznie jak w poprzednich przypadkach.
Przykład 3. Przypuśćmy, że dom gry wypłaca graczowi sumę złotych
równą liczbie rzutów rzetelną monetą, niezbędnych do wyrzucenia
pierwszego orla. Prawdopodobieństwo wyrzucenia orła w pierwszym rzucie
wynosi 1/2, prawdopodobieństwo reszki w pierwszym rzucie i orła w drugim
rzucie wynosi 1/4, reszki w pierwszym i drugim rzucie oraz orła w trzecim
1/8, itd. A więc perspektywą stojącą przed graczem jest
[l zł.,2 zł., 3 zł., ...]
(1/2 ,1/4,1/8,...)
Pojęcie loterii odgrywa ważną rolę w aksjomatyzacji relacji
Strona 4
Wykłady z Teorii Gier i Decyzji
preferencji.
3. Aksjomaty relacji preferencji perspektyw.
Aby problem wyboru był problemem decyzyjnym w sensie teorii
normatywnej relacja preferencji musi spełniać pewne aksjomaty. Zapewniają
one określony typ racjonalności decydenta, który umożliwi matematyczną
analizę problemu decyzyjnego (w odróżnieniu od analizy psychologicznej
czy behawioralnej). Podkreślmy, że teoria nie twierdzi, że każde preferencje
decydenta spełniają te aksjomaty, jedynie mówi, że to co dalej będziemy
mówić jest prawdziwe – udowodnione – gdy relacja preferencji te aksjomaty
spełnia. Dlatego po ich sformułowaniu zastanawiać się będziemy czy wydają
nam się one intuicyjne czy sztuczne i „wydumane”. Podawać będziemy
przykłady sytuacji, gdy ich spełnienie jest bezdyskusyjne i takie, gdzie to od
subiektywnej oceny decydenta zależy czy uzna, że jego preferencje spełniają
przyjęte założenia.
Aksjomat l: Dla każdych dwu perspektyw zachodzi jedna z relacji
P > Q lub Q > P, lub P ~ Q
Aksjomat 2: Jeżeli P ≥ Q i Q ≥ R, to P ≥ R.
Aksjomat 3: Jeżeli P1 > P2, to dla każdego prawdopodobieństwa r i
dla każdej perspektywy P spełniona jest relacja
[P1, P]
r
> [P2, P]
r
Aksjomat 4: Dla trzech danych perspektyw o uporządkowaniu
P1>P2>P3, istnieją mieszanki [P1, P3]
p
i [P1, P3]
r
, takie, że
P1 > [P1, P3]
p
> P2 > [P1, P3]
r
>P3
Omówimy teraz znaczenie przyjętych aksjomatów.
Strona 5
Wykłady z Teorii Gier i Decyzji
Aksjomat l stwierdza, że gdy są dane jakieś dwie perspektywy,
wówczas albo pierwsza perspektywa jest przedkładana nad drugą, albo druga
nad pierwszą, albo obie perspektywy są równie atrakcyjne. Może się jednak
zdarzyć, zwłaszcza przy rozpatrywaniu perspektyw, które są bardziej zawiłe i
do pewnego stopnia nieznane, że mimo konieczności stwierdzenia, iż któraś z
perspektyw jest atrakcyjniejsza, lub że obie perspektywy są równie
atrakcyjne, stwierdzenie tego będzie dla danej osoby trudne. Na przykład,
pięćdziesięcioletni wdowiec może odkryć, że chcą go poślubić dwie kobiety:
dwudziestoośmioletnia, która chciałaby mieć dużą rodzinę, i
czterdziestoletnią , która jest bardzo inteligentna i towarzyska. A więc czy
perspektywa poślubienia młodszej kobiety, z wszystkimi kłopotami
wychowania nowej generacji potomstwa, lecz i z radościami młodości, jest
bardziej, mniej czy równie atrakcyjna z perspektywą poślubienia starszej,
która zadowoli się życiem we dwoje. Być może wdowiec potrafi
uporządkować te perspektywy, a być może nie.
Mówiąc krótko – na pewno są sytuacje, gdy perspektywy są
nieporównywalne. Zastanówmy się, czy w kolejnych przykładach potrafimy
uszeregować atrakcyjność proponowanych perspektyw.
Przykład 4.
a) Perspektywy:
nowy samochód Audi A6, wyjazd na urlop nad polskie wybrzeże,
niezasłużony wyrok więzienia,
b) Perspektywy:
ciekawa praca połączona z realizacją zainteresowań, światowa
kariera sportowa, przyjaźń z pogodnym filozofem, szczęśliwe
życie rodzinne.
Widzimy, że są sytuacje, gdy aksjomat ten jest spełniony, ale też
łatwo sobie wyobrazić takie, w których spełniony być nie musi. W takich
problemach normatywna teoria decyzji w wyborze perspektywy nam
oczywiście nie pomorze – analizą takich sytuacji zajmą się nauki
behawioralne; psychologia czy socjologia, wchodzące w zakres
deskryptywnej teorii decyzji.
Strona 6
Wykłady z Teorii Gier i Decyzji
Aksjomat 2 stwierdza przechodniość relacji preferencji. Jego
przyjęcie zapobiega pewnemu rodzajowi niezgodności w modelu
matematycznym, opisującym mniej lub bardziej dokładnie rzeczywiste
preferencje ludzi. W rzeczywistości jednak ludzie działają czasem
niekonsekwentnie: ktoś może przedkładać kawę nad herbatę, herbatę nad
mleko, a jednak również mleko nad kawę! Tu uwaga – świadomość istnienia
relacji przechodniości nie jest człowiekowi wrodzona, uczymy się jej w
trakcie naszego rozwoju. Badania empiryczne (z psychologii i epistemologii)
dowodzą, że człowiek wnioskuje na podstawie tej relacji dopiero około 7-8
roku życia. Dziecko młodsze, z faktu, że np. samolot porusza się szybciej niż
pociąg, a pociąg szybciej niż statek nie wysnuje wniosku, że samolot porusza
się szybciej niż statek. Z kolei dorośli już tak się „wyuczą” tej relacji, że
nawet wtedy, gdy jest ona niespełniona, to uważają że być powinna. I tak w
przykładzie z napojami, gdyby dorosłych poprosić o uszeregowanie ich
atrakcyjności podając propozycje naraz, to wszyscy je jakoś uszeregują.
Dopiero wtedy, gdy w trakcie badań pytamy się o względną atrakcyjność
proponując wybór parami (tak, by się nie zorientowali o co chodzi) to
okazuje się, że może dojść do wskazanej na początku niekonsekwencji w
preferencjach.
Aksjomat 3 mówi, że poprawienie jednej z perspektyw,
wchodzących do skończonej mieszanki perspektyw, poprawia tę mieszankę.
Trudno jest wyobrazić sobie sytuację, w której pewnik ten byłby nie do
przyjęcia (przynajmniej w odniesieniu do mieszanek skończonych).
Jeżeli na przykład perspektywy otrzymania nowego samochodu (NS)
jest dla kogoś bardziej atrakcyjna niż perspektywa otrzymania nowy
motoroweru (NM) to dla dowolnej trzeciej perspektywy (TP) takiej jak np.
„wycieczka do Krakowa”, „wizyta u dentysty”, „przygotowanie obiadu”,
Strona 7
Wykłady z Teorii Gier i Decyzji
„praca w prestiżowej firmie finansowej” loterię [NS, TP]
r
przedkładamy nad
loterię [NM, TP]
r
, gdzie 1-r jest dowolnym, ustalonym , ale takim samym w
obu loteriach prawdopodobieństwem wylosowania trzeciej perspektywy.
Mówiąc inaczej jeśli w dowolnej loterii jedną z perspektyw zamienimy na
lepszą, a wszystkie prawdopodobieństwa i pozostałe perspektywy pozostaną
bez zmian to otrzymamy lepszą loterię. Wydaje się trudne podanie przykładu
wyborów, w których aksjomat ten byłby niespełniony.
Znaczenie aksjomatu 4 może nie być już dla każdego tak całkowicie
oczywiste. Wynika to pewnie z dość skomplikowanego zapisu. Zacznijmy
zatem od przykładu, który wyjaśni jego sens.
Przykład 5. Młody człowiek, kończący właśnie uczelnię i stojący u
progu kariery zawodowej, rozważa trzy perspektywy:
P1: otrzymanie sumy 1 miliona złotych
P2: otrzymanie sumy 2 tysięcy złotych
P3: oddanie już posiadanych 20 tysięcy złotych
Jest prawdopodobne, że młody człowiek uporządkuje te perspektywy
następująco: P1 > P2 >P3. Wyobraźmy sobie, że owe perspektywy pojawiły
się w związku z udziałem w telewizyjnym teleturnieju. Prowadzący ten
teleturniej redaktor KI proponuje studentowi wybór: P2 lub loteria [P1 , P3]
r
.
Czy jest jasne co wybierze student, czy my wiemy, co byśmy wybrali?
Zapewne zależy to od prawdopodobieństwa r wylosowania 2 milionów
złotych (tj. realizacji perspektywy P1). Stawiamy pytanie, czy istnieje jakaś
mieszanka perspektyw P3 i P1, która jest gorsza niż P2. Innymi słowy, czy
bez względu na to jakie jest prawdopodobieństwa r wylosowania P1, każda
perspektywa zawierająca nawet najmniejszą szansę zostania milionerem jest
bardziej atrakcyjna niż perspektywa P2?
A bardziej szczegółowo: czy prawdopodobieństwo 0,001 dla P1,,
Strona 8
Wykłady z Teorii Gier i Decyzji
wobec prawdopodobieństwa 0,999 dla P3, dostatecznie angażuje P1, czyniąc
mieszankę bardziej atrakcyjną niż perspektywa P2? Zależy to oczywiście od
młodego człowieka, lecz większość ludzi znajdzie takie małe, lecz dodatnie r,
że perspektywa P2 będzie dla nich bardziej atrakcyjna niż perspektywa
losowa [P1, P3]r, pomimo zachwycającej perspektywy P1 . (Może to być, na
przykład, r równe szansie znalezienia ziarnka ryżu rzuconego przez stryja
gdzieś na plaży). Chyba zgodzimy się, że zawsze istnieje tak małe
prawdopodobieństwo r wylosowania milionów, że student (czy my w jego
sytuacji) będzie wolał pewne 2 tys. zł. Oczywiście odwracając argumentację
(a dokładniej zamieniając wielkość prawdopodobieństwa) otrzymujemy taką
loterię, którą zarówno student jak i my w jego sytuacji uznamy za bardziej
atrakcyjna od pewnych 2 tys. zł.
Sens aksjomatu czwartego można też przedstawić inaczej choć
równoważnie. Mianowicie, zadajmy kolejne pytania:
•
czy istnieje jakaś perspektywa P1 tak absolutnie wspaniała by każda
mieszanka P3 i P1 (w której prawdopodobieństwo uzyskania P3 jest
dodatnie) była lepsza niż P2 ?
•
czy istnieje perspektywa P3 tak straszna (bez wątpienia gorsza niż
oddanie posiadanych 20 tysięcy), że jakiekolwiek dodatnie
prawdopodobieństwo jej realizacji w mieszance z P3, daje zawsze
perspektywę gorszą niż P2 ?
Otóż aksjomat 4 stwierdza, że gdy P1 >P2 >P3. to nie istnieje tak
wspaniała perspektywa P1 by najmniejsza szansa jej realizacji zamiast P3 (to
jest w mieszance [P1, P3]
r
) była lepszą perspektywą niż jakaś zwykła
perspektywa P2. Nie ma również tak strasznej perspektywy P3, by
najmniejsza szansa jej spełnienia, zamiast P1 dawała mieszankę gorszą niż
jakaś zwykła perspektywa P2. Rzeczywiście jest to zgodne z naszym
doświadczeniem codziennym – przecież mimo, że są realne szanse, że
wychodząc na ulice zostaniemy przejechani przez samochód to jednak
Strona 9
Wykłady z Teorii Gier i Decyzji
prawie nikt nie rezygnuje z tego powodu z robienia zakupów. I choć
perspektywę utraty życia można chyba powszechnie uznać za straszną, a
perspektywę rezygnacji z robienia zakupów za zwykłą, to uznajemy szanse r
realizacji strasznej perspektywy P3 za zbyt małą by pozostać w domu.
Przykładów tego typu można by mnożyć
4. Twierdzenie o perspektywie pośredniej
Z aksjomatów przedstawionych na poprzednim wykładzie wynikają
ważne wnioski. Zauważmy po pierwsze, że można na podstawie aksjomatów
wykazać, że gdy dane są dwie różne perspektywy P1 i P2, spełniającej
warunek P1>P2, wówczas wszystkie mieszanki tych perspektyw znajdują
się, pod względem atrakcyjności, między tymi dwiema perspektywami:
P1 > [P1, P2]
p
> P2
Ponadto, im większe p występujące w określeniu powyższej loterii,
tym większa jest atrakcyjność tej mieszanki (jest to intuicyjnie jasne jeśli
przypomnimy, że w omawianej sytuacji p określa prawdopodobieństwo
wylosowania perspektywy atrakcyjniejszej).
Sformułujemy te intuicyjne uwagi w postaci poniższych faktów.
Fakt 1.
2
1 P
P
>
)
1
,
0
(
∈
∀
⇒
s
:
2
]
2
,
1
[
1
P
P
P
P
s
>
>
Dowód. Rzeczywiście, z A3 i definicji mieszanki perspektyw mamy:
s
s
s
P
P
P
P
P
P
P
]
2
,
1
[
]
1
,
2
[
]
1
,
1
[
1
1
1
=
>
=
−
−
. Dowód drugiej nierówności
pozostawiamy czytelnikowi jako ćwiczenie.
Fakt 2.
2
1 P
P
>
⇒
(
s
r
P
P
P
P
s
r
>
⇔
>
]
2
,
1
[
]
2
,
1
[
)
Dowód. Niech r > s. Wtedy mieszankę
r
P
P
]
2
,
1
[
możemy zapisać
jako
p
s
r
P
P
P
P
P
]
]
2
,
1
[
,
1
[
]
2
,
1
[
=
dla pewnego
)
1
,
0
(
∈
p
. Z Faktu 1 oraz A3
Strona 10
Wykłady z Teorii Gier i Decyzji
otrzymujemy więc
s
p
s
s
p
s
r
P
P
P
P
P
P
P
P
P
P
P
]
2
,
1
[
]
]
2
,
1
[
,
]
2
,
1
[[
]
]
2
,
1
[
,
1
[
]
2
,
1
[
=
>
=
Dowód w druga stronę przeprowadzony nie wprost jest
natychmiastowy.
Najważniejsze jest jednak to, że jeśli P jest dowolną perspektywą
między P1 i P3, tj. spełnia warunek P1> P > P3, to istnieje pewna mieszanka
perspektyw P1 i P3, indyferentna z perspektywą P (tj. równoważna P pod
względem atrakcyjności). Prawdziwe jest zatem twierdzenie:
Twierdzenie l. Jeżeli dane są dwie dowolne perspektywy P1 i P3,
takie, że P1>P3, i dana jest perspektywa P spełniająca warunek P1> P > P3,,
to istnieje dokładnie jedna liczba p, zawarta między 0 a 1, taka, że mieszanka
[P1, P3]
p
jest równoważna perspektywie P.
Dowód twierdzenia
Zdefiniujmy dwa niepuste zbiory:
2
]
3
,
1
[
:
)
1
,
0
(
{
P
P
P
p
r
L
<
∈
=
Θ
}
2
]
3
,
1
[
:
)
1
,
0
(
{
P
P
P
p
r
U
>
∈
=
Θ
}
Ponadto
L
p
Θ
=
sup
0
.
Skoro loteria
0
]
3
,
1
[
p
P
P
nie jest indyferentna perspektywą P2 to z A1
wynika, że albo jest bardziej albo mniej atrakcyjna od tej perspektywy.
Pokażemy, że żaden z tych przypadków zajść nie może. Zacznijmy od
przypuszczenia, że
2
]
3
,
1
[
0
P
P
P
p
>
. Wtedy z A4
)
1
,
0
(
∈
∃
⇒
r
takie, że:
Strona 11
Wykłady z Teorii Gier i Decyzji
2
]
3
,
]
3
,
1
[[
0
P
P
P
P
r
p
>
,
z tego wynika:
2
]
3
,
1
[
0
P
P
P
rp
>
Na podstawie Faktu 2 nierówność
2
]
3
,
1
[
P
P
P
s
>
zachodzi dla
każdego
)
,
(
0
0
p
rp
s
∈
, jest to sprzeczne z definicją p
0
jako kresu górnego
zbioru
L
Θ
(wszak dowolnie blisko p
0
powinny znajdować się liczby
spełniające warunek definiujący zbiór
L
Θ
)
Przypuśćmy zatem, że
2
]
3
,
1
[
0
P
P
P
p
<
. Wobec nierówności
1
2
]
3
,
1
[
0
P
P
P
P
p
<
<
z A4 dla pewnego r mamy:
r
p
P
P
P
P
]
]
3
,
1
[
,
1
[
2
0
>
z tego wynika:
)
1
(
)
1
(
0
0
0
]
3
,
1
[
]
3
,
1
[
2
p
r
p
p
r
r
P
P
P
P
P
−
+
−
+
=
>
Ponieważ
0
0
0
)
1
(
p
p
r
p
>
−
+
, więc zachodzi sprzeczność z
definicja p
0
.
Z A1. wynika, że dowolne perspektywy są porównywalne, więc po
wykluczeniu innych możliwości otrzymaliśmy:
2
~
]
3
,
1
[
0
P
P
P
p
.
Koniec dowodu.
5. Funkcje użyteczności
W tej części wykładu przeprowadzimy dowód istnienia funkcji
Strona 12
Wykłady z Teorii Gier i Decyzji
rzeczywistej, która jest nośnikiem informacji o preferencjach decydenta oraz
posiada pewną ważną z punktu widzenia teorii decyzji i jej zastosowań
własność.
Niech, jak poprzednio W będzie zbiorem wszystkich możliwych
perspektyw w danym problemie decyzyjnym. Zakładamy, że zbiór ten
zawiera przynajmniej dwie różne perspektywy. Zdefiniujemy następujące
rozłączne podzbiory zbioru W:
:
{
1
3
W
∈
=
P
M
P
P
}
1
3
P
P
P
P
≥
∧
≥
}
1
:
{
1
P
P
P
U
P
>
∈
=
W
:
{
3
W
∈
=
P
L
P
}
P
P
>
3
Zdefiniujmy funkcję
R
M
u
P
P
→
1
3
:
w sposób następujący. Niech
u(P1)=1, u(P3)=0, zaś dla pozostałych perspektyw P
z rozpatrywanego zbio-
ru
r
P
u
=
)
(
, gdzie r jest jedyną liczbą z przedziału (0,1) spełniającą warunek
P
P
P
r
~
]
3
,
1
[
.
Funkcja u jest dobrze określona. Istnienie żądanej liczby r wynika z
twierdzenia o perspektywie pośredniej, zaś jej jednoznaczność z Faktu 2. Za-
uważmy, że funkcja u spełnia następujące warunki:
Warunek A. Dla każdej pary perspektyw P, Q ze zbioru
1
3
P
P
M zachodzi:
)
(
)
(
Q
u
P
u
Q
P
>
⇔
>
(1.7)
Warunek B. Dla dowolnej loterii [P,Q]
p
, w której perspektywy P, Q pocho-
dzą ze zbioru
1
3
P
P
M zachodzi: u([P,Q]
p
) = p u(P) + (1-p) u(Q)
Dowód spełnienia warunku A (nie wprost) .
Zaczniemy od implikacji
)
(
)
(
Q
u
P
u
Q
P
>
⇒
>
.
Strona 13
Wykłady z Teorii Gier i Decyzji
Niech
Q
P
>
. Przypuśćmy, że nie zachodzi
)
(
)
(
Q
u
P
u
>
. Zatem albo
)
(
)
(
Q
u
P
u
=
albo
)
(
)
(
Q
u
P
u
<
. Rozważmy pierwszą z tych możliwości.
Niech
)
(
)
(
Q
u
r
P
u
=
=
. Wtedy, w myśl definicji funkcji u otrzymujemy
r
P
P
P
]
3
,
1
[
~
∧
⇒
r
P
P
Q
]
3
,
1
[
~
Q
P ~
co jest sprzeczne z założeniem
Q
P
>
.
Załóżmy więc, że zachodzi druga możliwość :
)
(
)
(
Q
u
P
u
<
. Z twierdzenia o
perspektywie pośredniej wynika istnienie mieszanek spełniających warunek:
r
P
P
P
]
3
,
1
[
~
oraz
s
P
P
Q
]
3
,
1
[
~
.
Zatem z założenia, że
)
(
)
(
Q
u
P
u
<
i definicji funkcji u wynika, że r
<
s. Wo-
bec udowodnionego Faktu 2 na podstawie założenia P1>P3 otrzymujemy
stąd
Q
P
P
P
P
P
s
r
~
]
3
,
1
[
]
3
,
1
[
~
<
Jest to sprzeczne z założeniem , że P > Q , a to dowodzi słuszności implika-
cji
⇐
.
Rozważmy teraz implikację w drugą stronę tj.
Q
P
Q
u
P
u
>
⇒
>
)
(
)
(
.
Aby jej dowieść wystarczy powtórzyć rozumowanie z poprzedniego frag-
mentu dowodu. Z założenia, że
)
(
)
(
Q
u
P
u
>
i definicji funkcji u wynika, że
r
>
s, gdzie r i s spełniają warunki
r
P
P
P
]
3
,
1
[
~
oraz
s
P
P
Q
]
3
,
1
[
~
. Z Faktu 2
otrzymujemy
P
P
P
P
P
Q
r
s
~
]
3
,
1
[
]
3
,
1
[
~
<
Ostatecznie wykazaliśmy więc prawdziwość warunku A. Łatwo jest też
wykazać następujący wniosek:
Wniosek. Dla każdej pary perspektyw P, Q ze zbioru
1
3
P
P
M zachodzi:
Strona 14
Wykłady z Teorii Gier i Decyzji
)
(
)
(
~
Q
u
P
u
Q
P
=
⇔
Dowód spełnienia warunku B.
Niech
r
P
P
P
]
3
,
1
[
~
oraz
s
P
P
Q
]
3
,
1
[
~
. Otrzymujemy
[P,Q]
p
~[ [P1,P3]
r
, [P1,Q3]
s
]
p
= [P1,P3]
rp+s(1-p)
oraz
u([P,Q]
p
) = u([P1,P3]
rp+s(1-p)
) = rp+s(1-p) = pu(P) + (1-p)u(Q)
gdzie ostatnie dwie równości wynikają z definicji funkcji u.
Uwaga 1.0 Perspektywy P1 i P3 występujące w konstrukcji funkcji u
zostały wybrane zupełnie dowolnie. Zatem gdybyśmy wybrali jakiekolwiek
inne dwie perspektywy P1` > P3` moglibyśmy zdefiniować jakąś, być może
inną funkcję v, która oczywiście również spełniałaby warunki A i B na
zbiorze pośrednich perspektyw P, tj. perspektyw spełniających warunek P1`
> P > P3`
Teraz zajmiemy się przedłużaniem funkcji u na zbiór wszystkich
perspektyw W tak, by spełniała ona warunki A i B.
Załóżmy zatem, że zbiór
}
1
:
{
1
P
P
W
P
U
P
>
∈
=
perspektyw bardziej
atrakcyjnych niż P1 jest niepusty. Na początek przedłużmy funkcję u na
zbiór U
P1
tak, by zachowała się własność B. W tym celu rozważmy dowolną
perspektywę P z tego zbioru. Ponieważ P>P1>P3, więc
r
P
P
P
]
3
,
[
~
1
(1.a)
dla pewnego
)
1
,
0
(
∈
r
(przypomnijmy, wnioskujemy to z twierdzenia o
perspektywie pośredniej). Zatem by nasza funkcja spełniała warunek B musi
zachodzić związek:
)
3
(
)
1
(
)
1
(
)
]
1
,
([
)
1
(
P
u
r
P
ru
P
P
u
P
u
r
−
+
=
=
Strona 15
Wykłady z Teorii Gier i Decyzji
czyli
0
)
1
(
)
(
1
r
P
ru
−
+
=
,
Zatem ostatecznie, by zachowała się własność B musimy zdefiniować
u na zbiorze U
P1
wzorem:
r
P
u
1
)
(
=
(1.b)
Analogicznie postępujemy w przypadku zbioru perspektyw mniej
atrakcyjnych niż P3 czyli zbioru
:
{
3
W
P
L
P
∈
=
}
P
P
>
3
. Jeśli
3
P
L
P
∈
, to
P1>P3>P, i w konsekwencji
r
P
P
P
]
,
1
[
~
3
dla pewnego
)
1
,
0
(
∈
r
. Zatem musi być
)
(
)
1
(
)
1
(
)
3
(
P
u
r
P
ru
P
u
−
+
=
oraz
)
(
)
1
(
0
P
u
r
r
−
+
=
Ostatecznie, po przekształceniu powyższego wzoru otrzymujemy:
1
)
(
−
=
r
r
P
u
,
(1.c)
Uwaga 1.1 Z powyższych wzorów 1.b oraz 1.c bezpośrednio wynika,
że prawdopodobieństwo r, definiujące równoważne mieszanki perspektyw w
przypadku relacji 1.1a dane jest wzorem r=1/u(P), zaś w przypadku relacji
1.b dane jest wzorem
1
)
(
)
(
−
=
P
u
P
u
r
.
Dowiedziemy teraz, że zdefiniowana przez nas funkcja u spełnia
warunki A i B na zbiorze wszystkich perspektyw. Fakt ten sformułujemy w
postaci twierdzenia
Strona 16
Wykłady z Teorii Gier i Decyzji
Twierdzenie (konstrukcja funkcji użyteczności w oparciu o dwie zadane
perspektywy). Niech P1 i P3 będą dwiema dowolnymi perspektywami
spełniającymi warunek P1>P3. Niech u będzie funkcją rzeczywistą, której
dziedziną jest zbiór wszystkich perspektyw, określoną następującymi
wzorami:
•
dla P>P1, u(P)=1/r , gdzie r jest jedyną liczbą spełniającą warunek:
1
~
]
3
,
[
P
P
P
r
•
dla P1>P>P3, u(P)=r , gdzie r jest jedyną liczbą spełniającą
warunek:
P
P
P
r
~
]
3
,
1
[
•
dla P3>P, u(P)=r/(1-r) , gdzie r jest jedyną liczbą spełniającą
warunek:
3
~
]
,
1
[
P
P
P
r
Funkcja u jest dobrze określona, zawsze istnieje i spełnia warunki A i B.
Dowód twierdzenia.
Fakt, że funkcja u jest dobrze określona i zawsze istnieje został już
wykazany. Teraz udowodnimy, że wskazana funkcja spełnia warunki A i B
dla dowolnych perspektyw ze zbioru W. Rozważmy zatem dwie dowolne
perspektywy P, Q. Załóżmy, bez straty na ogólności, że
Q
P
>
. Niech jak
dotychczas P1, P3 oznaczają perspektywy wykorzystane w definicji funkcji
u i niech
max
P ,
min
P oznaczają odpowiednio, najbardziej i najmniej atrakcyjną
spośród wymienionych czterech perspektyw.
Zdefiniujmy nową (być może) funkcje
ℜ
→
min
max
*
:
P
P
M
u
sposobem
identycznym jaki wykorzystaliśmy do definicji funkcji u z ta różnicą, że
zamiast perspektyw P1 i P3 wykorzystamy perspektywy P
max
i P
min
.
Oczywiście jest możliwe, że pary perspektyw (P1 , P3) oraz (P
max
, P
min
) mają
identyczne elementy lub nawet się pokrywają. To nam jednak nie
Strona 17
Wykłady z Teorii Gier i Decyzji
przeszkadza. Tak czy owak wiemy, że funkcja u* na zbiorze
min
max
P
P
M
spełnia
warunki A i B, patrz Uwaga 1.0. Naszym celem będzie znalezienie związku
między funkcjami
*
u oraz u na tym zbiorze. Weźmy zatem dowolną
perspektywę ze zbioru
min
max
P
P
M
i oznaczmy ją jako R. Mamy trzy
wykluczające się możliwości : albo R > P1, albo
1
3
P
P
M
R
∈
, albo P3 > R.
Rozpatrzymy je po kolei. Na początek niech R > P1 >P3 . Wtedy
(patrz Uwaga 1.1)
)
(
1
]
3
,
[
~
1
R
u
P
R
P
Ponieważ u* spełnia na zbiorze
min
max
P
P
M
warunek B zatem
)
3
(
)
)
(
1
1
(
)
(
)
(
1
])
3
,
([
)
1
(
*
*
)
(
1
*
*
P
u
R
u
R
u
R
u
P
R
u
P
u
R
u
−
+
=
=
)
3
(
)
3
(
)
(
)
(
)
1
(
)
(
*
*
*
*
P
u
P
u
R
u
R
u
P
u
R
u
−
+
=
)
3
(
)
(
))
3
(
)
1
(
(
)
(
*
*
*
*
P
u
R
u
P
u
P
u
R
u
+
−
=
Znaleziony związek pomiędzy liczbami u(R) oraz u(R) możemy
zapisać w postaci
*
*
*
)
(
β
α
+
=
R
u
u
(1.L)
gdzie
)
3
(
)
1
(
*
*
*
P
u
P
u
−
=
α
oraz
)
3
(
*
*
P
u
=
β
. Zauważmy, że
0
*
>
α
.
Rozpatrzmy teraz drugą możliwość:
P1>R>P3. Wtedy
)
(
]
3
,
1
[
~
R
u
P
P
R
, oraz
)
3
(
))
(
1
(
)
1
(
)
(
)
(
*
*
*
P
u
R
u
P
u
R
u
R
u
−
+
*
)
3
(
)]
3
(
)
1
(
[
)
(
*
)
(
*
*
*
P
u
P
u
P
u
R
u
R
u
+
−
=
Zatem ponownie otrzymujemy
*
*
*
)
(
β
α
+
=
R
u
u
.
Strona 18
Wykłady z Teorii Gier i Decyzji
Rozważmy ostatni możliwy przypadek: P > P3 > R. Kolejno
otrzymujemy (patrz uwaga 1.1):
1
)
(
)
(
]
,
1
[
~
3
−
R
u
R
u
R
P
P
)
(
1
)
(
1
)
1
(
1
)
(
)
(
)
3
(
*
*
*
R
u
R
u
P
u
R
u
R
u
P
u
−
−
+
−
=
)
(
)
(
)]
3
(
)
1
(
[
)
(
*
*
*
*
R
u
R
u
P
u
P
u
R
u
−
−
=
*
*
*
)
(
β
α
+
=
R
u
u
Zatem ostatecznie możemy stwierdzić, że związek (1.L) zachodzi na
całym zbiorze
min
max
P
P
M
.
Wykażemy teraz, że dla dowolnej pary perspektyw funkcja u spełnia
warunki A i B .
Zacznijmy od warunku A. Musimy wykazać, że
)
(
)
(
Q
u
P
u
Q
P
>
⇔
>
Z definicji zbioru
min
max
P
P
M
wiemy, że perspektywy P i Q są jego
elementami. Zatem zachodzi nierówność:
)
(
)
(
*
*
Q
u
P
u
>
Wykorzystując wykazany związek zachodzący pomiędzy funkcjami u
i u*, mamy:
*
*
*
*
)
(
)
(
β
α
β
α
+
>
+
Q
u
P
u
,
Ze względu na to, że
α
*>0 w konsekwencji otrzymujemy
⇔
>
)
(
)
(
Q
u
P
u
)
(
)
(
*
*
Q
u
P
u
>
Ponieważ
)
(
)
(
)
(
*
)
(
*
Q
u
P
u
Q
u
P
u
Q
P
>
⇔
>
⇔
>
więc ostatecznie
wykazaliśmy spełnienie warunku A.
Przejdźmy teraz do dowodu warunku B. Niech [P,Q]
r
będzie dowolna
Strona 19
Wykłady z Teorii Gier i Decyzji
mieszanką perspektyw P i Q. Wobec faktu, że
α
*>0, ze związku (1.zw) łatwo
wykazać, że również zachodzi
β
α
+
=
)
(
)
(
*
Q
u
P
u
dla pewnych liczb
α
>0 i
β
.
Otrzymujemy więc
=
+
−
+
=
+
=
β
α
β
α
)]
(
)
1
(
)
(
[
)
]
,
([
)
]
,
([
*
*
*
Q
u
r
P
ru
Q
P
u
Q
P
u
r
r
]
)
(
)[
1
(
]
)
(
[
*
*
β
α
β
α
+
−
+
+
=
Q
u
r
P
u
r
)
(
)
1
(
)
(
Q
u
r
P
ru
−
+
=
Wykazaliśmy więc spełnienie warunku B. Wobec dowolności
początkowego wyboru perspektyw P i Q zakończyliśmy dowód naszego
twierdzenia. Koniec dowodu twierdzenia.
Definicja. Dowolną funkcję u spełniającą warunki A i B na określonym
zbiorze perspektyw występujących w problemie decyzyjnym nazywamy
funkcją użyteczności dla tego problemu decyzyjnego.
Twierdzenie (o funkcji użyteczności)
W każdym problemie decyzyjnym, w którym relacja preferencji decydenta
spełnia aksjomaty A1-A4, prawdziwe są następujące zdania:
1) istnieje nieskończenie wiele funkcji użyteczności
2)
jeżeli u i v są funkcjami użyteczności, to istnieją stałe a i b ,
0
>
a
,
takie, że
b
av
u
+
=
3)
jeżeli u jest funkcją użyteczności, to dla dowolnych stałych a i b ,
0
>
a
, funkcja
b
au
v
+
=
jest również funkcją użyteczności
W tym miejscu należy zauważyć, że nazwa „funkcja użyteczności”,
choć intuicyjna, to jednak może być myląca. Podkreślmy zatem, że obiektem
wyjściowym w stosunku funkcji użyteczności jest relacja preferencji. To ta
ostatnie decyduje o tym jak zdefiniowana jest funkcja użyteczności, nie na
odwrót. Oznacza to, że nie tyle wolimy to, co jest bardziej użyteczne, ale
Strona 20
Wykłady z Teorii Gier i Decyzji
odwrotnie: bardziej użyteczne jest to, co wolimy. Zatem użyteczność w
rozważanym przez nas znaczeniu może mieć zupełnie inny sens niż ten, który
funkcjonuje potocznie. Przeznaczeniem, rolą funkcji użyteczności danego
decydenta jest wskazywać co ten decydent woli. I tak w problemie wyboru
może się okazać, że dla pewnego decydenta bardziej użyteczne jest wypicie
pół litra alkoholu niż zarobienie 200 zł za zamiecenie podwórka. Oznacza to
dla nas tylko tyle, że dla owego decydenta wypicie wódki jest bardziej
atrakcyjne od sprzątania za wynagrodzeniem, widzimy, że nie ma to
większego związku z potocznym znaczeniem słowa użyteczność. Wymieńmy
tu w jednym miejscu najczęstsze błędne stwierdzenia świadczące o
niezrozumieniu istoty funkcji użyteczności.
N
IEPOROZUMIENIE
l (
ODWRÓCENIE
PRZYCZYNOWOŚCI
). Jeśli ktoś przedkłada
jakąś propozycję albo jakiś wybór nad inne, znaczy to, że propozycja ta ma
wyższą użyteczność.
Błąd w tym przypadku polega na odwróceniu relacji przyczynowości,
jak w poprzednim przykładzie. W istocie jest tak, że propozycji A
przypisywana jest wyższa użyteczność niż propozycji B dlatego, ponieważ
dana osoba wskazała, że mając do wyboru A i B, wybiera A. Wskazanie to
może być bezpośrednie lub pośrednie (gdy wynika ono z innych wskazań i
założenia o ich zgodności).
N
IEPOROZUMIENIE
2 (
RACJONALNOŚĆ
). Jeśli mając do wyboru jedną z
dwóch propozycji, osoba wybiera tę o niższej użyteczności, znaczy to, że
postępuje nieracjonalnie.
Należałoby raczej stwierdzić, że dokonany wybór jest niezgodny z
tymi wyborami tej osoby, na podstawie których określiliśmy jej
użyteczności. Może to wynikać z faktu, że użyteczności te zdążyły już ulec
zmianie, bądź też, że preferencji tej osoby nie da się przedstawić w postaci
Strona 21
Wykłady z Teorii Gier i Decyzji
funkcji użyteczności, gdyż w jej przypadku nie są spełnione aksjomaty 1-4 .
N
IEPOROZUMIENIE
3 (
DODAWANIE
UŻYTECZNOŚCI
). Możemy określić, jaka
propozycja jest społecznie najbardziej pożądana, sumując użyteczności
różnych osób.
Na przykład, gdy propozycja A ma użyteczności 20 dla Pana
Kowalskiego i 50 dla Pani Nowak, zaś B ma użyteczności odpowiednio 100
dla Kowalskiego i 20 dla Nowak, to B jest społecznie lepsze od A, ponieważ
jego łączna użyteczność jest wyższa (120 > 70). Nie uwzględnia ono faktu,
że użyteczności określone są z dokładnością do rosnącego przekształcenia
liniowego. Przekształcenie użyteczności Kowalskiego i/lub Nowak przez
taką funkcję mogłoby z łatwością prowadzić do odwrócenia w podanym
przykładzie relacji pomiędzy łącznymi użytecznościami. Rzeczywiście,
oznaczmy wykorzystaną w przykładzie funkcję użyteczności Kowalskiego
symbolem u
K
(nawet nie wiemy jaka ona była, ale to nie istotne, wystarczy
nam wiedzieć, że u
K
(A)=20 i u
K
(B)=100) Jeśli teraz zamiast wykorzystanej
funkcji u
K
wprowadzimy funkcje użyteczności u=
K
u
10
1
, to ona również
oddaje preferencje Kowalskiego (twierdzenie 3) i jest równie dobrą funkcją
użyteczności jak u
K
. Ale teraz u(A)=2 i u(B)=10, a suma użyteczności obu
decydentów (Kowalskiego i Nowak) dla perspektywy A wynosi 52 a dla
perspektywy B jest równa 30, Zatem, gdyby sumowanie użyteczności miało
sens to otrzymalibyśmy, że społecznie bardziej użyteczna jest perspektywa
A – odwrotnie niż poprzednio!
N
IEPOROZUMIENIE
4 (
MIĘDZYOSOBOWE
PORÓWNYWANIE
UŻYTECZNOŚCI
). Jeśli
dany wynik ma dla jednego z graczy wyższą użyteczność niż dla drugiego, to
jest on przez pierwszego gracza pożądany bardziej niż przez drugiego.
Strona 22
Wykłady z Teorii Gier i Decyzji
Podobnie jak poprzednio, stwierdzenie takie jest nonsensowne wobec
faktu, że użyteczności można dowolnie przekształcać przez rosnące funkcje
liniowe. W istocie, nie istnieje procedura pozwalająca na porównanie
użyteczności dla dwu różnych osób. Użyteczności są określone tylko dla
danej osoby i odnoszą się jedynie do jej indywidualnych decyzji co do
wyboru pomiędzy różnymi możliwościami. Chociaż zdarza nam się czasami
wygłaszać stwierdzenia w rodzaju „sto zł ma dla mnie większą wartość niż
dla ciebie", ale nie bardzo wiadomo, co by to miało znaczyć. Gdyby na
przykład zdanie to dało się przełożyć na „za 100 zł. mógłbym nawet wykąpać
się lodowatej wodzie, a ty nie", to równie dobrze mogłoby z tego wynikać, że
kąpiel w lodowatej wodzie jest dla tej osoby mniej nieprzyjemna niż dla
ciebie (są tacy, którzy to robią za darmo, a nawet płacą za taką
„przyjemność”).
Podsumowując należy zatem zapamiętać, że użyteczność w sensie
von Neumanna-Morgenstema nie jest wartością istniejącą samoistnie:
stanowi jedynie wygodną, liczbową metodę systematyzowania informacji o
preferencjach danej osoby o ile preferencje te spełniają określone w
aksjomatach warunki zgodności. Jest to dokładnie ta forma informacji o
preferencji, która pozwala analizować problem z punktu widzenia
normatywnej teorii decyzji.
Strona 23