Przedstawienie
za
pomocą
tablicy
lub
tablic
decyzyjnych problemu wieloetapowego jest raczej trudne
i może prowadzić do dużych niejasności.
Rozwiązanie problemu decyzyjnego w warunkach
niepewności, polegające na wyznaczeniu optymalnej
decyzji, może być przedstawione na odpowiednim
wykresie, zwanym dendrytem, lub - jak przyjęto ten
wykres nazywać w teorii podejmowania decyzji -
drzewem decyzyjnym. Każde drzewo decyzyjne składa
się z dwóch rodzajów węzłów.
• węzłów decyzyjnych, oznaczanych kwadratami,
• węzłów losowych, oznaczanych okręgami.
Jeżeli podmiot podejmujący decyzję znajduje się w
węźle oznaczonym kwadratem, to może wówczas wybrać
dowolną drogę, co jest równoznaczne z wyborem
określonej decyzji. Gdy podmiot znajduje się w węźle
losowym oznaczonym okręgiem, to jego dalsza droga nie
zależy od jego decyzji, lecz jest wyznaczona przez
czynniki zewnętrzne.
wierzchołek
odgałęzienia
wierzchołki
odgałęzienia wypłata
decyzyjny
decyzyjne
stanów natury
stanów natury
68000
0.4
s1
200 000
d1
2
0.6
-20 000
s2
72000
0.4
d
s
150 000
2
1
1
3
0.6
s2
20 000
76000
0.4
d3
s1
100 000
4
0.6
60 000
s2
Rys. Drzewo decyzyjne dla Przykładu 1
Wyznaczanie optymalnej decyzji:
Ogólną zasadą jest zawsze analiza drzewa decyzyjnego od strony prawej ku lewej, a
mówiąc obrazowo, od gałązek do gałęzi i konarów, albo inaczej - od korony do pnia
drzewa. Analiza taka nosi w teorii podejmowania decyzji nazwę indukcji wstecznej ( backward induction).
W naszym przypadku węzłami położonymi najdalej na prawo są węzły losowe
(oznaczone okręgami), które dla ułatwienia zostały ponumerowane. Od tych właśnie węzłów zaczynamy analizę. I tak, gdybyśmy znaleźli się w węźle (2) wówczas oczekiwana korzyść (wygrana, wypłata, zysk) wyniosłaby:
E a
2 = 0.4 ⋅ 200 000 + 0.6 ⋅ (-20 000) = 68 000$
Podobnych obliczeń dokonujemy dla pozostałych dwóch węzłów i otrzymujemy
odpowiednio dla węzła (3)- 72000$, dla węzła (4) - 76000$.
Następnie cofamy się do węzła leżącego dalej na lewo. Jest to węzeł decyzyjny, a więc od podmiotu decyzyjnego zależy, którą spośród czterech możliwych dróg wybierzemy. Kierując się zasadą maksymalizacji oczekiwanej wygranej Bayes'a-Laplace'a, za optymalną musimy uznać drogę odpowiadającą decyzji d3 , gdyż gwarantuje ona największą oczekiwaną korzyść. Drogi odpowiadające pozostałym decyzjom, tj. d1 i d2, zgodnie z przyjętym w literaturze przedmiotu zwyczajem, blokujemy dwoma kreskami prostopadłymi do danej gałęzi. W rezultacie, będąc w węźle [1], możemy sobie zapewnić - wybierając optymalną decyzję d3 - oczekiwaną korzyść wynoszącą 76 000$, co zapisujemy nad węzłem [1]. W ten sposób analiza procesu decyzyjnego została zakończona.
Znajdując się w węźle [1] idziemy drogą równoważną z podjęciem decyzji d3
(pozostałe drogi są zablokowane); docierając do węzła (4) zapewniamy sobie maksymalną oczekiwaną korzyść w wysokości 76 000$. Dalsza droga z węzła (4), który jest węzłem losowym, nie zależy od podmiotu podejmującego decyzje. Z tego też względu nie da się przewidzieć dokładnie jaką uzyskamy korzyść - może to być
100 000$ lub 60 000$.
0.4
s1
200 000 $
d
68 000
1
3
0.6
s2
-20 000 $
76 000
s1
0.4
72 000
4
150 000 $
2
d2
0.6
s2
20 000 $
0.4
s1
(*)
76 000
100 000 $
5
0.6
d
3
s2
60 000 $
1
s1
0.92
182 400
d
1
200 000 $
9
s2
182 400
0.08
-20 000 $
(**)
139 600
s1
0.92
7
d
150 000 $
2
10
s
2
0.08
20 000 $
96 800
0.92
s
d
1
100 000 $
w
3
1
11
s2
0.08
60 000 $
0.37
6
0.095
s1
900
200 000 $
0.63
d1
12
w
0.905
s2
2
63 800
107 682
-20 000 $
32 350
s
0.095
1
150 000 $
d2
8
13
0.905
s2
20 000 $
s
0.095
1
100 000 $
63 800
d
3
14
0.905
60 000 $
s2
(*) - nie korzystamy z informacji dodatkowej
(**) - korzystamy z informacji dodatkowej
Rys. Drzewo decyzyjne dla Przykładu 2 z analizą bayesowską.
Uzyskane wyniki, mimo, że jeszcze nie wyczerpują
analizy są dość interesujące. Zwróćmy uwagę na dwa
nasuwające się wnioski:
- uzyskane wyniki określają, którą z decyzji d1 , d2 albo d3
należy podjąć, w zależności od posiadanej informacji,
- nie każda z możliwych do uzyskania informacji
wstępnych
poprawia
naszą
sytuację.
W
przypadku
odgałęzienia "bez informacji", jeżeli przed podjęciem decyzji
nie pobieramy żadnej dodatkowej informacji, to zapewniamy
sobie oczekiwaną korzyść (zysk) na poziomie 76.000$. Gdyby
jednak w wyniku badania rynku przed podjęciem ostatecznej
decyzji okazało się, że wskaźnik rynku jest równy w2 , to
maksymalna spodziewana korzyść (zysk) jaką można uzyskać
będzie kształtowała się na poziomie 63.800$. Posiadanie
dodatkowej
informacji
pozwala
uprecyzyjnić
ocenę
oczekiwanego zysku w zależności od tego co obserwujemy na
rynku i ostrzegać nas, ewentualnie, przed podjęciem złej
decyzji.
Znając maksymalne oczekiwane korzyści odpowiadające
węzłom [2], [7], [8] przesuwamy się w lewą stronę do węzła
(6) i obliczamy oczekiwaną korzyść odpowiadającą temu
węzłowi. Będąc w tym węźle dokonaliśmy już wyboru, że
przeprowadzamy badanie rynku, ale nie znamy jeszcze jego
wyniku. Znamy jedynie odpowiednie prawdopodobieństwa i
maksymalną oczekiwaną korzyść jaką możemy sobie
zapewnić w zależności od otrzymania w1 lub w2 - wynosi ona
107 682$. Jest ona wprawdzie większa od oczekiwanej
korzyści odpowiadającej gałęzi "bez informacji dodatkowej",
ale musimy zdawać sobie sprawę, że przeprowadzenie badania
rynku związane jest z pewnymi kosztami. Łatwo obliczyć, że
granicą opłacalności zbierania dodatkowej informacji w tym
przypadku jest 31 682$.
Alternatywną
metodą
rozwiązywania
procesów
decyzyjnych w warunkach niepewności do analizy drzewa
decyzyjnego jest analiza w oparciu o dokonywanie oceny
poszczególnych strategii decyzyjnych. Metoda ta może być
stosowana komplementarnie.
Punktem
startowym
metody
oceny
strategii
jest
konstrukcja
wszystkich
możliwych
reguł
decyzyjnych
przyporządkowujących
poszczególnym
sytuacjom
decyzyjnym różne decyzje. Jeśli możliwych sytuacji
decyzyjnych jest k a możliwych decyzji n, to rachunek
kombinatoryczny
wskazuje,
że
ogólna
liczba
reguł
decyzyjnych wynosi nk . Reguły te nazywamy strategiami. W
omawianym przez nas Przykładzie 2 (rozszerzonym o
możliwość uzyskania dodatkowej informacji) ogólna liczba
strategii wynosi 32 =9 1). W Tablicy przedstawiamy
wszystkie strategie decyzyjne dla omawianego przykładu.
1 ) Sytuacje decyzyjne w naszym przykładzie różnicujemy według tego czy zaobserwowaliśmy wskaźnik rynku w1
czy w2.
Strategie decyzyjne dla Przykładu 2
Strategia
Reguła
Strategia
Reguła
decyzyjna
decyzyjna
Z1
w →
Z
→
1
d1
2
w1
d1
w →
→
2
d1
w2
d2
Z3
w →
Z
→
1
d2
4
w1
d2
w →
→
2
d1
w2
d2
Z5
w →
Z
→
1
d2
6
w1
d3
w →
→
2
d3
w2
d2
Z7
w →
Z
→
1
d3
8
w1
d1
w →
→
2
d3
w2
d3
Z9
w →
1
d3
w →
2
d1
Strategie oznaczamy symbolicznie pisząc za numerem
strategii Zi i=1,...,nk , w nawiasie, decyzje przyporządkowane
poszczególnym
sytuacjom
decyzyjnym
(w
naszym
przykładzie - wskaźnikom rynku), np. Z6 (d3,d2 ).
Po ustaleniu zbioru wszystkich możliwych strategii należy
określić
oczekiwane
korzyści
(lub
użyteczności)
odpowiadające poszczególnym strategiom. Prześledzimy tok
rozumowania i przeprowadzimy związane z tym obliczenia
dla strategii Z2 (d1,d2).
Przypomnijmy:
Prawdopodobieństwa warunkowe wskaźników badania
Stany natury
Wskaźniki badania
2
∑ P( w s )
l
j
l 1
=
w1
w2
s1
P(w1|s1)= 0.85 P(w2|s1)= 0.15
1
s2
P(w1|s2)= 0.05 P(w2|s2)= 0.95
1
Załóżmy, że mieliśmy do czynienia z wysoką akceptacją usług
firmy na rynku - stan natury s1. Wiemy, że podjęcie decyzji d1
daje korzyść w wysokości 200 000$, natomiast podjęcie
decyzji d2 daje korzyść równą 150 000$. Biorąc pod uwagę
prawdopodobieństwa
warunkowe
wskaźników
rynku
P(w1|s1)=0.85 oraz P(w2|s1)=0.15, warunkowa oczekiwana
korzyść (wypłata) przy przyjęciu strategii Z2 wynosi:
E(Z2|s1) = 0.85⋅200 000 + 0.15⋅150 000 = 192 500.
Podobne rozumowanie prowadzi do obliczenia warunkowej
wartości oczekiwanej, przy założeniu zaistnienia stanu natury
s2 $. Biorąc pod uwagę prawdopodobieństwa warunkowe
wskaźników rynku P(w1|s2)=0.05 oraz P(w2|s2)=0.95:
E(Z2|s2) = 0.05⋅(-20 000) + 0.95⋅20 000 = 18 000 .
Wykorzystując informację o prawdopodobieństwach a priori
stanów natury s1 i s2 możemy obliczyć bezwarunkową
oczekiwaną korzyść wynikającą z przyjęcia strategii Z2:
E(Z2) = P(s1) ⋅ E(Z2|s1) + P(s2) ⋅ E(Z2|s2) =
= 0.4 ⋅ 192 500 + 0.6 ⋅ 18 000 = 87 800.
W tejże tablicy pokazano także oczekiwane korzyści netto
zastosowania poszczególnych strategii - bezwarunkowe
korzyści pomniejszone o koszt przeprowadzenia dodatkowego
badania rynku - w naszym przykładzie przyjęto, że koszt
badania rynku wynosi 20 000$.
Warunkowe i bezwarunkowe korzyści odpowiadające
strategiom Zi
Strategia E(Zi|s1) E(Zi|s2)
E(Zi)
Oczekiwana
korzyść netto
Z1
200 000 -20 000
68 000
68 000
Z2
192 500
18 000
87 800
67 800
Z3
157 500 -18 000
52 200
32 200
Z4
150 000
20 000
72 000
72 000
Z5
142 500
58 000
91 800
71 800
Z6
107 500
22 000
56 200
36 200
Z7
100 000
60 000
76 000
76 000
Z8
185 000
56 000 107 600
87 600
Z9
115 000 -16 000
36 400
16 400
Stosując
jako
kryterium
wyboru
maksymalizację
oczekiwanej korzyści wybieramy jako optymalną strategię Z8 ,
dla której oczekiwana korzyść brutto E(Z8 )=107 600$.
Zwróćmy uwagę, że stosowanie strategii Z1 , Z4 i Z7
oznacza, że nie korzystamy z dodatkowej informacji - przy
liczeniu wartości oczekiwanej korzyści netto nie odliczamy
kosztów jej pozyskania.
Strategia Z8 jest również optymalna, gdy jako kryterium
optymalności
przyjmiemy
maksymalizację
oczekiwanej
korzyści netto - po odjęciu kosztów badania rynku.
Gdyby koszt badania rynku przewyższył kwotę 31 600$,
to strategie Z8 (z dodatkową informacją) i Z7 (bez
dodatkowej informacji) byłyby równoważne pod względem
wartości oczekiwanej korzyści netto.
Sytuację decyzyjną opisaną wyżej, ze względu na to, że
wyróżniliśmy jedynie dwa stany natury, można zilustrować na
wykresie.
Każdej strategii Zi został przyporządkowany punkt o
współrzędnych [ E(Zi|s1 ),E(Zi|s2)].
W dalszej analizie chwilowo abstrahujemy od wartości
prawdopodobieństw zajścia stanów natury s1 i s2. Mimo to, z
położenia punktów odpowiadających wyróżnionym strategiom
możemy wnioskować, że niektóre ze strategii mogą zostać na
wstępie wyeliminowane z dalszych rozważań.
Są to strategie, dla których można wskazać inną strategię
taką, że jedna ze współrzędnych jest większa co do wartości a
druga nie mniejsza. Takie strategie nazywamy strategiami
zdominowanymi. Zdominowane będą strategie: Z3, Z4, Z6, Z9.
Strategie, które nie są zdominowane nazywamy strategiami
dominującymi. Dominujące są, w naszym przykładzie
strategie: Z1, Z2, Z5, Z7, Z8.
80000
Z7
Z5
60000
Z8
40000
Z6
Z4
Z2
20000
0
0
40000
80000
120000
160000
200000
240000
Z9
-20000
Z3
Z1
-40000
Rys. Strategie decyzyjne dla Przykładu 2