Drzewo decyzyjne

Przedstawienie

za

pomocą

tablicy

lub

tablic

decyzyjnych problemu wieloetapowego jest raczej trudne

i może prowadzić do dużych niejasności.

Rozwiązanie problemu decyzyjnego w warunkach

niepewności, polegające na wyznaczeniu optymalnej

decyzji, może być przedstawione na odpowiednim

wykresie, zwanym dendrytem, lub - jak przyjęto ten

wykres nazywać w teorii podejmowania decyzji -

drzewem decyzyjnym. Każde drzewo decyzyjne składa

się z dwóch rodzajów węzłów.

• węzłów decyzyjnych, oznaczanych kwadratami,

• węzłów losowych, oznaczanych okręgami.

Jeżeli podmiot podejmujący decyzję znajduje się w

węźle oznaczonym kwadratem, to może wówczas wybrać

dowolną drogę, co jest równoznaczne z wyborem

określonej decyzji. Gdy podmiot znajduje się w węźle

losowym oznaczonym okręgiem, to jego dalsza droga nie

zależy od jego decyzji, lecz jest wyznaczona przez

czynniki zewnętrzne.

wierzchołek

odgałęzienia

wierzchołki

odgałęzienia wypłata

decyzyjny

decyzyjne

stanów natury

stanów natury

68000

0.4

s1

200 000

d1

2

0.6

-20 000

s2

72000

0.4

d

s

150 000

2

1

1

3

0.6

s2

20 000

76000

0.4

d3

s1

100 000

4

0.6

60 000

s2

Rys. Drzewo decyzyjne dla Przykładu 1

Wyznaczanie optymalnej decyzji:

Ogólną zasadą jest zawsze analiza drzewa decyzyjnego od strony prawej ku lewej, a

mówiąc obrazowo, od gałązek do gałęzi i konarów, albo inaczej - od korony do pnia

drzewa. Analiza taka nosi w teorii podejmowania decyzji nazwę indukcji wstecznej ( backward induction).

W naszym przypadku węzłami położonymi najdalej na prawo są węzły losowe

(oznaczone okręgami), które dla ułatwienia zostały ponumerowane. Od tych właśnie węzłów zaczynamy analizę. I tak, gdybyśmy znaleźli się w węźle (2) wówczas oczekiwana korzyść (wygrana, wypłata, zysk) wyniosłaby:

E a

2 = 0.4 ⋅ 200 000 + 0.6 ⋅ (-20 000) = 68 000$

Podobnych obliczeń dokonujemy dla pozostałych dwóch węzłów i otrzymujemy

odpowiednio dla węzła (3)- 72000$, dla węzła (4) - 76000$.

Następnie cofamy się do węzła leżącego dalej na lewo. Jest to węzeł decyzyjny, a więc od podmiotu decyzyjnego zależy, którą spośród czterech możliwych dróg wybierzemy. Kierując się zasadą maksymalizacji oczekiwanej wygranej Bayes'a-Laplace'a, za optymalną musimy uznać drogę odpowiadającą decyzji d3 , gdyż gwarantuje ona największą oczekiwaną korzyść. Drogi odpowiadające pozostałym decyzjom, tj. d1 i d2, zgodnie z przyjętym w literaturze przedmiotu zwyczajem, blokujemy dwoma kreskami prostopadłymi do danej gałęzi. W rezultacie, będąc w węźle [1], możemy sobie zapewnić - wybierając optymalną decyzję d3 - oczekiwaną korzyść wynoszącą 76 000$, co zapisujemy nad węzłem [1]. W ten sposób analiza procesu decyzyjnego została zakończona.

Znajdując się w węźle [1] idziemy drogą równoważną z podjęciem decyzji d3

(pozostałe drogi są zablokowane); docierając do węzła (4) zapewniamy sobie maksymalną oczekiwaną korzyść w wysokości 76 000$. Dalsza droga z węzła (4), który jest węzłem losowym, nie zależy od podmiotu podejmującego decyzje. Z tego też względu nie da się przewidzieć dokładnie jaką uzyskamy korzyść - może to być

100 000$ lub 60 000$.

0.4

s1

200 000 $

d

68 000

1

3

0.6

s2

-20 000 $

76 000

s1

0.4

72 000

4

150 000 $

2

d2

0.6

s2

20 000 $

0.4

s1

(*)

76 000

100 000 $

5

0.6

d

3

s2

60 000 $

1

s1

0.92

182 400

d

1

200 000 $

9

s2

182 400

0.08

-20 000 $

(**)

139 600

s1

0.92

7

d

150 000 $

2

10

s

2

0.08

20 000 $

96 800

0.92

s

d

1

100 000 $

w

3

1

11

s2

0.08

60 000 $

0.37

6

0.095

s1

900

200 000 $

0.63

d1

12

w

0.905

s2

2

63 800

107 682

-20 000 $

32 350

s

0.095

1

150 000 $

d2

8

13

0.905

s2

20 000 $

s

0.095

1

100 000 $

63 800

d

3

14

0.905

60 000 $

s2

(*) - nie korzystamy z informacji dodatkowej

(**) - korzystamy z informacji dodatkowej

Rys. Drzewo decyzyjne dla Przykładu 2 z analizą bayesowską.

Uzyskane wyniki, mimo, że jeszcze nie wyczerpują

analizy są dość interesujące. Zwróćmy uwagę na dwa

nasuwające się wnioski:

- uzyskane wyniki określają, którą z decyzji d1 , d2 albo d3

należy podjąć, w zależności od posiadanej informacji,

- nie każda z możliwych do uzyskania informacji

wstępnych

poprawia

naszą

sytuację.

W

przypadku

odgałęzienia "bez informacji", jeżeli przed podjęciem decyzji

nie pobieramy żadnej dodatkowej informacji, to zapewniamy

sobie oczekiwaną korzyść (zysk) na poziomie 76.000$. Gdyby

jednak w wyniku badania rynku przed podjęciem ostatecznej

decyzji okazało się, że wskaźnik rynku jest równy w2 , to

maksymalna spodziewana korzyść (zysk) jaką można uzyskać

będzie kształtowała się na poziomie 63.800$. Posiadanie

dodatkowej

informacji

pozwala

uprecyzyjnić

ocenę

oczekiwanego zysku w zależności od tego co obserwujemy na

rynku i ostrzegać nas, ewentualnie, przed podjęciem złej

decyzji.

Znając maksymalne oczekiwane korzyści odpowiadające

węzłom [2], [7], [8] przesuwamy się w lewą stronę do węzła

(6) i obliczamy oczekiwaną korzyść odpowiadającą temu

węzłowi. Będąc w tym węźle dokonaliśmy już wyboru, że

przeprowadzamy badanie rynku, ale nie znamy jeszcze jego

wyniku. Znamy jedynie odpowiednie prawdopodobieństwa i

maksymalną oczekiwaną korzyść jaką możemy sobie

zapewnić w zależności od otrzymania w1 lub w2 - wynosi ona

107 682$. Jest ona wprawdzie większa od oczekiwanej

korzyści odpowiadającej gałęzi "bez informacji dodatkowej",

ale musimy zdawać sobie sprawę, że przeprowadzenie badania

rynku związane jest z pewnymi kosztami. Łatwo obliczyć, że

granicą opłacalności zbierania dodatkowej informacji w tym

przypadku jest 31 682$.

Ocena strategii decyzyjnych

Alternatywną

metodą

rozwiązywania

procesów

decyzyjnych w warunkach niepewności do analizy drzewa

decyzyjnego jest analiza w oparciu o dokonywanie oceny

poszczególnych strategii decyzyjnych. Metoda ta może być

stosowana komplementarnie.

Punktem

startowym

metody

oceny

strategii

jest

konstrukcja

wszystkich

możliwych

reguł

decyzyjnych

przyporządkowujących

poszczególnym

sytuacjom

decyzyjnym różne decyzje. Jeśli możliwych sytuacji

decyzyjnych jest k a możliwych decyzji n, to rachunek

kombinatoryczny

wskazuje,

że

ogólna

liczba

reguł

decyzyjnych wynosi nk . Reguły te nazywamy strategiami. W

omawianym przez nas Przykładzie 2 (rozszerzonym o

możliwość uzyskania dodatkowej informacji) ogólna liczba

strategii wynosi 32 =9 1). W Tablicy przedstawiamy

wszystkie strategie decyzyjne dla omawianego przykładu.

1 ) Sytuacje decyzyjne w naszym przykładzie różnicujemy według tego czy zaobserwowaliśmy wskaźnik rynku w1

czy w2.

Strategie decyzyjne dla Przykładu 2

Strategia

Reguła

Strategia

Reguła

decyzyjna

decyzyjna

Z1

w →

Z

→

1

d1

2

w1

d1

w →

→

2

d1

w2

d2

Z3

w →

Z

→

1

d2

4

w1

d2

w →

→

2

d1

w2

d2

Z5

w →

Z

→

1

d2

6

w1

d3

w →

→

2

d3

w2

d2

Z7

w →

Z

→

1

d3

8

w1

d1

w →

→

2

d3

w2

d3

Z9

w →

1

d3

w →

2

d1

Strategie oznaczamy symbolicznie pisząc za numerem

strategii Zi i=1,...,nk , w nawiasie, decyzje przyporządkowane

poszczególnym

sytuacjom

decyzyjnym

(w

naszym

przykładzie - wskaźnikom rynku), np. Z6 (d3,d2 ).

Po ustaleniu zbioru wszystkich możliwych strategii należy

określić

oczekiwane

korzyści

(lub

użyteczności)

odpowiadające poszczególnym strategiom. Prześledzimy tok

rozumowania i przeprowadzimy związane z tym obliczenia

dla strategii Z2 (d1,d2).

Przypomnijmy:

Prawdopodobieństwa warunkowe wskaźników badania

Stany natury

Wskaźniki badania

2

∑ P( w s )

l

j

l 1

=

w1

w2

s1

P(w1|s1)= 0.85 P(w2|s1)= 0.15

1

s2

P(w1|s2)= 0.05 P(w2|s2)= 0.95

1

Załóżmy, że mieliśmy do czynienia z wysoką akceptacją usług

firmy na rynku - stan natury s1. Wiemy, że podjęcie decyzji d1

daje korzyść w wysokości 200 000$, natomiast podjęcie

decyzji d2 daje korzyść równą 150 000$. Biorąc pod uwagę

prawdopodobieństwa

warunkowe

wskaźników

rynku

P(w1|s1)=0.85 oraz P(w2|s1)=0.15, warunkowa oczekiwana

korzyść (wypłata) przy przyjęciu strategii Z2 wynosi:

E(Z2|s1) = 0.85⋅200 000 + 0.15⋅150 000 = 192 500.

Podobne rozumowanie prowadzi do obliczenia warunkowej

wartości oczekiwanej, przy założeniu zaistnienia stanu natury

s2 $. Biorąc pod uwagę prawdopodobieństwa warunkowe

wskaźników rynku P(w1|s2)=0.05 oraz P(w2|s2)=0.95:

E(Z2|s2) = 0.05⋅(-20 000) + 0.95⋅20 000 = 18 000 .

Wykorzystując informację o prawdopodobieństwach a priori

stanów natury s1 i s2 możemy obliczyć bezwarunkową

oczekiwaną korzyść wynikającą z przyjęcia strategii Z2:

E(Z2) = P(s1) ⋅ E(Z2|s1) + P(s2) ⋅ E(Z2|s2) =

= 0.4 ⋅ 192 500 + 0.6 ⋅ 18 000 = 87 800.

W tejże tablicy pokazano także oczekiwane korzyści netto

zastosowania poszczególnych strategii - bezwarunkowe

korzyści pomniejszone o koszt przeprowadzenia dodatkowego

badania rynku - w naszym przykładzie przyjęto, że koszt

badania rynku wynosi 20 000$.

Warunkowe i bezwarunkowe korzyści odpowiadające

strategiom Zi

Strategia E(Zi|s1) E(Zi|s2)

E(Zi)

Oczekiwana

korzyść netto

Z1

200 000 -20 000

68 000

68 000

Z2

192 500

18 000

87 800

67 800

Z3

157 500 -18 000

52 200

32 200

Z4

150 000

20 000

72 000

72 000

Z5

142 500

58 000

91 800

71 800

Z6

107 500

22 000

56 200

36 200

Z7

100 000

60 000

76 000

76 000

Z8

185 000

56 000 107 600

87 600

Z9

115 000 -16 000

36 400

16 400

Stosując

jako

kryterium

wyboru

maksymalizację

oczekiwanej korzyści wybieramy jako optymalną strategię Z8 ,

dla której oczekiwana korzyść brutto E(Z8 )=107 600$.

Zwróćmy uwagę, że stosowanie strategii Z1 , Z4 i Z7

oznacza, że nie korzystamy z dodatkowej informacji - przy

liczeniu wartości oczekiwanej korzyści netto nie odliczamy

kosztów jej pozyskania.

Strategia Z8 jest również optymalna, gdy jako kryterium

optymalności

przyjmiemy

maksymalizację

oczekiwanej

korzyści netto - po odjęciu kosztów badania rynku.

Gdyby koszt badania rynku przewyższył kwotę 31 600$,

to strategie Z8 (z dodatkową informacją) i Z7 (bez

dodatkowej informacji) byłyby równoważne pod względem

wartości oczekiwanej korzyści netto.

Sytuację decyzyjną opisaną wyżej, ze względu na to, że

wyróżniliśmy jedynie dwa stany natury, można zilustrować na

wykresie.

Każdej strategii Zi został przyporządkowany punkt o

współrzędnych [ E(Zi|s1 ),E(Zi|s2)].

W dalszej analizie chwilowo abstrahujemy od wartości

prawdopodobieństw zajścia stanów natury s1 i s2. Mimo to, z

położenia punktów odpowiadających wyróżnionym strategiom

możemy wnioskować, że niektóre ze strategii mogą zostać na

wstępie wyeliminowane z dalszych rozważań.

Są to strategie, dla których można wskazać inną strategię

taką, że jedna ze współrzędnych jest większa co do wartości a

druga nie mniejsza. Takie strategie nazywamy strategiami

zdominowanymi. Zdominowane będą strategie: Z3, Z4, Z6, Z9.

Strategie, które nie są zdominowane nazywamy strategiami

dominującymi. Dominujące są, w naszym przykładzie

strategie: Z1, Z2, Z5, Z7, Z8.

80000

Z7

Z5

60000

Z8

40000

Z6

Z4

Z2

20000

0

0

40000

80000

120000

160000

200000

240000

Z9

-20000

Z3

Z1

-40000

Rys. Strategie decyzyjne dla Przykładu 2