Elementy teorii decyzji

Elementy teorii decyzji – gry z naturą (1) warunki pogodowe (stan natury)

decyzja

susza

normalne

deszcze

rolnika

s

s

s

1

2

3

d – zboŜe 1

24

28

36

1

d – zboŜe 2

31

30

28

2

d – zboŜe 3

28

34

29

4

d – zboŜe 4

27

29

33

4

d – zboŜe 5

31

30

29

5

Dwóch graczy:

1. decydent (rolnik) mający pięć moŜliwości;

2. natura (warunki pogodowe) mająca trzy moŜliwości Elementy teorii decyzji – gry z naturą (2) Analiza gry z naturą oparta jest na:

1. macierzy wypłat (macierz korzyści lub macierz strat)

24 28 36





31 30 28

A5×3 = 28 34 29





27 29 33

31 30 29





1

Elementy teorii decyzji – gry z naturą (3) Analiza gry z naturą oparta jest na:

1. analizie drzewa decyzyjnego

s1

24

s

2

2

28

d

s3

1

36

s1

31

s2

d

3

30

2

s3

28

s1

28

d

s

1

3

4

2

34

s3

29

s1

27

d

s2

4

5

29

s3

33

d

s1

5

31

s

6

2

30

s3

29

Podejmowanie decyzji w warunkach niepewności (1) Kryteria wyboru decyzji:

1. kryterium MaxiMax (kryterium ryzykanta, optymisty) 2. kryterium MaxiMin (kryterium asekuranta, pesymisty) 3. kryterium Hurwicza (kompromis pomiędzy MaxiMax a MaxiMin) 4. kryterium Savage’a (kryterium MiniMax „Ŝalu”) 5. kryterium Laplace’a (maksymalizacja oczekiwanego zysku) Podejmowanie decyzji w warunkach niepewności (2) Kryterium MaxiMax:

1. Dla kaŜdej decyzji d wyznacz maksymalny zysk o i

i

2. WskaŜ decyzję d , dla której maksymalny zysk o jest największy k

i

 o

max a

i =

{ ij}



j

 o

max o

k =

{ i}



i

24 28 36 o = max{24;28;36} = 36

1





31 30 28 o = max{31;30;28} = 31

2

A ×

o = max{28;34;29} = 34

5 3 = 28

34

29

o = max{36;31;34;33;31} = 36





3

k

27 29 33 o = max{27;29;33} = 33

4

31 30 29



 o = max{31;30;29} = 31

5

d1

2

Podejmowanie decyzji w warunkach niepewności (3) Kryterium MaxiMin:

1. Dla kaŜdej decyzji d wyznacz minimalny zysk p i

i

2. WskaŜ decyzję d , dla której minimalny zysk p jest największy k

i

 p

min a

i =

{ ij}



j

 p

max p

k =

{ i}



i

24 28 36 p = min{24;28;36} = 24

1





31 30 28 p = min{31;30;28} = 28

2

A ×

p = min{28;34;29} = 28

5 3 = 28

34

29

p = max{24;28;28;27;29} = 29





3

k

27 29 33 p = min{27;29;33} = 27

4

31 30 29



 p = min{31;30;29} = 29

5

d5

Podejmowanie decyzji w warunkach niepewności (4) Kryterium Hurwicza:

1. α ∈(0,1) – skłonność do ryzyka przy decyzji d

i

i

2. Dla kaŜdej decyzji d wyznacz średni waŜony zysk h z zysków: i

i

maksymalnego ( o ) i minimalnego ( p )

i

i

3. WskaŜ decyzję d , dla której średni waŜony zysk h jest największy k

i

 h

α o

1

(

α ) p

i =

i i +

− i i

 h max h

k =

{ i}



i

24 28 36 α = 0,1

h = 0,1×36 + (1-0,1)×24 = 25,2

1

1





31 30 28 α = 0,3

h = 0,3×31 + (1-0,3)×28 = 28,9

2

2

A ×

α = 0,5

h = 0,5×34 + (1-0,5)×28 = 29

5 3 = 28

34

29





3

3

27 29 33 α = 0,7

h = 0,7×33 + (1-0,7)×27 = 31,2

4

4

31 30 29



 α = 0,9

h = 0,9×31 + (1-0,9)×29 = 30,8

5

5

h = max{25,2; 28,9; 29; 31,2; 30,8} = 31,2

d

k

4

Podejmowanie decyzji w warunkach niepewności (5) Kryterium Savage’a:

1. Zbuduj macierz „Ŝalu” R

 a

max a

j =

{ ij}



i

R ×

r

a

a

m n = [ ij =

j −

ij ]

24 28 36

31− 24 = 7 34 − 28 = 6 36 − 36 = 0









31 30 28

 31− 31 = 0 34 − 30 = 4 36 − 28 = 8

A

R ×

5 3 = 31 − 28 = 3

34 − 34 = 0 36 − 29 = 7

5×3 = 28

34

29









27 29 33

31− 27 = 4 34 − 29 = 5 36 − 33 = 3





31 30 29

 31− 31 = 0 34 − 30 = 4 36 − 29 = 7





3

Podejmowanie decyzji w warunkach niepewności (6) Kryterium Savage’a (c.d.):

2.

Operując na macierzy „Ŝalu” R wyznacz dla kaŜdej decyzji di maksymalny „Ŝal” ri

3.

WskaŜ decyzję d , dla której Ŝal r jest najmniejszy k

i

 r

max r

i =

{ ij}



j

 r

min r

k =

{ i}



i

7 6 0

r = max{7;6;0} = 7

1





0 4 8

r = max{0;4;8} = 8

2

R

r = max{3;0;7} = 7

5×3 = 3

0

7

3

r = min{7;8;7;5;7} = 5





k

4 5 3

r = max{4;5;3} = 5

4





0 4 7

r = max{0;4;7} = 7

5

d4

Podejmowanie decyzji w warunkach niepewności (7) Kryterium Laplace’a:

1. Prawdopodobieństwo zaistnienia kaŜdego stanu natury jest jednakowe i wynosi: P{ s } = 1/ n

j

2. Dla kaŜdej decyzji d wyznacz oczekiwaną wartość zysku l uŜywając w/w i

i

prawdopodobieństwa stanu natury

3. WskaŜ decyzję d , dla której oczekiwana wartość zysku l jest największa k

i

 l

P s

{

a

}

1 n

a

i = ∑ n

n

j =1

/

j

ij =

∑ j=1 ij

 l max l

k =

{ i}



i

24 28 36

l = 1/3×24 + 1/3×28 + 1/3×36 = 29⅓

1





31 30 28

l = 1/3×31 + 1/3×30 + 1/3×28 = 29⅔

2

A ×

5 3 = 28

34

29

l = 1/3×28 + 1/3×34 + 1/3×29 = 30⅓





3

27 29 33

l = 1/3×27 + 1/3×29 + 1/3×33 = 29⅔

4

31 30 29





l = 1/3×31 + 1/3×30 + 1/3×29 = 30

5

l = max{29⅓; 29⅔; 30⅓; 29⅔; 30} = 30⅓

d

k

3

Podejmowanie decyzji w warunkach ryzyka (1)

warunki pogodowe (stan natury)

decyzja

susza

normalne

deszcze

rolnika

s

s

s

1

2

3

P{s } = 0,15

P{s } = 0,50

P{s } = 0,35

1

2

1

d – zboŜe 1

24

28

36

1

d – zboŜe 2

31

30

28

2

d – zboŜe 3

28

34

29

3

d – zboŜe 4

27

29

33

4

d – zboŜe 5

31

30

29

5

P{ s } – określone z góry prawdopodobieństwo zaistnienia stanu natury s j

j

– prawdopodobieństwo a priori

4

Podejmowanie decyzji w warunkach ryzyka (2)

Kryteria wyboru decyzji:

1. kryterium maksymalnej oczekiwanej wartości (MOW) 2. kryterium minimalnego oczekiwanego „Ŝalu”

Podejmowanie decyzji w warunkach ryzyka (3)

Kryterium maksymalnego oczekiwanego zysku (MOW): 1. Dla kaŜdej decyzji d wyznacz oczekiwaną wartość zysku E ( a) uŜywając i

i

określonych prawdopodobieństw stanu natury

2. WskaŜ decyzję d , dla której oczekiwana wartość zysku E ( a) jest k

i

największa

 E ( a)

i

= ∑ nj= {

P s } a

1

j

ij



P{s }=0,15 P{s }=0,50 P{s }=0,35

 E ( a)

1

2

3

k

= ma {

x E ( a

i

}



)

i

24 28 36

E ( a) = 0,15×24 + 0,50×28 + 0,35×36 = 30,20

1





31 30 28

E ( a) = 0,15×31 + 0,50×30 + 0,35×28 = 29,45

2

A ×

E ( a) = 0,15×28 + 0,50×34 + 0,35×29 = 31,35

5 3 = 28

34

29





3

27 29 33

E ( a) = 0,15×27 + 0,50×29 + 0,35×33 = 30,10

4

31 30 29





E ( a) = 0,15×31 + 0,50×30 + 0,35×29 = 29,80

5

E ( a)= max{30,20; 29,45; 31,35; 30,10; 29,80} = 31,35

d

k

3

Podejmowanie decyzji w warunkach ryzyka (4)

Kryterium minimalnego oczekiwanego „Ŝalu” : 1. Dla kaŜdej decyzji d wyznacz oczekiwaną wartość „Ŝalu” E ( r) uŜywając i

i

określonych prawdopodobieństw stanu natury

2. WskaŜ decyzję d , dla której oczekiwana wartość „Ŝalu” E ( r) jest k

i

najmniejsza

 E ( r)

i

= ∑ nj= {

P s } r

1

j

ij



P{s }=0,15 P{s }=0,50 P{s }=0,35

 E ( r)

1

2

3

k

= mi {

n E ( r

i

}



)

i

7 6 0

E ( r) = 0,15×7 + 0,50×6 + 0,35×0 = 4,05

1





0 4 8

E ( r) = 0,15×0 + 0,50×4 + 0,35×8 = 4,80

2

A ×

E ( r) = 0,15×3 + 0,50×0 + 0,35×7 = 2,90

5 3 = 3

0

7





3

4 5 3

E ( r) = 0,15×4 + 0,50×5 + 0,35×3 = 4,15

4

0 4 7





E ( r) = 0,15×0 + 0,50×4 + 0,35×7 = 4,45

5

E ( r)= min{4,05; 4,80; 2,90; 4,15; 4,45} = 2,90

d

k

3

5

Podejmowanie decyzji w warunkach ryzyka (5)

Cena graniczna doskonałej informacji

Cena graniczna doskonałej (perfekcyjnej) informacji to maksymalna kwota, jaką warto zainwestować w dodatkowe badanie związane z poznaniem przyszłego zachowania się natury. Doskonała informacja to wiedza o przyszłym stanie natury przed podjęciem decyzji.

Jaka będzie korzyść w warunkach doskonałej (perfekcyjnej) informacji ( OKPI)?

 a

max a

j =

{ ij}



j

P{s }=0,15 P{s }=0,50 P{s }=0,35



1

2

3

 OKPI = ∑ n P s

{

a

j =1

}

j

j

24 28 36

s : a = max{24; 31; 28; 27; 31} = 31

1

1





31 30 28

s : a = max{28; 30; 34; 29; 30} = 34

2

2

A ×

s : a = max{36; 28; 29; 33; 29} = 36

5 3 = 28

34

29





3

3

27 29 33

31 30 29





OKPI = P{ s }× a + P{ s }× a + P{ s }× a =

1

1

2

2

3

3

= 0,15×31 + 0,50×34 + 0,35×36 = 34,25

Podejmowanie decyzji w warunkach ryzyka (6)

Cena graniczna doskonałej informacji (c.d.)

Cena graniczna doskonałej (perfekcyjnej) informacji ( CGPI) wynika z porównania korzyści osiąganej w warunkach doskonałej informacji z korzyścią osiąganą w warunkach zwykłych, tzn. w warunkach kiedy decyzja musi być podjęta przed zarejestrowaniem stanu natury.

Jest to róŜnica pomiędzy OKPI a kwotą uzyskaną z zastosowania kryterium maksymalnej oczekiwanej wartości ( MOW):

CGPI = OKPI – MOW = 34,25 – 31,35 = 2,90

Uzyskana kwota CGPI jest równa minimalnemu oczekiwanemu „Ŝalowi”: CGPI = E ( r)

k

Podejmowanie decyzji z wykorzystaniem dodatkowej informacji (1) ZałóŜmy, Ŝe dla na zaistnienie stanu natury s ma istotny wpływ K czynników j

(wskaźników): I , I , I ,…, I . Celem analizy jest określenie prawdopodobieństw 1 2 3

K

warunkowych P{ s | I }, tzn. prawdopodobieństw zaistnienia stanu natury s pod j k

j

warunkiem, Ŝe wystąpił czynnik I ( k=1,2,…, K).

k

P{ s | I } – prawdopodobieństwa a posteriori – zrewidowana forma j k

prawdopodobieństw a priori P{ s }

j

Najczęściej w wyniku dodatkowych badań (eksperymentów) szacuje się prawdopodobieństwa warunkowe P{ I | s }

j

k

{

P I | s } {

P s }

{

P s | I }

k

j

j

=

j

k

{

P I }

k

gdzie

{

P I }

n

= ∑

{

P I ∩ s }

n

∑

{

P I | s } {

P s }

k

j 1

=

=

k

j

j 1

=

k

j

j

6

Podejmowanie decyzji z wykorzystaniem dodatkowej informacji (2)

stan natury

Czynniki

susza

normalne

deszcze

s

s

s

1

2

3

I

10%

30%

50%

1

I

40%

50%

25%

2

I

50%

20%

25%

3

stan natury

Czynniki

susza

normalne

deszcze

s

s

s

1

2

3

I

0,1

0,3

0,5

1

I

0,4

0,5

0,25

2

I

0,5

0,2

0,25

3

Podejmowanie decyzji z wykorzystaniem dodatkowej informacji (3)

I :

Określenie prawdopodobieństw warunkowych P{ s | I }:

1

j 1

P{ s }

P{ I | s }

P{ I

j

1

j

∩ s }

P{ s | I }

1

j

j 1

s

0,15

0,10

0,15

1

×0,10=0,0150

0,0150/0,3400=0,0441

s

0,50

0,30

0,50

2

×0,30=0,1500

0,1500/0,3400=0,4412

s

0,35

0,50

0,35

3

×0,50=0,1750

0,1750/0,3400=0,5147

∑

1,00

×

P{ I } = 0,3400

1,0000

1

I :

Określenie prawdopodobieństw warunkowych P{ s | I }:

2

j 2

P{ s }

P{ I | s }

P{ I

j

2

j

∩ s }

P{ s | I }

2

j

j 2

s

0,15

0,40

0,15

1

×0,40=0,0600

0,0600/0,3975=0,1509

s

0,50

0,50

0,50

2

×0,50=0,2500

0,2500/0,3975=0,6289

s

0,35

0,25

0,35

3

×0,25=0,0875

0,0875/0,3975=0,2202

∑

1,00

×

P{ I } = 0,3975

1,0000

2

Podejmowanie decyzji z wykorzystaniem dodatkowej informacji (4)

I :

Określenie prawdopodobieństw warunkowych P{ s | I }:

3

j 3

P{ s }

P{ I | s }

P{ I

j

3

j

∩ s }

P{ s | I }

3

j

j 3

s

0,15

0,50

0,15

1

×0,50=0,0750

0,0750/0,2625=0,2857

s

0,50

0,20

0,50

2

×0,20=0,1000

0,1000/0,2625=0,3810

s

0,35

0,25

0,35

3

×0,25=0,0875

0,0875/0,2625=0,3333

∑

1,00

×

P{ I } = 0,2625

1,0000

3

7

Podejmowanie decyzji z wykorzystaniem dodatkowej informacji (5) Wyznaczenie optymalnej decyzji przy wykorzystaniu kryterium maksymalnego oczekiwanego zysku (MOW):

1.

Prawdopodobieństwa a priori P{ s } zostają zastąpione j

prawdopodobieństwami a posteriori

2.

Decyzje optymalne podejmowane są dla oddzielnie uwzględnianych czynników Ik

 E ( a)

n

P s

I a

i| I

= ∑ j= { | }

1

j

k

ij



k

*

 E ( a) max E

a

i| I

=

i I

k

{ (

| k

}



)

i

Podejmowanie decyzji z wykorzystaniem dodatkowej informacji (6) Optymalna decyzja jeŜeli wystąpi czynnik I – kryterium MOW:

1

 E ( a)

n

P s

I a

i| I

= ∑ j= { | }

1

j

1

ij



1

*

 E ( a) max E

a

i| I

=

i| I

1

{ (1 }



)

i

P{ s | I }=0,0441 P{ s | I }=0,4412 P{s | I }=0,5147

1 1

2 1

3 1

24 28 36

E

( a) = 0,0441×24 + 0,4412×28 + 0,5147×36 = 31,9412

1|I1





31 30 28

E

( a) = 0,0441×31 + 0,4412×30 + 0,5147×28 = 29,0147

2|I1

A ×

5 3 = 28

34

29

E

( a) = 0,0441×28 + 0,4412×34 + 0,5147×29 = 31,1619





3|I1

27 29 33

E

( a) = 0,0441×27 + 0,4412×29 + 0,5147×33 = 30,9706

4|I1

31 30 29





E

( a) = 0,0441×31 + 0,4412×30 + 0,5147×29 = 29,5254

5|I1

E*

( a)= max{31,9412; 29,0147; 31,1619; 30,9706; 29,5254} = 31,9412

d

k|I1

1

Podejmowanie decyzji z wykorzystaniem dodatkowej informacji (7) Optymalna decyzja jeŜeli wystąpi czynnik I – kryterium MOW:

2

 E ( a)

n

P s

I a

i| I

= ∑ j= { | }

1

j

1

ij



2

*

 E ( a) max E

a

i| I

=

i| I

2

{ (2 }



)

i

P{ s | I }=0,1509 P{ s | I }=0,6289 P{s | I }=0,2202

1 2

2 2

3 2

24 28 36

E

( a) = 0,1509×24 + 0,6289×28 + 0,2202×36 = 29,1580

1|I2





31 30 28

E

( a) = 0,1509×31 + 0,6289×30 + 0,2202×28 = 29,7105

2|I2

A ×

5 3 = 28

34

29

E

( a) = 0,1509×28 + 0,6289×34 + 0,2202×29 = 31,9936





3|I2

27 29 33

E

( a) = 0,1509×27 + 0,6289×29 + 0,2202×33 = 29,5790

4|I2

31 30 29





E

( a) = 0,1509×31 + 0,6289×30 + 0,2202×29 = 29,9307

5|I2

E*

( a)= max{29,1580; 29,7105; 31,9936; 29,5790; 29,9307} = 31,9936

d

k|I2

3

8

Podejmowanie decyzji z wykorzystaniem dodatkowej informacji (8) Optymalna decyzja jeŜeli wystąpi czynnik I – kryterium MOW:

3

 E ( a)

n

P s

I a

i| I

= ∑ j= { | }

1

j

1

ij



3

*

 E ( a) max E

a

i| I

=

i| I

3

{ (3 }



)

i

P{ s | I }=0,2857 P{ s | I }=0,3810 P{s | I }=0,3333

1 3

2 3

3 3

24 28 36

E

( a) = 0,2857×24 + 0,3810×28 + 0,3333×36 = 29,5236

1|I3





31 30 28

E

( a) = 0,2857×31 + 0,3810×30 + 0,3333×28 = 29,6191

2|I3

A ×

5 3 = 28

34

29

E

( a) = 0,2857×28 + 0,3810×34 + 0,3333×29 = 30,6193





3|I3

27 29 33

E

( a) = 0,2857×27 + 0,3810×29 + 0,3333×33 = 29,7618

4|I3

31 30 29





E

( a) = 0,2857×31 + 0,3810×30 + 0,3333×29 = 29,9524

5|I3

E*

( a)= max{29,5236; 29,6191; 30,6193; 29,7618; 29,9524} = 30,6193

d

k|I3

3

Podejmowanie decyzji z wykorzystaniem dodatkowej informacji (9) Oczekiwana korzyść dodatkowej informacji

OKDI = ∑ K P{ I } E* ( a) k =1

k

i| I k

P{I } = 0,3400 E*

( a) = 31,9412

1

k|I1

P{I } = 0,3975 E*

( a) = 31,9936

2

k|I2

P{I } = 0,2625 E*

( a) = 30,6193

3

k|I3

OKDI = P{ I }× E*

( a) + P{ I }× E*

( a) + P{ I }× E*

( a) =

1

k|I1

2

k|I2

3

k|I3

= 0,3400×31,9412 + 0,3975×31,9936 + 0,2625×30,6193 = 31,6150

Podejmowanie decyzji z wykorzystaniem dodatkowej informacji (10) Oczekiwana wartość dodatkowej informacji

Jest to róŜnica pomiędzy oczekiwaną korzyścią przy uwzględnieniu dodatkowej informacji ( OKDI) a oczekiwaną korzyścią bez uwzględnienia dodatkowej informacji, tzn. kwotą uzyskaną z zastosowania kryterium maksymalnej oczekiwanej wartości ( MOW):

OWDI = OKDI – MOW = 31,6150 – 31,35 = 0,265

9

Podejmowanie decyzji z wykorzystaniem dodatkowej informacji (11) Efektywność dodatkowej informacji

Jest to iloraz oczekiwanej wartości dodatkowej informacji ( OWDI) do ceny granicznej doskonałej informacji ( CGPI):

= OWDI

EDI

×10 %

0

CGPI

,

0 265

EDI =

×10 %

0

= 1

,

9

%

4

9

,

2 0

10