1944


ELEMENTY ANALIZY PROCESÓW DECYZYJNYCH

Gry z naturą

Własności problemów decyzyjnych, które można rozwiązać wykorzystując metody teorii gier

  1. Istnieje skończona liczba uczestników gry (zarówno zainteresowanych jak i nie zainteresowanych jej wynikiem).

  2. Każdy uczestnik dysponuje skończoną liczbą sposobów działania.

  3. Uczestnicy, którzy chcą zastosować teorię gier, muszą znać wszystkie sposoby działania innych uczestników, nie wiedząc jednak, które z nich zostaną wybrane.

  4. Każdej kombinacji sposobów działania wszystkich uczestników odpowiada określona korzyść płynąca z gry.

  5. Korzyść uczestnika gry zależy zarówno od jego działania, jak i od działania pozostałych uczestników.

  6. Wszystkie możliwe wyniki gry dadzą się wyliczyć.

Sytuacja odpowiadająca powyższym warunkom zwana jest grą.

"Gra z naturą" - decyzję podejmuje tylko jeden uczestnik gry, posiadając informację o możliwych stanach, w jakich znajdzie się otoczenie, wpływających na korzyści wynikające z podjęcia decyzji.

Przykład 1

Firma specjalizująca się w zakresie przetwarzania informacji, analizy danych, itp. zamierza wydzierżawić system komputerowy wspomagający jej usługi. Wchodzą w grę trzy możliwości:

d1 - dzierżawa dużego systemu komputerowego,

d2 - dzierżawa średniego systemu komputerowego,

d3 - dzierżawa małego systemu komputerowego.

Wybór jednej z trzech decyzji powinien prowadzić do uzyskania maksymalnego zysku przez firmę. Zysk ten zależy jednak od tego jak zachowa się rynek klientów w zakresie tego typu usług.

W grę wchodzą dwie możliwości:

s1 - wysoka akceptacja oferowanych usług lub

s2 - niska akceptacja oferowanych usług.

Każdej parze (di ,sj ) i=1,2,3, j=1,2 odpowiada pewna kwota zysku jaki osiągnie firma.

I tak, np.: przy decyzji o wydzierżawieniu małego systemu i dużej akceptacji dla oferowanych przez firmę usług (para: (d3 ,s1 )) zysk wynosi 100.000 zł. Dla decyzji (d1 ,s2 ) - duży system i mała akceptacja - zysk wyniesie -20.000 zł, czyli poniesiemy stratę. Zakładamy, że klienci nie działają świadomie na niekorzyść firmy. Również firma nie jest zainteresowana oferowaniem kiepskich usług za wygórowaną opłatą. Jaką decyzję powinna podjąć firma ?

Każdej parze (di ,sj) odpowiada pewna wielkość nazywana wypłatą (korzyścią). Wypłaty zestawia się w, tzw. tablicę wypłat, w której wiersze są przyporządkowane graczowi I a kolumny odpowiadają stanom natury (tu: sytuacji rynkowej).

Tablica wypłat dla Przykładu 1

decyzja firmy

zachowanie rynku

s1

s2

d1

200 000

-20 000

d2

150 000

20 000

d3

100 000

60 000

W omawianym przykładzie macierz wypłat jest następująca:

s1 s2

A = [aij] = 0x01 graphic
0x01 graphic

Kryteria nieprobabilistyczne w grach z naturą

MaxiMin - postępowanie pesymisty (asekuranta)

Pesymista (asekurant) określa dla każdej swojej decyzji najgorszy możliwy wynik (minimalną wypłatę) 0x01 graphic
a następnie wybiera taką decyzję dk, dla której tak określona minimalna (gwarantowana) wypłata jest największa.

0x01 graphic

0x01 graphic

Firma podejmuje decyzję d3 o wydzierżawieniu małego systemu komputerowego.

MaxiMax - postępowanie optymisty (ryzykanta)

Optymista (ryzykant) określa dla każdej swojej decyzji najwyższy możliwy wynik (maksymalną wypłatę ) wio a następnie wybiera taką decyzję dk, dla której tak określona maksymalna (ale nie gwarantowana) wypłata jest największa.

dk : wko = 0x01 graphic
{ wio } , gdzie: wio = 0x01 graphic
{ aij }

Dla rozważanego przykładu postępowanie wg zasady MaxiMax'u jest następujące:

0x01 graphic

Firma podejmuje decyzję d1 o wydzierżawieniu dużego systemu komputerowego - nie bierze pod uwagę możliwej straty w przypadku małej akceptacji swoich usług przez klientów.

Kryterium Hurwicza - postępowanie pośrednie (mieszane)

Jest to postępowanie pośrednie pomiędzy postępowaniem pesymisty (asekuranta) a postępowaniem optymisty (ryzykanta). Reguła Hurwicza przyporządkowuje każdej decyzji di indeks h(di), który jest ważoną średnią minimalnej i maksymalnej wypłaty związanej z decyzją. Wybierana jest decyzja, której odpowiada maksymalna wartość h().

Oznaczmy:

αi - skłonność decydenta do ryzyka (optymizmu) przy wyborze decyzji di, αi∈[0,1].

(Zatem 1-αi jest skłonnością do bycia pesymistą (asekurantem).

Dla każdej decyzji di wyznaczamy hipotetyczną wygraną h(di)

h(di ) =αi wio + (1-αi)wip .

Należy wybrać taką decyzję, dla której hipotetyczna wygrana h(di) jest największa.

dk: h(dk ) = max { h(di) }.

Rozważymy dwa przypadki rozwiązania problemu prezentowanego w przykładzie zgodnie z kryterium Hurwicza przy przyjęciu różnych założeń odnośnie wag αi :

Przypadek (a)

Przyjmijmy α1 = α2 = α3 = 0,5, tzn. że przy każdej z trzech decyzji jesteśmy w jednakowym stopniu pesymistą i optymistą. Jest to postępowanie właściwe w przypadkach, gdy nie jesteśmy w stanie określić prawdopodobieństw zajścia "stanów natury" sj .

0x01 graphic

Właściwą decyzją jest w tym przypadku decyzja d1 (duży system).

Przypadek (b).

Przyjmijmy α1=0.6, α2 =0.5 oraz α3 = 0.4. Oznacza to, że przy decyzji d1 mamy większą skłonność do bycia asekurantem, przy decyzji d2 jesteśmy pół na pół asekurantem i ryzykantem oraz przy decyzji d3 mamy skłonność być większym ryzykantem.

0x01 graphic

W tym przypadku właściwą decyzją jest decyzja d1 (system komputerowy o dużych rozmiarach).

Wybór decyzji optymalnej zgodnie z kryterium Hurwicza może być bardzo wrażliwy na dobrane subiektywne wagi αi . Załóżmy, że i αi =α.

Wówczas

h(d1 ) = -20α + 200 - 200α = -220α + 200

h(d2 ) = 20α + 150 - 150α = -130α + 150

h(d3) = 60α + 100 - 100α = -40α + 100 .

0x01 graphic
0x08 graphic

Rys.1 Funkcja wagowa h(•) dla analizy optymalności według Hurwicza

Analiza zachowania się indeksów h(•) jako funkcji wagi α, wykazuje, że w powyższym przykładzie:

Minimax "żalu" - Savage'a

Macierz wypłat A = [aij ] transformujemy do postaci macierzy "żalu" R = [rij] w następujący sposób:

Określamy maksymalną wypłatę ai dla każdego "stanu natury" j=1,…n

0x01 graphic

a następnie obliczamy wartości elementów rij według wzoru:

rij = aj - aij .

Elementy macierzy "żalu" rij wyrażają naszą stratę z powodu podjęcia decyzji nieoptymalnej z punktu widzenia zaistniałego stanu natury. Do macierzy "żalu" stosujemy postępowanie według reguły MinMax, tzn. wskazujemy decyzję dk, dla której największa strata ("żal") z powodu źle podjętej decyzji będzie możliwie najmniejsza.

dk: 0x01 graphic

0x01 graphic
[rij] = 0x01 graphic

macierz „żalu”

0x08 graphic
0x01 graphic

Zgodnie z kryterium Savage'a firma powinna wybrać decyzję d2 - wydzierżawienie systemu komputerowego o średnich rozmiarach.

Kryteria probabilistyczne w grach z naturą

Zakładamy, że znamy rozkład prawdopodobieństwa dla stanów natury (w naszym przykładzie naturą jest rynek usług firmy). W najprostszym układzie wiedza ta sprowadza się do znajomości prawdopodobieństwa zaistnienia określonego stanu natury, tj. P(sj) j=1,…n. Stosowane podejścia noszą nazwę kryterium Bayesa-Laplace'a. Prawdopodobieństwa można oszacować na podstawie dostępnych informacji historycznych, specjalnie przeprowadzonego badania statystycznego, metodą ekspercką bądź wykorzystać subiektywne oceny prawdopodobieństw.

Maksymalizacja oczekiwanej korzyści

Wybieramy decyzję, dla której wartość oczekiwanej wypłaty (zysku) będzie największa, tj.

dk : Eka = 0x01 graphic

0x01 graphic

Oparcie decyzji na oczekiwanej wypłacie prowadzi do wyboru decyzji d3.

Minimalny oczekiwany "żal" (strata)

Wybieramy taką decyzję, dla której wartość oczekiwanej straty ("żalu") będzie najmniejsza, tj.

dk : 0x01 graphic

Dla rozważanego przykładu oparcie decyzji na minimalizacji oczekiwanego "żalu" związanego z nietrafną decyzją prowadzi do wyboru decyzji d3 , tak samo jak w przypadku kryterium maksymalizacji oczekiwanej wypłaty:

0x01 graphic

Załóżmy, że w ogólnym modelu podejmowania decyzji w warunkach niepewności posiadamy doskonałą informację wtedy, gdy przed podjęciem decyzji znamy stan natury. Tablica 2 przedstawia funkcję korzyści wraz z odpowiednimi prawdopodobieństwami P(sj) a priori stanów natury.

Tablica 2

Funkcja korzyści oraz oczekiwane korzyści

0x08 graphic
sj

P(s1)

P(s2)

...

P(sn)

di

s1

s2

...

sn

Eia

d1

a11

a12

...

a1n

0x01 graphic

d2

a21

a22

...

a2n

0x01 graphic

...

...

...

...

...

...

dm

am1

am2

...

amn

0x01 graphic

0x01 graphic

a1

a2

an

Decydent wybiera decyzję maksymalizującą korzyść przy danym stanie natury.

a.j - korzyść, jaką gwarantuje decyzja optymalna przy danym stanie natury.

Oczekiwana korzyść przy doskonałej informacji (OKDI) wynosi

OKDI =0x01 graphic
.

Jeżeli nie posiadamy doskonałej informacji, to wybieramy decyzję zgodnie z zasadą maksymalizacji oczekiwanej korzyści

0x01 graphic

Oczekiwaną wartość doskonałej informacji (OWDI) możemy obliczyć następująco OWDI = OKDI - Eka.

Spodziewany "żal" (strata) związany z optymalną decyzją wybraną przy pomocy kryterium minimalizacji oczekiwanego żalu jest równy oczekiwanej wartości doskonałej informacji.

W tym celu należy odpowiednio przekształcić wzór określający OWDI

0x01 graphic

gdzie elementy rij wyrażają stratę z powodu podjęcia decyzji.

Oczekiwana wartość dodatkowej informacji (OWDI), inaczej nazywana ceną graniczną dodatkowej informacji, jest równa wartości minimalnego oczekiwanego żalu odpowiadającej decyzji optymalnej, zgodnie z kryterium Savage'a.

Analiza bayesowska

Przed podjęciem istotnych ostatecznych decyzji będziemy szukać dodatkowej informacji prowadzącej do uaktualnienia ocen prawdopodobieństw zajścia poszczególnych stanów natury. Można to przedstawić na następującym schemacie.

0x08 graphic

Rys.2 Schemat uaktualniania wartości prawdopodobieństw

Oznaczmy przez (S,W) dwuwymiarową zmienną losową posiadającą łączny rozkład prawdopodobieństwa P(sj ,wl ) j=1,...,n, l=1,...,k.

Rozważymy przypadek, w którym zmienna (S,W) ma charakter dyskretny. Obie zmienne losowe W i S posiadają rozkłady brzegowe. Dla zmiennej S jest to rozkład a priori prawdopodobieństw stanów natury P(sj).

Łączny rozkład zmiennej (S,W) określimy jako

0x01 graphic
. lub

0x01 graphic

Rozkład brzegowy zmiennej W, prawdopodobieństwa wyników eksperymentu, można wyrazić przez

0x01 graphic

Analiza bayesowska ma na celu uaktualnienie szacunków prawdopodobieństw a priori stanów natury P(sj) w wyniku czego otrzymujemy oszacowania prawdopodobieństw a posteriori P(sj|wl ). Powinny one dostarczać nam precyzyjniejszej informacji dla uzyskania dokładniejszych ocen oczekiwanych wypłat.

Prawdopodobieństwa a posteriori:

0x01 graphic
.

Układ prawdopodobieństw warunkowych P(sj|wl) daje nam rozkład a posteriori stanów natury, który uzależnia wartości szacunków prawdopodobieństw zajścia stanów natury od wyników eksperymentu - informacji dodatkowej.

Zmienna W, która reprezentuje eksperyment powinna być wobec tego odpowiednio dobrana. Musi to być oczywiście zmienna zależna od zmiennej S a ponadto powinna być łatwo obserwowalna bądź jej wartości powinny dać się bez kłopotu precyzyjnie prognozować. Jest to warunek konieczny dla praktycznego wykorzystania analizy bayesowskiej w procesie podejmowania decyzji.

W teorii podejmowania decyzji szczególnie ważną sprawą jest umiejętność oceny dodatkowych korzyści płynących ze zmniejszenia niepewności (nieokreśloności) w porównaniu do kosztów uzyskania dodatkowych informacji. Można dokładnie obliczyć wartość dodatkowej informacji, odejmując maksymalną spodziewaną korzyść, jaką jesteśmy w stanie osiągnąć posługując się dodatkową informacją od spodziewanej korzyści bez posługiwania się nią.

Przykład 2

Załóżmy, że firma rozważana w Przykładzie 1 ma możliwość przeprowadzenia badania rynku w celu określenia potrzeb klientów. Studium takie może polepszyć oceny prawdopodobieństw preferencji rynku - akceptacji usług firmy. Oczywiście koszt badania rynku obciąża firmę i jeżeli przewyższa on wartość dodatkowej informacji (uzyskanej w wyniku badania), to firma z niego zrezygnuje. Spróbujmy oszacować wartość doskonałej informacji.

P(sj)

0.4

0.6

0x08 graphic
di sj

s1

s2

Eia

d1

200

-20

68

d2

150

20

72

d3

100

60

76

aj

200

60

P(sj)aj

80

36

OKDI = 80 + 36 = 116 tys. $ .

Zatem, gdybyśmy byli w stanie wybrać zawsze najkorzystniejszą decyzję, w przypadku każdego ze stanów natury (akceptacji usług naszej firmy na rynku), oczekiwana wypłata mogłaby wynosić (jesteśmy to w stanie policzyć zdając sobie sprawę z tego, że jest to sytuacja idealna, w praktyce prawie niemożliwa) 116 tys.$. Oznaczałoby to wybór d1 w przypadku stanu rynku s1 i d3 w przypadku stanu rynku s2.

W przypadku braku doskonałej informacji, decyzję można podjąć stosując zasadę maksymalizacji oczekiwanej korzyści.

0x01 graphic
= max {68, 72, 76} = 76 tys. $.

Zatem optymalną decyzją w przypadku braku doskonałej informacji jest d3 - dzierżawa małego systemu komputerowego.

Oczekiwana wartość doskonałej informacji:

OWDI = OKDI - 0x01 graphic
= = 116 - 76 = 40 tys. $.

Wynika z tego, że jeżeli cena pozyskania dodatkowej pełnej informacji (doskonałej) przekracza 40 tys. $ firmie nie opłaca się z niej skorzystać. W przeciwnym przypadku można rozważyć skorzystanie z usługi badania rynku.

OWDI stanowi pułap maksymalny - wartość informacji próbkowej (OWPI) na pewno nie będzie wyższa.

Załóżmy, że firma decyduje się zaangażować firmę specjalizującą się w badaniach rynku w celu sprawdzenia potencjalnej akceptacji swoich usług na rynku. Badanie rynku dostarczy nowej informacji próbkowej, dzięki której prawdopodobieństwa a priori zostaną za pomocą procedury bayesowskiej zaktualizowane - staną się prawdopodobieństwami a posteriori.

Wyróżnimy dwa wskaźniki rynku:

w1 - klienci w badanej próbie wykazują duże zainteresowanie usługami firmy,

w2 - w badanej próbie klienci wykazują małe zainteresowanie usługami firmy.

Jako wyniku eksperymentu mającego na celu zdobycie dodatkowej informacji oczekujemy prawdopodobieństw a posteriori: P(sj|wl), które oznaczają warunkowe prawdopodobieństwa, że zaistnieje stan natury j, jeżeli wynikiem eksperymentu był wskaźnik wl .

Na podstawie wcześniejszych doświadczeń firma prowadząca badanie rynku szacuje, że prawdopodobieństwa warunkowe P(wl|sj) są następujące:

Tablica 3

Prawdopodobieństwa warunkowe wskaźników badania

Stany natury

Wskaźniki badania

0x01 graphic

w1

w2

s1

P(w1|s1)=0.85

P(w2|s1)=0.15

1

s2

P(w1|s2)=0.05

P(w2|s2)=0.95

1

Tablica 4

Obliczanie prawdopodobieństw a posteriori

sj

P(sj)

P(wl|sj)

P(sj)P(wl|sj)= P(wl sj)

w1

w2

w1

w2

s1

0.4

0.85

0.15

0.34

0.06

s2

0.6

0.05

0.95

0.03

0.57

0x01 graphic

0.37

0.63

P(s1|wl)

0.34/0.37= 0.92

0.06/0.63= 0.095

P(s2|wl)

0.03/0.37= 0.08

0.57/0.63= 0.905

Możemy teraz obliczyć maksymalne oczekiwane korzyści dla poszczególnych sytuacji, jakie mogą zaistnieć w przypadku korzystania z dodatkowej próbklowej informacji:

  1. w wyniku badania otrzymaliśmy wskaźnik w1

max E(di|w1) =0x01 graphic
0x01 graphic
= 182.4 tys. $ ,

co odpowiada decyzji d1.

2. w wyniku badania otrzymaliśmy wskaźnik w2

max E(di|w2) = 0x01 graphic
= 63.8 tys $,

co odpowiada decyzji d3.

Reasumując, jeżeli w wyniku badania rynku otrzymamy informację, że klienci w badanej próbie wykazują silne zainteresowanie usługami świadczonymi przez naszą firmę, to powinniśmy podjąć decyzję d1 o dzierżawie dużego systemu komputerowego. Możemy wówczas oczekiwać zysku w wysokości 182.4 tys. $. Jeżeli natomiast badanie rynku pokaże, że klienci są słabo zainteresowani usługami naszej firmy, to powinniśmy wydzierżawić mały system komputerowy - oczekiwać możemy wówczas zysków w wysokości 63.8 tys. $.

Oczekiwana korzyść przy próbkowej informacji statystycznej (OKPI)

OKPI = 0x01 graphic
.

W naszym przykładzie oczekiwana wypłata szacowana w przypadku korzystania z próbkowej informacji statystycznej wynosi:

OKPI= 0.37⋅182.4 + 0.63⋅63.8 = 107.6 tys. $.

Oczekiwana wartość informacji próbkowej (OWPI), będąca różnicą szacunków oczekiwanej wypłaty w przypadku korzystania i nie korzystania z dodatkowej próbkowej informacji statystycznej wynosi

OWPI = OKPI - 0x01 graphic

W naszym przykładzie wartość dodatkowej informacji pochodzącej ze statystycznego badania rynku wynosi

OWPI = 107.6 - 76 = 31.6 tys. $

i tyle, ewentualnie, moglibyśmy maksymalnie zapłacić za przeprowadzenie tego badania.

Wartość OWPI jest oczywiście nie większa niż wartość doskonałej informacji OWDI.

Efektywność informacji dodatkowej :

E = OWPI/OWDI ⋅ 100%

Efektywność badania rynku w naszym przykładzie wynosi:

E = 31.6/40 ⋅ 100% = 0.79 ⋅ 100% = 79%.

Można powiedzieć, że informacja pochodząca z proponowanego w naszym przykładzie badania rynku odpowiada w 79% doskonałej informacji.

0x01 graphic

Prawdopodobieństwa

a priori

Dodatkowa informacja

Analiza bayesowska

Prawdopodobieństwa

a posteriori



Wyszukiwarka