ELEMENTY ANALIZY PROCESÓW DECYZYJNYCH
Gry z naturą
Własności problemów decyzyjnych, które można rozwiązać wykorzystując metody teorii gier
Istnieje skończona liczba uczestników gry (zarówno zainteresowanych jak i nie zainteresowanych jej wynikiem).
Każdy uczestnik dysponuje skończoną liczbą sposobów działania.
Uczestnicy, którzy chcą zastosować teorię gier, muszą znać wszystkie sposoby działania innych uczestników, nie wiedząc jednak, które z nich zostaną wybrane.
Każdej kombinacji sposobów działania wszystkich uczestników odpowiada określona korzyść płynąca z gry.
Korzyść uczestnika gry zależy zarówno od jego działania, jak i od działania pozostałych uczestników.
Wszystkie możliwe wyniki gry dadzą się wyliczyć.
Sytuacja odpowiadająca powyższym warunkom zwana jest grą.
"Gra z naturą" - decyzję podejmuje tylko jeden uczestnik gry, posiadając informację o możliwych stanach, w jakich znajdzie się otoczenie, wpływających na korzyści wynikające z podjęcia decyzji.
Przykład 1
Firma specjalizująca się w zakresie przetwarzania informacji, analizy danych, itp. zamierza wydzierżawić system komputerowy wspomagający jej usługi. Wchodzą w grę trzy możliwości:
d1 - dzierżawa dużego systemu komputerowego,
d2 - dzierżawa średniego systemu komputerowego,
d3 - dzierżawa małego systemu komputerowego.
Wybór jednej z trzech decyzji powinien prowadzić do uzyskania maksymalnego zysku przez firmę. Zysk ten zależy jednak od tego jak zachowa się rynek klientów w zakresie tego typu usług.
W grę wchodzą dwie możliwości:
s1 - wysoka akceptacja oferowanych usług lub
s2 - niska akceptacja oferowanych usług.
Każdej parze (di ,sj ) i=1,2,3, j=1,2 odpowiada pewna kwota zysku jaki osiągnie firma.
I tak, np.: przy decyzji o wydzierżawieniu małego systemu i dużej akceptacji dla oferowanych przez firmę usług (para: (d3 ,s1 )) zysk wynosi 100.000 zł. Dla decyzji (d1 ,s2 ) - duży system i mała akceptacja - zysk wyniesie -20.000 zł, czyli poniesiemy stratę. Zakładamy, że klienci nie działają świadomie na niekorzyść firmy. Również firma nie jest zainteresowana oferowaniem kiepskich usług za wygórowaną opłatą. Jaką decyzję powinna podjąć firma ?
Każdej parze (di ,sj) odpowiada pewna wielkość nazywana wypłatą (korzyścią). Wypłaty zestawia się w, tzw. tablicę wypłat, w której wiersze są przyporządkowane graczowi I a kolumny odpowiadają stanom natury (tu: sytuacji rynkowej).
Tablica wypłat dla Przykładu 1
decyzja firmy |
zachowanie rynku
|
|
|
s1 |
s2 |
d1 |
200 000 |
-20 000 |
d2 |
150 000 |
20 000 |
d3 |
100 000 |
60 000 |
W omawianym przykładzie macierz wypłat jest następująca:
s1 s2
A = [aij] =
Kryteria nieprobabilistyczne w grach z naturą
MaxiMin - postępowanie pesymisty (asekuranta)
Pesymista (asekurant) określa dla każdej swojej decyzji najgorszy możliwy wynik (minimalną wypłatę)
a następnie wybiera taką decyzję dk, dla której tak określona minimalna (gwarantowana) wypłata jest największa.
Firma podejmuje decyzję d3 o wydzierżawieniu małego systemu komputerowego.
MaxiMax - postępowanie optymisty (ryzykanta)
Optymista (ryzykant) określa dla każdej swojej decyzji najwyższy możliwy wynik (maksymalną wypłatę ) wio a następnie wybiera taką decyzję dk, dla której tak określona maksymalna (ale nie gwarantowana) wypłata jest największa.
dk : wko =
{ wio } , gdzie: wio =
{ aij }
Dla rozważanego przykładu postępowanie wg zasady MaxiMax'u jest następujące:
Firma podejmuje decyzję d1 o wydzierżawieniu dużego systemu komputerowego - nie bierze pod uwagę możliwej straty w przypadku małej akceptacji swoich usług przez klientów.
Kryterium Hurwicza - postępowanie pośrednie (mieszane)
Jest to postępowanie pośrednie pomiędzy postępowaniem pesymisty (asekuranta) a postępowaniem optymisty (ryzykanta). Reguła Hurwicza przyporządkowuje każdej decyzji di indeks h(di), który jest ważoną średnią minimalnej i maksymalnej wypłaty związanej z decyzją. Wybierana jest decyzja, której odpowiada maksymalna wartość h(⋅).
Oznaczmy:
αi - skłonność decydenta do ryzyka (optymizmu) przy wyborze decyzji di, αi∈[0,1].
(Zatem 1-αi jest skłonnością do bycia pesymistą (asekurantem).
Dla każdej decyzji di wyznaczamy hipotetyczną wygraną h(di)
h(di ) =αi wio + (1-αi)wip .
Należy wybrać taką decyzję, dla której hipotetyczna wygrana h(di) jest największa.
dk: h(dk ) = max { h(di) }.
Rozważymy dwa przypadki rozwiązania problemu prezentowanego w przykładzie zgodnie z kryterium Hurwicza przy przyjęciu różnych założeń odnośnie wag αi :
Przypadek (a)
Przyjmijmy α1 = α2 = α3 = 0,5, tzn. że przy każdej z trzech decyzji jesteśmy w jednakowym stopniu pesymistą i optymistą. Jest to postępowanie właściwe w przypadkach, gdy nie jesteśmy w stanie określić prawdopodobieństw zajścia "stanów natury" sj .
Właściwą decyzją jest w tym przypadku decyzja d1 (duży system).
Przypadek (b).
Przyjmijmy α1=0.6, α2 =0.5 oraz α3 = 0.4. Oznacza to, że przy decyzji d1 mamy większą skłonność do bycia asekurantem, przy decyzji d2 jesteśmy pół na pół asekurantem i ryzykantem oraz przy decyzji d3 mamy skłonność być większym ryzykantem.
W tym przypadku właściwą decyzją jest decyzja d1 (system komputerowy o dużych rozmiarach).
Wybór decyzji optymalnej zgodnie z kryterium Hurwicza może być bardzo wrażliwy na dobrane subiektywne wagi αi . Załóżmy, że ∀i αi =α.
Wówczas
h(d1 ) = -20α + 200 - 200α = -220α + 200
h(d2 ) = 20α + 150 - 150α = -130α + 150
h(d3) = 60α + 100 - 100α = -40α + 100 .
Rys.1 Funkcja wagowa h(•) dla analizy optymalności według Hurwicza
Analiza zachowania się indeksów h(•) jako funkcji wagi α, wykazuje, że w powyższym przykładzie:
dla α = 5/9 nie jesteśmy w stanie podjąć decyzji o wyborze strategii - wartość indeksu Hurwicza jest jednakowa dla wszystkich strategii i równa 700/9 ≅ 77.8.
dla α < 5/9 optymalną decyzją jest wybór strategii d1 ,
dla α >5/9 optymalną decyzją jest wybór d3 .
Minimax "żalu" - Savage'a
Macierz wypłat A = [aij ] transformujemy do postaci macierzy "żalu" R = [rij] w następujący sposób:
Określamy maksymalną wypłatę ai dla każdego "stanu natury" j=1,…n
a następnie obliczamy wartości elementów rij według wzoru:
rij = aj - aij .
Elementy macierzy "żalu" rij wyrażają naszą stratę z powodu podjęcia decyzji nieoptymalnej z punktu widzenia zaistniałego stanu natury. Do macierzy "żalu" stosujemy postępowanie według reguły MinMax, tzn. wskazujemy decyzję dk, dla której największa strata ("żal") z powodu źle podjętej decyzji będzie możliwie najmniejsza.
dk:
[rij] =
macierz „żalu”
Zgodnie z kryterium Savage'a firma powinna wybrać decyzję d2 - wydzierżawienie systemu komputerowego o średnich rozmiarach.
Kryteria probabilistyczne w grach z naturą
Zakładamy, że znamy rozkład prawdopodobieństwa dla stanów natury (w naszym przykładzie naturą jest rynek usług firmy). W najprostszym układzie wiedza ta sprowadza się do znajomości prawdopodobieństwa zaistnienia określonego stanu natury, tj. P(sj) j=1,…n. Stosowane podejścia noszą nazwę kryterium Bayesa-Laplace'a. Prawdopodobieństwa można oszacować na podstawie dostępnych informacji historycznych, specjalnie przeprowadzonego badania statystycznego, metodą ekspercką bądź wykorzystać subiektywne oceny prawdopodobieństw.
Maksymalizacja oczekiwanej korzyści
Wybieramy decyzję, dla której wartość oczekiwanej wypłaty (zysku) będzie największa, tj.
dk : Eka =
Oparcie decyzji na oczekiwanej wypłacie prowadzi do wyboru decyzji d3.
Minimalny oczekiwany "żal" (strata)
Wybieramy taką decyzję, dla której wartość oczekiwanej straty ("żalu") będzie najmniejsza, tj.
dk :
Dla rozważanego przykładu oparcie decyzji na minimalizacji oczekiwanego "żalu" związanego z nietrafną decyzją prowadzi do wyboru decyzji d3 , tak samo jak w przypadku kryterium maksymalizacji oczekiwanej wypłaty:
Załóżmy, że w ogólnym modelu podejmowania decyzji w warunkach niepewności posiadamy doskonałą informację wtedy, gdy przed podjęciem decyzji znamy stan natury. Tablica 2 przedstawia funkcję korzyści wraz z odpowiednimi prawdopodobieństwami P(sj) a priori stanów natury.
Tablica 2
Funkcja korzyści oraz oczekiwane korzyści
|
P(s1) |
P(s2) |
... |
P(sn) |
|
|
di |
s1 |
s2 |
... |
sn |
Eia |
|
d1 |
a11 |
a12 |
... |
a1n |
|
|
d2 |
a21 |
a22 |
... |
a2n |
|
|
... |
... |
... |
... |
... |
... |
|
dm |
am1 |
am2 |
... |
amn |
|
|
|
a1 |
a2 |
… |
an |
|
Decydent wybiera decyzję maksymalizującą korzyść przy danym stanie natury.
a.j - korzyść, jaką gwarantuje decyzja optymalna przy danym stanie natury.
Oczekiwana korzyść przy doskonałej informacji (OKDI) wynosi
OKDI =
.
Jeżeli nie posiadamy doskonałej informacji, to wybieramy decyzję zgodnie z zasadą maksymalizacji oczekiwanej korzyści
Oczekiwaną wartość doskonałej informacji (OWDI) możemy obliczyć następująco OWDI = OKDI - Eka.
Spodziewany "żal" (strata) związany z optymalną decyzją wybraną przy pomocy kryterium minimalizacji oczekiwanego żalu jest równy oczekiwanej wartości doskonałej informacji.
W tym celu należy odpowiednio przekształcić wzór określający OWDI
gdzie elementy rij wyrażają stratę z powodu podjęcia decyzji.
Oczekiwana wartość dodatkowej informacji (OWDI), inaczej nazywana ceną graniczną dodatkowej informacji, jest równa wartości minimalnego oczekiwanego żalu odpowiadającej decyzji optymalnej, zgodnie z kryterium Savage'a.
Analiza bayesowska
Przed podjęciem istotnych ostatecznych decyzji będziemy szukać dodatkowej informacji prowadzącej do uaktualnienia ocen prawdopodobieństw zajścia poszczególnych stanów natury. Można to przedstawić na następującym schemacie.
Rys.2 Schemat uaktualniania wartości prawdopodobieństw
Oznaczmy przez (S,W) dwuwymiarową zmienną losową posiadającą łączny rozkład prawdopodobieństwa P(sj ,wl ) j=1,...,n, l=1,...,k.
W - oznacza zmienną losową, której wartości to możliwe do uzyskania warianty dodatkowej informacji,
S - jest zmienną losową, której wartościami są poszczególne stany natury.
Rozważymy przypadek, w którym zmienna (S,W) ma charakter dyskretny. Obie zmienne losowe W i S posiadają rozkłady brzegowe. Dla zmiennej S jest to rozkład a priori prawdopodobieństw stanów natury P(sj).
Łączny rozkład zmiennej (S,W) określimy jako
. lub
Rozkład brzegowy zmiennej W, prawdopodobieństwa wyników eksperymentu, można wyrazić przez
Analiza bayesowska ma na celu uaktualnienie szacunków prawdopodobieństw a priori stanów natury P(sj) w wyniku czego otrzymujemy oszacowania prawdopodobieństw a posteriori P(sj|wl ). Powinny one dostarczać nam precyzyjniejszej informacji dla uzyskania dokładniejszych ocen oczekiwanych wypłat.
Prawdopodobieństwa a posteriori:
.
Układ prawdopodobieństw warunkowych P(sj|wl) daje nam rozkład a posteriori stanów natury, który uzależnia wartości szacunków prawdopodobieństw zajścia stanów natury od wyników eksperymentu - informacji dodatkowej.
Zmienna W, która reprezentuje eksperyment powinna być wobec tego odpowiednio dobrana. Musi to być oczywiście zmienna zależna od zmiennej S a ponadto powinna być łatwo obserwowalna bądź jej wartości powinny dać się bez kłopotu precyzyjnie prognozować. Jest to warunek konieczny dla praktycznego wykorzystania analizy bayesowskiej w procesie podejmowania decyzji.
W teorii podejmowania decyzji szczególnie ważną sprawą jest umiejętność oceny dodatkowych korzyści płynących ze zmniejszenia niepewności (nieokreśloności) w porównaniu do kosztów uzyskania dodatkowych informacji. Można dokładnie obliczyć wartość dodatkowej informacji, odejmując maksymalną spodziewaną korzyść, jaką jesteśmy w stanie osiągnąć posługując się dodatkową informacją od spodziewanej korzyści bez posługiwania się nią.
Przykład 2
Załóżmy, że firma rozważana w Przykładzie 1 ma możliwość przeprowadzenia badania rynku w celu określenia potrzeb klientów. Studium takie może polepszyć oceny prawdopodobieństw preferencji rynku - akceptacji usług firmy. Oczywiście koszt badania rynku obciąża firmę i jeżeli przewyższa on wartość dodatkowej informacji (uzyskanej w wyniku badania), to firma z niego zrezygnuje. Spróbujmy oszacować wartość doskonałej informacji.
P(sj) |
0.4 |
0.6 |
|
|
s1 |
s2 |
Eia |
d1 |
200 |
-20 |
68 |
d2 |
150 |
20 |
72 |
d3 |
100 |
60 |
76 |
aj |
200 |
60 |
|
P(sj)aj |
80 |
36 |
|
OKDI = 80 + 36 = 116 tys. $ .
Zatem, gdybyśmy byli w stanie wybrać zawsze najkorzystniejszą decyzję, w przypadku każdego ze stanów natury (akceptacji usług naszej firmy na rynku), oczekiwana wypłata mogłaby wynosić (jesteśmy to w stanie policzyć zdając sobie sprawę z tego, że jest to sytuacja idealna, w praktyce prawie niemożliwa) 116 tys.$. Oznaczałoby to wybór d1 w przypadku stanu rynku s1 i d3 w przypadku stanu rynku s2.
W przypadku braku doskonałej informacji, decyzję można podjąć stosując zasadę maksymalizacji oczekiwanej korzyści.
= max {68, 72, 76} = 76 tys. $.
Zatem optymalną decyzją w przypadku braku doskonałej informacji jest d3 - dzierżawa małego systemu komputerowego.
Oczekiwana wartość doskonałej informacji:
OWDI = OKDI -
= = 116 - 76 = 40 tys. $.
Wynika z tego, że jeżeli cena pozyskania dodatkowej pełnej informacji (doskonałej) przekracza 40 tys. $ firmie nie opłaca się z niej skorzystać. W przeciwnym przypadku można rozważyć skorzystanie z usługi badania rynku.
OWDI stanowi pułap maksymalny - wartość informacji próbkowej (OWPI) na pewno nie będzie wyższa.
Załóżmy, że firma decyduje się zaangażować firmę specjalizującą się w badaniach rynku w celu sprawdzenia potencjalnej akceptacji swoich usług na rynku. Badanie rynku dostarczy nowej informacji próbkowej, dzięki której prawdopodobieństwa a priori zostaną za pomocą procedury bayesowskiej zaktualizowane - staną się prawdopodobieństwami a posteriori.
Wyróżnimy dwa wskaźniki rynku:
w1 - klienci w badanej próbie wykazują duże zainteresowanie usługami firmy,
w2 - w badanej próbie klienci wykazują małe zainteresowanie usługami firmy.
Jako wyniku eksperymentu mającego na celu zdobycie dodatkowej informacji oczekujemy prawdopodobieństw a posteriori: P(sj|wl), które oznaczają warunkowe prawdopodobieństwa, że zaistnieje stan natury j, jeżeli wynikiem eksperymentu był wskaźnik wl .
Na podstawie wcześniejszych doświadczeń firma prowadząca badanie rynku szacuje, że prawdopodobieństwa warunkowe P(wl|sj) są następujące:
Tablica 3
Prawdopodobieństwa warunkowe wskaźników badania
Stany natury |
Wskaźniki badania |
|
|
|
w1 |
w2 |
|
s1 |
P(w1|s1)=0.85 |
P(w2|s1)=0.15 |
1 |
s2 |
P(w1|s2)=0.05 |
P(w2|s2)=0.95 |
1 |
Tablica 4
Obliczanie prawdopodobieństw a posteriori
sj |
P(sj) |
P(wl|sj) |
P(sj)P(wl|sj)= P(wl ∩ sj) |
||
|
|
w1 |
w2 |
w1 |
w2 |
s1 |
0.4 |
0.85 |
0.15 |
0.34 |
0.06 |
s2 |
0.6 |
0.05 |
0.95 |
0.03 |
0.57 |
|
0.37 |
0.63 |
|||
P(s1|wl) |
0.34/0.37= 0.92 |
0.06/0.63= 0.095 |
|||
P(s2|wl) |
0.03/0.37= 0.08 |
0.57/0.63= 0.905 |
Możemy teraz obliczyć maksymalne oczekiwane korzyści dla poszczególnych sytuacji, jakie mogą zaistnieć w przypadku korzystania z dodatkowej próbklowej informacji:
w wyniku badania otrzymaliśmy wskaźnik w1
max E(di|w1) =
= 182.4 tys. $ ,
co odpowiada decyzji d1.
2. w wyniku badania otrzymaliśmy wskaźnik w2
max E(di|w2) =
= 63.8 tys $,
co odpowiada decyzji d3.
Reasumując, jeżeli w wyniku badania rynku otrzymamy informację, że klienci w badanej próbie wykazują silne zainteresowanie usługami świadczonymi przez naszą firmę, to powinniśmy podjąć decyzję d1 o dzierżawie dużego systemu komputerowego. Możemy wówczas oczekiwać zysku w wysokości 182.4 tys. $. Jeżeli natomiast badanie rynku pokaże, że klienci są słabo zainteresowani usługami naszej firmy, to powinniśmy wydzierżawić mały system komputerowy - oczekiwać możemy wówczas zysków w wysokości 63.8 tys. $.
Oczekiwana korzyść przy próbkowej informacji statystycznej (OKPI)
OKPI =
.
W naszym przykładzie oczekiwana wypłata szacowana w przypadku korzystania z próbkowej informacji statystycznej wynosi:
OKPI= 0.37⋅182.4 + 0.63⋅63.8 = 107.6 tys. $.
Oczekiwana wartość informacji próbkowej (OWPI), będąca różnicą szacunków oczekiwanej wypłaty w przypadku korzystania i nie korzystania z dodatkowej próbkowej informacji statystycznej wynosi
OWPI = OKPI -
W naszym przykładzie wartość dodatkowej informacji pochodzącej ze statystycznego badania rynku wynosi
OWPI = 107.6 - 76 = 31.6 tys. $
i tyle, ewentualnie, moglibyśmy maksymalnie zapłacić za przeprowadzenie tego badania.
Wartość OWPI jest oczywiście nie większa niż wartość doskonałej informacji OWDI.
Efektywność informacji dodatkowej :
E = OWPI/OWDI ⋅ 100%
Efektywność badania rynku w naszym przykładzie wynosi:
E = 31.6/40 ⋅ 100% = 0.79 ⋅ 100% = 79%.
Można powiedzieć, że informacja pochodząca z proponowanego w naszym przykładzie badania rynku odpowiada w 79% doskonałej informacji.
∝
Prawdopodobieństwa
a priori
Dodatkowa informacja
Analiza bayesowska
Prawdopodobieństwa
a posteriori