276 Podejmowanie decyzji w warunkach niepełnej informacji
Następnie tworzymy macierz Z. Element lej macierzy to różnica między korzyścią, którą można byłoby osiągnąć, gdyby udało się trafnie przewidzieć zaistniały stan natury, czyli wj, oraz korzyścią z„ dla decyzji x-i, czyli:
Zij=w)-Wij. (5.3)
Elementy macierzy Z interpretujemy jako miarę strat poniesionych w wyniku podjęcia nietrafnej decyzji w stosunku do zaistniałego później stanu natury, stąd też jej nazwa — macierz żalu.
Omawianą regułę decyzyjną można sformułować następująco:
Reguła Savage’a
Wykorzystując kolejne kolumny macierzy wypłat, znajdujemy dla każdego stanu natury wartości maksymalnych korzyści w] i tworzymy macierz żalu Z. Dla kolejnych decyzji znajdujemy maksymalne wartości macierzy Z. Wybieramy decyzję, która minimalizuje największą możliwą stratę. W przypadku niejednoznaczności rekomendujemy wszystkie decyzje, dla których spełniony jest powyższy warunek.
Zastosujemy regułę Savage’a do danych z przykładu 5.3. W pierwszym kroku z każdej kolumny macierzy wypłat W wybieramy element największy. Dla stanu natury n = 1 wartość największa wynosi II, dla stanu natury n = 2 jest równa 13, a dla stanu natury rt=3 otrzymujemy wartość 12. Zgodnie ze wzorem (5.3) obliczamy kolejne elementy macierzy żalu. Z kolejnych wierszy tej macierzy wybieramy wartości maksymalne. Dołączamy je jako dodatkową kolumnę do macierzy wypłat. Z elementów tej kolumny wybieramy wartości najmniejsze (tablica 5.10).
Tablica 5.10
Rodzaj uprawy |
Warunki |
Maksymalny żal | ||
susze |
normalne |
deszcze | ||
i |
3 |
3 |
0 |
@ <— min |
2 |
1 |
2 |
5 |
5 |
3 |
2 |
0 |
4 |
4 |
4 |
0 |
3 |
6 |
6 |
5 |
1 |
3 |
3 |
(T) min |
Decyzjami rekomendowanymi przez regułę Savage’a są uprawy I i 5.
Rozwiązanie zadania z przykładu 5.3 przy wykorzystaniu różnych reguł decyzyjnych wskazuje na to, że najczęściej rekomendowanymi decyzjami są uprawy 3 oraz 5. Obie to decyzje są rekomendowane zgodnie z kryterium I lurwicza (w zależności od wartości współczynnika ostrożności). Uprawa 3 jest również rekomendowana na podstawie reguł max-max oraz Laplace’a, natomiast uprawa 5 — dodatkowo na podstawie reguł: max-min i minimalnego żalu. W rekomendacjach decyzyjnych pojawia się również uprawa l(rcguły: Laplace’a i minimalnego żalu). Zwróćmy uwagę, że pewne decyzje (chodzi o uprawy 2 i 4) nie są w ogóle rekomendowane, mimo to, że nie są zdominowane przez żadną inną decyzję4.
Porównanie wyników zastosowania różnych reguł decyzyjnych prowadzi więc do różnych rekomendacji decyzyjnych. Pierwszym zadaniem decydenta jest uzasadnienie wyboru reguły decyzyjnej, którą zamierza zastosować w rozpatrywanym problemie. Wybór ten może zależeć zarówno od specyfiki danego problemu, jak i nastawienia decydenta do ryzyka. Zauważmy przy tym, że przez porównanie wyniku otrzymanego po zastosowaniu wybranej reguły z wynikami otrzymanymi po wykorzystaniu pozostałych reguł decyzyjnych możemy uzyskać dodatkowe informacje, które mogą być również przydatne decydentowi do podjęcia końcowej decyzji.
5.4. Gry dwuosobowe o sumie zero
W podrozdziale tym rozpatrzymy dokładniej własności ważnego modelu teorii gier, zwanego grą dwuosobową o sumie zero, omówionego wstępnie w podrozdziale 5.1. Interesować nas będą strategie równowagi, dla których nic istnieje możliwość uzyskania przez uczestnika gry (zarówno Gracza I, jak i Gracza II) rezultatu lepszego niż w strategii równowagi bez obawy o możliwość poniesienia straty przy innym wyborze strategii przez przeciwnika. Ze względu na powyższą własność przyjmiemy, że strategie równowagi są strategiami optymalnymi. Znalezienie strategii równowagi określimy jako rozwiązanie gry.
' Dominację rozumiemy tak samo jak w programowaniu wielokryterialnym. Więcej o strategiach dominujących i zdominowanych dowiemy się w punkcie 5.4.1.