35
Statystyka matematyczna
Jak widzimy, „nabardziej naturalne” estymatory rzeczywiście przybliżają odpowiednie momenty rozkładów.
Kolejnym problemem jest „jakość” estymatora. Mając do wyboru kilka, chcielibyśmy wskazać „najlepszy”, czyli taki, dla którego „błąd przybliżenia” jest możliwie jak najmniejszy. Niestety, kwestii tej nie daje się w pełni ogólnie rozwiązać.
Jeśli weźmiemy pod uwagę różnicę, która mierzy błąd estymatora
g(Xu...tXn)-g{9) , (3.58)
to w oczywisty sposób wielkość ta jest losowa - jest przecież zmienną losową zależną od X\,...,Xn■ Ponadto na wielkość takiego błędu ma wpływ także wartość samego parametru 9.
Ponieważ wielkość błędu jest losowa (zależy od rozpatrywanego przypadku, od naszych obserwacji), możemy chcieć, aby „średnio” była odpowiednio mała. Prowadzi to do następującej definicji.
Definicja 3.29. Niechg(X\,..., A'„) będzie estymatoremg(9). Ryzykiem (lub funkcją ryzyka^ tego estymatora nazywamy
R(9) = Eo(9(Xu...,Xn)-g($))2 . (3.59)
Uwaga! Możliwe jest rozpatrywanie innych postaci funkcji ryzyka, np. wartości oczekiwanej z modułu różnicy pomiędzy estymatorem a wartością estymowa-ną. Przedstawiona jednak powyżej formuła jest bardzo użyteczna ze względów obliczeniowych.
Jak widzimy, ryzyko R(9) zdefiniowane wzorem (3.59) nie jest już czymś losowym, jest tylko funkcją parametru 9.
Przykład 3.30. Niech X\,X2, ■ • •, Xn będzie próbką z rozkładu normalnego N{p,o2). Policzmy ryzyko estymatora ji — x. Mamy
: — (3.60)
z niezależności zmiennych losowych w naszej próbie.
Dwa estymatory g\ i g2 tej samej wielkości g($) można spróbować porównać ze sobą, biorąc pod uwagę ich ryzyko.
Definicja 3.31. Mówimy, że estymator g\ jest lepszy niż g2, jeśli dla każdego 9 € 0 zachodzi
gdzie Ri{9) jest ryzykiem estymatora gi, oraz dla pewnego 9& € © mamy
Ri(0o) < W ■ (3.62)
Oznacza to, że aby estymator był lepszy, wykres jego funkcji ryzyka musi znajdować się pod, lub przynajmniej w jednym punkcie pod i w pozostałych na równi, z wykresem funkcji ryzyka drugiego z estymatorów.
Niestety, mimo wprowadzenia tej definicji, znalezienie „najlepszego” estymatora nie jest najczęściej możliwe. Zauważmy bowiem, że dwa estymatory, których funkcje ryzyka krzyżują się, są już ze sobą nieporównywalne.
Na szczęście istnieje możliwość zawężenia naszych poszukiwań najlepszego estymatora do pewnej specyficznej klasy.