36
3.5 Estymacja przedziałowa
Definicja 3.32. Estymator g wielkości g(0) jest nieobciążony, jeśli dla każdego $ € © zachodzi
E$g(Xu...tXn) = g(9) ■ (3.63)
Innymi słowy, estymator jest nieobciążony, jeśli średnio jego wartość jest równa wielkości estymowanej.
Przykład 3.33. Jak pamiętamy, w statystyce opisowej wprowadziliśmy dwa różne estymatory wariancji s2 i s%. Przypuśćmy, że próbka pochodzi z rozkładu normalnego N(p, o2). Wtedy
E„.» s2 = <r2 Ą=a‘ . (3.64)
Jak więc widzimy, estymator ś2 zawsze średnio zaniża estymowaną wartość parametru o2, zaś Sq jest jego estymatorem nieobciążonym.
Jeśli ograniczymy się tylko do estymatorów nieobciążonych, możliwe jest w wielu przypadkach znalezienie najlepszego estymatora. Estymator taki, o minimalnym ryzyku, nazywany jest estymatorem minimalnej wariancji.
Definicja 3.34. Estymator g(Xi,...,Xn) jest estymatorem nieobciążonym o minimalnej wariancji (co zapisujemy EN MW) dla wielkości g{9), jeśli:
1. g jest estymatorem nieobciążonym g(9),
2. dla każdego nieobciążonego estymatora g\ mamy Var# g{X\,..., Xn) < Var$ gi(X\,..., Xn) dla dowolnego 0 € ©.
Poprzednio omawialiśmy estymację nieznanego parametru 0, która dokonywana była poprzez pewną statystykę9(Xi, X2,..., Xn). Estymacja taka nazywa się czasami punktową, ponieważ każdy pojedynczy parametr z przestrzeni parametrów © przybliżany jest jedną wartością (czyli punktem na osi liczbowej).
Zamiast tego „pojedynczego” oszacowania zastosować możemy oszacowanie poprzez podanie dolnej i górnej granicy pewnego przedziału. Granice te wybieramy w ten sposób, aby prawdopodobieństwo, iż nieznany parametr 9 znajdzie się w wyznaczonym nimi przedziale było odpowiednio wysokie.
Definicja 3.35. Niech g(9) będzie funkcją nieznanego parametru 9, a g{X\,..., Xn ig(X 1,... ,Xn) dwiema statystykami próbki. Mówimy, że \g;g] jest przedziałem ufności dla g(9) na poziomie ufności fi, jeśli
P„ (g(Xi, »(#) < g(X, X„)) k 0 (3.65)
dla każdego 9 € ©. |
Zazwyczaj fi jest liczbą zbliżoną do jedności, np. 0,95 (tzw. klasyczny poziom ufności) lub 0,99.
Zgodnie z (3.65) przedział [9; <j] jest przedziałem ufności dla g(9), jeśli prawdopodobieństwo, iż g(9) zawiera się w tym przedziale wynosi co najmniej fi. Należy pamiętać, iż takiego rozumienia definicji nie możemy przenosić na przypadek, gdy przedział ufności został już wyznaczony na podstawie zaobserwowanych wartości próbki i wynosi np. [1,23; 3,41]. Wtedy mechanizm losowy już zadziałał i g(9) albo już zawiera się w tym przedziale, albo jest poza tym przedziałem.