Estymacja punktowa
Zgodność estymatora
Można ją zbadać dwoma sposobami:
I.
, gdzie
>0 (co oznacza, że ze wzrostem liczności próbki wzrasta dokładność oszacowania parametru
-
maleje, czyli przedział „naokoło” parametru
maleje).
II.
oraz
Nieobciążoność estymatora
Estymator jest nieobciążony, gdy dla każdego n mamy:
Jeśli jednak
, to
nazywamy estymatorem obciążonym parametru
, a Bn(
) =
obciążeniem estymatora.
Jeśli
to estymator
jest estymatorem asymptotycznie nieobciążonym parametru
.
Efektywność estymatora
Jeśli mamy kilka estymatorów nieobciążonych, to efektywniejszy(lepszy) jest ten, który ma mniejszą wariancję.
Jeśli
, to efektywniejszy jest
. (Nierówność Rao-Cramera trzeba badać tylko dla rozkładu równomiernego).
Efektywność estymatora:
, gdzie
- estymator efektywny par.
,
- inny nieobciążony estymator par.
,
.
jest to asymptotyczna efektywność estymatora
.
Metoda Największej Wiarygodności
Funkcja wiarygodności:
, gdzie f(x;
1,...,
k) to gęstość prawdopodobieństwa dla cechy typu ciągłego lub funkcja rozkładu prawdopodobieństwa dla cechy typu skokowego.
Następnie należy funkcję L zlogarytmować oraz
(gdy mamy jeden parametr
; gdy jest ich więcej, przyrównujemy do zera poszczególne pochodne cząstkowe i tworzymy układ równań).
Estymacja przedziałowa
Przedział ufności:
- jego końce
1=
1(X1,...,Xn) oraz
2=
2(X1,...,Xn) są funkcjami próby losowej i nie zależą od parametru
- P(
1(X1,...,Xn) <
<
2(X1,...,Xn)) = 1 - α, gdzie 1 - α to współczynnik ufności.
Przedziały ufności dla nieznanej wartości przeciętnej
Model 1. ( cecha X ma rozkład
o nieznanej wartości przeciętnej m i znanym odchyleniu standardowym σ). Zad1
Bierzemy statystykę
, która ma rozkład
i ją standaryzujemy:
. Statystyka U ma rozkład N(0,1).
Następnie mamy:
, a po przekształceniach wchodzi przedział:
, gdzie
to kwantyl rzędu
(odczytywany z tablic).
Model 2. (cecha X ma rozkład
o nieznanej wartości przeciętnej m i nieznanym odchyleniu standardowym σ). Zad2
Do obliczeń wybieramy statystykę t-Studenta o n-1 stopniach swobody, bo nie zależy ona od nieznanych parametrów.
Poprzez analogię do modelu 1 (zamiast σ wpisujemy S; zamiast U mamy t i zamiast
mamy
) zapisujemy przedział:
.
II. Przedziały ufności dla wariancji i odchylenia standardowego.
Model 1. (cecha X ma rozkład
o nieznanych m i σ; próba liczności
) zad3
Wykorzystamy tutaj statystykę chi-kwadrat o n-1 stopniach swobody:
. Po odpowiednich przekształceniach mamy:
Model 2. (cecha X ma rozkład
o nieznanych m i σ; próba liczności
) zad4
Wykorzystamy tu fakt, że statystyka
ma w przybliżeniu rozkład N(
. Zatem otrzymujemy:
. Po odpowiednich przekształceniach mamy przedział:
III. Przedziały ufności dla wskaźnika struktury populacji.
Model 1. (cecha ma rozkład dwupunktowy z parametrem p; niewielkie n)
Mamy przedział (f1(k,n,α), f2(k,n,α)); gdzie k - liczba wyróżnionych elementów próbki).
Model 2.(cecha ma rozkład dwupunktowy z parametrem p; próba o liczności
). Zad5
Statystyka
ma rozkład
. Standaryzujemy p:
, U ma w przybliżeniu rozkład N(0,1) zatem
. Otrzymujemy przedział : A(B-C) < p < A(B+C), gdzie:
,
oraz
.
IV. Minimalna liczność próby niezbędna do uzyskania przedziału ufności o zadanej długości.
Model 1. (cecha ma rozkład
o znanym σ; przedział ufności dla wartości przeciętnej ma być nie większy niż 2l) zad6
Mamy zatem:
. Rozwiązując tą nierówność względem n mamy:
. Jeśli nie jest to liczba całkowita, to korzystamy z wzoru:
.
Model 3. (cecha ma rozkład
o nieznanych parametrach; przedział ufności dla wartości przeciętnej ma być nie większy niż 2l) zad7
Z wcześniejszych wzorów(zad.2) wiemy, że:
. Analogicznie do modelu 1 mamy:
, a stąd:
. Nie można z tego wzoru obliczyć n (ze względu na zmianę wartości wariancji zależnie od próbki), ale można obliczyć k. Pobieramy próbkę wstępną o liczności n0, obliczamy k i sprawdzamy:
jeśli
, to przedział ufności jest taki jak wyżej (jak w zad.2).
jeśli
, to do wstępnej próbki n0 pobieramy jeszcze próbkę o liczności n1=[k]-n0+1.
Następnie liczymy:
a przedział ufności spełniający odpowiednie warunki ma postać:
gdzie s2 jest obliczone z próbki wstępnej.