WYKŁAD IV i V
Parametrem zbiorowości generalnej nazywa się miarę opisową, której wartość nie jest znana.
Estymatorem nazywa się dowolną statystykę Tn służącą do oszacowania nieznanej wartości parametru w populacji generalnej .
W literaturze i praktyce wyróżnia się dwa rodzaje estymacji:
estymację punktową, czyli metodę szacunku, za pomocą której jako wartość parametru zbiorowości generalnej przyjmuje się konkretną wartość estymatora wyznaczonego na podstawie n-elementowej próby,
estymację przedziałową, za pomocą której wyznacza się przedział liczbowy, który z ustalonym prawdopodobieństwem zawiera nieznaną wartość szacowanego parametru zbiorowości generalnej. Prawdopodobieństwo to nosi nazwę współczynnika ufności i oznaczane jest jako 1- , a znaleziony przedział nazywany jest przedziałem ufności. Innymi słowy, przedział ufności informuje, w jakich granicach należy spodziewać się wartości dla poszukiwanego parametru z zadanym z góry prawdopodobieństwem.
Ogólną postać przedziału ufności można zapisać jako:
gdzie:
P- symbol prawdopodobieństwa,
1- - poziom ufności,
Tn - estymator,
- szacowany parametr,
- górna i dolna granica przedziału ufności.
Funkcje f1 i f2 jako funkcje zmiennej losowej Tn są zmiennymi losowymi.
Konstruując przedział ufności jesteśmy w stanie określić prawdopodobieństwo, z jakim oszacowaliśmy przedział dla wartości nieznanego parametru, czego nie daje estymacja punktowa. Należy przy tym pamiętać, że:
przy zadanym poziomie ufności 1- im większa jest liczebność, tym krótszy przedział ufności,
przy ustalonej liczebności próby wraz ze wzrostem poziomu ufności rośnie rozpiętość (długość) przedziału ufności,
im krótszy przedział, tym mniejszy błąd szacunku, co oznacza większą dokładność oszacowania.
Długość przedziału ufności oznaczana jest przez 2d, a więc:
Natomiast maksymalny błąd szacunku równy jest połowie tej długości, czyli d.
Miary średnie
Przypadek I. Przedział ufności dla wartości oczekiwanej, gdy znana jest wariancja
gdzie:
- szacowana wartość oczekiwana (średnia) w populacji generalnej,
σ - znana wartość odchylenia standardowego w populacji generalnej,
- średnia arytmetyczna obliczona dla n-elementowej próby statystycznej
- wartość zmiennej losowej u odczytana z tablic dystrybuanty rozkładu normalnego standaryzowanego tak, aby spełniony był warunek
.
Korzystając z własności prawdopodobieństwa i dystrybuanty standaryzowanego rozkładu normalnego możemy zapisać
Zatem z tablic dystrybuanty standaryzowanego rozkładu normalnego odczytujemy taką wartość
, która spełnia równanie
.
Przedziałem ufności dla parametru jest przedział
,
który z prawdopodobieństwem 1- pokrywa nieznana wartość parametru .
Przy szacowaniu wartości przeciętnej maksymalny błąd szacunku (d) jest równy połowie długości przedziału ufności, a zatem wynosi:
Minimalna liczeność próby
Jeśli n nie jest liczbą naturalną, to zaokrąglamy n w górę.
Przypadek II. Przedział ufności dla wartości oczekiwanej, gdy nieznana jest wariancja (mała próba)
gdzie:
S - odchylenie standardowe obliczone dla n-elementowej próby
- wartość zmiennej t odczytana z tablicy rozkładu t-Studenta dla n-1 stopni swobody w taki sposób, aby spełniony był warunek:
Korzystając z własności prawdopodobieństwa możemy zapisać:
.
Przedział ufności dla wartości średniej ma postać:
Z prawdopodobieństwem 1- można twierdzić, że w obliczonym przedziale znajduje się nieznana wartość średniej.
Przy szacowaniu wartości przeciętnej maksymalny błąd szacunku (d) jest równy połowie długości przedziału ufności, a zatem wynosi:
Minimalna liczenośc próby:
Przypadek III. Przedział ufności dla wartości oczekiwanej, gdy nieznana jest wariancja (duża próba)
Zatem z tablic dystrybuanty standaryzowanego rozkładu normalnego odczytujemy taką wartość
, która spełnia równanie
.
Przedziałem ufności dla parametru jest przedział
który z prawdopodobieństwem 1- pokrywa nieznana wartość parametru .
Przy szacowaniu wartości przeciętnej maksymalny błąd szacunku (d) jest równy połowie długości przedziału ufności, a zatem wynosi:
Minimalna liczeność próby
Przedział ufności dla wskaźnika struktury
gdzie:
p - frakcja w populacji generalnej ,
n - liczebność badanej próby,
- wartość odczytana z tablic dystrybuanty standaryzowanego rozkładu normalnego przy poziomie ufności 1- , dla której
,
- frakcja w badanej próbie.
Przy szacowaniu wartości wskaźnika struktury przeciętny błąd szacunku (d) jest równy połowie długości przedziału ufności, a zatem wynosi:
Minimalna liczebność próby
Przedziały ufności dla miar dyspersji
Przedział ufności dla wariancji
odczytujemy z tablic rozkładu 2 dla n-1 stopni swobody w ten sposób, aby spełniały dla zadanego poziomu ufności 1- równości:
Przedziałem ufności dla parametru
jest zatem przedział
który z dokładnością 1- pokrywa nieznana wartość parametru
.
Przedział ufności dla odchylenia standardowego
,
gdzie
odczytujemy z tablic rozkładu normalnego dla przyjętego poziomu ufności 1- , aby spełniona była relacja
.
Przedziałem ufności dla parametru σ jest przedział:
,
który z prawdopodobieństwem 1- pokrywa nieznana wartość parametru σ .
1
18