PiS15 W05 Estymacja i weryfikacja parametrów populacji


PiS15 W05: ESTYMACJA I WERYFIKACJA
PARAMETRÓW POPULACJI
1. Estymacja punktowa, estymator, jego ocena i własno-
ści
2. Estymator wartości oczekiwanej
Przykład 1
3. Estymator wariancji populacji
Przykład 2
4. Estymator wskaznika struktury
5. Estymacja przedziałowa, przedział ufności i poziom
ufności
Przykład 3
6. Hipotezy statystyczne i ich podział
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 1
7. Weryfikacja hipotezy statystycznej
8. Testy parametryczne
Przykład 4
Przykład projektu zaliczeniowego cz. 3
Tablice statystyk: http://www.statsoft.com/textbook/sttable.html#chi
ZAACZNIKI:
1. Modele przedziałów ufności dla wartości oczekiwanej, wa-
riancji i wskaznika struktury przy jednej populacji
2. Modele przedziałów ufności dla wartości oczekiwanych, wa-
riancji i wskazników struktury przy dwóch populacjach
3. Testy dotyczące wartości oczekiwanej, wariancji i wskaznika
struktury w jednej populacji.
4. Testy dotyczące wartości oczekiwanej, wariancji i wskaznika
struktury w dwóch populacjach.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 2
1. Estymacja punktowa, estymator, jego ocena i
własności
Estymacja punktowa (point estimation), to grupa metod
statystycznych, służąca do punktowego oszacowania wartości
nieznanego parametru rozkładu cechy w populacji.
Badany rozkład cechy X w populacji zależy od nieznanego
parametru  i parametr ten jest szacowany na podstawie pro-
stej próby losowej Xn.
W szczególności, estymować można wartość oczekiwaną,
wariancję i wskaznik struktury badanych cech w populacji.
W przypadku badania populacji ze względu na dwie cechy
estymować można współczynnik korelacji.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 3
Estymatorem Un nieznanego parametru q populacji gene-
ralnej nazywamy statystykę Un = h(Xn) służącą do jego osza-
cowania.
Oceną parametru q nazywamy każdą realizację un esty-
matora Un. Ocena parametru prawie zawsze różni się od rze-
czywistej wartości parametru .
Miarą błędu estymacji jest różnica d = Un - .
Własności dobrego estymatora
Nieobciążoność. Estymator Un nazywamy estymatorem
nieobciążonym, jeśli:
E(Un) = q.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 4
Jeśli E(Un) - q = b(Un), to estymator nazywamy estymato-
rem obciążonym, zaś samą różnicę nazywamy obciążeniem
estymatora (bias of an estimator).
Asymptotyczna nieobciążoność. Estymator nazywamy
asymptotycznie nieobciążonym, jeśli obciążenie estymatora
dąży do zera przy rosnącej liczebności próby, tj.
lim b(Un) = 0
.

Zgodność. Estymator nazywamy zgodnym, jeśli jest stocha-
stycznie zbieżny do szacowanego parametru, tj.
lim P(Un - q < e) =1

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 5
W konsekwencji zwiększając liczebność próby, zmniejszamy
ryzyko błędu.
Efektywność. Spośród zbioru wszystkich nieobciążonych
estymatorów U1,n, U2,n,& , Ur,n estymatorem najefektyw-
niejszym nazywamy estymator o najmniejszej wariancji.
Definicja efektywności jest bardzo niewygodna, ponieważ do
wyznaczenia najefektywniejszego estymatora potrzebna jest
znajomość wariancji wszystkich estymatorów nieobciążonych
danego parametru. W praktyce korzysta się z nierówności
Rao-Cramera.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 6
2. Estymator wartości oczekiwanej
Średnia arytmetyczna jest estymatorem nieobciążonym i
jednocześnie estymatorem największej wiarygodności warto-
ści oczekiwanej zm. l., jeżeli przynajmniej:
liczba obserwacji jest dostatecznie duża (zob. CTG),
rozkład badanej cechy jest normalny.
Średnia dla szeregu szczegółowego (średnia nieważona):
n
1
x =
x
i
n
i=1
Jeżeli dane są pogrupowane w klasy w postaci szeregu
rozdzielczego, stosujemy wzór ważony (średnia ważona):
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 7
m
1
x =
k ni
i
n
i=1
gdzie ki to liczba reprezentująca i-tą klasę, zaś ni to liczebność
i-tej klasy (i = 1, 2,& , m).
Przykład 1. Wyniki 130 pomiarów (wyrażonych w [j.u.])
pewnej wielkości losowej X są zestawione w tabeli.
Tabela danych pogrupowanych
Przedziały klasowe Liczba
dla wartości zm. X obserwacji
co najwyżej 3,6 2
8
(3,6 - 4,2]
35
(4,2 - 4,8]
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 8
43
(4,8 - 5,4]
22
(5,4 - 6,0]
15
(6,0 - 6,6]
ponad 6,6 5
Wyznaczyć:
a) szereg rozdzielczy,
b) średnią arytmetyczną.
Rozwiązanie. a) Szereg rozdzielczy
Numer i przedziału Reprezentant klasy1 Liczba obserwacji
klasowego ki ni
1 3,32 2
2 3,9 8
1
Tutaj środek przedziału klasowego.
2
Wartość przyjęta umownie.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 9
3 4,5 35
4 5,1 43
5 5,7 22
6 6,3 15
7 6,93 5
b) Ponieważ dane są w postaci szeregu rozdzielczego, więc
wyznaczamy średnią arytmetyczną ważoną
m
1 1
x =
k ni = 130 (3,3 2 + 3,98 + ...+ 6,95) = 5,15 [ j.u.]
i
n
i=1
Średnia uzyskanych pomiarów wynosi 5,15 [j.u.].
3
Wartość przyjęta umownie.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 10
3. Estymator wariancji populacji
s2
Wariancję w populacji X można oceniać wariancją
X
empiryczną s2(x). Dla szeregu szczegółowego:
n
1
2
s2(x) =
(x - x)
i
n -1
i=1
gdzie
xi - kolejne wartości próby losowej,
x
- średnia arytmetyczna z próby,
n - liczba elementów w próbie.
Dla danych w postaci szeregu rozdzielczego:
m
1
2
s2(x) =
n (ki - x)
i
n -1
i=1
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 11
Przykład 2. Dla danych z przykładu 1 wyznacz wariancję z próby.
Tablica. Obliczenia pomocnicze.
i ni
ki - (ki - )2 ni (ki - )2
x x x
1 2 3,4225 6,8450
-1,85
2 8 1,5625 12,5000
-1,25
3 35 0,4225 14,7875
-0,65
4 43 0,0025 0,1075
-0,05
5 22 0,55 0,3025 6,6550
6 15 1,15 1,3225 19,8375
7 5 1,75 3,0625 15,3125
S = 130 S= 76,045
Stąd wariancja i odch. std. z próby wynoszą:
s2(x) = 0,589496124
[j.u.]2, s(x) = 0,767786509 [j.u.].
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 12
4. Estymator wskaznika struktury
Wskaznikiem struktury nazywamy parametr p w populacji
X ~ B(p), tj. prawdop. zaobserwowania wyróżnionej cechy.
Estymatorem wskaznika p jest częstość z próby X1,& , Xn:
SXi
Pn =
,
n
gdzie K = SXi jest liczbą elementów próby, które posiadają
wyróżnioną cechę, a n jest liczebnością próby.
Zastosowanie CTG do estymacji wskaznika struktury. Je-
Pn
żeli liczebność próby n wzrasta, to rozkład estymatora , dą-
p(1- p) / n
ży do rozkładu N(p, ).
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 13
5. Estymacja przedziałowa, przedział ufności i po-
ziom ufności
Estymacja przedziałowa to grupa metod statystycznych
służących do oszacowania parametrów rozkładu cechy w po-
pulacji generalnej. W metodach estymacji przedziałowej oce-
ną parametru nie jest konkretna wartość, ale pewien przedział,
który z określonym prawdop. pokrywa nieznaną wartość pa-
rametru. Podstawowym pojęciem estymacji przedziałowej jest
przedział ufności.
Niech cecha X ma rozkład w populacji z nieznanym parame-
trem . Z populacji wybieramy próbę losową (X1, X2, ..., Xn).
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 14
Przedziałem ufności nazywamy taki przedział ( - 1,  +
2), który spełnia warunek:
P(1 <  < 2) = 1 - ą,
gdzie 1 i 2 są statystykami wyznaczonymi z próby losowej.
Pojęcie przedziału ufności zostało wprowadzone do staty-
styki przez Jerzego Spławę-Neymana4,
4
Jerzy Spława-Neyman (1894 - 1981)  polski matematyk. Studiował matematykę w
Charkowie. W 1921 wrócił do Polski, gdzie prowadził badania i wykłady. Od 1938 przebywał w USA. Zo-
stał profesorem Uniwersytetu w Berkeley. W swych pracach zajmował się głównie statystyką oraz teorią
mnogości i i rachunkiem prawdopodobieństwa. Wprowadził pojęcie przedziału ufności.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 15
Jako kryterium wyboru najlepszych przedziałów ufności
przyjmujemy te statystyki dla których otrzymamy najkrótsze
przedziały.
Wielkość 1-a nazywamy poziomem ufności. Poziom uf-
ności jest to prawdop., że wartość szacowanego parametru 
znajduje się w wyznaczonym przedziale ufności. Im większa
wartość tego współczynnika, tym szerszy przedział ufności, a
więc mniejsza dokładność estymacji parametru. Im mniejsza
wartość 1 - ą, tym większa dokładność estymacji, ale jedno-
cześnie tym większe prawdop. popełnienia błędu. Wybór od-
powiedniego współczynnika jest więc kompromisem pomię-
dzy dokładnością estymacji a ryzykiem błędu. W praktyce
przyjmujemy zazwyczaj wartości: 0,99; 0,95 lub 0,90.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 16
Przykład 3. W pewnym zakładzie zbadano 500 urządzeń
spośród nowo wyprodukowanej partii i otrzymano następują-
cy rozkład liczby usterek:
Liczba usterek
0 1 2 3 4 5 6
Liczba urządzeń
112 168 119 63 28 9 1
a) Ocenić wartość oczekiwaną i odchylenie standardowe
liczby usterek w każdym z produkowanych urządzeń.
Ocenić wskaznik struktury urządzeń bez usterek.
b) Na poziomie ufności 0,95 wyznaczyć przedział ufności
dla przeciętnej liczby usterek.
c) Na poziomie ufności 0,99 wyznaczyć przedział ufności
dla odchylenia stand. liczby usterek.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 17
d) Na poziomie ufności 0,90 wyznaczyć przedział ufności
dla wskaznika produkowanych urządzeń bez usterek.
Rozwiązanie. Niech X oznacza liczbę usterek w badanej po-
pulacji urządzeń, tj. w każdym z produkowanych urządzeń. W
rozwiązaniach korzystamy z CTG, więc musimy założyć, że
istnieje skończona wariancja zm. l. X o nieznanym rozkładzie.
Próba jest bardzo duża, n = 500, więc można z tego twierdze-
nia skorzystać.
a) Dane dotyczące liczby usterek są podane w postaci szeregu
rozdzielczego, więc obliczamy średnią arytmetyczną ważoną.
Obliczone z próby wartości statystyk wynoszą:
s =1,24
x = 1,52,
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 18
Stąd oceny nieznanych parametrów:
x = 112 = 0,224
i
pn =
Ć
Ć
sX =1,24,
mX = 1,52
,
n 500
b) Rozkład populacji oraz odchylenie standardowe populacji
są nieznane. Próba jest duża, więc końce przedziału wyzna-
czamy ze wzoru:
s
x m z1-a / 2
n
x = 1,52
Dane i obliczenia pomocnicze: n = 500, , s = 1,24, 1
- a = 0,95, kwantyl z0,975 standardowego rozkładu normalne-
go odczytany z tablic lub wyznaczony za pomocą programu
komputerowego wynosi z0,975 = 1,96.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 19
Stąd otrzymujemy
1,24
1,52m1,96 .
500
Wniosek: Przedział (1,41; 1,6395) jest 95-procentową reali-
zacją przedziału ufności dla przeciętnej liczby usterek.
c) Próba jest bardzo duża, więc korzystamy z granicznego
rozkładu statystyki S, tj. z rozkładu normalnego. Przedział uf-
ności dla odchylenia standardowego s jest postaci:
s s
< s <
1 1
1+ z1-a / 2 1- z1-a / 2
2n 2n
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 20
Dane i obliczenia pomocnicze:
n = 500, s = 1,24, 1 - a = 0,99,
kwantyl z0,995 rzędu 0,995 standardowego rozkładu normalne-
go wynosi 2,5758. Stąd otrzymujemy oszacowanie
1,24 1,24
< s <
2,576 2,576
1+ 1-
.
1000 1000
Wniosek: 99 procentową realizacją przedziału ufności dla
nieznanego odchylenia standardowego liczby usterek produ-
kowanych urządzeń jest przedział (1,15; 1,35).
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 21
d) Badana cecha ma rozkład B(p), gdzie p jest nieznanym
wskaznikiem bezusterkowości. Próba jest duża, więc do wy-
znaczenia końców przedziału ufności dla p korzystamy z:
p(1- p)
pn m z1-a / 2
n
pn = 0,224
Dane: n = 500, , 1 - a = 0,90, z0,95 = 1,645, stąd
0,224 0,776
0,224 m1,645 = 0,22400 m 0,03067
.
500
Wniosek: 90 procentową realizacją przedziału ufności dla
wskaznika p jest przedział (0,19333; 0,25467).
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 22
6. Hipotezy statystyczne i ich podział
Weryfikację hipotez statystycznych ograniczamy tylko do
klasycznej teorii J. Neymana i E. Pearsona, dotyczącej testów
istotności (test of significance).
Hipoteza statystyczna (statistical hypothesis) to dowolne
przypuszczenie dotyczące rozkładu cech w populacji, tj. po-
staci funkcyjnej lub wartości parametru rozkładu.
Przykłady hipotez statystycznych:
- czas dojazdu do pracy pracowników firmy A ma rozkład
N(25, 5) (min),
- zawartości szkodliwych związków w spalinach samocho-
dów z katalizatorem i bez katalizatora różnią się,
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 23
Formułowanie hipotezy statystycznej rozpoczynamy od
zebrania informacji na temat określonej cechy w badanej po-
pulacji i jej możliwego rozkładu. Dzięki temu możliwe jest
zbudowanie zbioru hipotez dopuszczalnych, czyli zbioru roz-
kładów, które mogą charakteryzować badaną cechę (lub ce-
chy) w populacji.
Formalnie, hipotezą statystyczną nazywamy każdy pod-
zbiór zbioru hipotez dopuszczalnych.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 24
Hipotezy statystyczne dzielimy na:
hipotezy parametryczne (parametric hypothesis) - hipote-
za dotyczy wartości parametru rozkładu
hipotezy nieparametryczne - hipoteza dotyczy postaci
funkcyjnej rozkładu
Według innego kryterium podział przebiega następująco:
hipotezy proste (simple hypothesis) - hipoteza jedno-
znacznie określa rozkład danej populacji, czyli odpowiada-
jący jej podzbiór zbioru Q zawiera dokładnie jeden ele-
ment (rozkład),
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 25
hipotezy złożone (composite hypothesis) - hipoteza określa
całą grupę rozkładów, zaś odpowiadający jej podzbiór
zbioru Q zawiera więcej niż jeden element.
Stwierdzenie:  wzrost badanej populacji jest określony roz-
kładem normalnym o parametrach m = 1,75m i  = 10 jest
hipotezą parametryczną, ponieważ określa wartość parame-
trów rozkładu oraz hipotezą prostą, bo jednoznacznie definiu-
je rozkład.
Stwierdzenie:  wzrost badanej populacji jest określony roz-
kładem normalnym jest hipotezą nieparametryczną - nie do-
tyczy wartości parametrów rozkładu i złożoną - określa wię-
cej niż jeden możliwy rozkład.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 26
7. Weryfikacja hipotezy statystycznej
Weryfikacją hipotezy (hypothesis testing) nazywamy
sprawdzanie sądów o populacji, sformułowanych bez zbada-
nia jej całości. Przeprowadzamy ją na podstawie próby loso-
wej X pobranej z populacji X, której hipoteza dotyczy. Prze-
bieg procedury weryfikacyjnej przebiega w 5. krokach.
Krok 1: Sformułowanie hipotez: zerowej i alternatywnej
Hipoteza zerowa H0 (null hypothesis) - jest to hipoteza pod-
dana procedurze weryfikacyjnej. Przykładowo, wnioskując o
pewnym parametrze rzeczywistym w dwóch populacjach, hi-
poteza zerowa (ozn. H0) może mieć jedną z trzech postaci:
H0: 1 - 2 = D (hipoteza prosta),
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 27
H0: 1 - 2 Ł D (hipoteza lewostronna),
H0: 1 - 2 ł D, (hipoteza prawosytronna),
gdzie D R jest daną wartością.
Hipoteza alternatywna H1 (alternative hypothesis) - hipoteza
przeciwstawna do hipotezy zerowej:
H1: 1 - 2 ą D (hipoteza dwustronna),
H1: 1 - 2 > D (hipoteza prawostronna),
H1: 1 - 2 < D (hipoteza lewostronna).
Na przykład, założeniu symetryczności monety odpowiada
prosta hipoteza zerowa H0: p = . Natomiast hipoteza złożona
H1: p ą , odpowiada założeniu o braku symetryczności.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 28
Krok 2 (opcjonalny): Przyjęcie poziomu istotności ą
Przyjmujemy a priori dopuszczalne prawdop. popełnienia
błędu I rodzaju (error of first kind), który polega na odrzuce-
niu hipotezy zerowej wtedy, gdy jest ona prawdziwa. Praw-
dop. to oznaczamy symbolem ą i nazywamy przyjętym po-
ziomem istotności (significance level) testu. Ryzyko popeł-
nienia błędu a winno być jak najmniejsze, więc zwykle za-
kładamy, że poziom istotności ą d" 0,1.
Nie odrzucenie fałszywej hipotezy H0 nazywamy błędem
II rodzaju. Prawdop. popełnienia tego błędu oznaczamy b.
Prawdop. (1-b) nazywamy mocą testu.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 29
Krok 3: Wybór testu i obliczenia
Statystycy budują różne statystyki U, które są funkcjami
prób losowych U = h(Xn) i wyznaczają ich rozkłady przy za-
łożeniu, że odpowiednie hipotezy H0 są prawdziwe.
Odpowiednią statystykę U zastosowaną do weryfikacji hi-
potezy H0 nazywamy statystyką testową lub testem hipotezy
H0. Wyboru testu dokonujemy na podstawie spełnianych za-
łożeń.
Wyniki próby opracowujemy tak, aby można z cząstko-
wych obliczeń wyznaczyć wartość u0 odpowiedniej statystyki
testowej U. Najczęściej stosowane statystyki testowe mają
dokładny lub graniczny rozkład normalny, rozkład t-Studenta,
rozkład chi-kwadrat lub rozkład Snedecora.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 30
Krok 4: Wyznaczenie obszaru krytycznego
Obszar krytyczny (critical region) - podzbiór Ra zbioru
wartości statystyki testowej dla których hipoteza H0 jest od-
rzucana. Obszar ten znajduje się zawsze na krańcach rozkładu
statystyki. Wielkość obszaru krytycznego zależy od poziomu
istotności ą, natomiast jego położenie określane jest przez hi-
potezę H1.
Wartości graniczne obszaru krytycznego nazywamy war-
tościami krytycznymi. Wartości krytyczne są odczytywane z
tablic kwantyli lub są obliczane komputerowo przy danym ą,
tak aby spełniona była relacja zależna od sposobu sformuło-
wania hipotezy H1:
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 31
gdy H1 typu `", to obszar krytyczny dwustronny
Ra = {uR: u < ua/2 u > u1-a/2}, ,
gdy H1 typu >, to obszar krytyczny prawostronny
Ra = {uR: u > u1-a},
gdy H1 typu <, to obszar krytyczny lewostronny
Ra = {uR: u < ua}, ,
gdzie ua jest kwantylem rzędu a rozkładu statystyki U.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 32
Krok 5: Podjęcie decyzji
Sprawdzamy, czy obliczona z próby wartość statystyki u0 na-
leży do obszaru krytycznego Ra.
Jeżeli wartość statystyki znajdzie się w obszarze krytycz-
nym, to na przyjętym poziomie istotności odrzucamy hipo-
tezę H0, jako mało prawdop., na rzecz hipotezy H1.
Jeżeli wartość statystyki znajdzie się poza obszarem kry-
tycznym, to stwierdzamy brak podstaw do odrzucenia hi-
potezy zerowej (jako bardzo prawdop.). Nie odrzucenie hi-
potezy zerowej nie oznacza, że jest ona prawdziwa.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 33
8. Testy parametryczne
Służą do weryfikacji hipotez parametrycznych, odnoszą-
cych się do parametrów rozkładu badanej cechy w jednej,
dwóch lub kilku populacjach generalnych. Najczęściej wery-
fikowane są sądy dotyczące takich parametrów populacji jak:
wartość oczekiwana, wariancja, wskaznik struktury i współ-
czynnik korelacji.
Wyróżniamy dwie podstawowe grupy testów parame-
trycznych.
I. Testy dotyczące parametrów (np.: m, p, s2, r) w jednej po-
pulacji.
II. Testy porównywania parametrów w dwóch populacjach.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 34
Przykład 4. Dla danych z przykładu 3 (Przedziały ufności)
dotyczących liczby usterek w produkowanych urządzeniach
(populacja X), zweryfikować podane hipotezy parametryczne,
na poziomie istotności a = 0,05.
a) przeciętna liczba usterek wynosi 2,
b) przeciętna liczba usterek jest większa od 1,
c) wariancja liczby usterek wynosi 2,
d) odchylenie standardowe liczby usterek jest więk-
sze od 1,2,
e) wskaznik urządzeń bez usterek wynosi 20%,
f) wskaznik urządzeń bez usterek jest większy od
20%.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 35
Rozwiązanie. Rozkład cechy w populacji X jest nieznany, ale
próba jest bardzo duża (n = 500) i możemy skorzystać
z twierdzeń granicznych. Wszystkie hipotezy dotyczą para-
metrów jednej populacji. Parametrami tymi są: m, s, p.
a) Hipoteza  przeciętna liczba usterek wynosi 2 jest para-
metryczną hipotezą prostą, dotyczącą cechy X - liczby uste-
rek w produkowanych urządzeniach. Hipotezę tę ustawiamy
jako hipotezę zerową:
H0: m = 2,
jako hipotezę alternatywną przyjmujemy hipotezę złożoną:
H1: m ą 2.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 36
Rozkład badanej cechy jest nieznany, a próba jest bardzo du-
ża, więc korzystamy z testu 3 (zestawienie testów dla jednej
populacji):
x - m0
z = n
.
s
x =1,52
Dane: , m0 = 2, s = 1,24, n = 500, a = 0,05.
1,52 - 2
z0 = 500 = -8,66
1,24
Hipoteza alt. jest dwustronna, więc dla danego a wyznacza-
my dwustronny obszar krytyczny
Ra = (-Ą, za / 2) (z1-a / 2, Ą)
,
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 37
gdzie zp jest kwantylem p-tego rzędu rozkładu N(0, 1). W tym
przykładzie p = 0,025 i p = 0,975.
Odczytane z tablic kwantyle wynoszą:
z0,025 = -1,960, z0,975 = 1,960.
Stąd obszar krytyczny:
R0,05 = (-Ą, -1,96) (1,96, Ą)
.
z0 = -8,66(-Ą, -1,96) (1,96, Ą)
Decyzja: Ponieważ , więc
na poziomie istotności 0,05, odrzucamy hipotezę zerową na
rzecz hipotezy alt. i stwierdzamy, że: przeciętna liczba uste-
rek istotnie różni się od 2.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 38
b) Hipoteza  przeciętna liczba usterek jest większa od 1 jest
parametryczną hipotezą bez przypadku m = 1, więc ustawia-
my ją jako hipotezę alt. Uzupełniamy hipotezę zerową zgod-
nie z normą, czyli
H0: m Ł 1 (obejmuje hip. prostą m = 1),
H1: m > 1.
Statystyka jest ta sama co w punkcie a). Wśród danych zmie-
nia się wartość m0. Teraz m0 = 1. Obliczamy statystykę
1,52 -1
z0 = 500 = 9,377
.
1,24
Hipoteza alt. jest prawostronna, więc dla a = 0,05 wyznacza-
R0,05 = (z0,05, Ą) = (1,65, Ą)
my prawostronny obszar krytyczny
.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 39
Decyzja. Ponieważ obliczona statystyka należy do obszaru
krytycznego, więc odrzucamy H0 rzecz hipotezy alt. Czyli
przeciętna usterkowość jest istotnie większa od 1.
c) Hipoteza  wariancja liczby usterek wynosi 2 jest parame-
tryczną hipotezą prostą dotyczącą wariancji badanej cechy.
Ustawiamy ja jako hipotezę zerową H0: s2 = 2.
Jako przeciwstawną przyjmujemy dwustronną hipotezę alt.
H1: s2 ą 2
Stosujemy statystykę chi-kwadrat z modelu 4
2
(n -1)S
c2 =
2
s0
2
s0 = 2
Dane: n = 500, , s = 1,24, a = 0,05, stąd
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 40
4991,5376
2
c0 = = 383,63
2
2 2
Ra = (0, ca/ 2,n-1) (c1-a/ 2,n-1, Ą)
Obszar krytyczny . Wielkości
2 2
c0,05; 499 c0,95; 499 są kwantylami rzędu 0,025 i 0,975 rozkła-
du chi-kwadrat z 499 stopniami swobody.
Uwaga. Tablice kwantyli rozkładu chi-kwadrat są sporządza-
ne zwykle od 1 do 30 stopni swobody. Jeżeli nie możemy
skorzystać z komputerowego obliczenia, to korzystamy z wła-
sności granicznej
(n -1)S2
c2 = ~ N(n -1, 2(n -1))
2
(*) nĄ
s0
a po standaryzacji statystyki (*) otrzymujemy statystykę
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 41
c2 - (n -1)
Z =
(**) ,
2(n -1)
która dla dużych n ma w przybliżeniu rozkład N(0, 1).
Obliczamy wartość tej statystyki
383,63 - 499
z0 = -3,65
998
R0,05 = (-Ą, -1,96) (1,96, Ą)
Obszar krytyczny
Decyzja. Ponieważ z0R0,05, więc odrzucamy hipotezę zero-
wą i stwierdzamy, że wariancja usterkowości istotnie różni się
od 2.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 42
d) Hipoteza  odchylenie standardowe liczby usterek jest
większe od 1,2 jest hipotezą złożoną i ustawiamy ją jako hi-
potezę alt. Uzupełniamy hipotezę zerową, czyli
H0: s Ł 1,2 oraz H1: s > 1,2
Zwykle modele są podawane dla wariancji, więc powyższe
hipotezy przekształcamy na równoważne hipotezy dotyczące
wariancji, tj.
H0: s2 Ł 1,44 oraz H1: s2 > 1,44
Ponieważ n = 500, więc stosujemy statystykę (**)
z0 1,07.
R0,05 = (1,65, Ą)
Obszar krytyczny jednostronny: .
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 43
Decyzja. Obliczona statystyka nie należy do obszaru krytycz-
nego, więc na poziomie istotności a = 0,05, nie mamy pod-
staw do odrzucenia hipotezy zerowej, że odchylenie standar-
dowe liczby usterek wynosi 1,2.
e) Hipoteza  wskaznik urządzeń bez usterek wynosi 20% jest
hipotezą prostą dotyczącą wskaznika p. Ustawiamy ją jako
hipotezę zerową. Dobieramy dwustronną hipotezę alt.:
H0: p = 0,2
H1: p ą 0,2
Badana cecha ma rozkład Bernoulliego. Próba jest bardzo du-
ża, więc korzystamy z granicznej statystyki o rozkładzie nor-
malnym.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 44
pn - p0
z =
p0(1- p0)
n
Dane: p0 = 0,2, n = 500, Sxi =112, stąd
x = 112 = 0,224
i
pn =
.
n 500
Obliczamy wartość z0 statystyki Z
0,224 - 0,200
z0 = 1,34
0,20,8
500
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 45
Hipoteza alt. jest dwustronna, więc obszar krytyczny
Ra = (-Ą, za/ 2) (z1-a/ 2, Ą).
Z tablic kwantyli otrzymujemy
R0,05 = (-Ą, -1,96) (1,96, Ą)
.
Decyzja. Ponieważ obliczona statystyka z0 1,34 nie należy
do obszaru krytycznego, więc na przyjętym poziomie istotno-
ści, nie mamy podstaw do odrzucenia hipotezy zerowej, że
wskaznik urządzeń bez usterek wynosi 20%.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 46
f) Hipotezę  wskaznik urządzeń bez usterek jest większy od
20% ustawiamy jako alternatywną hipotezę prawostronną i
uzupełniamy złożoną hipotezę zerową, czyli
H0: p Ł 0,2,
H1: p > 0,2.
Statystyka jest ta sama jak w e), więc u0 1,34.
Ra = (z1-a, Ą)
Obszar krytyczny prawostronny . Stąd
R0,05 = (z0,95, Ą) = (1,65, Ą)
.
Decyzja. Ponieważ obliczona statystyka nie należy do obsza-
ru krytycznego, więc nie mamy podstaw do odrzucenia hipo-
tezy zerowej, że wskaznik urządzeń bez usterek wynosi co
najwyżej 20%.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 47
Przykład projektu zaliczeniowego cz. 3
Uwaga. Należy przytaczać wzory i składnie funkcji wykorzystywanych w
rozwiązaniach. Udzielać pełnych odpowiedzi. Sporządzić tabelę ocen
według wzoru. W przypadku braku rozwiązania punktu, pod jego nume-
rem, w polu  uzyskano wpisać  0 .
Punkt 1 2 3 Aącznie
do uzyskania 2 4 4 10
uzyskano
Norma długości pewnego detalu jest określona jako przedział (19,6;
20,4) [mm]. Długość X (w mm) detalu produkowanego na pewnego typu
automacie ma rozkład normalny, tj. X ~ N(m, s) o nieznanych parame-
trach. Parametry te oraz wskaznik spełniania normy są przedmiotem ba-
dania. W tym celu wylosowano prostą próbę detali produkowanych na
tym automacie i zmierzono ich długości.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 48
Otrzymano następujące wyniki pomiarów w [mm]:
i) 20,019; 20,157; 19,840; 19,924; 20,149; 20,118; 20,827; 20,199;
20,611; 20,626; 20,259; 19,616; 20,120; 19,913, 20,393.
ii) wygenerować próbę o liczności 40 według rozkładu N(19,9; 0,25).
1. Na podstawie otrzymanych wyników pomiarów długości detali
ocenić:
a) wartość oczekiwaną długości detalu,
b) wariancję i odchylenie standardowe długości detalu,
c) wskaznik spełniania normy długości.
Ponadto wyznaczyć
d) wartości minimalną i maksymalną oraz rozstęp.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 49
2. Wyznaczyć 95-procentowe przedziały ufności dla:
a) oczekiwanej długości detalu,
b) wariancji długości detalu,
c) wskaznika spełniania normy długości.
3. Na poziomie istotności a = 0,05 zweryfikować hipotezy:
a) oczekiwana długość detalu wynosi 20[mm],
b) wariancja długości detalu jest większa od 0,04[mm2],
c) wskaznik spełniania normy wynosi co najmniej 0,95.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 50


Wyszukiwarka

Podobne podstrony:
ESTYMACJA WERYFIKACJA 1
Weryfikacja hipotezy na temat wartości przeciętnej w populacji
6 własności estymatora parametrów klasycznego modelu liniowego uzyskanego metodą najmniejszych kwadr
4 estymacja parametrów jednorównaniowego liniowego modelu ekonometrycznego
6 weryfikacja hipotez parametrycznych
5 Weryfikacja hipotez statystycznych z wykorzystaniem testˇw parametrycznych
1 parametry technniczne wymiary tablic zal nr1id?43
Cw 6 Parametryczny stabilizator napiecia
W05 Fizyka Haran
Oszacowanie parametrów charakterystyk podatnych połączeń stalowych za pomocą sieci neuro rozmytej
kernel parameters
3 2 invocation parameters
(1) Estymacja

więcej podobnych podstron