Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
1
PiS15 W05: ESTYMACJA I WERYFIKACJA
PARAMETRÓW POPULACJI
1. Estymacja punktowa, estymator, jego ocena i własno-
ści
2. Estymator wartości oczekiwanej
Przykład 1
3. Estymator wariancji populacji
Przykład 2
4. Estymator wskaźnika struktury
5. Estymacja przedziałowa, przedział ufności i poziom
ufności
Przykład 3
6. Hipotezy statystyczne i ich podział
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
2
7. Weryfikacja hipotezy statystycznej
8. Testy parametryczne
Przykład 4
Przykład projektu zaliczeniowego cz. 3
Tablice statystyk:
http://www.statsoft.com/textbook/sttable.html#chi
1. Modele przedziałów ufności dla wartości oczekiwanej, wa-
riancji i wskaźnika struktury przy jednej populacji
2. Modele przedziałów ufności dla wartości oczekiwanych, wa-
riancji i wskaźników struktury przy dwóch populacjach
3. Testy dotyczące wartości oczekiwanej, wariancji i wskaźnika
Testy dotyczące wartości oczekiwanej, wariancji i wskaźnika
struktury w dwóch populacjach
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
3
1. Estymacja punktowa, estymator, jego ocena i
własności
), to grupa metod
statystycznych, służąca do punktowego oszacowania wartości
nieznanego parametru rozkładu cechy w populacji.
Badany rozkład cechy X w populacji zależy od nieznanego
parametru θ i parametr ten jest szacowany na podstawie pro-
stej próby losowej X
n
.
W szczególności, estymować można wartość oczekiwaną,
wariancję i wskaźnik struktury badanych cech w populacji.
W przypadku badania populacji ze względu na dwie cechy
estymować można współczynnik korelacji.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
4
n
nieznanego parametru
populacji gene-
ralnej nazywamy statystykę U
n
h(X
n
) służącą do jego osza-
cowania.
Oceną parametru
nazywamy każdą realizację u
n
esty-
matora U
n
. Ocena parametru prawie zawsze różni się od rze-
czywistej wartości parametru θ.
Miarą błędu estymacji jest różnica d
U
n
θ.
Własności dobrego estymatora
Nieobciążoność. Estymator U
n
nazywamy
estymatorem
nieobciążonym
, jeśli:
E(U
n
)
.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
5
Jeśli E(U
n
)
b(U
n
), to estymator nazywamy
estymato-
rem obciążonym
, zaś samą różnicę nazywamy
obciążeniem
.
Asymptotyczna nieobciążoność. Estymator nazywamy
asymptotycznie nieobciążonym
, jeśli obciążenie estymatora
dąży do zera przy rosnącej liczebności próby, tj.
0
)
(
lim
n
n
U
b
.
Zgodność. Estymator nazywamy
zgodnym
, jeśli jest stocha-
stycznie zbieżny do szacowanego parametru, tj.
1
)
P(
lim
n
n
U
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
6
W konsekwencji zwiększając liczebność próby, zmniejszamy
ryzyko błędu.
Efektywność. Spośród zbioru wszystkich nieobciążonych
estymatorów U
1,n
, U
2,n
,…, U
r
,
n
estymatorem najefektyw-
niejszym
nazywamy estymator o najmniejszej wariancji.
Definicja efektywności jest bardzo niewygodna, ponieważ do
wyznaczenia najefektywniejszego estymatora potrzebna jest
znajomość wariancji wszystkich estymatorów nieobciążonych
danego parametru. W praktyce korzysta się z
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
7
2. Estymator wartości oczekiwanej
Średnia arytmetyczna jest
jednocześnie
estymatorem największej wiarygodności
, jeżeli przynajmniej:
liczba obserwacji jest dostatecznie duża (zob.
),
rozkład badanej cechy jest normalny.
średnia nieważona
):
n
i
i
x
n
1
1
x
Jeżeli dane są pogrupowane w klasy w postaci
, stosujemy wzór ważony (
średnia ważona
):
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
8
i
m
i
i
n
k
n
1
1
x
gdzie k
i
to liczba reprezentująca i-tą klasę, zaś n
i
to liczebność
i-tej klasy (i = 1, 2,…, m).
Przykład 1. Wyniki 130 pomiarów (wyrażonych w [j.u.])
pewnej wielkości losowej X są zestawione w tabeli.
Tabela
danych pogrupowanych
Przedziały klasowe
dla wartości zm. X
Liczba
obserwacji
co najwyżej 3,6
2
(3,6
4,2]
8
(4,2
4,8]
35
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
9
(4,8
5,4]
43
(5,4
6,0]
22
(6,0
6,6]
15
ponad 6,6
5
Wyznaczyć:
a) szereg rozdzielczy,
b) średnią arytmetyczną.
Rozwiązanie.
a) Szereg rozdzielczy
Numer i przedziału
klasowego
Reprezentant klasy
1
k
i
Liczba obserwacji
n
i
1
3,3
2
2
2
3,9
8
1
Tutaj środek przedziału klasowego.
2
Wartość przyjęta umownie.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
10
3
4,5
35
4
5,1
43
5
5,7
22
6
6,3
15
7
6,9
3
5
b) Ponieważ dane są w postaci szeregu rozdzielczego, więc
wyznaczamy średnią arytmetyczną ważoną
]
.
.
[
15
,
5
)
5
9
,
6
...
8
9
,
3
2
3
,
3
(
130
1
1
1
u
j
n
k
n
i
m
i
i
x
Średnia uzyskanych pomiarów wynosi 5,15 [j.u.].
3
Wartość przyjęta umownie.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
11
3. Estymator wariancji populacji
Wariancję
2
X
w populacji X można oceniać wariancją
empiryczną s
2
(x). Dla szeregu szczegółowego:
n
i
i
x
n
s
1
2
2
1
1
)
(
x
x
gdzie
x
i
kolejne wartości próby losowej,
x
n
liczba elementów w próbie.
m
i
i
i
k
n
n
s
1
2
2
1
1
)
(
x
x
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
12
Przykład 2. Dla danych z przykładu 1 wyznacz wariancję z próby.
Tablica. Obliczenia pomocnicze.
i
n
i
k
i
x
(k
i
x
)
2
n
i
(k
i
x
)
2
1
2
1,85 3,4225
6,8450
2
8
1,25 1,5625
12,5000
3
35
0,65 0,4225
14,7875
4
43
0,05 0,0025
0,1075
5
22
0,55
0,3025
6,6550
6
15
1,15
1,3225
19,8375
7
5
1,75
3,0625
15,3125
= 130
= 76,045
Stąd wariancja i odch. std. z próby wynoszą:
589496124
,
0
)
(
2
x
s
[j.u.]
2
, s(x) = 0,767786509 [j.u.].
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
13
4. Estymator wskaźnika struktury
Wskaźnikiem struktury
nazywamy parametr p w populacji
X ~ B(p), tj. prawdop. zaobserwowania wyróżnionej cechy.
Estymatorem wskaźnika p jest częstość z próby X
1
,…, X
n
:
n
X
P
i
n
,
gdzie K
X
i
jest liczbą elementów próby, które posiadają
wyróżnioną cechę, a n jest liczebnością próby.
Zastosowanie CTG do estymacji wskaźnika struktury.
Je-
żeli liczebność próby n wzrasta, to rozkład estymatora
n
P
, dą-
ży do rozkładu N(p,
n
p
p
/
)
1
(
).
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
14
5. Estymacja przedziałowa, przedział ufności i po-
ziom ufności
służących do oszacowania parametrów rozkładu cechy w
. W metodach estymacji przedziałowej oce-
ną parametru nie jest konkretna wartość, ale pewien przedział,
który z określonym prawdop. pokrywa nieznaną wartość pa-
rametru. Podstawowym pojęciem estymacji przedziałowej jest
Niech cecha X ma rozkład w populacji z nieznanym parame-
trem θ. Z populacji wybieramy
1
, X
2
, ..., X
n
).
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
15
Przedziałem ufności
nazywamy taki przedział (θ
θ
1
, θ +
θ
2
), który spełnia warunek:
P(θ
1
< θ < θ
2
) = 1 − α,
gdzie θ
1
i θ
2
są statystykami wyznaczonymi z próby losowej.
Pojęcie przedziału ufności zostało wprowadzone do staty-
styki przez
,
4
Jerzy Spława-Neyman (1894 - 1981) – polski matematyk. Studiował matematykę w
Charkowie. W 1921 wrócił do Polski, gdzie prowadził badania i wykłady. Od 1938 przebywał w USA. Zo-
stał profesorem Uniwersytetu w Berkeley. W swych pracach zajmował się głównie statystyką oraz teorią
mnogości i i rachunkiem prawdopodobieństwa. Wprowadził pojęcie
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
16
Jako kryterium wyboru najlepszych przedziałów ufności
przyjmujemy te statystyki dla których otrzymamy najkrótsze
przedziały.
Wielkość 1
nazywamy poziomem ufności.
Poziom uf-
ności
jest to prawdop., że wartość szacowanego parametru θ
znajduje się w wyznaczonym przedziale ufności. Im większa
wartość tego współczynnika, tym szerszy przedział ufności, a
więc mniejsza dokładność estymacji parametru. Im mniejsza
wartość 1
α, tym większa dokładność estymacji, ale jedno-
cześnie tym większe prawdop. popełnienia błędu. Wybór od-
powiedniego współczynnika jest więc kompromisem pomię-
dzy dokładnością estymacji a ryzykiem błędu. W praktyce
przyjmujemy zazwyczaj wartości: 0,99; 0,95 lub 0,90.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
17
Przykład 3. W pewnym zakładzie zbadano 500 urządzeń
spośród nowo wyprodukowanej partii i otrzymano następują-
cy rozkład liczby usterek:
Liczba usterek
0
1
2 3 4 5 6
Liczba urządzeń 112 168 119 63 28 9
1
a) Ocenić wartość oczekiwaną i odchylenie standardowe
liczby usterek w każdym z produkowanych urządzeń.
Ocenić wskaźnik struktury urządzeń bez usterek.
b) Na poziomie ufności 0,95 wyznaczyć przedział ufności
dla przeciętnej liczby usterek.
c) Na poziomie ufności 0,99 wyznaczyć przedział ufności
dla odchylenia stand. liczby usterek.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
18
d) Na poziomie ufności 0,90 wyznaczyć przedział ufności
dla wskaźnika produkowanych urządzeń bez usterek.
Rozwiązanie.
Niech X oznacza liczbę usterek w badanej po-
pulacji urządzeń, tj. w każdym z produkowanych urządzeń. W
rozwiązaniach korzystamy z CTG, więc musimy założyć, że
istnieje skończona wariancja zm. l. X o nieznanym rozkładzie.
Próba jest bardzo duża, n = 500, więc można z tego twierdze-
nia skorzystać.
a) Dane dotyczące liczby usterek są podane w postaci szeregu
rozdzielczego, więc obliczamy średnią arytmetyczną ważoną.
Obliczone z próby wartości statystyk wynoszą:
52
,
1
x
,
24
,
1
s
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
19
Stąd oceny nieznanych parametrów:
52
,
1
ˆ
x
X
m
,
24
,
1
ˆ
s
X
,
224
,
0
500
112
ˆ
n
x
p
p
i
n
b) Rozkład populacji oraz odchylenie standardowe populacji
są nieznane. Próba jest duża, więc końce przedziału wyzna-
czamy ze wzoru:
n
s
z
2
/
1
x
Dane i obliczenia pomocnicze: n = 500,
52
,
1
x
, s = 1,24, 1
= 0,95, kwantyl z
0,975
rozkładu N(0, 1) odczytany z tablic
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
20
lub wyznaczony za pomocą programu komputerowego wyno-
si z
0,975
= 1,96. Stąd otrzymujemy
.
500
24
,
1
96
,
1
52
,
1
Wniosek:
Przedział (1,41; 1,6395) jest 95
procentową reali-
zacją przedziału ufności dla przeciętnej liczby usterek.
c) Próba jest bardzo duża, więc korzystamy z granicznego
rozkładu statystyki S, tj. z rozkładu normalnego. Przedział uf-
ności dla odchylenia standardowego
jest postaci:
n
z
s
n
z
s
2
1
1
2
1
1
2
/
1
2
/
1
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
21
Dane i obliczenia pomocnicze:
n = 500, s = 1,24, 1
= 0,99,
kwantyl z
0,995
rzędu 0,995 standardowego rozkładu normalne-
go wynosi 2,5758. Stąd otrzymujemy oszacowanie
1000
576
,
2
1
24
,
1
1000
576
,
2
1
24
,
1
.
Wniosek:
99 procentową realizacją przedziału ufności dla
nieznanego odchylenia standardowego liczby usterek produ-
kowanych urządzeń jest przedział (1,15; 1,35).
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
22
d) Badana cecha ma rozkład B(p), gdzie p jest nieznanym
wskaźnikiem bezusterkowości. Próba jest duża, więc do wy-
znaczenia końców przedziału ufności dla p korzystamy z:
n
p
p
z
p
n
)
1
(
2
/
1
Dane: n = 500,
224
,
0
n
p
, 1
= 0,90, z
0,95
= 1,645, stąd
03067
,
0
22400
,
0
500
776
,
0
224
,
0
645
,
1
224
,
0
.
Wniosek:
90 procentową realizacją przedziału ufności dla
wskaźnika p jest przedział (0,19333; 0,25467).
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
23
6. Hipotezy statystyczne i ich podział
Weryfikację hipotez statystycznych ograniczamy tylko do
klasycznej teorii J. Neymana i E. Pearsona, dotyczącej
testów
istotności
(test of significance).
(statistical hypothesis) to dowolne
przypuszczenie dotyczące rozkładu cech w populacji, tj. po-
staci funkcyjnej lub wartości parametru rozkładu.
Przykłady hipotez statystycznych
:
czas dojazdu do pracy pracowników firmy A ma rozkład
N(25, 5) (min),
zawartości szkodliwych związków w spalinach samocho-
dów z katalizatorem i bez katalizatora różnią się,
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
24
Formułowanie hipotezy statystycznej rozpoczynamy od
zebrania informacji na temat określonej cechy w badanej po-
pulacji i jej możliwego rozkładu. Dzięki temu możliwe jest
zbudowanie
zbioru hipotez dopuszczalnych
, czyli zbioru roz-
kładów, które mogą charakteryzować badaną cechę (lub ce-
chy) w populacji.
Formalnie, hipotezą statystyczną nazywamy każdy pod-
zbiór zbioru hipotez dopuszczalnych.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
25
Hipotezy statystyczne dzielimy na:
hipotezy parametryczne
(parametric hypothesis)
dotyczą
wartości parametru rozkładu badanej cechy,
hipotezy nieparametryczne
dotyczą postaci funkcyjnej
rozkładu, niezależności, losowości.
Według innego kryterium podział przebiega następująco:
hipotezy proste
(simple hypothesis)
hipoteza jedno-
znacznie określa rozkład danej populacji, czyli odpowiada-
jący jej podzbiór zbioru
zawiera dokładnie jeden ele-
ment (rozkład),
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
26
hipotezy złożone
(composite hypothesis)
hipoteza określa
całą grupę rozkładów, zaś odpowiadający jej podzbiór
zbioru
zawiera więcej niż jeden element.
Stwierdzenie: „wzrost badanej populacji jest określony roz-
kładem normalnym o parametrach m
1,75m i σ
10” jest
hipotezą parametryczną, ponieważ określa wartość parame-
trów rozkładu oraz hipotezą prostą, bo jednoznacznie definiu-
je rozkład.
Stwierdzenie: „wzrost badanej populacji jest określony roz-
kładem normalnym” jest hipotezą nieparametryczną
nie do-
tyczy wartości parametrów rozkładu i złożoną
określa wię-
cej niż jeden możliwy rozkład.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
27
7. Weryfikacja hipotezy statystycznej
Weryfikacją hipotezy (hypothesis testing) nazywamy
sprawdzanie sądów o populacji, sformułowanych bez zbada-
nia jej całości. Przeprowadzamy ją na podstawie próby loso-
wej X pobranej z populacji X, której hipoteza dotyczy. Prze-
bieg procedury weryfikacyjnej przebiega w 5. krokach.
Krok 1: Sformułowanie hipotez: zerowej i alternatywnej
Hipoteza zerowa H
0
(null hypothesis)
jest to hipoteza pod-
dana procedurze weryfikacyjnej. Przykładowo, wnioskując o
pewnym parametrze rzeczywistym w dwóch populacjach, hi-
poteza zerowa (ozn. H
0
) może mieć jedną z trzech postaci:
H
0
: θ
1
θ
2
(hipoteza prosta),
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
28
H
0
: θ
1
θ
2
(hipoteza lewostronna),
H
0
: θ
1
θ
2
, (hipoteza prawosytronna),
gdzie
R jest daną wartością.
Hipoteza alternatywna H
1
(alternative hypothesis)
hipoteza
przeciwstawna do hipotezy zerowej:
H
1
: θ
1
θ
2
(hipoteza dwustronna),
H
1
: θ
1
θ
2
>
(hipoteza prawostronna),
H
1
: θ
1
θ
2
<
(hipoteza lewostronna).
Na przykład, założeniu symetryczności monety odpowiada
prosta hipoteza zerowa H
0
: p = ½. Natomiast hipoteza złożona
H
1
: p
½, odpowiada założeniu o braku symetryczności.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
29
Krok 2 (opcjonalny): Przyjęcie poziomu istotności α
Przyjmujemy a priori dopuszczalne prawdop. popełnienia
błędu I rodzaju (error of first kind), który polega na odrzuce-
niu hipotezy zerowej wtedy, gdy jest ona prawdziwa. Praw-
dop. to oznaczamy symbolem α i nazywamy przyjętym po-
ziomem istotności (significance level) testu. Ryzyko popeł-
nienia błędu
winno być jak najmniejsze, więc zwykle za-
kładamy, że poziom istotności α ≤ 0,1.
Nie odrzucenie fałszywej hipotezy H
0
nazywamy błędem
II rodzaju. Prawdop. popełnienia tego błędu oznaczamy
.
Prawdop. (1
) nazywamy mocą testu.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
30
Krok 3: Wybór testu i obliczenia
Statystycy budują różne statystyki U, które są funkcjami
prób losowych U = h(X
n
) i wyznaczają ich rozkłady przy za-
łożeniu, że odpowiednie hipotezy H
0
są prawdziwe.
Odpowiednią statystykę U zastosowaną do weryfikacji hi-
potezy H
0
nazywamy statystyką testową
lub testem hipotezy
H
0
. Wyboru testu dokonujemy na podstawie spełnianych za-
łożeń.
Wyniki próby opracowujemy tak, aby można z cząstko-
wych obliczeń wyznaczyć wartość u
0
odpowiedniej statystyki
testowej U. Najczęściej stosowane statystyki testowe mają
dokładny lub graniczny rozkład normalny, rozkład t-Studenta,
rozkład chi-kwadrat lub rozkład Snedecora.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
31
Krok 4: Wyznaczenie obszaru krytycznego
Obszar krytyczny (critical region)
podzbiór R
zbioru
wartości statystyki testowej dla których hipoteza H
0
jest od-
rzucana. Obszar ten znajduje się zawsze na krańcach rozkładu
statystyki. Wielkość obszaru krytycznego zależy od poziomu
istotności α, natomiast jego położenie określane jest przez hi-
potezę H
1
.
Wartości graniczne obszaru krytycznego nazywamy war-
tościami krytycznymi. Wartości krytyczne są odczytywane z
tablic kwantyli lub są obliczane komputerowo przy danym α,
tak aby spełniona była relacja zależna od sposobu sformuło-
wania hipotezy H
1
:
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
32
gdy H
1
typu ≠, to obszar krytyczny dwustronny
R
{u
R: u < u
/2
u > u
1
/2
}, ,
gdy H
1
typu >, to obszar krytyczny prawostronny
R
{u
R: u > u
1
},
gdy H
1
typu <, to obszar krytyczny lewostronny
R
{u
R: u < u
}, ,
gdzie u
jest kwantylem rzędu
rozkładu statystyki U.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
33
Krok 5: Podjęcie decyzji
Sprawdzamy, czy obliczona z próby wartość statystyki u
0
na-
leży do obszaru krytycznego R
.
Jeżeli wartość statystyki znajdzie się w obszarze krytycz-
nym, to na przyjętym poziomie istotności odrzucamy hipo-
tezę H
0
, jako mało prawdop., na rzecz hipotezy H
1
.
Jeżeli wartość statystyki znajdzie się poza obszarem kry-
tycznym, to stwierdzamy brak podstaw do odrzucenia hi-
potezy zerowej (jako bardzo prawdop.). Nie odrzucenie hi-
potezy zerowej nie oznacza, że jest ona prawdziwa.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
34
8. Testy parametryczne
Służą do weryfikacji
, odnoszą-
cych się do parametrów rozkładu badanej cechy w jednej,
dwóch lub kilku
. Najczęściej wery-
fikowane są sądy dotyczące takich parametrów populacji jak:
wartość oczekiwana
,
czynnik korelacji.
Wyróżniamy dwie podstawowe grupy testów parame-
trycznych.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
35
Przykład 4. Dla danych z przykładu 3 (Przedziały ufności)
dotyczących liczby usterek w produkowanych urządzeniach
(populacja X), zweryfikować podane hipotezy parametryczne,
na poziomie istotności
= 0,05.
a) przeciętna liczba usterek wynosi 2,
b) przeciętna liczba usterek jest większa od 1,
c) wariancja liczby usterek wynosi 2,
d) odchylenie standardowe liczby usterek jest więk-
sze od 1,2,
e) wskaźnik urządzeń bez usterek wynosi 20%,
f) wskaźnik urządzeń bez usterek jest większy od
20%.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
36
Rozwiązanie. Rozkład cechy w populacji X jest nieznany, ale
próba jest bardzo duża (n = 500) i możemy skorzystać
z twierdzeń granicznych. Wszystkie hipotezy dotyczą para-
metrów jednej populacji. Parametrami tymi są: m,
, p.
a) Hipoteza „przeciętna liczba usterek wynosi 2” jest para-
metryczną hipotezą prostą, dotyczącą cechy X
liczby uste-
rek w produkowanych urządzeniach. Hipotezę tę ustawiamy
jako hipotezę zerową:
H
0
: m = 2,
jako hipotezę alternatywną przyjmujemy hipotezę złożoną:
H
1
: m
2.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
37
Rozkład badanej cechy jest nieznany, a próba jest bardzo du-
ża, więc korzystamy z testu 3 (zestawienie testów dla jednej
populacji):
n
s
m
z
0
x
.
Dane:
52
1,
x
, m
0
= 2, s = 1,24, n = 500,
= 0,05.
66
,
8
500
24
,
1
2
52
,
1
0
z
Hipoteza alt. jest dwustronna, więc dla danego
wyznacza-
my dwustronny obszar krytyczny
)
,
(
)
,
(
2
/
1
2
/
z
z
R
,
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
38
gdzie z
p
jest kwantylem p-tego rzędu rozkładu N(0, 1). W tym
przykładzie p = 0,025 i p = 0,975.
Odczytane z tablic kwantyle wynoszą:
z
0,025
=
1,960, z
0,975
= 1,960.
Stąd obszar krytyczny:
)
,
96
,
1
(
)
96
,
1
,
(
05
,
0
R
.
Decyzja: Ponieważ
)
,
96
,
1
(
)
96
,
1
,
(
66
,
8
0
z
, więc
na poziomie istotności 0,05, odrzucamy hipotezę zerową na
rzecz hipotezy alt. i stwierdzamy, że: przeciętna liczba uste-
rek istotnie różni się od 2.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
39
b) Hipoteza „przeciętna liczba usterek jest większa od 1” jest
parametryczną hipotezą bez przypadku m
1, więc ustawia-
my ją jako hipotezę alt. Uzupełniamy hipotezę zerową zgod-
nie z normą, czyli
H
0
: m
1 (obejmuje hip. prostą m
1),
H
1
: m > 1.
Statystyka jest ta sama co w punkcie a). Wśród danych zmie-
nia się wartość m
0
. Teraz m
0
= 1. Obliczamy statystykę
377
,
9
500
24
,
1
1
52
,
1
0
z
.
Hipoteza alt. jest prawostronna, więc dla
= 0,05 wyznacza-
my prawostronny obszar krytyczny
)
,
65
,
1
(
)
,
(
05
,
0
05
,
0
z
R
.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
40
Decyzja. Ponieważ obliczona statystyka należy do obszaru
krytycznego
,
więc odrzucamy H
0
rzecz hipotezy alt. Czyli
przeciętna usterkowość jest istotnie większa od 1.
c) Hipoteza
„wariancja liczby usterek wynosi 2”
jest parame-
tryczną hipotezą prostą dotyczącą wariancji badanej cechy.
Ustawiamy ja jako hipotezę zerową H
0
:
2
= 2.
Jako przeciwstawną przyjmujemy dwustronną hipotezę alt.
H
1
:
2
2
Stosujemy statystykę chi-kwadrat z modelu 4
2
0
2
2
)
1
(
S
n
Dane: n = 500,
2
2
0
, s = 1,24,
= 0,05, stąd
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
41
63
,
383
2
5376
,
1
499
2
0
Obszar krytyczny
)
,
(
)
,
0
(
2
1
,
2
/
1
2
1
,
2
/
n
n
R
. Wielkości
2
499
;
05
,
0
2
499
;
95
,
0
są kwantylami rzędu 0,025 i 0,975 rozkła-
du chi-kwadrat z 499 stopniami swobody.
Uwaga. Tablice kwantyli rozkładu chi-kwadrat są sporządza-
ne zwykle od 1 do 30 stopni swobody. Jeżeli nie możemy
skorzystać z komputerowego obliczenia, to korzystamy z wła-
sności granicznej
(*)
)
)
1
(
2
,
1
(
~
)
1
(
2
0
2
2
n
n
N
S
n
n
a po standaryzacji statystyki (*) otrzymujemy statystykę
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
42
(**)
)
1
(
2
)
1
(
2
n
n
Z
,
która dla dużych n ma w przybliżeniu rozkład N(0, 1).
Obliczamy wartość tej statystyki
65
,
3
998
499
63
,
383
0
z
Obszar krytyczny
)
,
96
,
1
(
)
96
,
1
,
(
05
,
0
R
Decyzja. Ponieważ z
0
R
0,05
, więc odrzucamy hipotezę zero-
wą i stwierdzamy, że wariancja usterkowości istotnie różni się
od 2.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
43
d) Hipoteza „odchylenie standardowe liczby usterek jest
większe od 1,2” jest hipotezą złożoną i ustawiamy ją jako hi-
potezę alt. Uzupełniamy hipotezę zerową, czyli
H
0
:
1,2 oraz H
1
:
> 1,2
Zwykle modele są podawane dla wariancji, więc powyższe
hipotezy przekształcamy na równoważne hipotezy dotyczące
wariancji, tj.
H
0
:
2
1,44 oraz H
1
:
2
> 1,44
Ponieważ n
500, więc stosujemy statystykę (**)
z
0
1,07.
Obszar krytyczny jednostronny:
)
,
65
,
1
(
05
,
0
R
.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
44
Decyzja. Obliczona statystyka nie należy do obszaru krytycz-
nego, więc na poziomie istotności
0,05, nie mamy pod-
staw do odrzucenia hipotezy zerowej, że odchylenie standar-
dowe liczby usterek wynosi 1,2.
e) Hipoteza „wskaźnik urządzeń bez usterek wynosi 20%” jest
hipotezą prostą dotyczącą wskaźnika p. Ustawiamy ją jako
hipotezę zerową. Dobieramy dwustronną hipotezę alt.:
H
0
: p = 0,2
H
1
: p
0,2
Badana cecha ma rozkład Bernoulliego. Próba jest bardzo du-
ża, więc korzystamy z granicznej statystyki o rozkładzie nor-
malnym:
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
45
n
p
p
p
p
z
n
)
1
(
0
0
0
Dane: p
0
= 0,2, n = 500,
x
i
=112, stąd
224
,
0
500
112
n
x
p
i
n
.
Obliczamy wartość z
0
statystyki Z
34
,
1
500
8
,
0
2
,
0
200
,
0
224
,
0
0
z
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
46
Hipoteza alt. jest dwustronna, więc obszar krytyczny
)
,
(
)
,
(
2
/
1
2
/
z
z
R
.
Z tablic kwantyli otrzymujemy
)
,
96
,
1
(
)
96
,
1
,
(
05
,
0
R
.
Decyzja. Ponieważ obliczona statystyka z
0
1,34 nie należy
do obszaru krytycznego, więc na przyjętym poziomie istotno-
ści, nie mamy podstaw do odrzucenia hipotezy zerowej, że
wskaźnik urządzeń bez usterek wynosi 20%.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
47
f) Hipotezę „wskaźnik urządzeń bez usterek jest większy od
20%” ustawiamy jako alternatywną hipotezę prawostronną i
uzupełniamy złożoną hipotezę zerową, czyli
H
0
: p
0,2,
H
1
: p > 0,2.
Statystyka jest ta sama jak w e), więc u
0
1,34.
Obszar krytyczny prawostronny
)
,
(
1
z
R
. Stąd
)
,
65
,
1
(
)
,
(
95
,
0
05
,
0
z
R
.
Decyzja. Ponieważ obliczona statystyka nie należy do obsza-
ru krytycznego, więc nie mamy podstaw do odrzucenia hipo-
tezy zerowej, że wskaźnik urządzeń bez usterek wynosi co
najwyżej 20%.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
48
Przykład projektu zaliczeniowego cz. 3
Uwaga. Należy przytaczać wzory i składnie funkcji wykorzystywanych w
rozwiązaniach. Udzielać pełnych odpowiedzi. Sporządzić tabelę ocen
według wzoru. W przypadku braku rozwiązania punktu, pod jego nume-
rem, w polu „uzyskano” wpisać „0”.
Punkt
1 2 3 Łącznie
do uzyskania 2 4 4
10
uzyskano
Długość X (w mm) detalu produkowanego na pewnego typu automacie
ma rozkład normalny, tj. X ~ N(m,
) o nieznanych parametrach. Norma
długości detali jest określona jako przedział (19,6; 20,4) [mm]. Parame-
try rozkładu oraz wskaźnik spełniania normy są przedmiotem badania.
W tym celu wylosowano prostą próbę detali produkowanych na tym au-
tomacie i zmierzono ich długości.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
49
Otrzymano następujące wyniki pomiarów w [mm]:
i) 20,019; 20,157; 19,840; 19,924; 20,149; 20,118; 20,827; 20,199;
20,611; 20,626; 20,259; 19,616; 20,120; 19,913, 20,393.
ii) wygenerować próbę o liczności 40 według rozkładu N(19,9; 0,25).
1. Na podstawie otrzymanych wyników pomiarów długości detali
ocenić:
a)
wartość oczekiwaną długości detalu,
b)
wariancję i odchylenie standardowe długości detalu,
c)
wskaźnik spełniania normy długości.
Ponadto wyznaczyć
d)
wartości minimalną i maksymalną oraz rozstęp.
Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji
50
2. Wyznaczyć 95-procentowe przedziały ufności dla:
a)
oczekiwanej długości detalu,
b)
wariancji długości detalu,
c)
wskaźnika spełniania normy długości.
3. Na poziomie istotności
0,05 zweryfikować hipotezy:
a) oczekiwana długość detalu wynosi 20[mm],
b) wariancja długości detalu jest większa od 0,04[mm
2
],
c) wskaźnik spełniania normy wynosi co najmniej 0,95.