Statystyka II-4
1
Testowanie hipotez statystycznych
(1)
• Drugim (obok teorii estymacji) ważnym działem
wnioskowania statystycznego jest testowanie hipotez
statystycznych, obejmu-jące zasady i metody
sprawdzania określonych przypuszczeń (założeń),
dotyczących parametrów lub postaci rozkładu cech
statystycznych populacji generalnej na podstawie
wyników z próby. Hipotezą statystyczną nazywamy każdy
sąd o zbiorowości generalnej, wydany bez
przeprowadzenia badania całkowitego. Prawdziwość
hipotezy statystycznej orzeka się na podstawie próby
losowej.
• Hipotezy mogą być parametryczne, gdy dotyczą wartości
odpowiednich parametrów statystycznych populacji
generalnej, takich jak wartość przeciętna, wariancja czy
wskaźnik struktury, lub nieparametryczne, gdy dotyczą
np. postaci rozkładu cechy statystycznej, współzależności
cech lub losowości próby.
Statystyka II-4
2
Testowanie hipotez statystycznych
(2)
• Hipotezą zerową H
0
nazywamy hipotezę sprawdzaną
(testowaną, weryfikowaną).
• Hipotezą alternatywną H
1
nazywamy hipotezę, którą
jesteśmy skłonni przyjąć, gdy odrzucamy hipotezę H
0
.
• Test statystyczny jest to reguła postępowania, która
przyporządkowuje wynikom próby losowej decyzję
przyjęcia lub odrzucenia hipotezy H
0
.
• Bląd I rodzaju polega na odrzuceniu hipotezy H
0
, mimo że
jest ona prawdziwa.
• Poziomem istotności nazywamy prawdopodobieństwo
popełnienia błędu I rodzaju. Wartości są bliskie zera i na
ogół są równe 0,01; 0,02; 0,05; 0,1.
• Bląd II rodzaju polega na przyjęciu hipotezy H
0
, gdy jest
ona fałszywa. Prawdopodobieństwo popełnienia tego błędu
oznacza się przez . Dobry test statystyczny powinien mieć
tę własność, że również powinno być bliskie zera.
Statystyka II-4
3
Testowanie hipotez statystycznych
(3)
• W statystycznej kontroli jakości (SKJ) określane jest
często jako ryzyko producenta, zaś jako ryzyko odbiorcy.
Wartości i są wzajemnie powiązane i zmniejszanie jednej
z nich powoduje zwiększenie drugiej.
• Pewnym kompromisem są tzw. testy istotności, które dla
zadanego z góry poziomu istotności zapewniają możliwie
najmniejszą wartość prawdopodobieństwa .
• Sprawdzianem hipotezy nazywamy taką statystykę T (o
znanym rozkładzie), której wartość t
e
, policzona na
podstawie próby losowej, pozwala na podjecie decyzji, czy
odrzucić hipotezę H
0
. Dla hipotez parametrycznych
sprawdzianami są estymatory odpowiednich parametrów,
natomiast dla hipotez nieparametrycznych rolę
sprawdzianów pełnią mierniki rozbieżności między
rozkładem empirycznym a teoretycznym, sformułowanym w
hipotezie H
0
.
Statystyka II-4
4
Testowanie hipotez statystycznych
(4)
Ilustracja graficzna wielkości i
Statystyka II-4
5
Testowanie hipotez statystycznych
(5)
• Zbiorem krytycznym Z nazywamy zbiór tych
wartości sprawdzianu hipotezy, które przemawiają
za odrzuceniem hipotezy H
0
.
• Zbiór Z może być w zależności od postaci hipotezy
alternatywnej zbiorem jednostronnym
(prawostronnym lub lewostronnym) albo zbiorem
dwustronnym. Mówimy wtedy również, że test
statystyczny jest jednostronny (prawostronny,
lewostronny) lub dwustronny. Rozkład sprawdzianu
hipotezy określa, z jakich tablic należy odczytać
wartość krytyczną t
wyznaczającą zbiór Z, a zatem
zbiór Z zależy również od liczebności próby n, od
tego, czy znamy parametry (m lub
) w zbiorowości
generalnej oraz od poziomu istotności .
Statystyka II-4
6
Testowanie hipotezy o wartości
przeciętnej (1)
•
Konstrukcję testu statystycznego omówimy na
przykła-dzie. Zakłada się, że długość życia opon ma
rozkład
N(m,
). Producent twierdzi, że wartość przeciętna tej
charakterystyki jest równa 50 tys. km. Na podstawie
100 losowo wybranych opon otrzymano = 45 tys.
km i
s = 8 tys. km. Czy na poziomie istotności =0,05
można uważać, że producent ma rację?
•
1
o
Sformułowanie hipotezy H
0
i H
1
W testach istotności hipoteza H
0
jest hipotezą „o
równoś-ci”. Hipoteza alternatywna H
1
może być
prostym zaprzeczeniem H
0
albo hipotezą „o
większości” lub „o mniejszości”. W tym przypadku:
•
H
0
: m = 50
H
1
: m
50
•
W testach istotności wartość jest z góry zadana
x
Statystyka II-4
7
Testowanie hipotezy o wartości
przeciętnej (2)
• 2
o
Zakładając, że długość życia opon ma rozkład
N(m,
) wybór sprawdzianu hipotezy zależy od
liczebności próby n oraz od tego, czy parametr
w zbiorowości generalnej jest znany: jeśli
jest znane i n30 lub
jest znane i n>30 lub
jest nieznane i n>30, ale wówczas
S
to sprawdzianem hipotezy H
0
jest statystyka:
o rozkładzie N(0,1).
• Gdy
jest nieznane i n 30, to sprawdzianem
hipotezy jest
o rozkładzie Studenta z (n-1) st.swobody
n
m
X
T
1
1
n
S
m
X
T
n
T
e
=(45-
50)/8·100=-6,25
Statystyka II-4
8
Testowanie hipotezy o wartości
przeciętnej (3)
• 3
o
Wyznaczanie zbioru krytycznego
Wartość krytyczną t
odczytujemy w danym przykładzie
z tablic funkcji (t) w ten sposób, że przy zbiorze
dwustron-nym (t
)=(1- )/2, a przy jednostronnym
(t
)=1/2- . Jeżeli relacja wyznaczająca zbiór
krytyczny jest spełniona, czyli wartość t
wpada w zbiór
krytyczny, to hipotezę H
0
należy odrzucić. W
przeciwnym przypadku nie ma podstaw do odrzucenia
H
0
. W przypadku przyjęcia sprawdzianu hipotezy T
n-1
wartość krytyczną t
odczytujemy z tablic rozkładu
Studenta dla n-1 stopni swobody i: a)P(t
)= przy
zbiorze jednostronnym;
b) P(t
)= 2 przy zbiorach dwustronnych. W
przykładzie H
1
: m
50, więc zbiór krytyczny jest
dwustronny.
Statystyka II-4
9
Testowanie hipotezy o wartości
przeciętnej (4)
Zbiory krytyczne w
zależności od postaci
hipotezy
alternatywnej
Statystyka II-4
10
Testowanie hipotez
parametrycznych
• W przypadku testowania hipotezy H
0
: m = m
0
wobec hipotezy
alternatyw-nej postaci H
1
: m
m
0
można podejmować decyzję o
odrzuceniu (lub nie) H
0
na podstawie przedziału ufności
wyznaczonego dla parametru m na poziomie ufności l-.
Jeśli wartość m
0
wpada do przedziału ufności, to nie ma podstaw do
odrzucenia H
0
; jeśli nie, to H
0
należy odrzucić, ponieważ zbiór leżący
poza przedziałem ufności jest zbiorem krytycznym.
• Korzystając z gotowych pakietów statystycznych, takich jak np.
„Statgra-phics", otrzymujemy wśród wyników, na wydrukach,
wartość określaną jako „P-value". Wartość ta jest równa
prawdopodobieństwu zajścia odpowiednich zdarzeń: a) P
V
= P(T>t
e
)
przy testach dwustronnych,
b) P
V
= P(T>t
e
) przy testach prawostronnych, c) P
v
=P(T< -t
e
) przy
testach lewostronnych, gdzie T — oznacza sprawdzian hipotezy, t
e
—
wartość sprawdzianu T policzoną na podstawie wyników z próby.
Jeśli wartość obliczonego prawdopodobieństwa P jest nie większa od
zadanego poziomu istotności (P
v
), to hipotezę H
0
należy
odrzucić na korzyść odpowiedniej hipotezy alternatywnej. W
przeciwnym wypadku, gdy
P
v
> , nie ma podstaw do odrzucenia H
0
.
Podsumowanie przykładu
• W rozpatrywanym przykładzie H
1
: m ≠ 50, więc
zbiór krytyczny jest dwustronny. Sprawdzianem
hipotezy jest
(t
) = (1 – 0,05)/2 = 0,95/2 = 0,475
stąd t
= 1,95
• W przykładzie wyznaczyliśmy wartość t
e
= -6,25.
Wynika stąd, że t
e
wpada w zbiór krytyczny, należy
zatem odrzucić hipotezę H
0
i w konsekwencji
przyjąć hipotezę alternatywną H
1
. Zatem producent
opon nie ma racji twierdząc, że przeciętna długość
życia opon wynosi 50 tys. km.
Statystyka II-4
11
Podsumowanie
• W przypadku testowania hipotezy H
0
: m ≠
m
0
można podejmować decyzję o
odrzuceniu (lub nie) H
0
na podstawie
przedziału ufności wyznaczonego dla
parametru m na poziomie ufności 1 - . Jeśli
wartość m
0
wpada do przedziału ufności, to
nie ma podstaw do odrzucenia H
0
; jeśli nie,
to H
0
należy odrzucić, ponieważ zbiór
leżący poza przedziałem ufności jest
zbiorem krytycznym.
Statystyka II-4
12
P-value
• Korzystając z gotowych pakietów statystycznych, np. pakietu
„Statistica”, na wydrukach wyników otrzymujemy wartość
określaną jako „P-value”. Wartość ta jest równa
prawdopodobieństwu zajścia odpowiednich zdarzeń:
a) P
v
= P(|T| > t
e
) przy testach dwustronnych,
b) P
v
= P(T > t
e
) przy testach prawostronnych,
c) P
v
= P(T < -t
e
) przy testach lewostronnych,
gdzie T – oznacza sprawdzian hipotezy, t
e
–wartość
sprawdzianu T policzoną na podstawie wyników z próby.
Jeśli wartość obliczonego prawdopodobieństwa P jest nie
większa od zadanego poziomu istotności (P
v
≤ ), to
hipotezę H
0
należy odrzucić na korzyść odpowiedniej hipotezy
alternatywnej. W przeciwnym przypadku, gdy P
v
> , nie ma
podstaw do odrzucenia H
0
.
Statystyka II-4
13
Testowanie hipotezy o
równości dwóch wartości
przeciętnych
• Dane są dwie zbiorowości generalne o
rozkładach normalnych N(m
1
,
1
) i N(m
2
,
2
). Chcemy zweryfikować hipotezę H
0
: m
1
= m
2
wobec hipotezy H
1
: m
1
≠ m
2
(lub H
1
:
m
1
< m
2
albo H
1
: m
1
> m
2
). Niech n
1
, n
2
oznaczają wielkości prób prostych,
wylosowanych z każdej zbiorowości , a
oraz oznaczają odpowiednio
średnie arytmetyczne i wariancje z prób.
Statystyka II-4
14
2
1
, X
X
2
)
2
(
2
)
1
(
S
i
S
Testowanie hipotezy o
równości dwóch wartości
przeciętnych (2)
• W zależności od założeń
dotyczących zbiorowości
generalnych oraz od liczebności
prób, sprawdzian hipotezy H
0
ma
różną postać i jest związany z
rozkładem normalnym lub
rozkładem Studenta.
Statystyka II-4
15
Testowanie hipotezy o
równości dwóch wartości
przeciętnych (3)
• Jeżeli
1
,
2
znane i n
1
≤ 30, n
2
≤ 30 lub
1
,
2
znane i n
1
> 30, n
2
> 30 lub
1
,
2
nieznane i n
1
> 30, n
2
> 30 i
przyjmujemy, że
, to
sprawdzian hipotezy ma postać:
Statystyka II-4
16
2
)
2
(
2
1
2
)
1
(
2
1
,
S
S
2
2
2
1
2
1
2
1
n
n
X
X
T
Rozkład statystyki przy
założeniu prawdziwości
H
0
, jest N(0, 1).
Statystyka II-4
17
Hipotezy nieparametryczne (1)
• Nieparametryczne testy istotności dzielimy na trzy zasadnicze
grupy: testy zgodności, testy niezależności oraz testy
losowości próby. Testy nieparametryczne, w przeciwieństwie
do testów parametrycznych, mają tę zaletę, że nie wymagają
założeń w odniesieniu do postaci rozkładu cechy w zbiorowości
generalnej.
• Do najczęściej stosowanych testów nieparametrycznych należy
test zgodności chi-kwadrat (
2
). Test zgodności
2
służy do
weryfikowania hipotezy, że obserwowana cecha X w
zbiorowości generalnej ma określony typ rozkładu, np.
dwumianowy, Poissona, normalny itd. Poniżej podajemy kilka
sposobów formułowania takiej hipotezy:
a. H
0
: cecha X ma rozkład określony dystrybuantą F(x) = F
0
(x).
b. H
0
: cecha X ma rozkład N(m,
).
c. H
0
: cecha X ma rozkład N (100, 5).
d. H
0
: cecha X ma rozkład Poissona.
e. H
0
: cecha X ma rozkład Poissona z parametrem m = 2.
Statystyka II-4
18
Hipotezy nieparametryczne (2)
• W celu jednoznacznego określenia rozkładu teoretycznego
(hipote-tycznego) w danej ich klasie niejednokrotnie należy
najpierw na pod-stawie próby oszacować odpowiednie
parametry. Dla zweryfikowania hipotezy przedstawionej w b)
należy oszacować m i
w d) parametr m; w c) i e) parametry
są podane. W omawianych przykładach hipoteza
alternatywna jest prostym zaprzeczeniem hipotezy zerowej.
Test zgodności
2
można stosować, jeśli:
1° dane pochodzą z dużej n-elementowej próby wylosowanej
w sposób niezależny,
2° dane są przedstawione w postaci szeregu rozdzielczego o
r przedziałach klasowych, o liczebnościach przedziałów n
1
,
n
2
,..., n
r
spełniających warunek n
1
+ n
2
+...+ n
r
= n. Na ogół
przyjmuje się, że n
j
5, j = l, 2,..., r,
3° rozkład hipotetyczny (sprecyzowany w H
0
) może być
zarówno rozkładem typu ciągłego, jak i skokowego.
Statystyka II-4
19
Hipotezy nieparametryczne (2)
• Sprawdzianem hipotezy H
0
jest statystyka
• Statystyka ta ma, przy założeniu prawdziwości hipotezy H
0
,
rozkład
2
o k = (r-s-1) stopniach swobody, przy czym s oznacza
liczbę parametrów, które należy wstępnie wyznaczyć na podstawie
próby; r — liczbę przedziałów klasowych.
• We wzorze (*) p
i
oznacza prawdopodobieństwo, że cecha X
przyjmuje wartość należącą do i-tego przedziału klasowego (gdy
rozkład cechy jest zgodny z H
0
), np
i
, zaś oznacza liczbę jednostek,
które powinny znaleźć się w i-tym przedziale, przy założeniu, że
cecha ma rozkład zgodny z hipotetycznym. Określa się je jako
liczebności teoretyczne. Wartość empiryczną statystyki (*)
oznaczamy przez
e2
. Statystyka
2
jest miarą rozbieżności między
rozkładem empirycznym a teoretycznym, a zatem zbyt duże
wartości
2
powodują odrzucenie H
0
. Z tego względu relacja
wyznaczająca zbiór krytyczny ma postać
gdzie
2
oznacza wartość krytyczną odczytaną z tablic.
(*)
1
2
r
i
i
i
i
np
np
n
2
2
P
Statystyka II-4
20
Test zgodności -Kołmogorowa (1)
• Test służy do weryfikowania hipotezy, że cecha X
ma w zbiorowości generalnej określony rozkład
typu ciągłego; najczęsciej jest to rozkład
normalny. Warunki dotyczące danych z próby są
takie same, jak w teście
2
. Hipotezy H
0
i H
1
formułuje się następująco:
H
0
: F(x) = F
0
(x)
H
1
: F(x) F
0
(x)
Sprawdzian hipotezy ma postać:
F(x) oznacza dystrybuantę hipotetyczną
(teoretyczną), a F*(x) – dystrybuantę empiryczną
)
(
*
)
(
sup
x
F
x
F
D
D
n
x
n
n
Statystyka II-4
21
Test zgodności -Kołmogorowa (1)
• Wartość dystrybuanty empirycznej dla danego x
oblicza się z zależności: F*(x)=n
isk
/n, w której n
isk
jest skumulowaną liczebnością, odpowiadającą
wartościom cechy nie większym od x.
• Statystyka przy założeniu prawdziwości H
0
ma
asymptotyczny rozkład - Kołmogorowa. Z uwagi
na fakt, iż D
n
mierzy rozbieżność między
dystrybuantą teoretyczną i empiryczną, zbiór
krytyczny będą tworzyły tylko zbyt duże wartości
, tak więc będzie to zbiór prawostronny
określony równością:
odczytuje się z tablic, przy czym Q(
) =
P