WYKŁAD 4
WERYFIKACJA HIPOTEZ
PARAMETRYCZNYCH
X - cecha populacji, θ – parametr rozkładu cechy X.
1
Wysuwamy hipotezy:
zerową (podstawową)
H (θ = θ )
0
0
i alternatywną H 1 , która ma jedną z następujących postaci H (θ >θ ) H (θ < θ
H (θ ≠ θ )
1
0
,
)
1
0
,
1
0
2
Postępowanie przy weryfikacji powyższych hipotez jest
następujące
1. Wybieramy pewną statystykę U n o rozkładzie zależnym od parametru θ oraz pewną liczbę α z przedziału (0 , 1)
i wyznaczamy podzbiór K zbioru liczb rzeczywistych tak by spełniony był warunek
P( U n ∈ K |θ = θ )
0
= α
czyli aby prawdopodobieństwo, iż statystyka U n przyjmie wartość ze zbioru K, przy założeniu, że prawdziwa jest hipoteza zerowa było równe α.
3
2. Pobieramy próbę i obliczamy wartość u
U
n statystyki
n
3. Podejmujemy decyzje
u ∈ K
gdy
n
odrzucamy H 0 ,
u ∉ K
gdy
n
przyjmujemy H 0 (nie ma podstaw do
odrzucenia H 0 ).
4
Hipotezę H
∈
0 odrzucamy gdy
u
K
n
bowiem
prawdopodobieństwo zajścia zdarzenia U ∈ K
n
jest
bardzo małe przy założeniu, że prawdziwa jest
hipoteza H 0 i skoro takie zdarzenie dla pobranej próby
zaszło,
należy
sądzić,
że
założenie
o prawdziwości hipotezy
H 0 było niesłusznie
przyjęte.
5
Terminologia.
U n - sprawdzian, (statystyka testowa)
K – zbiór krytyczny (zbiór odrzuceń),
α - poziom istotności (typowe wartości α : 0,1; 0,05; 0,01).
αˆ - krytyczny poziom istotności (poziom istotności przy którym następuje zmiana decyzji).
6
Błędy decyzji w teście sprawdzającym hipotezę H 0 .
Decyzja
Przyjmujemy H
H
0
Odrzucamy
0
H - prawdziwa Decyzja wła
0
ściwa
Błąd I rodzaju
H - fałszywa
0
Błąd II rodzaju
Decyzja właściwa
Prawdopodobieństwo popełnienia błędu I rodzaju wynosi:
P( U n ∈ K | H )
0
= α
Prawdopodobieństwo popełnienia błędu II rodzaju wynosi:
P( U n ∉ K | H )
1
= β
7
Testy do weryfikacji hipotez o wartości oczekiwanej I. Cecha X populacji ma rozkład normalny N(m , σ), σ jest znane Hipoteza zerowa H ( m = m ) 0
0
H1
U
Nr
n
Zbiór kryt. K
Wyznaczanie
liczby k
testu
H ( m > m )
<
Φ( k ) = 1−α
1
0
k ; ∞)
1
H ( m < m )
Φ( k) = 1−α
1
0
X − m
(−∞ ; − k >
0
2
H ( m ≠ m )
−∞ − k > <
∪ k ∞
α
1
0
σ / n ( ;
; )
Φ ( k ) = 1 −
3
2
II. Cecha X populacji ma rozkład normalny N(m , σ), σ nie jest znane. Hipoteza zerowa H ( m = m ) 0
0
H
Nr
1
Zbiór kryt . K
Wyznaczanie
U n
liczby k
tes
tu
H ( m > m )
< k ; ∞
P(| T
|
n−
≥ k) =
1
α
2
1
0
)
4
H ( m < m ) X
(−∞ ; − k >
P(| T
|
n−
≥ k) =
1
α
2
1
0
− m 0
5
H ( m ≠ m ) S / n −1 (−∞; − k >∪< k ; ∞
P(| Tn− |
k
1
≥ ) =
1
0
)
α
6
III. Cecha X populacji ma dowolny rozkład, próba jest liczna n > 120. Hipoteza zerowa H ( m = m ) 0
0
H1
U
Nr
n
Zbiór kryt. K
Wyznaczanie
liczby k
test
u
H ( m > m )
< k ; ∞
Φ( k ) = 1−
1
0
X − m
)
α
7
0
H ( m < m )
(−∞ ; − k >
Φ( k) = 1−
1
0
α
S / n
8
H ( m ≠ m )
−∞ − k > <
∪ k ∞
α
1
0
(
;
; )
Φ ( k ) = 1 −
9
2
8
Test do weryfikacji hipotezy o prawdopodobieństwie sukcesu
Cecha X populacji ma rozkład zerojedynkowy
P( X = )
1 = p, P( X = )
0 = 1− p,
p ∈ (0 ;1)
Hipoteza zerowa H ( p = p )
0
0
Próba liczna n>100
H
Nr
1
U n
Zbiór kryt. K
Wyznaczanie
liczby k
testu
H ( p > p )
W − p
< k ; ∞
Φ( k ) = 1−
1
0
0
10
n
)
α
p 1
(
H ( p < p )
− p )
(−∞ ; −
0
0
k >
Φ( k) =1−α
1
0
11
H ( p ≠ p ) W – średnia
(−∞ ; − k > ∪ < k ; ∞
α
1
0
)
Φ( k) = 1−
12
częstość sukcesu
2
k
W =
n
9
Test do weryfikacji hipotez o odchyleniu
standardowym
Cecha X populacji ma rozkład normalny N(m , σ).
Hipoteza zerowa H (σ = σ )
0
0
H1
U
Nr
n
Zbiór kryt . K
Wyznaczanie liczb
k i l
testu
H (σ > σ )
1
0
< k ; ∞)
P( Yn−
k
1 ≥
) = α 13
2
H (σ < σ )
(0 ; k >
P( Yn−
k
1 ≥
) = 1 −
1
0
nS
α 14
2
H (σ ≠ σ )
(0 ; k > ∪ < l ; ∞)
P( Y
n−
≥ l) = α / 2
1
0
σ
0
1
15
P( Y
n−
≥ k) = 1−α / 2
1
Uwaga: dla n>30 można stosować statystykę
2
=
nS
U
2
−
(
2 n − )
1 −1
2
σ
0
o rozkładzie N(0,1).
10
Testy do porównywania wartości oczekiwanych Badane są dwie cechy X i Y różnych populacji.
Zakładamy, że cechy te są zmiennymi losowymi
niezależnymi. Z populacji, w której badana jest
cecha X pobrano próbę n 1 elementową, natomiast z drugiej populacji pobrano próbę n 2 elementową.
1. Cechy X i Y mają rozkłady normalne N m σ
N m σ
odpowiednio
(
,
),
(
,
)
1
1
2
2
,
przy
czym odchylenia standardowe σ
σ
1 i
2 są znane.
=
Hipoteza zerowa H ( m
m )
0
1
2
H
Nr
1
U
Zbiór kryt. K
Wyznaczanie
1
n n 2
liczby k
testu
H ( m > m )
Φ( k ) = 1−
1
1
2
X − Y
< k ; ∞ )
α 16
H ( m < m )
(−∞ ; − k >
Φ( k) = 1−α
1
1
2
2
2
σ
σ
17
1
2
H ( m ≠ m )
+
(−∞ ; − k > ∪ < k ; )
∞
α
1
1
2
n
n
Φ( k) = 1−
18
1
2
2
11
2. Cechy X i Y mają rozkłady normalne odpowiednio N ( m ,σ ), N ( m ,σ )
1
2
, przy czym odchylenia standardowe obu cech
są sobie równe i nie są znane. Hipoteza zerowa H ( m = m ) 0
1
2
H
Wyznaczanie
Nr
1
U
Zbiór kryt.
1
n n 2
K
liczby k
testu
(
P | T
|
n + n −
≥ )
k =
2
α
H ( m > m )
X − Y
2
1
1
2
< k ; ∞ )
1
2
19
2
2
n S + n S
n + n
1 1
2
2
1
2
H ( m < m )
(−∞ ; − k >
(
P | T
|
n + n −
≥ )
k =
2
α
2
1
1
2
⋅
20
n + n − 2
n n
1
2
1
2
1 2
H ( m ≠ m )
(−∞ ; − k > ∪
(
P | T
k
21
1
n + 2
n − |
2
≥ ) α
=
1
1
2
∪ <
k ; ∞)
2
2
n S
+ n S
n + n
2
1
1
2
2
1
2
Wielko
=
⋅
ść S p
n + n − 2
n n
nazywamy
1
2
1
2
wariancją połączonych populacji.
3. Cechy X i Y mają rozkłady dowolne o wartościach oczekiwanych m , m
1
2 , przy czym próby są liczne,
n
n
H ( m = m
1 ,
2 > 120.
)
0
1
2
H
Nr
1
U
Zbiór kryt. K
Wyznaczanie
1
n n 2
liczby k
testu
H ( m > m )
−
< k ; ∞
Φ( k ) = 1−
1
1
2
X
Y
)
α
22
2
2
S
S
1
2
+
H ( m < m )
(−∞ ; − k >
Φ( k) =1−α
1
1
2
n
n
1
2
23
H ( m ≠ m )
(−∞ ; − k > ∪ < k ; ∞)
α
1
1
2
Φ( k) = 1−
24
2
12
Test do porównywania prawdopodobieństw sukcesu.
Badane są dwie cechy X i Y różnych populacji o rozkładach zerojedynkowych,
P( X = )
1 = p ,
P( X = )
0 = 1 − p ,
1
1
P( Y = )
1 = p , P( Y = )
0 =1 − p ,
2
2
Z populacji, której badana jest cecha X pobrano próbę n 1 elementową, natomiast z drugiej populacji pobrano próbę n 2 elementową. Obie próby są liczne n
n
1 ,
2 >100.
Hipoteza zerowa: H ( p = p )
0
1
2
H
Nr
1
U
Zbiór kryt. K
Wyznaczanie
liczby k
testu
1
n n 2
H ( p > p )
< k ; ∞
Φ( k ) = 1−
1
1
2
W W
−
)
α
25
1
2
H ( p < p )
(−∞ ; − k >
Φ( k) = 1−α
1
1
2
n n
+
26
1
2
W 1
( − )
W ⋅
H ( p ≠ p )
(−∞ ; − k > ∪ < k ; ∞)
α
1
1
2
n n
Φ( k) = 1−
27
1 2
2
W , W
1
2 średnie częstości sukcesów w poszczególnych
próbach,
W = k / n , W = k / n , 1
1
1
2
2
2
=
+
+
W
( k
k ) /( n
n )
1
2
1
2
- średnia częstość
sukcesu w połączonych próbach,
n
n
1
1
W =
⋅ W +
⋅ W
1
2
n + n
n + n
1
2
1
2
13
Test do weryfikacji hipotez o porównywaniu wariancji
Cechy X i Y mają rozkłady normalne odpowiednio N ( m ,σ ), N( m ,σ )
1
1
2
2
.
Z populacji, w której badana jest cecha X pobrano próbę n 1 elementową, natomiast z drugiej populacji pobrano próbę n 2 elementową.
2
2
ˆ
ˆ
Tak dobieramy oznaczenia populacji aby S
≥ S
1
n
n 2
2
Hipoteza zerowa H (
2
σ = σ )
0
1
2
H
Wyznaczanie liczby k Nr
1
U
Zbiór kryt .
testu
1
n n 2
K
P( F
k
n
n
28
1 − ;
1 2 −1 ≥
) = α
2
ˆ
H ( 2
2
σ > σ )
S
< k ; ∞)
(F - rozkład
1
1
2
n
1
Snedecora)
2
ˆ
Sn
2
14
Przykłady
Przykład.
Według
danych
producenta,
określony
typ
samochodu zużywał 10 l/100km. Po dokonaniu
pewnych usprawnień w tym typie samochodu
oczekuje się, że zużycie paliwa spadnie. Aby to
sprawdzić dokonano pomiaru zużycia paliwa w 25
losowo wybranych samochodach tego typu po
modernizacji i otrzymano wynik x = 3
,
9
25
l/100km.
Zakładając, że zużycie paliwa ma rozkład normalny
N(m, 2) sprawdzić czy modernizacja istotnie
zmniejszyła zużycie paliwa.
Przyjąć α = 0,05.
15
Zastosujemy test 2.
H ( m = 10), H ( m < 1 ) 0
0
1
, α = 0,05
zatem
Φ( k ) = 1−α = 0,95 stąd k = 1,64
Zbiór krytyczny
K = (-∞; - 1,64>
Wartość statystyki
3
,
9 − 10
u =
25 = − ,
1 75
2
interpretacja graficzna:
0,05
-1,75
--1,64
0
Ponieważ u ∈ K to hipotezę H odrzucamy. Zatem 0
zmiany konstrukcyjne istotnie zmniejszyły zużycie
paliwa.
16
Obliczymy dla jakich wartości średniej z próby
25 - elementowej decyzja byłaby taka sama:
x −10 25 < − ,164 ⇒ x < 3,
9 4
2
Zatem dla x < 3
,
9 4 wartość U należy do zbioru
krytycznego.
17
Wyznaczymy krytyczny poziom istotności αˆ .
Φ ,
1
( 75) = 1 − αˆ ≅ 0,96
stąd αˆ ≅ 0,04.
Zatem dla α < 0,04 podjęlibyśmy inną decyzję.
Zauważmy, że odrzucając hipotezę H 0 narażamy się na
popełnienie
błędu
I
rodzaju
(prawdopodobieństwo jego popełnienia wynosi
0,05).
18
Przykład.
Dla sytuacji z poprzedniego przykładu niech
x
= ,
9 44
25
.
Rozpatrzmy hipotezy
H ( m = 1 )
0 , H ( m = )
9
0
1
,
Zastosujemy test 2.
19
Zbiór krytyczny jak poprzednio
K = (-∞; - 1,64>
Wartość statystyki
,
9 44 − 10
u =
25 = − ,
1 4
2
interpretacja graficzna:
0,05
-1,4
0
-1,64
Ponieważ u ∉ K to nie ma podstaw do odrzucenia hipotezy H . Przyjmując hipotezę H narażamy się 0
0
na popełnienie błędu II rodzaju.
Wyznaczymy krytyczny poziom istotności αˆ .
Φ ,
1
(
)
4 = 1 − αˆ ≅ 0,92
stąd αˆ ≅ 0,08. Zatem dla α > 0,08 podjęlibyśmy
inną decyzję.
20
Obliczymy prawdopodobieństwo popełnienia błędu
II rodzaju.
X 1
− 0
β = (
P U ∉ K m = )
9 = P
5 > − 6
,
1 4 m = 9
=
2
= (
P X > 3
,
9 44 m = )
9 =
X −9
3
,
9 44−9
P
5 >
5
=1−Φ 8
,
0
(
)
6 ≈ 2
,
0
2
2
Zatem
przyjmując
hipotezę
H 0
możemy
zakwalifikować około 20% samochodów mających
zużycie 9 l/100km jako samochody o zużyciu
10 l/100km.
21
Interpretacja powyższych wyników na wykresie
gęstości rozkładów N(9, 2/5) i N(10, 2/5).
10
9
9,44
0,2
0,05
Uwaga.
Z powyższego wykresu widać, że
• gdy n rośnie (wykresy są bardziej smukłe) to
maleje p-stwo popełnienia błędu II rodzaju – dla
danego zbioru krytycznego,
• gdy maleje p-stwo popełnienia błędu I rodzaju to
rośnie p-stwo popełnienia błędu II rodzaju
22
Niech H (θ = θ ), H (θ = θ ),
0
0
1
1
K = zbiór krytyczny,
określamy moc testu w punkcie θ = θ ′ jako
M (θ )
′ = P( U ∈ K θ = θ )′
Jest to prawdopodobieństwo odrzucenia hipotezy H , 0
gdy θ = θ ′
Uwaga
M θ
(
)
0
= α
M θ
( )
1
= 1− β
(im większa moc testu tym mniejsze
prawdopodobieństwo popełnienia błędu II rodzaju)
23
Test dla weryfikacji hipotez H (θ = θ ), H (θ = θ ), 0
0
1
1
jest nazywany testem najmocniejszym, jeśli jego moc dla θ ′= θ1 jest największa w porównaniu z innymi testami (poziom istotności ten sam).
Dla testu najmocniejszego prawdopodobieństwo
popełnienia błędu II rodzaju jest najmniejsze.
24
Wyznaczymy funkcję mocy testu z poprzedniego
przykładu.
Rozpatrzmy hipotezy H ( m = 10), H ( m = 9) 0
1
,
α = 0,05,
zbiór krytyczny K = (– ∞; – 1, 64>.
25
M ( m′) = P
25 < − ,
1 64 m = m′ =
2
= P( X <
m
3
,
9 44 m = m′)
3
,
9 44 − ′
= Φ
5
2
26
Wartości funkcji zestawiamy w tabeli:
9 ,344 − m ′
m'
5
M( m' )
2
8,0
3,36
0,9996
8,5
2,11
0,9800
9,0
0,86
0,8050
9,5
– 0,39
0,3480
10,0
– 1,64
0,0500
Wykres funkcji M ( m )′
27
Przykład
Dwie brygady produkują detale. Z partii detali
wyprodukowanych przez I brygadę wylosowano 1000
szt. i wśród nich było 20 braków. Z partii detali
wyprodukowanych przez II brygadę wylosowano 900 szt.
i wśród nich było 30 braków. Na poziomie istotności
α = 0,01 sprawdzić hipotezę, że odsetek braków w I
brygadzie jest niż niższy niż w II brygadzie.
28
Zastosujemy test 26.
H ( p = p ), H ( p < p ) , α = 0,01
0
1
2
1
1
2
Zbiór krytyczny
K = (– ∞; – 2,33>
Obliczamy:
w = 20 /1000 w = 30 /
1
;
900
2
w = 50 /1900
Wartość statystyki
u = − 8
,
1 1
29
0,01
--2,33
-1,81
0
Ponieważ u ∉ K to nie ma podstaw do odrzucenia hipotezy H . Oznacza to,
0
że w granicach błędu
statystycznego obie brygady mają ten sam odsetek
braków.
30
Wyznaczymy krytyczny poziom istotności αˆ .
Φ 8
,
1
(
)
1 = 1 − αˆ ≅ 0,96485
stąd αˆ ≅ 0,035. Zatem dla α > 0,035 podjęlibyśmy inną decyzję.
31
Dokładność pracy obrabiarki sprawdza się wyznaczając odchylenie standardowe średnicy toczonego detalu,
powinno ono wynosić σ = ,
0 2
0
. Zmierzono średnice
(mm) 11 losowo wybranych detali i otrzymano:
100,6; 99,6; 100,0; 100,1; 100,3; 100,0; 99,9; 100,2; 100,4; 100,6; 100,5.
Zakładając, że średnice detali mają rozkład normalny, sprawdzić na podstawie powyższych danych, że
obrabiarka ma pożądaną dokładność. Przyjąć poziom
istotności 0,05.
32
Rozwiązanie.
Zastosujemy test 25.
H (σ = ,
0 )
2 , H (σ > ,
0 2)
0
1
,
α = 0,05
Zbiór krytyczny
K = <18,307; ∞)
Obliczamy:
2
x
= 10 ,
0 2
s = ,
0
11
091
11
Wartość statystyki
11⋅ ,
0 091
u =
= 25
,
0 04
interpretacja graficzna:
0,05
18,307
25
Ponieważ u ∈ K to hipotezę H 0 odrzucamy. Zatem należy sądzić, że obrabiarka ma gorszą dokładność niż pożądana.
Wyznaczymy krytyczny poziom istotności αˆ .
Y (2 )
5 =
10
αˆ ≅ 0,005
Zatem dla α < 0,005 podjęlibyśmy inną decyzję.
33