sm-w-4-2011 id 457959

STATYSTYKA MATEMATYCZNA

WYKŁAD 4

WERYFIKACJA HIPOTEZ

PARAMETRYCZNYCH

X - cecha populacji, θ – parametr rozkładu cechy X.

Wysuwamy hipotezy:

zerową (podstawową)

H (θ = θ )

i alternatywną H 1 , która ma jedną z następujących postaci H (θ >θ ) H (θ < θ

H (θ ≠ θ )

)

Postępowanie przy weryfikacji powyższych hipotez jest

następujące

1. Wybieramy pewną statystykę U n o rozkładzie zależnym od parametru θ oraz pewną liczbę α z przedziału (0 , 1)

i wyznaczamy podzbiór K zbioru liczb rzeczywistych tak by spełniony był warunek

P( U n ∈ K |θ = θ )

= α

czyli aby prawdopodobieństwo, iż statystyka U n przyjmie wartość ze zbioru K, przy założeniu, że prawdziwa jest hipoteza zerowa było równe α.

2. Pobieramy próbę i obliczamy wartość u

n statystyki

3. Podejmujemy decyzje

u ∈ K

gdy

odrzucamy H 0 ,

u ∉ K

gdy

przyjmujemy H 0 (nie ma podstaw do

odrzucenia H 0 ).

Uzasadnienie:

Hipotezę H

∈

0 odrzucamy gdy

bowiem

prawdopodobieństwo zajścia zdarzenia U ∈ K

jest

bardzo małe przy założeniu, że prawdziwa jest

hipoteza H 0 i skoro takie zdarzenie dla pobranej próby

zaszło,

należy

sądzić,

że

założenie

o prawdziwości hipotezy

H 0 było niesłusznie

przyjęte.

Terminologia.

U n - sprawdzian, (statystyka testowa)

K – zbiór krytyczny (zbiór odrzuceń),

α - poziom istotności (typowe wartości α : 0,1; 0,05; 0,01).

αˆ - krytyczny poziom istotności (poziom istotności przy którym następuje zmiana decyzji).

Błędy decyzji w teście sprawdzającym hipotezę H 0 .

Decyzja

Przyjmujemy H

Odrzucamy

H - prawdziwa Decyzja wła

ściwa

Błąd I rodzaju

H - fałszywa

Błąd II rodzaju

Decyzja właściwa

Prawdopodobieństwo popełnienia błędu I rodzaju wynosi:

P( U n ∈ K | H )

= α

Prawdopodobieństwo popełnienia błędu II rodzaju wynosi:

P( U n ∉ K | H )

= β

Testy do weryfikacji hipotez o wartości oczekiwanej I. Cecha X populacji ma rozkład normalny N(m , σ), σ jest znane Hipoteza zerowa H ( m = m ) 0

Zbiór kryt. K

Wyznaczanie

liczby k

testu

H ( m > m )

Φ( k ) = 1−α

k ; ∞)

H ( m < m )

Φ( k) = 1−α

X − m

(−∞ ; − k >

H ( m ≠ m )

−∞ − k > <

∪ k ∞

σ / n ( ;

; )

Φ ( k ) = 1 −

II. Cecha X populacji ma rozkład normalny N(m , σ), σ nie jest znane. Hipoteza zerowa H ( m = m ) 0

Zbiór kryt . K

Wyznaczanie

U n

liczby k

tes

H ( m > m )

< k ; ∞

P(| T

n−

≥ k) =

)

H ( m < m ) X

(−∞ ; − k >

P(| T

n−

≥ k) =

− m 0

H ( m ≠ m ) S / n −1 (−∞; − k >∪< k ; ∞

P(| Tn− |

≥ ) =

)

III. Cecha X populacji ma dowolny rozkład, próba jest liczna n > 120. Hipoteza zerowa H ( m = m ) 0

Zbiór kryt. K

Wyznaczanie

liczby k

test

H ( m > m )

< k ; ∞

Φ( k ) = 1−

X − m

)

H ( m < m )

(−∞ ; − k >

Φ( k) = 1−

S / n

H ( m ≠ m )

−∞ − k > <

∪ k ∞

(

;

; )

Φ ( k ) = 1 −

Test do weryfikacji hipotezy o prawdopodobieństwie sukcesu

Cecha X populacji ma rozkład zerojedynkowy

P( X = )

1 = p, P( X = )

0 = 1− p,

p ∈ (0 ;1)

Hipoteza zerowa H ( p = p )

Próba liczna n>100

U n

Zbiór kryt. K

Wyznaczanie

liczby k

testu

H ( p > p )

W − p

< k ; ∞

Φ( k ) = 1−

)

p 1

(

H ( p < p )

− p )

(−∞ ; −

k >

Φ( k) =1−α

H ( p ≠ p ) W – średnia

(−∞ ; − k > ∪ < k ; ∞

)

Φ( k) = 1−

częstość sukcesu

W =

Test do weryfikacji hipotez o odchyleniu

standardowym

Cecha X populacji ma rozkład normalny N(m , σ).

Hipoteza zerowa H (σ = σ )

Zbiór kryt . K

Wyznaczanie liczb

k i l

testu

H (σ > σ )

< k ; ∞)

P( Yn−

1 ≥

) = α 13

H (σ < σ )

(0 ; k >

P( Yn−

1 ≥

) = 1 −

α 14

H (σ ≠ σ )

(0 ; k > ∪ < l ; ∞)

P( Y

n−

≥ l) = α / 2

P( Y

n−

≥ k) = 1−α / 2

Uwaga: dla n>30 można stosować statystykę

−

(

2 n − )

1 −1

o rozkładzie N(0,1).

Testy do porównywania wartości oczekiwanych Badane są dwie cechy X i Y różnych populacji.

Zakładamy, że cechy te są zmiennymi losowymi

niezależnymi. Z populacji, w której badana jest

cecha X pobrano próbę n 1 elementową, natomiast z drugiej populacji pobrano próbę n 2 elementową.

1. Cechy X i Y mają rozkłady normalne N m σ

N m σ

odpowiednio

(

)

przy

czym odchylenia standardowe σ

1 i

2 są znane.

Hipoteza zerowa H ( m

m )

Zbiór kryt. K

Wyznaczanie

n n 2

liczby k

testu

H ( m > m )

Φ( k ) = 1−

X − Y

< k ; ∞ )

α 16

H ( m < m )

(−∞ ; − k >

Φ( k) = 1−α

H ( m ≠ m )

(−∞ ; − k > ∪ < k ; )

∞

Φ( k) = 1−

2. Cechy X i Y mają rozkłady normalne odpowiednio N ( m ,σ ), N ( m ,σ )

, przy czym odchylenia standardowe obu cech

są sobie równe i nie są znane. Hipoteza zerowa H ( m = m ) 0

Wyznaczanie

Zbiór kryt.

n n 2

liczby k

testu

(

P | T

n + n −

≥ )

k =

H ( m > m )

X − Y

< k ; ∞ )

n S + n S

n + n

1 1

H ( m < m )

(−∞ ; − k >

(

P | T

n + n −

≥ )

k =

⋅

n + n − 2

n n

1 2

H ( m ≠ m )

(−∞ ; − k > ∪

(

P | T

n + 2

n − |

≥ ) α

∪ <

k ; ∞)

n S

+ n S

n + n

Wielko

⋅

ść S p

n + n − 2

n n

nazywamy

wariancją połączonych populacji.

3. Cechy X i Y mają rozkłady dowolne o wartościach oczekiwanych m , m

2 , przy czym próby są liczne,

H ( m = m

1 ,

2 > 120.

)

Zbiór kryt. K

Wyznaczanie

n n 2

liczby k

testu

H ( m > m )

−

< k ; ∞

Φ( k ) = 1−

)

H ( m < m )

(−∞ ; − k >

Φ( k) =1−α

H ( m ≠ m )

(−∞ ; − k > ∪ < k ; ∞)

Φ( k) = 1−

Test do porównywania prawdopodobieństw sukcesu.

Badane są dwie cechy X i Y różnych populacji o rozkładach zerojedynkowych,

P( X = )

1 = p ,

P( X = )

0 = 1 − p ,

P( Y = )

1 = p , P( Y = )

0 =1 − p ,

Z populacji, której badana jest cecha X pobrano próbę n 1 elementową, natomiast z drugiej populacji pobrano próbę n 2 elementową. Obie próby są liczne n

1 ,

2 >100.

Hipoteza zerowa: H ( p = p )

Zbiór kryt. K

Wyznaczanie

liczby k

testu

n n 2

H ( p > p )

< k ; ∞

Φ( k ) = 1−

W W

−

)

H ( p < p )

(−∞ ; − k >

Φ( k) = 1−α

n n

W 1

( − )

W ⋅

H ( p ≠ p )

(−∞ ; − k > ∪ < k ; ∞)

n n

Φ( k) = 1−

1 2

W , W

2 średnie częstości sukcesów w poszczególnych

próbach,

W = k / n , W = k / n , 1

( k

k ) /( n

n )

- średnia częstość

sukcesu w połączonych próbach,

W =

⋅ W +

⋅ W

n + n

Test do weryfikacji hipotez o porównywaniu wariancji

Cechy X i Y mają rozkłady normalne odpowiednio N ( m ,σ ), N( m ,σ )

Z populacji, w której badana jest cecha X pobrano próbę n 1 elementową, natomiast z drugiej populacji pobrano próbę n 2 elementową.

Tak dobieramy oznaczenia populacji aby S

≥ S

n 2

Hipoteza zerowa H (

σ = σ )

Wyznaczanie liczby k Nr

Zbiór kryt .

testu

n n 2

P( F

1 − ;

1 2 −1 ≥

) = α

H ( 2

σ > σ )

< k ; ∞)

(F - rozkład

Snedecora)

Przykłady

Przykład.

Według

danych

producenta,

określony

typ

samochodu zużywał 10 l/100km. Po dokonaniu

pewnych usprawnień w tym typie samochodu

oczekuje się, że zużycie paliwa spadnie. Aby to

sprawdzić dokonano pomiaru zużycia paliwa w 25

losowo wybranych samochodach tego typu po

modernizacji i otrzymano wynik x = 3

l/100km.

Zakładając, że zużycie paliwa ma rozkład normalny

N(m, 2) sprawdzić czy modernizacja istotnie

zmniejszyła zużycie paliwa.

Przyjąć α = 0,05.

Rozwiązanie.

Zastosujemy test 2.

H ( m = 10), H ( m < 1 ) 0

, α = 0,05

zatem

Φ( k ) = 1−α = 0,95 stąd k = 1,64

Zbiór krytyczny

K = (-∞; - 1,64>

Wartość statystyki

9 − 10

u =

25 = − ,

1 75

interpretacja graficzna:

0,05

-1,75

--1,64

Ponieważ u ∈ K to hipotezę H odrzucamy. Zatem 0

zmiany konstrukcyjne istotnie zmniejszyły zużycie

paliwa.

Obliczymy dla jakich wartości średniej z próby

25 - elementowej decyzja byłaby taka sama:

x −10 25 < − ,164 ⇒ x < 3,

9 4

Zatem dla x < 3

9 4 wartość U należy do zbioru

krytycznego.

Wyznaczymy krytyczny poziom istotności αˆ .

Φ ,

( 75) = 1 − αˆ ≅ 0,96

stąd αˆ ≅ 0,04.

Zatem dla α < 0,04 podjęlibyśmy inną decyzję.

Zauważmy, że odrzucając hipotezę H 0 narażamy się na

popełnienie

błędu

rodzaju

(prawdopodobieństwo jego popełnienia wynosi

0,05).

Przykład.

Dla sytuacji z poprzedniego przykładu niech

= ,

9 44

Rozpatrzmy hipotezy

H ( m = 1 )

0 , H ( m = )

Zastosujemy test 2.

Zbiór krytyczny jak poprzednio

K = (-∞; - 1,64>

Wartość statystyki

9 44 − 10

u =

25 = − ,

1 4

interpretacja graficzna:

0,05

-1,4

-1,64

Ponieważ u ∉ K to nie ma podstaw do odrzucenia hipotezy H . Przyjmując hipotezę H narażamy się 0

na popełnienie błędu II rodzaju.

Wyznaczymy krytyczny poziom istotności αˆ .

Φ ,

(

)

4 = 1 − αˆ ≅ 0,92

stąd αˆ ≅ 0,08. Zatem dla α > 0,08 podjęlibyśmy

inną decyzję.

Obliczymy prawdopodobieństwo popełnienia błędu

II rodzaju.

 X 1

− 0



β = (

P U ∉ K m = )

9 = P

5 > − 6

1 4 m = 9



 =





= (

P X > 3

9 44 m = )

9 =

 X −9

9 44−9 

5 >



 =1−Φ 8

(

)

6 ≈ 2

 2



Zatem

przyjmując

hipotezę

H 0

możemy

zakwalifikować około 20% samochodów mających

zużycie 9 l/100km jako samochody o zużyciu

10 l/100km.

Interpretacja powyższych wyników na wykresie

gęstości rozkładów N(9, 2/5) i N(10, 2/5).

9,44

0,2

0,05

Uwaga.

Z powyższego wykresu widać, że

• gdy n rośnie (wykresy są bardziej smukłe) to

maleje p-stwo popełnienia błędu II rodzaju – dla

danego zbioru krytycznego,

• gdy maleje p-stwo popełnienia błędu I rodzaju to

rośnie p-stwo popełnienia błędu II rodzaju

Moc testu

Niech H (θ = θ ), H (θ = θ ),

K = zbiór krytyczny,

określamy moc testu w punkcie θ = θ ′ jako

M (θ )

′ = P( U ∈ K θ = θ )′

Jest to prawdopodobieństwo odrzucenia hipotezy H , 0

gdy θ = θ ′

Uwaga

M θ

(

)

= α

M θ

( )

= 1− β

(im większa moc testu tym mniejsze

prawdopodobieństwo popełnienia błędu II rodzaju)

Uwaga

Test dla weryfikacji hipotez H (θ = θ ), H (θ = θ ), 0

jest nazywany testem najmocniejszym, jeśli jego moc dla θ ′= θ1 jest największa w porównaniu z innymi testami (poziom istotności ten sam).

Dla testu najmocniejszego prawdopodobieństwo

popełnienia błędu II rodzaju jest najmniejsze.

Przykład

Wyznaczymy funkcję mocy testu z poprzedniego

przykładu.

Rozpatrzmy hipotezy H ( m = 10), H ( m = 9) 0

α = 0,05,

zbiór krytyczny K = (– ∞; – 1, 64>.

 X −10



M ( m′) = P

25 < − ,

1 64 m = m′ =





= P( X <

9 44 m = m′)

 3

9 44 − ′ 

= Φ

5





Wartości funkcji zestawiamy w tabeli:

9 ,344 − m ′

M( m' )

8,0

3,36

0,9996

8,5

2,11

0,9800

9,0

0,86

0,8050

9,5

– 0,39

0,3480

10,0

– 1,64

0,0500

Wykres funkcji M ( m )′

Przykład

Dwie brygady produkują detale. Z partii detali

wyprodukowanych przez I brygadę wylosowano 1000

szt. i wśród nich było 20 braków. Z partii detali

wyprodukowanych przez II brygadę wylosowano 900 szt.

i wśród nich było 30 braków. Na poziomie istotności

α = 0,01 sprawdzić hipotezę, że odsetek braków w I

brygadzie jest niż niższy niż w II brygadzie.

Rozwiązanie.

Zastosujemy test 26.

H ( p = p ), H ( p < p ) , α = 0,01

Zbiór krytyczny

K = (– ∞; – 2,33>

Obliczamy:

w = 20 /1000 w = 30 /

;

900

w = 50 /1900

Wartość statystyki

u = − 8

1 1

interpretacja graficzna:

0,01

--2,33

-1,81

Ponieważ u ∉ K to nie ma podstaw do odrzucenia hipotezy H . Oznacza to,

że w granicach błędu

statystycznego obie brygady mają ten sam odsetek

braków.

Wyznaczymy krytyczny poziom istotności αˆ .

Φ 8

(

)

1 = 1 − αˆ ≅ 0,96485

stąd αˆ ≅ 0,035. Zatem dla α > 0,035 podjęlibyśmy inną decyzję.

Przykład.

Dokładność pracy obrabiarki sprawdza się wyznaczając odchylenie standardowe średnicy toczonego detalu,

powinno ono wynosić σ = ,

0 2

. Zmierzono średnice

(mm) 11 losowo wybranych detali i otrzymano:

100,6; 99,6; 100,0; 100,1; 100,3; 100,0; 99,9; 100,2; 100,4; 100,6; 100,5.

Zakładając, że średnice detali mają rozkład normalny, sprawdzić na podstawie powyższych danych, że

obrabiarka ma pożądaną dokładność. Przyjąć poziom

istotności 0,05.

Rozwiązanie.

Zastosujemy test 25.

H (σ = ,

0 )

2 , H (σ > ,

0 2)

α = 0,05

Zbiór krytyczny

K = <18,307; ∞)

Obliczamy:

= 10 ,

0 2

s = ,

091

Wartość statystyki

11⋅ ,

0 091

u =

= 25

0 04

interpretacja graficzna:

0,05

18,307

Ponieważ u ∈ K to hipotezę H 0 odrzucamy. Zatem należy sądzić, że obrabiarka ma gorszą dokładność niż pożądana.

Wyznaczymy krytyczny poziom istotności αˆ .

Y (2 )

5 =

αˆ ≅ 0,005

Zatem dla α < 0,005 podjęlibyśmy inną decyzję.