STATYSTYKA MATEMATYCZNA

WYKŁAD 4

WERYFIKACJA HIPOTEZ

PARAMETRYCZNYCH

X - cecha populacji, θ – parametr rozkładu cechy X.

1

Wysuwamy hipotezy:

zerową (podstawową)

H (θ = θ )

0

0

i alternatywną H 1 , która ma jedną z następujących postaci H (θ >θ ) H (θ < θ

H (θ ≠ θ )

1

0

,

)

1

0

,

1

0

2

Postępowanie przy weryfikacji powyższych hipotez jest

następujące

1. Wybieramy pewną statystykę U n o rozkładzie zależnym od parametru θ oraz pewną liczbę α z przedziału (0 , 1)

i wyznaczamy podzbiór K zbioru liczb rzeczywistych tak by spełniony był warunek

P( U n ∈ K |θ = θ )

0

= α

czyli aby prawdopodobieństwo, iż statystyka U n przyjmie wartość ze zbioru K, przy założeniu, że prawdziwa jest hipoteza zerowa było równe α.

3

2. Pobieramy próbę i obliczamy wartość u

U

n statystyki

n

3. Podejmujemy decyzje

u ∈ K

gdy

n

odrzucamy H 0 ,

u ∉ K

gdy

n

przyjmujemy H 0 (nie ma podstaw do

odrzucenia H 0 ).

4

Uzasadnienie:

Hipotezę H

∈

0 odrzucamy gdy

u

K

n

bowiem

prawdopodobieństwo zajścia zdarzenia U ∈ K

n

jest

bardzo małe przy założeniu, że prawdziwa jest

hipoteza H 0 i skoro takie zdarzenie dla pobranej próby

zaszło,

należy

sądzić,

że

założenie

o prawdziwości hipotezy

H 0 było niesłusznie

przyjęte.

5

Terminologia.

U n - sprawdzian, (statystyka testowa)

K – zbiór krytyczny (zbiór odrzuceń),

α - poziom istotności (typowe wartości α : 0,1; 0,05; 0,01).

αˆ - krytyczny poziom istotności (poziom istotności przy którym następuje zmiana decyzji).

6

Błędy decyzji w teście sprawdzającym hipotezę H 0 .

Decyzja

Przyjmujemy H

H

0

Odrzucamy

0

H - prawdziwa Decyzja wła

0

ściwa

Błąd I rodzaju

H - fałszywa

0

Błąd II rodzaju

Decyzja właściwa

Prawdopodobieństwo popełnienia błędu I rodzaju wynosi:

P( U n ∈ K | H )

0

= α

Prawdopodobieństwo popełnienia błędu II rodzaju wynosi:

P( U n ∉ K | H )

1

= β

7

Testy do weryfikacji hipotez o wartości oczekiwanej I. Cecha X populacji ma rozkład normalny N(m , σ), σ jest znane Hipoteza zerowa H ( m = m ) 0

0

H1

U

Nr

n

Zbiór kryt. K

Wyznaczanie

liczby k

testu

H ( m > m )

<

Φ( k ) = 1−α

1

0

k ; ∞)

1

H ( m < m )

Φ( k) = 1−α

1

0

X − m

(−∞ ; − k >

0

2

H ( m ≠ m )

−∞ − k > <

∪ k ∞

α

1

0

σ / n ( ;

; )

Φ ( k ) = 1 −

3

2

II. Cecha X populacji ma rozkład normalny N(m , σ), σ nie jest znane. Hipoteza zerowa H ( m = m ) 0

0

H

Nr

1

Zbiór kryt . K

Wyznaczanie

U n

liczby k

tes

tu

H ( m > m )

< k ; ∞

P(| T

|

n−

≥ k) =

1

α

2

1

0

)

4

H ( m < m ) X

(−∞ ; − k >

P(| T

|

n−

≥ k) =

1

α

2

1

0

− m 0

5

H ( m ≠ m ) S / n −1 (−∞; − k >∪< k ; ∞

P(| Tn− |

k

1

≥ ) =

1

0

)

α

6

III. Cecha X populacji ma dowolny rozkład, próba jest liczna n > 120. Hipoteza zerowa H ( m = m ) 0

0

H1

U

Nr

n

Zbiór kryt. K

Wyznaczanie

liczby k

test

u

H ( m > m )

< k ; ∞

Φ( k ) = 1−

1

0

X − m

)

α

7

0

H ( m < m )

(−∞ ; − k >

Φ( k) = 1−

1

0

α

S / n

8

H ( m ≠ m )

−∞ − k > <

∪ k ∞

α

1

0

(

;

; )

Φ ( k ) = 1 −

9

2

8

Test do weryfikacji hipotezy o prawdopodobieństwie sukcesu

Cecha X populacji ma rozkład zerojedynkowy

P( X = )

1 = p, P( X = )

0 = 1− p,

p ∈ (0 ;1)

Hipoteza zerowa H ( p = p )

0

0

Próba liczna n>100

H

Nr

1

U n

Zbiór kryt. K

Wyznaczanie

liczby k

testu

H ( p > p )

W − p

< k ; ∞

Φ( k ) = 1−

1

0

0

10

n

)

α

p 1

(

H ( p < p )

− p )

(−∞ ; −

0

0

k >

Φ( k) =1−α

1

0

11

H ( p ≠ p ) W – średnia

(−∞ ; − k > ∪ < k ; ∞

α

1

0

)

Φ( k) = 1−

12

częstość sukcesu

2

k

W =

n

9

Test do weryfikacji hipotez o odchyleniu

standardowym

Cecha X populacji ma rozkład normalny N(m , σ).

Hipoteza zerowa H (σ = σ )

0

0

H1

U

Nr

n

Zbiór kryt . K

Wyznaczanie liczb

k i l

testu

H (σ > σ )

1

0

< k ; ∞)

P( Yn−

k

1 ≥

) = α 13

2

H (σ < σ )

(0 ; k >

P( Yn−

k

1 ≥

) = 1 −

1

0

nS

α 14

2

H (σ ≠ σ )

(0 ; k > ∪ < l ; ∞)

P( Y

n−

≥ l) = α / 2

1

0

σ

0

1

15

P( Y

n−

≥ k) = 1−α / 2

1

Uwaga: dla n>30 można stosować statystykę

2

=

nS

U

2

−

(

2 n − )

1 −1

2

σ

0

o rozkładzie N(0,1).

10

Testy do porównywania wartości oczekiwanych Badane są dwie cechy X i Y różnych populacji.

Zakładamy, że cechy te są zmiennymi losowymi

niezależnymi. Z populacji, w której badana jest

cecha X pobrano próbę n 1 elementową, natomiast z drugiej populacji pobrano próbę n 2 elementową.

1. Cechy X i Y mają rozkłady normalne N m σ

N m σ

odpowiednio

(

,

),

(

,

)

1

1

2

2

,

przy

czym odchylenia standardowe σ

σ

1 i

2 są znane.

=

Hipoteza zerowa H ( m

m )

0

1

2

H

Nr

1

U

Zbiór kryt. K

Wyznaczanie

1

n n 2

liczby k

testu

H ( m > m )

Φ( k ) = 1−

1

1

2

X − Y

< k ; ∞ )

α 16

H ( m < m )

(−∞ ; − k >

Φ( k) = 1−α

1

1

2

2

2

σ

σ

17

1

2

H ( m ≠ m )

+

(−∞ ; − k > ∪ < k ; )

∞

α

1

1

2

n

n

Φ( k) = 1−

18

1

2

2

11

2. Cechy X i Y mają rozkłady normalne odpowiednio N ( m ,σ ), N ( m ,σ )

1

2

, przy czym odchylenia standardowe obu cech

są sobie równe i nie są znane. Hipoteza zerowa H ( m = m ) 0

1

2

H

Wyznaczanie

Nr

1

U

Zbiór kryt.

1

n n 2

K

liczby k

testu

(

P | T

|

n + n −

≥ )

k =

2

α

H ( m > m )

X − Y

2

1

1

2

< k ; ∞ )

1

2

19

2

2

n S + n S

n + n

1 1

2

2

1

2

H ( m < m )

(−∞ ; − k >

(

P | T

|

n + n −

≥ )

k =

2

α

2

1

1

2

⋅

20

n + n − 2

n n

1

2

1

2

1 2

H ( m ≠ m )

(−∞ ; − k > ∪

(

P | T

k

21

1

n + 2

n − |

2

≥ ) α

=

1

1

2

∪ <

k ; ∞)

2

2

n S

+ n S

n + n

2

1

1

2

2

1

2

Wielko

=

⋅

ść S p

n + n − 2

n n

nazywamy

1

2

1

2

wariancją połączonych populacji.

3. Cechy X i Y mają rozkłady dowolne o wartościach oczekiwanych m , m

1

2 , przy czym próby są liczne,

n

n

H ( m = m

1 ,

2 > 120.

)

0

1

2

H

Nr

1

U

Zbiór kryt. K

Wyznaczanie

1

n n 2

liczby k

testu

H ( m > m )

−

< k ; ∞

Φ( k ) = 1−

1

1

2

X

Y

)

α

22

2

2

S

S

1

2

+

H ( m < m )

(−∞ ; − k >

Φ( k) =1−α

1

1

2

n

n

1

2

23

H ( m ≠ m )

(−∞ ; − k > ∪ < k ; ∞)

α

1

1

2

Φ( k) = 1−

24

2

12

Test do porównywania prawdopodobieństw sukcesu.

Badane są dwie cechy X i Y różnych populacji o rozkładach zerojedynkowych,

P( X = )

1 = p ,

P( X = )

0 = 1 − p ,

1

1

P( Y = )

1 = p , P( Y = )

0 =1 − p ,

2

2

Z populacji, której badana jest cecha X pobrano próbę n 1 elementową, natomiast z drugiej populacji pobrano próbę n 2 elementową. Obie próby są liczne n

n

1 ,

2 >100.

Hipoteza zerowa: H ( p = p )

0

1

2

H

Nr

1

U

Zbiór kryt. K

Wyznaczanie

liczby k

testu

1

n n 2

H ( p > p )

< k ; ∞

Φ( k ) = 1−

1

1

2

W W

−

)

α

25

1

2

H ( p < p )

(−∞ ; − k >

Φ( k) = 1−α

1

1

2

n n

+

26

1

2

W 1

( − )

W ⋅

H ( p ≠ p )

(−∞ ; − k > ∪ < k ; ∞)

α

1

1

2

n n

Φ( k) = 1−

27

1 2

2

W , W

1

2 średnie częstości sukcesów w poszczególnych

próbach,

W = k / n , W = k / n , 1

1

1

2

2

2

=

+

+

W

( k

k ) /( n

n )

1

2

1

2

- średnia częstość

sukcesu w połączonych próbach,

n

n

1

1

W =

⋅ W +

⋅ W

1

2

n + n

n + n

1

2

1

2

13

Test do weryfikacji hipotez o porównywaniu wariancji

Cechy X i Y mają rozkłady normalne odpowiednio N ( m ,σ ), N( m ,σ )

1

1

2

2

.

Z populacji, w której badana jest cecha X pobrano próbę n 1 elementową, natomiast z drugiej populacji pobrano próbę n 2 elementową.

2

2

ˆ

ˆ

Tak dobieramy oznaczenia populacji aby S

≥ S

1

n

n 2

2

Hipoteza zerowa H (

2

σ = σ )

0

1

2

H

Wyznaczanie liczby k Nr

1

U

Zbiór kryt .

testu

1

n n 2

K

P( F

k

n

n

28

1 − ;

1 2 −1 ≥

) = α

2

ˆ

H ( 2

2

σ > σ )

S

< k ; ∞)

(F - rozkład

1

1

2

n

1

Snedecora)

2

ˆ

Sn

2

14

Przykłady

Przykład.

Według

danych

producenta,

określony

typ

samochodu zużywał 10 l/100km. Po dokonaniu

pewnych usprawnień w tym typie samochodu

oczekuje się, że zużycie paliwa spadnie. Aby to

sprawdzić dokonano pomiaru zużycia paliwa w 25

losowo wybranych samochodach tego typu po

modernizacji i otrzymano wynik x = 3

,

9

25

l/100km.

Zakładając, że zużycie paliwa ma rozkład normalny

N(m, 2) sprawdzić czy modernizacja istotnie

zmniejszyła zużycie paliwa.

Przyjąć α = 0,05.

15

Rozwiązanie.

Zastosujemy test 2.

H ( m = 10), H ( m < 1 ) 0

0

1

, α = 0,05

zatem

Φ( k ) = 1−α = 0,95 stąd k = 1,64

Zbiór krytyczny

K = (-∞; - 1,64>

Wartość statystyki

3

,

9 − 10

u =

25 = − ,

1 75

2

interpretacja graficzna:

0,05

-1,75

--1,64

0

Ponieważ u ∈ K to hipotezę H odrzucamy. Zatem 0

zmiany konstrukcyjne istotnie zmniejszyły zużycie

paliwa.

16

Obliczymy dla jakich wartości średniej z próby

25 - elementowej decyzja byłaby taka sama:

x −10 25 < − ,164 ⇒ x < 3,

9 4

2

Zatem dla x < 3

,

9 4 wartość U należy do zbioru

krytycznego.

17

Wyznaczymy krytyczny poziom istotności αˆ .

Φ ,

1

( 75) = 1 − αˆ ≅ 0,96

stąd αˆ ≅ 0,04.

Zatem dla α < 0,04 podjęlibyśmy inną decyzję.

Zauważmy, że odrzucając hipotezę H 0 narażamy się na

popełnienie

błędu

I

rodzaju

(prawdopodobieństwo jego popełnienia wynosi

0,05).

18

Przykład.

Dla sytuacji z poprzedniego przykładu niech

x

= ,

9 44

25

.

Rozpatrzmy hipotezy

H ( m = 1 )

0 , H ( m = )

9

0

1

,

Zastosujemy test 2.

19

Zbiór krytyczny jak poprzednio

K = (-∞; - 1,64>

Wartość statystyki

,

9 44 − 10

u =

25 = − ,

1 4

2

interpretacja graficzna:

0,05

-1,4

0

-1,64

Ponieważ u ∉ K to nie ma podstaw do odrzucenia hipotezy H . Przyjmując hipotezę H narażamy się 0

0

na popełnienie błędu II rodzaju.

Wyznaczymy krytyczny poziom istotności αˆ .

Φ ,

1

(

)

4 = 1 − αˆ ≅ 0,92

stąd αˆ ≅ 0,08. Zatem dla α > 0,08 podjęlibyśmy

inną decyzję.

20

Obliczymy prawdopodobieństwo popełnienia błędu

II rodzaju.

 X 1

− 0



β = (

P U ∉ K m = )

9 = P

5 > − 6

,

1 4 m = 9



 =



2



= (

P X > 3

,

9 44 m = )

9 =

 X −9

3

,

9 44−9 

P

5 >

5



 =1−Φ 8

,

0

(

)

6 ≈ 2

,

0

 2

2



Zatem

przyjmując

hipotezę

H 0

możemy

zakwalifikować około 20% samochodów mających

zużycie 9 l/100km jako samochody o zużyciu

10 l/100km.

21

Interpretacja powyższych wyników na wykresie

gęstości rozkładów N(9, 2/5) i N(10, 2/5).

10

9

9,44

0,2

0,05

Uwaga.

Z powyższego wykresu widać, że

• gdy n rośnie (wykresy są bardziej smukłe) to

maleje p-stwo popełnienia błędu II rodzaju – dla

danego zbioru krytycznego,

• gdy maleje p-stwo popełnienia błędu I rodzaju to

rośnie p-stwo popełnienia błędu II rodzaju

22

Moc testu

Niech H (θ = θ ), H (θ = θ ),

0

0

1

1

K = zbiór krytyczny,

określamy moc testu w punkcie θ = θ ′ jako

M (θ )

′ = P( U ∈ K θ = θ )′

Jest to prawdopodobieństwo odrzucenia hipotezy H , 0

gdy θ = θ ′

Uwaga

M θ

(

)

0

= α

M θ

( )

1

= 1− β

(im większa moc testu tym mniejsze

prawdopodobieństwo popełnienia błędu II rodzaju)

23

Uwaga

Test dla weryfikacji hipotez H (θ = θ ), H (θ = θ ), 0

0

1

1

jest nazywany testem najmocniejszym, jeśli jego moc dla θ ′= θ1 jest największa w porównaniu z innymi testami (poziom istotności ten sam).

Dla testu najmocniejszego prawdopodobieństwo

popełnienia błędu II rodzaju jest najmniejsze.

24

Przykład

Wyznaczymy funkcję mocy testu z poprzedniego

przykładu.

Rozpatrzmy hipotezy H ( m = 10), H ( m = 9) 0

1

,

α = 0,05,

zbiór krytyczny K = (– ∞; – 1, 64>.

25

 X −10



M ( m′) = P

25 < − ,

1 64 m = m′ =



2



= P( X <

m

3

,

9 44 m = m′)

 3

,

9 44 − ′ 

= Φ

5



2



26

Wartości funkcji zestawiamy w tabeli:

9 ,344 − m ′

m'

5

M( m' )

2

8,0

3,36

0,9996

8,5

2,11

0,9800

9,0

0,86

0,8050

9,5

– 0,39

0,3480

10,0

– 1,64

0,0500

Wykres funkcji M ( m )′

27

Przykład

Dwie brygady produkują detale. Z partii detali

wyprodukowanych przez I brygadę wylosowano 1000

szt. i wśród nich było 20 braków. Z partii detali

wyprodukowanych przez II brygadę wylosowano 900 szt.

i wśród nich było 30 braków. Na poziomie istotności

α = 0,01 sprawdzić hipotezę, że odsetek braków w I

brygadzie jest niż niższy niż w II brygadzie.

28

Rozwiązanie.

Zastosujemy test 26.

H ( p = p ), H ( p < p ) , α = 0,01

0

1

2

1

1

2

Zbiór krytyczny

K = (– ∞; – 2,33>

Obliczamy:

w = 20 /1000 w = 30 /

1

;

900

2

w = 50 /1900

Wartość statystyki

u = − 8

,

1 1

29

interpretacja graficzna:

0,01

--2,33

-1,81

0

Ponieważ u ∉ K to nie ma podstaw do odrzucenia hipotezy H . Oznacza to,

0

że w granicach błędu

statystycznego obie brygady mają ten sam odsetek

braków.

30

Wyznaczymy krytyczny poziom istotności αˆ .

Φ 8

,

1

(

)

1 = 1 − αˆ ≅ 0,96485

stąd αˆ ≅ 0,035. Zatem dla α > 0,035 podjęlibyśmy inną decyzję.

31

Przykład.

Dokładność pracy obrabiarki sprawdza się wyznaczając odchylenie standardowe średnicy toczonego detalu,

powinno ono wynosić σ = ,

0 2

0

. Zmierzono średnice

(mm) 11 losowo wybranych detali i otrzymano:

100,6; 99,6; 100,0; 100,1; 100,3; 100,0; 99,9; 100,2; 100,4; 100,6; 100,5.

Zakładając, że średnice detali mają rozkład normalny, sprawdzić na podstawie powyższych danych, że

obrabiarka ma pożądaną dokładność. Przyjąć poziom

istotności 0,05.

32

Rozwiązanie.

Zastosujemy test 25.

H (σ = ,

0 )

2 , H (σ > ,

0 2)

0

1

,

α = 0,05

Zbiór krytyczny

K = <18,307; ∞)

Obliczamy:

2

x

= 10 ,

0 2

s = ,

0

11

091

11

Wartość statystyki

11⋅ ,

0 091

u =

= 25

,

0 04

interpretacja graficzna:

0,05

18,307

25

Ponieważ u ∈ K to hipotezę H 0 odrzucamy. Zatem należy sądzić, że obrabiarka ma gorszą dokładność niż pożądana.

Wyznaczymy krytyczny poziom istotności αˆ .

Y (2 )

5 =

10

αˆ ≅ 0,005

Zatem dla α < 0,005 podjęlibyśmy inną decyzję.

33