background image

Testowanie hipotez

hipotezy nieparametryczne

Katedra Metod Ilo

ściowych

Testowanie hipotez

Testowanie

hipotez statystycznych, obejmuje zasady

i metody 

sprawdzania

określonych przypuszczeń

(założeń), odnośnie parametrów lub postaci
rozkładu cech statystycznych populacji generalnej
na podstawie wyników z próby. 

Podstawowe pojęcia



Hipoteza statystyczna 

– każdy sąd dotyczący nieznanego 

rozkładu badanej cechy w populacji. Przypuszczenie to 
może dotyczyć postaci rozkładu lub jego parametrów. 



Hipotezy parametryczne – dotyczą sądów o wartościach 
parametrów rozkładu 



Hipotezy nieparametryczne – dotyczą innych przypuszczeń niż 
wartości parametrów w szczególności dotyczą postaci rozkładu 



Test statystyczny to procedura, która na podstawie próby 
losowej pozwala na przyjęcie lub odrzucenie hipotezy 

background image

E

ta

py

 t

es

tow

ani

hi

pot

ez

 

podjęcie  decyzji  i sformułowanie  odpowiedzi 

porównanie wartości statystyki testowej z wartością 

krytyczną 

odczytanie  wartości krytycznej  z odpowiednich  tablic 

statystycznych 

t

α

obliczenie  wartości statystyki testowej

t

wybranie  odpowiedniej  statystyki testowej 

T

sformułowanie  hipotez i określenie  poziomu istotności 

H

0

i H

1

α

Związek dwóch cech jakościowych

W celu stwierdzenia, czy podawanie chorym na pewną chorobę nowego leku 
przynosi poprawę w ich stanie zdrowia, wylosowano dwie grupy pacjentów w 
jednakowym stopniu chorych na tę chorobę. Jednej grupie o liczebności 120 
podawano nowy lek, a druga grupa o liczebności 80 pacjentów otrzymywała 
tradycyjne leki. Wyniki zestawiono w tablicy. Należy sprawdzić czy występuje 

zależność 

stanu zdrowia pacjentów od typu stosowanego leku.

leczeni

stan zdrowia

bez poprawy

wyraźna 
poprawa

całkowite 

wyzdrowienie

badanym 

lekiem

20

40

60

tradycyjnie

45

20

15

Test niezależności 

χ

2 (

chi-kwadrat) stosowany jest w przypadku 

badania niezależności cech jakościowych lub w przypadku 
badania niezależności cechy jakościowej z ilościową. 

Test niezależności  

χ

2 Pearsona

Tablica niezależności jest podstawą weryfikacji hipotezy 
głoszącej, że w populacji nie ma zależności między cechami 
(zmiennymi) X i Y. 

H

0

: cechy X i Y są niezależne

H

1

: cechy X i Y są zależne,

przy przyjętym poziomie istotności 

α

αα

α

.

background image

(

)

χ

2

2

1

1

=

=

=

n

np

np

ij

ij

ij

j

s

i

r

oraz

r

- liczba w wierszy w tablicy

s

- liczba kolumn w tablicy 

n

n

n

np

j

i

ij

=

gdzie

χ

2

11

22

12

21

2

1

2

1

2

=

• •

n

n

n

n

n

n

n

n

n

(

)

Dla tablicy czteropolowej

Test niezależności  

χ

2 Pearsona

Statystyka testowa ma postać:

Test niezależności  

χ

2 Pearsona

Z tablic rozkładu 

χχχχ

2

odczytuje się wartość statystyki 

χχχχ

2

przy 

poziomie istotności 

α

i przy (r-1)(s-1) stopniach swobody, 

czyli: 

2

)

1

-

)(

1

-

(

;

s

r

α

χ

Jeżeli 

χ

2

≥ χ

2

α

H

0

odrzucamy na rzecz hipotezy alternatywnej

Jeżeli 

χ

2

χ

2

α

nie ma podstaw do odrzucenia H

0

niezależności cech

Test niezależności  

χ

2 Pearsona

Wartości 

χ

2

zależą od:



natężenia

(siły) 

związku

badanych cech – im większe 

różnice między liczebnością empiryczną a teoretyczną, tym 
większa wartość 

χχχχ

2

i tym samym większa zależność między 

cechami,



od 

wielkości próby

, przy czym 

χχχχ

2

liczymy tylko dla dużych 

prób,



od 

stopnia szczegółowości danych, 

przy czym w każdym 

polu tabeli powinno być co najmniej 5 obserwacji.

Statystyka

χχχχ

2

przyjmuje zawsze wartości większe (równe) od zera

0 ≤ 

χχχχ

2

 N(r-1)(s-1)

background image

Fragment 
tablicy 
rozkładu 

χχχχ

2

Związek dwóch cech jakościowych

leczeni

stan zdrowia

bez

poprawy

wyraźna 

poprawa

całkowite

wyzdrowienie

badanym

lekiem

20

40

60

120

36

45

tradycyjnie

45

20

15

80

26

24

30

65

60

75

200

n

j

np

ij

=

39

n

i

n

n

n

np

j

i

ij

=

H

0

: stan zdrowia nie zależy od formy leczenia

H

1

: stan zdrowia zależy od formy leczenia

na poziomie istotności 

α

= 0,05.

Związek dwóch cech jakościowych

20

39

361

9,26

40

36

16

0,44

60

45

225

5,00

45

26

361

13,88

20

24

16

0,67

15

30

225

7,50

200

200

-

36,75

n

ij

np

ij

(

) /

n

np

np

ij

ij

ij

2

(

)

n

np

ij

ij

2

χχχχ

2

= 36,75

Wartość odczytana z tablic 

χχχχ

2

dla α = 0,05 i υ = 2 

wynosi 

χχχχ

2

α

= 5,991

background image

Związek dwóch cech jakościowych

Wysunięto hipotezę, że występuje zależność między paleniem 
papierosów a występowaniem niewydolności górnych dróg 
oddechowych. Wylosowano do próby 340 pacjentów palących 
oraz 36 niepalących a uzyskane wyniki zamieszczono w tablicy:

niewydolność 
górnych dróg 
oddechowych

palenie  tytoniu

tak

nie

występuje

203

14

217

nie występuje

137

22

159

340

36

376

n

i

n

j

χ

2

11

22

12

21

2

1

2

1

2

=

• •

n

n

n

n

n

n

n

n

n

(

)

78

,

5

=

159

217

36

340

)

4

1

37

1

-

2

2

203

(

376

=

2

2

χ

Dla tablicy czteropolowej

Wartość odczytana z tablic 

χχχχ

2

dla α = 0,05 i υ = 1 

wynosi 

χχχχ

2

α

= 3,841

Badanie rynku

Agencja badań rynkowych ABR otrzymała od biura usług turystycznych 
„BIUTUR” zlecenie, którego celem było zidentyfikowanie zmian w 
preferencjach i gustach potencjalnych i obecnych klientów firmy. 

Firma „BIUTUR” w warunkach rosnącej konkurencji musi dokładniej poznać 
potrzeby i wymagania  indywidualnych klientów oraz ich grup, a także zwrócić 
większą uwagę na własne oferty wakacyjne i akcje promocyjne oraz oferty 
konkurencji.

W początkowej fazie „BIUTUR” pragnie skupić się na indywidualnych 
turystach i ich rodzinach. 

Agencja ABR miała zbadać na podstawie badań ankietowych potrzeby i 
wymagania obecnych i potencjalnych klientów. 

background image

Badanie rynku

Głównym celem badań było określenie dotychczasowej aktywności turystycznej 
mieszkańców miasta M, w którym działa biuro „BIUTUR”, oraz określenie ich 
popytu na produkty firmy „BIUTUR” a także czynników go kształtujących. 

Jednym z celów badania było określenie jakimi kryteriami kierują się przy 
wyborze formy i miejsca wypoczynku  respondenci.

Badaną zbiorowością byli mieszkańcy miasta M, z których wylosowano 
reprezentatywną próbę, liczącą 2361 osób. 

Badanie przeprowadzono w 2001 roku.

Pierwszy 
fragment 
ankiety

Ciąg dalszy 
ankiety

background image

Ciąg dalszy 
ankiety

Ciąg dalszy 
ankiety

Dziękuję za uwagę