Testowanie hipotez
hipotezy nieparametryczne
Katedra Metod Ilo
ściowych
Testowanie hipotez
Testowanie
hipotez statystycznych, obejmuje zasady
i metody
sprawdzania
określonych przypuszczeń
(założeń), odnośnie parametrów lub postaci
rozkładu cech statystycznych populacji generalnej
na podstawie wyników z próby.
Podstawowe pojęcia
Hipoteza statystyczna
– każdy sąd dotyczący nieznanego
rozkładu badanej cechy w populacji. Przypuszczenie to
może dotyczyć postaci rozkładu lub jego parametrów.
Hipotezy parametryczne – dotyczą sądów o wartościach
parametrów rozkładu
Hipotezy nieparametryczne – dotyczą innych przypuszczeń niż
wartości parametrów w szczególności dotyczą postaci rozkładu
Test statystyczny to procedura, która na podstawie próby
losowej pozwala na przyjęcie lub odrzucenie hipotezy
E
ta
py
t
es
tow
ani
a
hi
pot
ez
podjęcie decyzji i sformułowanie odpowiedzi
porównanie wartości statystyki testowej z wartością
krytyczną
odczytanie wartości krytycznej z odpowiednich tablic
statystycznych
t
α
obliczenie wartości statystyki testowej
t
wybranie odpowiedniej statystyki testowej
T
sformułowanie hipotez i określenie poziomu istotności
H
0
i H
1
α
Związek dwóch cech jakościowych
W celu stwierdzenia, czy podawanie chorym na pewną chorobę nowego leku
przynosi poprawę w ich stanie zdrowia, wylosowano dwie grupy pacjentów w
jednakowym stopniu chorych na tę chorobę. Jednej grupie o liczebności 120
podawano nowy lek, a druga grupa o liczebności 80 pacjentów otrzymywała
tradycyjne leki. Wyniki zestawiono w tablicy. Należy sprawdzić czy występuje
zależność
stanu zdrowia pacjentów od typu stosowanego leku.
leczeni
stan zdrowia
bez poprawy
wyraźna
poprawa
całkowite
wyzdrowienie
badanym
lekiem
20
40
60
tradycyjnie
45
20
15
Test niezależności
χ
2 (
chi-kwadrat) stosowany jest w przypadku
badania niezależności cech jakościowych lub w przypadku
badania niezależności cechy jakościowej z ilościową.
Test niezależności
χ
2 Pearsona
Tablica niezależności jest podstawą weryfikacji hipotezy
głoszącej, że w populacji nie ma zależności między cechami
(zmiennymi) X i Y.
H
0
: cechy X i Y są niezależne
H
1
: cechy X i Y są zależne,
przy przyjętym poziomie istotności
α
αα
α
.
(
)
χ
2
2
1
1
=
−
=
=
∑
∑
n
np
np
ij
ij
ij
j
s
i
r
oraz
r
- liczba w wierszy w tablicy
s
- liczba kolumn w tablicy
n
n
n
np
j
i
ij
•
•
⋅
=
gdzie
χ
2
11
22
12
21
2
1
2
1
2
=
⋅
−
⋅
⋅
⋅
⋅
•
• •
•
n
n
n
n
n
n
n
n
n
(
)
Dla tablicy czteropolowej
Test niezależności
χ
2 Pearsona
Statystyka testowa ma postać:
Test niezależności
χ
2 Pearsona
Z tablic rozkładu
χχχχ
2
odczytuje się wartość statystyki
χχχχ
2
przy
poziomie istotności
α
i przy (r-1)(s-1) stopniach swobody,
czyli:
2
)
1
-
)(
1
-
(
;
s
r
α
χ
Jeżeli
χ
2
≥ χ
2
α
→
H
0
odrzucamy na rzecz hipotezy alternatywnej
Jeżeli
χ
2
<
χ
2
α
→
nie ma podstaw do odrzucenia H
0
o
niezależności cech
Test niezależności
χ
2 Pearsona
Wartości
χ
2
zależą od:
natężenia
(siły)
związku
badanych cech – im większe
różnice między liczebnością empiryczną a teoretyczną, tym
większa wartość
χχχχ
2
i tym samym większa zależność między
cechami,
od
wielkości próby
, przy czym
χχχχ
2
liczymy tylko dla dużych
prób,
od
stopnia szczegółowości danych,
przy czym w każdym
polu tabeli powinno być co najmniej 5 obserwacji.
Statystyka
χχχχ
2
przyjmuje zawsze wartości większe (równe) od zera
0 ≤
χχχχ
2
≤
N(r-1)(s-1)
Fragment
tablicy
rozkładu
χχχχ
2
Związek dwóch cech jakościowych
leczeni
stan zdrowia
bez
poprawy
wyraźna
poprawa
całkowite
wyzdrowienie
badanym
lekiem
20
40
60
120
36
45
tradycyjnie
45
20
15
80
26
24
30
65
60
75
200
n
j
•
np
ij
=
39
n
i
•
n
n
n
np
j
i
ij
•
•
⋅
=
H
0
: stan zdrowia nie zależy od formy leczenia
H
1
: stan zdrowia zależy od formy leczenia
na poziomie istotności
α
= 0,05.
Związek dwóch cech jakościowych
20
39
361
9,26
40
36
16
0,44
60
45
225
5,00
45
26
361
13,88
20
24
16
0,67
15
30
225
7,50
200
200
-
36,75
n
ij
np
ij
(
) /
n
np
np
ij
ij
ij
−
2
(
)
n
np
ij
ij
−
2
χχχχ
2
= 36,75
Wartość odczytana z tablic
χχχχ
2
dla α = 0,05 i υ = 2
wynosi
χχχχ
2
α
= 5,991
Związek dwóch cech jakościowych
Wysunięto hipotezę, że występuje zależność między paleniem
papierosów a występowaniem niewydolności górnych dróg
oddechowych. Wylosowano do próby 340 pacjentów palących
oraz 36 niepalących a uzyskane wyniki zamieszczono w tablicy:
niewydolność
górnych dróg
oddechowych
palenie tytoniu
tak
nie
występuje
203
14
217
nie występuje
137
22
159
340
36
376
n
i
•
n
j
•
χ
2
11
22
12
21
2
1
2
1
2
=
⋅
−
⋅
⋅
⋅
⋅
•
• •
•
n
n
n
n
n
n
n
n
n
(
)
78
,
5
=
159
•
217
•
36
•
340
)
4
1
•
37
1
-
2
2
•
203
(
•
376
=
2
2
χ
Dla tablicy czteropolowej
Wartość odczytana z tablic
χχχχ
2
dla α = 0,05 i υ = 1
wynosi
χχχχ
2
α
= 3,841
Badanie rynku
Agencja badań rynkowych ABR otrzymała od biura usług turystycznych
„BIUTUR” zlecenie, którego celem było zidentyfikowanie zmian w
preferencjach i gustach potencjalnych i obecnych klientów firmy.
Firma „BIUTUR” w warunkach rosnącej konkurencji musi dokładniej poznać
potrzeby i wymagania indywidualnych klientów oraz ich grup, a także zwrócić
większą uwagę na własne oferty wakacyjne i akcje promocyjne oraz oferty
konkurencji.
W początkowej fazie „BIUTUR” pragnie skupić się na indywidualnych
turystach i ich rodzinach.
Agencja ABR miała zbadać na podstawie badań ankietowych potrzeby i
wymagania obecnych i potencjalnych klientów.
Badanie rynku
Głównym celem badań było określenie dotychczasowej aktywności turystycznej
mieszkańców miasta M, w którym działa biuro „BIUTUR”, oraz określenie ich
popytu na produkty firmy „BIUTUR” a także czynników go kształtujących.
Jednym z celów badania było określenie jakimi kryteriami kierują się przy
wyborze formy i miejsca wypoczynku respondenci.
Badaną zbiorowością byli mieszkańcy miasta M, z których wylosowano
reprezentatywną próbę, liczącą 2361 osób.
Badanie przeprowadzono w 2001 roku.
Pierwszy
fragment
ankiety
Ciąg dalszy
ankiety
Ciąg dalszy
ankiety
Ciąg dalszy
ankiety
Dziękuję za uwagę