1
Weryfikacja hipotez
statystycznych
2
Etapy
planowania i
opracowania
badań
1.
Sformułowanie
problemu
badawczego
–
postawienie hipotezy merytorycznej
2.
Zebranie materiału badawczego (obserwacja,
eksperyment).
3.
Weryfikacja hipotezy merytorycznej metodami
statystycznymi.
4.
Wyciągnięcie wniosków.
3
Rodzaje hipotez
Hipoteza statystyczna – jest to każde przypuszczenie
dotyczące populacji generalnej bez przeprowadzenia
badania całkowitego. Dotyczyć ona może wartości
parametrów rozkładu (hipoteza parametryczna) lub
postaci
funkcyjnej
rozkładu
populacji
(hipoteza
nieparametryczna).
Przykłady hipotez parametrycznych:
-
Średnia populacji jest równa pewnej określonej wartości.
-
Wariancje dwóch populacji o rozkładach normalnych są
takie same.
Przykłady hipotez nieparametrycznych:
-
Populacja generalna ma rozkład Poissona.
-
Rozkłady w obu populacjach są niezależne
.
Prawdziwość hipotezy statystycznej weryfikujemy na
podstawie próby losowej.
4
Rodzaje hipotez c.d.
We wnioskowaniu statystycznym mamy dwie
hipotezy:
Hipoteza
zerowa
(H
0
)
–
podlega
ona
sprawdzeniu; zakłada np. brak istotnych
statystycznie różnic między parametrami
dwóch populacji lub rozkładem empirycznym
i teoretycznym.
Hipoteza alternatywna (H
1
) – zakłada istnienie
tych różnic.
5
Rodzaje błędów
statystycznych
Hipoteza
zerowa
DECYZJE
Przyjąć H
0
Odrzucić H
0
Hipoteza
zerowa jest
prawdziwa
Decyzja
prawidłowa
Błąd I rodzaju
()
Hipoteza
zerowa jest
fałszywa
Błąd II rodzaju
()
Decyzja
prawidłowa
6
Test statystyczny
Do weryfikacji hipotezy statystycznej
służy test statystyczny, czyli pewna
reguła postępowania, która każdej
możliwej próbie losowej
przyporządkowuje decyzję przyjęcia lub
odrzucenia sprawdzanej hipotezy.
Test statystyczny opiera się na statystyce
testowej (zmiennej losowej), której
rozkład teoretyczny jest znany.
7
Test istotności -
wprowadzenie
Do weryfikacji H
0
najlepszy byłby taki test, który
minimalizowałby zarówno prawdopodobieństwo , jak i
. Jest to jednak niemożliwe, bowiem zmniejszenie
prawdo-podobieństwa powoduje jednoczesny wzrost
prawdo-podobieństwa . Stąd też w teorii weryfikacji
hipotez statystycznych dąży się do pewnego
kompromisu między prawdopodobieństwami i
błędów I i II rodzaju. Jednym ze sposobów uzyskiwania
takiego
kompromisu
jest
budowa
testu
najmocniejszego, dla którego - przy ustalonym z góry
poziomie błędu I rodzaju – prawdopodobieństwo błędu
II rodzaju będzie jak najmniejsze.
Założenie te spełnia test istotności.
8
Testy istotności - definicja
Test, w którym bierzemy pod uwagę jedynie
prawdopodobieństwo błędu I rodzaju nazywamy testem
istotności. W testach istotności w ogóle pomija się
kwestię błędu II rodzaju i prawdopodobieństwa jego
popełnienia. Stąd też w teście istotności nie podejmuje
się wcale decyzji o przyjęciu sprawdzanej hipotezy H
0
,
gdyż wówczas narażamy się na błąd II rodzaju, a
przecież jego prawdopodobieństwo w tym teście nie
jest brane pod uwagę. Test istotności pozwala jedynie na
ewentualne odrzucenie sprawdzanej hipotezy H
0
na
poziomie
istotności
,
równym
założonemu
prawdopodobieństwu błędu I rodzaju, bądź też na
stwierdzenie braku podstaw do odrzucenia H
0
.
9
Poziom istotności i
ufności.
Moc testu.
Z góry założone prawdopodobieństwo błędu I rodzaju (),
polegającego na odrzuceniu prawdziwej hipotezy zerowej
określamy poziomem istotności. W testach istotności
przyjęto określone małe wartości tego błędu, tak aby
wnioski formułowane przy nich były wystarczająco
wiarygodne:
= 0,05 - różnice istotne
= 0,01 - różnice wysoce istotne
= 0,001 - różnice bardzo wysoce istotne
Poziomem ufności określa się wartość 1 - , która oznacza
prawdopodobieństwo tego, że nie popełniliśmy błędu I
rodzaju.
Moc testu jest to wartość 1 - , czyli prawdopodobieństwo
tego, że test odrzuci fałszywą hipotezę zerową.
10
Obszar krytyczny testu
Robiąc założenie, że hipoteza H
0
jest prawdziwa,
dobiera się odpowiedni test np. test t, test F.
Następnie określa się wartości, jakie musiałyby
przyjąć ta zmienna losowa, aby było to „mało
prawdopodobne”, to znaczy prawdopodobieństwo
zaistnienia tych wartości byłoby równe poziomowi
istotności. Te mało prawdopodobne wartości tworzą
tzw. obszar krytyczny. Jeśli wartość testu obliczona
na podstawie wyników z próby znalazła się w
obszarze krytycznym, to wystąpiło zdarzenie mało
prawdopodobne. Skoro jednak zaszło, to można
odrzucić H
0
uznając ją za fałszywą z określonym
ryzykiem popełnienia błędu .
11
Obszar krytyczny testu
c.d.
Jeżeli przyjmiemy hipotezę zerową, że np. wartość przeciętna μ w
badanej populacji jest równa liczbie μ
o
(H
o
: μ = μ
o
, czyli H
o
: μ - μ
o
= 0),
to możemy sformułować trzy różne hipotezy alternatywne (H
1
)
dla tej
hipotezy zerowej:
obszar krytyczny lewostronny
obszar krytyczny prawostronny
obszar krytyczny obustronny
o
o
o
μ
μ
μ
12
Lewostronny obszar krytyczny
1 -
H
o
: =
o
H
1
: <
o
13
Prawostronny obszar
krytyczny
1 -
H
o
: =
o
H
1
: >
o
14
Dwustronny obszar krytyczny
1 -
H
o
: =
o
H
1
:
o
μ
μ
15
Zastosowania testu t-Studenta
Test t-Studenta może być wykorzystywany:
a) w zastosowaniach „ilościowych” do:
-
określenia przedziału ufności, w którym znajduje się średnia
populacji (),
-
określenia przedziału ufności w którym znajduje się różnica
między średnimi dwóch populacji (μ
A
- μ
B
)
-
określenia minimalnej wielkości próby,
b) w zastosowaniach „jakościowych” jako test istotności do:
- weryfikacji hipotezy o wartości średniej populacji
-
porównania
dwóch
średnich
metodą
zmiennych
niepołączonych,
-
porównania dwóch średnich metodą zmiennych połączonych.
n
s
μ)
x
(
s
μ
x
t
x
16
Test t - Studenta dla wartości
średniej
Norma zawartości ołowiu w żywności
wynosi 1,50 mg/kg s. m. Wykonano
dziesięć oznaczeń Pb w losowo wybranych
korzeniach marchwi i otrzymano wartość
średnią 1,57 mg/kg oraz odchylenie
standardowe 0,0921 mg/kg.
Na poziomie istotności 0,05 zweryfikować
hipotezę, że zawartość ołowiu w marchwi
jest w normie wobec hipotezy
alternatywnej, iż zawartość ołowiu
przekracza dopuszczalną normę.
17
Hipotezy i rozwiązanie
μ
o
=1,50;
n=10;
s=0,0921
H
o
: μ
= μ
o
H
1
: μ
> μ
o
Wartość krytyczna (z tablic) t
0,05; 10-1
= 1,833
Ponieważ t
emp
> t
0,05
, więc t
emp
znajduje się w obszarze
krytycznym i możemy odrzucić hipotezę zerową - na
poziomie istotności 0,05 - na korzyść hipotezy
alternatywnej.
1,57;
x
402
,
2
10
0921
,
0
50
,
1
57
,
1
n
s
μ
x
t
o
emp
18
Podział testów istotności różnic
dwóch średnich dla zmiennych
niepołączonych
Czy obserwowane populacje
mają rozkłady normalne ?
TAK
Znane wariancje ?
NIE
Duże próby ?
TAK
Test Z
NIE
Testy nieparam
.
TAK
Test Z
NIE
Równe wariancje ?
TAK
Test T
NIE
Test Cochrana-Coxa
19
Porównanie dwóch średnich metodą
zmiennych niepołączonych
Hipoteza zerowa zakłada, że
średnie populacji A i B są równe:
Hipoteza alternatywna zakłada,
że:
-
średnia A jest mniejsza od B
-
średnia A jest większa od B
-
średnie A i B różnią się,
B
A
H
:
0
B
A
B
A
B
A
H
H
H
:
:
:
1
1
1
20
Porównanie dwóch średnich metodą
zmiennych niepołączonych za pomocą
testu t Studenta (równe wariancje)
Test ten służy do określenia na podstawie dwóch prób,
czy pochodzą one z populacji o różnych wartościach
średniej.
Polega on na wyliczeniu wartości empirycznej testu i
porównaniu jej z wartością krytyczną (z tablic) dla zadanej
wartości α i ν = n
A
+ n
B
- 2.
2
:
1
1
2
2
2
2
2
2
b
a
B
A
B
A
B
A
d
B
A
d
d
B
A
emp
n
n
ns
ns
s
gdzie
n
n
gdy
n
n
s
s
n
n
gdy
n
s
s
s
x
x
t
21
Porównanie dwóch
średnich- interpretacja
parametrów
Jaki wpływ na możliwość
udowodnienia różnic między
średnimi z populacji ma:
-
różnica między średnimi z
prób?
-
liczebność prób ?
-
rozrzut wyników w obrębie
prób ?
22
Porównanie dwóch
średnich- wnioski
Wnioski na podstawie zastosowania testu istotności (w tym
testu t-Studenta) mogą być dwóch rodzajów:
1) W przypadku, gdy wartość empiryczna testu jest większa
od wartości krytycznej (t
emp
> t
)
to odrzucamy hipotezę
zerową (H
0
) na korzyść H
1
i z prawdopodobieństwem
popełnienia błędu mniejszym niż stwierdzamy, że
porównywane próby pochodzą z populacji o istotnie
różnych wartościach średnich.
Stwierdzenie istotności oznacza, że mamy co
najmniej
(1 - )100% pewności tego, że nie mylimy się.
23
Porównanie dwóch
średnich wnioski c.d.
2) W przypadku, gdy wartość empiryczna testu jest
mniejsza lub równa wartości krytycznej (t
emp
<= t
)
stwierdzamy brak podstaw do odrzucenia hipotezy
zerowej H
0
Brak podstaw do odrzucenia hipotezy
zerowej (H
0
) na poziomie istotności
nie
oznacza, że jest ona prawdziwa, a jedynie
oznacza to, iż nie mamy co najmniej (1 -
)100%
pewności,
że
hipoteza
alternatywna (H
1
) jest prawdziwa.
24
Przykład
Sprawdzano, czy skażenie diety preparatem Cynkotox
wpływa na retencję azotu w organizmie szczurów. W tym
celu zaprojektowano doświadczenie, w którym badano
dwie grupy szczurów, w każdej po 6 osobników. Grupa A -
kontrolna była karmiona czystą paszą, natomiast grupa B
- paszą z dodatkiem Cynkotoxu. W tabeli przedstawiono
wskaźnik retencji azotu [mg/dzień].
n
1
2
3
4
5
6
Grupa
A
48
8
63
3
544 60
0
52
5
624
569
Grupa
B
29
5
49
7
409 30
3
51
0
316
388
x
25
Hipotezy i rozwiązanie
228
,
2
87
,
3
7
,
46
388
569
7
,
46
6
75
,
6546
2
75
,
6546
6
2
2
6
:
:
10
2
6
6
2
;
05
,
0
2
2
2
1
B
A
n
n
emp
d
d
B
A
d
B
A
emp
B
A
B
A
o
t
t
s
s
s
n
s
s
n
n
s
x
x
t
H
H
26
Wniosek:
Ponieważ t
emp
= 3,87 > t
0,05
= ,8,
to z prawdopodobieństwem popełnienia
błędu mniejszym niż 0,05 hipotezę H
0
odrzucamy
na
korzyść
hipotezy
alternatywnej H
1
i stwierdzamy, że
skażenie diety pestycydem Cynkotox
wpływa istotnie na retencję azotu w
organizmie szczurów. Wynika stąd, że
skażenie diety tym preparatem hamuje
proces biosyntezy białka.
27
Porównanie dwóch średnich metodą
zmiennych połączonych za pomocą
testu
t - Studenta
Procedurę tą stosuje się, gdy badamy np. dwie serie
wyników dla
tych samych obiektów w różnym czasie. Dla każdego
obiektu próby mamy parę liczb x
1
i y
i
oraz ich różnicę
x
1
- y
i
= d. Kiedy populacja tych różnic ma rozkład
normalny,
wówczas zmienna losowa
ma rozkład t - Studenta przy n-1 stopniach swobody
(n - liczba par), gdzie:
średnia różnic
standardowe odchylenie różnic
n
s
d
t
d
1)
n(n
)
d
(d
s
2
i
d
d
s
d
28
Przykład
W grupie 6 osób sprawdzono wpływ nowego leku na
zawartość glukozy we krwi. Pomiar stężenia glukozy
wykonano przed podaniem leku (x
i
) i 2 godz. po podaniu
leku (y
i
). Czy podany lek wywiera istotny wpływ na
zawartość glukozy we krwi?
1
2
3
4
5
6
Σ
x
i
103,3
104,0
103,1
103,0
102,8
102,5
618,7
y
i
104,0
103,9
103,5
103,7
103,4
102,8
621,3
d
-0,7
0,1
-0,4
-0,7
-0,6
-0,3
-2,6
29
Hipotezy i rozwiązanie
4,032
t
2,571
t
3,420
0,308
6
0,43
s
n
d
t
308
,
0
s
0,43;
6
2,6
d
103,55;
6
621,3
y
103,12;
6
618,7
x
;
6
5
0,01;
5
0,05;
d
emp
d
0
d
:
H
0
d
:
H
1
o
n
Hipotezę zerową możemy odrzucić na poziomie
istotności 0,05, natomiast na poziomie 0,01 nie ma
podstaw do jej odrzucenia.