Badanie związku między dwiema cechami typu ilościowego.
A. Regresja liniowa. Współczynnik korelacji Pearsona.
B. t-test dla prób powiązanych .
Przykład 3.
Celem zbadania związku między wagą ciała i wzrostem wylosowano próbę nastolatków o liczebności 20 osób. Uzyskano następujące pary danych:
waga wzrost
1 |
47 |
161 |
2 |
48 |
167 |
3 |
52 |
171 |
4 |
69 |
177 |
5 |
45 |
162 |
6 |
52 |
170 |
7 |
70 |
180 |
8 |
58 |
178 |
9 |
66 |
168 |
10 |
60 |
171 |
11 |
65 |
172 |
12 |
56 |
175 |
13 |
49 |
155 |
14 |
40 |
160 |
15 |
57 |
172 |
16 |
75 |
170 |
17 |
58 |
164 |
18 |
65 |
163 |
19 |
74 |
164 |
20 |
72 |
183 |
Pytanie: Czy istnieje związek między wagą ciała i wzrostem u nastolatków?
Zweryfikować hipotezę o braku związku liniowego między
wagą ciała i wzrostem ?
Hipoteza zerowa:
Współczynnik korelacji (populacyjny) pomiędzy wagą ciała i wzrostem ρ=0.
Brak jest związku (korelacji, zależności) między wagą ciała i wzrostem.
H0: ρ=0
H1: ρ≠0 ( ρ>0 lub ρ<0 )
t =
gdzie
- współczynnik korelacji (próbkowy) i liczebność grupy.
Przy prawdziwości hipotezy zerowej funkcja (statystyka) t posiada rozkład
t-Studenta z k-2 stopniami swobody. Wartością krytyczną na poziomie istotności α=0,05 w tym rozkładzie jest wartość tkr (np. tkr = 1.98 dla 120 stopni swobody, tkr = 2.0 dla 60 stopni swobody, tkr = 2.09 dla 20 stopni swobody).
funkcja gęstości rozkładu t-Studenta
obszar przyjęcia H0
częstość
obszar odrzucenia H0 (zakreskowany)
-tkr 0 tkr wartości t
Weryfikacja hipotezy zerowej:
jeśli t > tkr lub t< -tkr to H0 odrzucona (jeśli -tkr ≤ t ≤ tkr to nie ma podstaw do odrzucenia H0 , H0 przyjęta),
jeśli p<0,05 to H0 odrzucona (jeśli p≥0,05 to nie ma podstaw do odrzucenia H0 , H0 przyjęta).
Wnioski:
jeśli H0 przyjęta (ozn. NS - non significant):
współczynnik korelacji
statystycznie równa się 0, tzn. ρ=0,
brak jest korelacji (związku liniowego) między badanymi cechami,
jeśli H0 odrzucona :
współczynnik korelacji
statystycznie różni się od 0,
>0 lub
<0
jest korelacja między badanymi cechami (wprost proporcjonalna lub odwrotnie proporcjonalna).
Obliczenia do przykładu:
Reguła decyzyjna: H0 odrzucona, bo t = 2,76>tkr =2,10 (p=0,013 < 0,05).
Wniosek: Współczynnik korelacji jest istotnie większy od 0. Stwierdzono wprost proporcjonalny związek między wzrostem i wagą. Im wyższy u osoby jest wzrost tym wyższa jest (średnio) waga ciała.
Uwagi:
współczynnik korelacji stosujemy jeśli analizowane cechy ilościowe posiadają rozkłady normalne (lub zbliżone do normalnych),
jeśli nie jest spełniony warunek z punktu 1) obliczamy nieparametryczny współczynnik korelacji Spearmana (lub Kendalla).
Przykład 4. Próby powiązane.
Celem porównania poziomu hemoglobiny u kobiet przed i po leczeniu wylosowano próbę o liczebności 10 osób. Uzyskano następujące pary danych:
(przed) (po) (różnica po - przed)
10.1 0.3
10.9 -0.4
12.1 0.7
12.7 0.5
11.1 0.6
10.8 0.0
12.0 0.5
12.0 0.4
10.4 0.1
10.9 0.3
Pytanie: Czy poziom hemoglobiny przed i po leczeniu różni się?
Zweryfikować hipotezę o braku różnicy między poziomem
hemoglobiny przed i po leczeniu?
Hipoteza zerowa:
Średnia wartość różnicy zk (populacyjna) wynosi 0.
Brak jest związku między poziomem hemoglobiny przed i po leczeniu.
H0: zk = 0
H1: zk ≠ 0 ( zk < 0 lub zk > 0 )
t =
gdzie
- średnia (próbkowa), odchylenie standardowe (próbkowe) i liczebność w grupie.
Przy prawdziwości hipotezy zerowej statystyka t posiada rozkład t-Studenta z k-1 stopniami swobody. Wykres funkcji gęstości i weryfikacja hipotezy zerowej podobnie jak dla współczynnika korelacji.
Wnioski:
1) jeśli H0 przyjęta (ozn. NS - non significant):
-średnia
jest statystycznie równa 0, co oznacza, że zk = 0,
-brak jest związku między badanymi cechami,
2) jeśli H0 odrzucona :
-średnia
różni się statystycznie od 0, (
<0 lub
>0), tzn. zk < 0 lub zk > 0,
-jest związek między badanymi cechami (podać szczegółowo).
Przykład cd. Obliczenia i wnioski:
Reguła decyzyjna: H0 odrzucona, bo t = 2,90>tkr =2,26 (p=0,017 < 0,05).
Wniosek: Średnia
jest statystycznie większa niż 0. Poziom hemoglobiny po
leczeniu jest większy niż przed leczeniem.
Uwagi: 1) t-test dla prób powiązanych stosujemy jeśli analizowana cecha
(różnice) posiada rozkład normalny,
2) jeśli nie jest spełniony warunek z punktu 1) to stosujemy
nieparametryczny test Wilcoxona dla par.