Testy nieparametryczne
Testy nieparametryczne mają
zastosowanie wszędzie tam, gdzie nie są
spełnione założenia wymagane dla
testów parametrycznych, ale stosujemy
je tylko wówczas, gdy nie możemy
posłużyć się testem parametrycznym
Testy nieparametryczne oparte są na
porównaniu rozkładów cech, a nie
określonych parametrów
charakteryzujących te rozkłady (stąd ich
nazwa – nieparametryczne).
Testy nieparametryczne
Testy nieparametryczne w odróżnieniu od
testów parametrycznych:
• można stosować do wszystkich cech, których
wartości można uporządkować, nie tylko do
cech mierzalnych (np. do danych jakościowych)
• nie wymagają żadnych założeń dotyczących
rozkładu cechy
• są proste i łatwe w użyciu
• są słabsze tzn. za pomocą tych testów
znacznie trudniej jest odrzucić hipotezę zerową
(a zatem łatwiej można popełnić błąd II
rodzaju) i dlatego wymagają prób o większej
liczebności
Testy nieparametryczne
W wielu testach nieparametrycznych
punktem wyjścia jest nadanie wynikom w
próbach tzw. rang.
Rangowanie przeprowadzamy następująco:
•
porządkujemy wartości w próbach (rosnąco
lub malejąco)
•
w uporządkowanej próbie
przyporządkowujemy poszczególnym
obserwacjom kolejne liczby naturalne tzw.
rangi
•
w przypadku wystąpienia kilku
jednakowych wartości przyporządkowujemy
im tzw. rangi wiązane (średnia arytmetyczna z
rang, jakie powinno im się przypisać)
Testy nieparametryczne
Testy nieparametryczne można
podzielić na następujące kategorie:
• testy różnic między grupami
niezależnymi
• testy różnic między grupami
zależnymi
• testy współzależności między
zmiennymi
Testy różnic między grupami
niezależnymi
Nieparametryczną alternatywą dla testu
t-Studenta dla grup niezależnych jest
• test Wilcoxona-Manna-Whitneya
• test U Manna-Whitneya
• test serii Walda-Wolfowitza
• test Kołmogorowa-Smirnowa
Nieparametrycznym odpowiednikiem
metody analizy wariancji jest
• test rangowy Kruskala-Wallisa
• test mediany
Testy
różnic między grupami
zależnymi
Nieparametrycznym odpowiednikiem
testu t-Studenta dla par skorelowanych
jest
• test znaków
• test Wilcoxona
Jeśli brane pod uwagę zmienne są
zmiennymi skategoryzowanymi (tj.
"zdał" lub "nie zdał") wówczas
stosowany jest test McNemary
Testy
współzależności
między zmiennymi
Aby zbadać współzależność między
dwiema cechami, obliczamy zazwyczaj
współczynnik korelacji Pearsona.
Odpowiednikami nieparametrycznymi
są:
• współczynnik korelacji rangowej
Spearmana
• współczynnik korelacji Kendalla
• współczynnik gamma
Testy
współzależności
między zmiennymi
W przypadku zmiennych
skategoryzowanych (np. "zdał" lub "nie
zdał", "mężczyzna" lub "kobieta"), do
oceny współzależności między
zmiennymi stosowane są:
• test chi-kwadrat
• współczynnik f
2
• dokładny test Fishera
Test Wilcoxona-Manna-
Whitneya
H
0
: μ
A
= μ
B
versus H
A
: μ
A
μ
B
Kroki postępowania:
1. Uszeregować wszystkie obserwacje rosnąco
(łącznie wyniki w grupie A i w grupie B)
2. Przypisać rangi uporządkowanym obserwacjom
3. Posumować rangi obserwacji dla grupy A (jako
T
A
) i dla grupy B (jako T
B
)
4. Przyjąć wartość testu: T = min(T
A
, T
B
)
5. Zweryfikować H
0
(jeśli wartość obliczona
statystyki testowej (T) znajduje się w obszarze
krytycznym testu (tzn. T<T
α
) to odrzucić H
0
)
Test Wilcoxona-Manna-
Whitneya
przykład
Jedną grupę krów żywiono sianem z łąk
mocno nawożonych (A), a drugą grupę
żywiono sianem z łąk nie nawożonych (B).
U zwierząt zbadano bilans Mg. Otrzymano
następujące wyniki:
Grupa A: 8, 12, 8, 9, 6, 9, 10
Grupa B: 2, 5, 3, 4, 5, 7
Zbadać, czy grupy różniły się bilansem Mg
H
0
: A i B mają taki sam bilans Mg (
μ
A
= μ
B
)
H
A
: A i B mają różny bilans Mg (
μ
A
μ
B
)
Test Wilcoxona-Manna-
Whitneya
przykład
Grupa A:
6
8 8 9 9 10 12
rangi:
6 8,5 8,5 10,5 10,5 12 13
Grupa B:
2 3 4 5 5 7
rangi:
1 2 3 4,5 4,5 7
Obliczamy sumy rang:
dla grupy A: T
A
=6+8,5+8,5+10,5+10,5+12+13=69
dla grupy B: T
B
=1+2+3+4,5+4,5+7=22
Przyjmujemy wartość testu:
T=min(T
A
, T
B
) =min(69, 22)=22
Wartość krytyczna testu dla T
α
=T
0,05
=27 więc
T< T
α
i odrzucamy H
0
Grupa A: 8, 12, 8, 9, 6, 9, 10
Grupa B: 2, 5, 3, 4, 5, 7
Test U Manna-Whitneya
H
0
: μ
A
= μ
B
versus
H
A
: μ
A
μ
B
Kroki postępowania:
• Uszeregować wszystkie obserwacje rosnąco
(łącznie wyniki w grupie A i w grupie B)
• Przypisać rangi uporządkowanym obserwacjom
• Podsumować rangi obserwacji dla grupy A (jako S
A
)
• Obliczyć wartość testu:
U=S
A
- n
A
(n
A
+1)/2
gdzie n
A
jest liczbą obserwacji w grupie A
5. Zweryfikować H
0
(jeśli wartość obliczona
statystyki
testowej (U) znajduje się w obszarze krytycznym
testu (tzn. U<U
α
lub U>n
A
n
B
–U
α
) to odrzucić
hipotezę H
0
)
Test U Manna-Whitneya -
przykład
Zebrano dane o czasie życia (w dobach) ryb
kontrolnych (grupa A) oraz ryb traktowanych
pewną substancją chemiczną (grupa B). Czy
między grupami A i B występuje różnica w
przeżywalności ryb?
A: 20 23 28 30 31 32 44 33
B: 20 29 23 48 41 32 36 43 42 46
n
A
= 8, n
B
= 10
H
0
: A i B mają taki sam czas przeżycia
H
A
: A i B różnią się czasem przeżycia
Test U Manna-Whitneya -
przykład
Szeregujemy dane i nadajemy im rangi
:
Grupa A: 20 23
28 30 31 32 33 44
rangi:
1,5 3,5 5 7 8 9,5
11 16
Grupa B:
20 23
29 32 36 41 42 43
46 48
rangi:
1,5 3,5 6 9,5 12 13 14
15 17 18
Sumujemy rangi dla grupy
A
S
A
=1,5+3,5+5+7+8+9,5+11+16=61,5
Obliczamy wartość
: U = S
A
–n
A
(n
A
+1)/2
U= 61,5 – 8(8+1)/2=61,5 – 36 = 25,5
A: 20 23 28 30 31 32 44
33
B: 20 29 23 48 41 32 36 43
42 46
Test U Manna-Whitneya -
przykład
Weryfikujemy H
0
Dla n
A
=8 i n
B
=10 i dla α=0,05: U
0,05
=18
(wartość dolna z tablic) oraz (n
A
n
B
–U
0,05
)=810 –
18= 62
Obliczona wartość U=25,5 jest poza
obszarem krytycznym więc nie ma
podstaw do odrzucenia H
0
tzn. że czas
przeżycia ryb w obu grupach nie różnił
się
Test U Manna-Whitneya
Test U Manna-Whitneya możemy
zastosować do danych spełniających
założenia testu t-Studenta, z tym że jego moc
wynosi około 95% mocy testu t-Studenta
Jeżeli dane są typu porządkowego
(niemierzalne) to hipoteza zerowa zakłada,
że badane grupy pochodzą z tych samych
populacji, tzn. rozkłady danych w
analizowanych grupach nie różnią się istotnie
ponieważ dla danych porządkowych nie
można obliczyć wartości średniej (miarą
położenia jest mediana)
Test Wilcoxona
Test Wilcoxona opiera się na różnicach
w parach i ich rangach (odpowiednik
testu t-Studenta dla par skorelowanych
tzn. grup zależnych)
Test Wilcoxona uwzględnia znak różnic,
ich wielkość, jak również ich kolejność.
Hipoteza zerowa:
H
0
: brak istotnych różnic w parach
Hipoteza alternatywna:
H
A
: różnice w parach są istotne
Test Wilcoxona
Kroki postępowania:
1.Obliczenie różnic wartości w parach
2.Uporządkowanie różnic i przypisanie im
rang (ignorując znak różnicy)
3.Posumowanie rang różnic dodatnich (T
+
)
i ujemnych (T
-
)
4.Wartość testu Wilcoxona: T=min(T
+
,T
-
)
5.Weryfikacja H
0
(porównanie T z
odpowiednią wartością krytyczną (T
α
) ;
jeśli T<T
α
to odrzucamy hipotezę
zerową)
Test znaku i Wilcoxona -
przykład
Badano liczbę przeciwciał przed szczepieniem
i po szczepieniu u 8 pacjentów. Czy
przeprowadzone szczepienie było skuteczne?
przeciwciała przed
szczepieniem (x
1
)
65
45
52
66
49
73
55
77
przeciwciała po
szczepieniu (x
2
)
68
47
59
67
48
77
59
75
Różnica (x
2
-x
1
)
3
2
7
1
-1
4
4
-2
ranga
5
3,5
8
1,5
1,5
6,5
6,5
3,5
liczba znaków „minus”=2, liczba znaków „plus”=6
Test Wilcoxona
przykład
H
0
: liczba przeciwciał przed i po szczepieniu
nie różni się
H
A
: liczba przeciwciał przed i po szczepieniu
różni się
Obliczamy sumy rang:
T
(+)
=5+3,5+8+1,5+6,5+6,5=31
T
(-)
=1,5+3,5=5
T=min(T
(+)
, T
(-)
)=min(31 , 5)=5
T
0,05
=4 (przy 8 parach)
zatem T >T
0,05
więc nie odrzucamy H
0
różni
ca
3
2
7
1
-1
4
4
-2
ranga 5
3,
5
8
1,
5
1,
5
6,
5
6,
5
3,
5