Testy nieparametryczne
Testy nieparametryczne mają
zastosowanie wszędzie tam, gdzie
niespełnione są założenia wymagane dla
testów parametrycznych, ale stosujemy je
tylko wówczas, gdy nie możemy posłużyć się
testem parametrycznym.
Testy nieparametryczne wymagają jedynie
założenia, że wartości badanych cech są
mierzalne na skali porządkowej (tzn. można
je uporządkować) dlatego mówimy, że testy
te wykonywane są na danych wyrażonych w
skali porządkowej
Testy nieparametryczne
Testy nieparametryczne oparte są na
porównaniu rozkładów cech, a nie
określonych parametrów charakteryzujących
te rozkłady (stąd ich nazwa –
nieparametryczne).
Testy nieparametryczne nie są zależne od
rozkładu badanej cechy (nie wymagają
rozkładu normalnego), mogą więc być
stosowane także w przypadku dowolnego
rozkładu cechy, niekoniecznie rozkładu
normalnego lub zbliżonego do rozkładu
normalnego
Testy nieparametryczne
Testy nieparametryczne w odróżnieniu od
testów parametrycznych:
•
można stosować do wszystkich cech, których
wartości można uporządkować, nie tylko cech
mierzalnych (np. do danych jakościowych)
•
nie wymagają żadnych założeń dotyczących
rozkładu cechy
•
są proste i łatwe w użyciu
•
są słabsze tzn. za pomocą tych testów
znacznie trudniej jest odrzucić hipotezę
zerową (a zatem łatwiej można popełnić błąd
II rodzaju) i dlatego wymagają prób o większej
liczebności
Testy nieparametryczne
W wielu testach nieparametrycznych punktem
wyjścia jest nadanie wynikom tzw. rang.
Rangowanie przeprowadzamy następująco:
• porządkujemy (rosnąco lub malejąco) wartości w
próbach
• zaczynając od wartości najmniejszej (lub
największej), przyporządkowujemy poszczególnym
obserwacjom kolejne liczby naturalne - rangi
• w przypadku wystąpienia kilku jednakowych
wartości w uporządkowanej próbie
przyporządkowujemy im tzw. rangi wiązane (średnia
arytmetyczna z rang, jakie powinno im się
przypisać)
Testy nieparametryczne
Testy nieparametryczne można
podzielić na następujące kategorie:
• testy różnic między grupami (próby
niezależne)
• testy różnic między zmiennymi (próby
zależne)
• testy współzależności między
zmiennymi
Testy różnic między grupami
Gdy mamy do czynienia z dwoma grupami, które
chcemy porównać pod względem wartości
średniej danej cechy, stosujemy zwykle test t-
Studenta dla grup niezależnych
Nieparametryczną alternatywą dla tego testu jest
test Wilcoxona-Manna-Whitneya, test U
Manna-Whitneya, test serii Walda-Wolfowitza,
oraz test Kołmogorowa-Smirnowa.
W przypadku porównania średnich wielu grup
używamy analizy wariancji - nieparametrycznymi
odpowiednikami tej metody są test rangowy
Kruskala-Wallisa oraz test mediany
Testy
różnic między
zmiennymi
Gdy chcemy porównać dwie cechy zmierzone
w tej samej próbie zazwyczaj stosujemy test t
dla grup zależnych (np. przy porównaniu
umiejętności matematycznych na początku i
na końcu semestru). Nieparametrycznym
odpowiednikiem tego testu jest test znaków
oraz test Wilcoxona.
Jeśli brane pod uwagę zmienne są zmiennymi
skategoryzowanymi (tj. "zdał" lub "nie zdał")
wówczas odpowiednim będzie test
McNemary .
Testy
współzależności
między zmiennymi
Aby zbadać współzależność między dwiema
cechami, obliczamy zazwyczaj współczynnik
korelacji Pearsona. Odpowiednikami
nieparametrycznymi są: współczynnik
korelacji rangowej Spearmana , Tau
Kendalla oraz współczynnik gamma
W przypadku zmiennych
skategoryzowanych (np. "zdał" lub "nie
zdał", "mężczyzna" lub "kobieta"), do oceny
współzależności między zmiennymi
stosowane są: test chi-kwadrat ,
współczynnik f
2
lub dokładny test
Fishera.
Test U Manna-Whitneya
H
0
: μ
A
= μ
B
vs
H
A
: μ
A
μ
B
Kroki postępowania:
• Uszeregować wszystkie obserwacje rosnąco
(łącznie wyniki w grupie A i w grupie B)
• Przypisać rangi uporządkowanym obserwacjom
• Podsumować rangi obserwacji dla grupy A (jako
S
A
)
• Obliczyć wartość testu:
U=S
A
- n
A
(n
A
+1)/2
gdzie n
A
jest liczbą obserwacji w grupie A
• Porównać, z użyciem tablicy Manna-Whitneya, czy
wartość obliczona statystyki testowej (U) znajduje
się w obszarze krytycznym testu (tzn. U<U
α
lub
U>n
A
n
B
–U
α
), a jeśli tak, to odrzucić hipotezę H
0
Test U Manna-Whitneya -
przykład
Zebrano dane o czas życia (w dobach) ryb
kontrolnych (grupa A) oraz ryb traktowanych
pewną substancją chemiczną (grupa B). Czy
między grupami A i B występuje różnica w
przeżywalności ryb?
A: 20 23 28 30 31 32 44 33
B: 20 29 23 48 41 32 36 43 42 46
n
A
= 8, n
B
= 10
H
0
: A i B mają ten sam rozkład czasu przeżycia
H
A
: A i B mają różne rozkłady czasu przeżycia
Test U Manna-Whitneya -
przykład
Szeregujemy dane i nadajemy im rangi:
20
20
23
23
28
29
30 31 32
32
33
36 41 42 43
44
46 48
A
B
A
B
A
B
A
A
A
B
A
B B B B
A
B B
1,5
1,5
3,5
3,5
5
6
7 8 9,5
9,5
11
12 13 14 15
16
17 18
Sumujemy rangi dla grupy
A
S
A
=1,5+3,5+5+7+8+9,5+11+16=61,5
Obliczamy wartość: U = S
A
–n
A
(n
A
+1)/2
U= 61,5 – 8(8+1)/2=61,5 – 36 = 25,5
Weryfikujemy H
0
Obszar krytyczny dla n
A
=8 i n
B
=10 i dla α=0,05
U
0,05
=18 (wartość dolna z tablic) oraz (n
A
n
B
–U
0,05
)=810 – 18= 62
Ponieważ obliczona wartość U=25,5 jest poza obszarem
krytycznym więc należy zaakceptować H
0
tzn. że czas przeżycia
ryb w obu grupach nie różnił się
A: 20 23 28 30 31 32 44
33
B: 20 29 23 48 41 32 36 43
42 46
Test U Manna-Whitneya
test U Manna-Whitneya możemy zastosować
do danych spełniających założenia testu t-
Studenta, z tym że jego moc wynosi wówczas
około 95% mocy testu t-Studenta
Jeżeli dane są typu porządkowego
(niemierzalne) to hipoteza zerowa zakłada, że
badane grupy pochodzą z tych samych
populacji, tzn. rozkłady danych w
analizowanych grupach nie różnią się istotnie;
dla danych porządkowych nie można bowiem
obliczyć wartości średniej, a prawidłową miarą
tendencji centralnej jest mediana
Test Wilcoxona-Manna-
Whitneya
H
0
: μ
A
= μ
B
vs
H
A
: μ
A
μ
B
Kroki postępowania:
•
Uszeregować wszystkie obserwacje rosnąco (łącznie
wyniki w grupie
A i w grupie B)
• Przypisać rangi uporządkowanym obserwacjom
• Posumować rangi obserwacji dla grupy A (jako T
A
) i dla
grupy B
(jako T
B
)
• Przyjąć wartość testu: T = min(T
A
, T
B
)
• Porównać, czy wartość obliczona statystyki testowej (T)
znajduje się
w obszarze krytycznym testu (tzn. T<T
α
), a jeśli tak, to
odrzucić H
0
Test Wilcoxona-Manna-
Whitneya
przykład
Jedną grupę krów żywiono sianem z łąk
mocno nawożonych (A), a drugą grupę
żywiono sianem z łąk nie nawożonych (B).
U zwierząt zbadano bilans Mg. Otrzymano
następujące wyniki:
Grupa A: 8, 12, 8, 9, 6, 9, 10
Grupa B: 2, 5, 3, 4, 5, 7
Zbadać, czy grupy różniły się bilansem Mg
H
0
: A i B mają taki sam bilans Mg
H
A
: A i B mają różny bilans Mg
Test Wilcoxona-Manna-
Whitneya
przykład
Grupa A: 6
8 8 9 9 10 12
rangi:
6 8,5 8,5 10,5 10,5 12 13
Grupa B:
2 3 4 5 5 7
rangi:
1 2 3 4,5 4,5 7
obliczamy sumy rang:
dla grupy A: T
A
=6+8,5+8,5+10,5+10,5+12+13=69
dla grupy B: T
B
=1+2+3+4,5+4,5+7=22
Przyjmujemy wartość testu:
T=min(T
A
, T
B
) =min(69, 22)=22
Wartość krytyczna testu dla T
α
=T
0,05
=27 więc
T< T
α
i odrzucamy H
0
Test Wilcoxona
Test ten opiera się na różnicach w
parach i ich randze (odpowiednik testu t
dla par skorelowanych tzn. grup
zależnych)
Hipoteza zerowa:
H
0
: brak istotnych różnic w parach
Hipoteza alternatywna:
H
A
: różnice w parach są istotne
Test Wilcoxona-Manna-
Whitneya przykład
W dwóch rejonach Zatoki Gdańskiej badano
liczebność meiofauny. W obu rejonach
pobrano losowo 10 próbek osadu, w
których określono liczbę organizmów.
Wyniki podano w tabeli:
Rejon A: 4 10 11 12 13 15 15 8 10
11
Rejon B: 10 12 12 15 12 18 20 13 15
13
Czy rejony różnią się istotnie w rozkładzie
liczebności meiofauny?
Test znaku i Wilcoxona -
przykład
Badano miana przeciwciał przed szczepieniem
i po szczepieniu u 8 pacjentów. Czy
przeprowadzone szczepienie było skuteczne?
miano przeciwciał
przed
szczepieniem
65
45
52
66
49
73
55
77
miano przeciwciał po
szczepieniu
68
47
59
67
48
77
59
75
różnica
3
2
7
1
-1
4
4
-2
ranga
5
3,5
8
1,5
1,5
6,5
6,5
3,5
liczba minusów=2, liczba plusów=6
Test znaku - przykład
R
E
: 2 : 6 H
0
: R
E
i R
T
nie różnią się
R
T
: 1 : 1 H
A
: R
E
i R
T
różnią się
Nie odrzucamy H
0
125
,
1
χ
4
5
,
0
4
6
4
5
,
0
4
2
2
0
2
2
2
05
,
0
2
0
2
05
,
0
χ
χ
1
84
,
3
χ
df
dla
Test Wilcoxona
przykład
H
0
: R
E
i R
T
nie różnią się
H
A
: R
E
i R
T
różnią się
Obliczamy sumy rang:
T
(+)
=5+3,5+8+1,5+6,5+6,5=31
T
(-)
=1,5+3,5=5
T
0
=min(T
(+)
, T
(-)
)=min(31 , 5)=5
T
0,05
=4 (przy 8 parach)
zatem T
0
>T
0,05
więc nie odrzucamy H
0
różni
ca
3
2
7
1
-1
4
4
-2
ranga 5
3,
5
8
1,
5
1,
5
6,
5
6,
5
3,
5