TESTY DLA WIĘCEJ NIŻ DWÓCH GRUP PORÓWNAWCZYCH - ZMIENNA ZALEŻNA PORZĄDKOWA, DANE NIEZALEŻNE: TEST Kruskla-Wallisa
- testu Kruskla-Wallisa używamy jeśli:
(1) mamy do czynienia z więcej niż dwoma grupami porównawczymi, na przykład, chcemy porównać jaka jest różnica pomiędzy mieszkańcami Poznania, Warszawy i Krakowa (trzy grupy porównawcze; dane niezależne) pod względem wykształcenia (1.wyższe - 2.średnie - 3.zawodowe - 4.podstawowe) albo częstotliwości chodzenia do kościoła (1.często - 2.rzadko - 3.bardzo rzadko - 4.nigdy)
(2) zmienna zależna jest wyrażona co najmniej na skali porządkowej (bazując na przykładzie powyżej, zmienna zależna to wykształcenie, które może być wyrażone na skali: podstawowe, zawodowe, średnie, wyższe); przy pomocy testu Kruskala-Wallisa można też testować zmienne wyrażone na skalach mocniejszych niż porządkowa (na przykład zmienną wyrażoną na skali Likerta (a zatem zmienną interwałową), powiedzmy ocena produktu na skali: 1.dobrze - 2.raczej dobrze - 3.ani dobrze, ani źle - 4.raczej źle - 5.źle), lepiej jest jednak zawsze jeśli to tylko możliwe stosować testy parametryczne.
(3) porównywane grupy są niezależne, z porównaniami niezależnymi mamy do czynienia zawsze wtedy, kiedy grupy nie są w żaden sposób ze sobą powiązane, bazując na naszym przykładzie: wyniki mieszkańców Poznania nie są powiązane w żaden sposób z wynikami mieszkańców Warszawy, ani z wynikami mieszkańców Krakowa (podobnie w przypadków pozostałych kombinacji np.: Warszawa-Kraków), innymi słowy: nie zależą od siebie. Inaczej rzecz się by miała gdybyśmy na przykład przeprowadzili następujące badanie. Badamy mieszkańców Poznania w okresie poprzedzającym wejście Polski do UE, powiedzmy ten okres to 4 lata. Pierwsze badanie ma miejsce w roku 2000, drugie w roku 2002, a trzecie w roku 2003, za każdym razem badamy to samo, te same postawy, opinie (generalnie badamy to, czy mieszkańcy Poznania są za czy przeciw przyłączenie się Polski do struktur europejskich). Wyniki z tych trzech badań, stanowią tak naprawdę trzy quasi-grup porównawcze, mamy trzy grupy wyników. Jeśli chcielibyśmy porównywać te trzy quasi-grupy (grupa z roku 2000, grupa z roku 2002 i grupa z roku 2003) to wówczas mielibyśmy do czynienia z danymi zależnymi, badamy te same osoby, więc wyniki w jakiś sposób zależą od siebie. Podobnie rzecz się ma jeśli byśmy badali te same osoby oceniające trzy marki piwa w blind teście, czyli grupa 20 osób ocenia piwo Żywiec, Lech i Warkę. Średnie rangi w pytaniu o satysfakcję - wyrażoną na skali od 1 (pełna satysfakcja) do 4 (brak satysfakcji) - to powiedzmy, odpowiednio: Żywiec 8,1; Lech 5,6: Warka 3,9 (Uwaga! Średnie rangi nie muszą się zawierać w wartościach skali, pomimo tego, że skala ma wartości od 1 do 4, średnia ranga może mieć wartość ponad 8,1). Jeśli chcielibyśmy stwierdzić czy uzyskane różnice są istotne statystyczne, musielibyśmy sięgnąć do test dla danych zależnych (konkretnie test Friedmana, zakładamy tu że skala była porządkowa), bo oceniają te same osoby. Natomiast jeśli badalibyśmy jak oceniane są te trzy piwa w Poznaniu, Warszawie i Krakowie, to wówczas stosujemy testy dla danych niezależnych, ponieważ nie badamy tych samych osób, wyniki nie zależą od siebie. Możemy zastosować test Kruskala-Wallisa.
Wynikiem testu Kruskala-Wallisa statystyka H, wyliczamy ją ze wzoru:
gdzie: N - liczba wszystkich badanych osób
∑ - znak sumy (tu chodzi o sumę ilorazów sumy rang i liczebności w każdej z badanych grup)
R - suma rang w danej grupie
N - liczebność danej grupy
Przypuśćmy tedy następującą sytuację:
- badamy częstotliwość chodzenia do Kościoła w trzech miastach: Poznaniu, Warszawie i Krakowie, w toku badań uzyskaliśmy następujące wyniki:
|
miasto - wyniki |
||
resp. |
Poznań |
Warszawa |
Kraków |
1 |
3 |
1 |
4 |
2 |
2 |
2 |
4 |
3 |
1 |
1 |
3 |
4 |
3 |
2 |
2 |
5 |
3 |
1 |
3 |
- pierwszą rzeczą jaką musimy zrobić, to - podobnie jak w przypadku testu U Manna-Whitneya - zapisać wszystkie wyniki w postaci rang, ponieważ test Kruskala-Walissa bazuje na rangach, nie na wynikach surowych
- uporządkowane i porangowane wszystkie (bez podziału na grupy!) wyniki wyglądają następująco:
wynik |
1 |
1 |
1 |
1 |
2 |
2 |
2 |
2 |
3 |
3 |
3 |
3 |
3 |
4 |
4 |
pozycja |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
ranga |
2,5 |
2,5 |
2,5 |
2,5 |
6,5 |
6,5 |
6,5 |
6,5 |
11 |
11 |
11 |
11 |
11 |
14,5 |
14,5 |
- tak jak już wspomniano wcześniej, dalsze obliczenie bazują na rangach, nie na wynikach surowych
- tabela z wpisanymi rangami wygląda na następująco:
|
miasto - rangi |
||
resp. |
Poznań |
Warszawa |
Kraków |
1 |
11 |
2,5 |
14,5 |
2 |
6,5 |
6,5 |
14,5 |
3 |
2,5 |
2,5 |
11 |
4 |
11 |
6,5 |
6,5 |
5 |
11 |
2,5 |
11 |
SUMA RANG |
42 |
20,5 |
57,5 |
- obliczenia:
H = 12/ 15x(15+1) x (422/5 + 20,52/5 + 57,52/5) - 3 x (15+1) =
= 12/ 15x16 x (1764/5 + 420,25/5 + 3306,25/5) - 3 x 16 =
= 12/ 240 x (352,8 + 84,05 + 661,25) - 48 =
= 0,05 x 1098,1 - 48 =
= 54, 905 - 48 = 6,905
- wartość H jest równa wartości chi-kwadrat, liczbę stopni swobody oblicza się ze wzoru: df=k-1, gdzie k = liczba porównywanych grup
- sprawdzamy czy wynik H=6,905 upoważnia nas do odrzucenia hipotezę zerowej, mówiącej, że badani nie różnią się pod względem częstotliwości chodzenia do kościoła,
- skoro wartość H jest równa χ2, w celu sprawdzenie czy zaobserwowane różnice są istotne statystycznie korzystamy z rozkłady chi-kwadrat, czyli znajdujemy najpierw liczbę stopni swobody i przemieszczamy się w prawo, aż do miejsca, gdzie wpisana jest wartość χ2 dla £ = 0.05 lub £ = 0.01, sprawdzamy czy wartość 6,905 przekracza tą wartość, jeśli tak jest zaobserwowane różnice są istotne statystycznie.
- na poziomie istotności £ = 0,05 możemy odrzucić hipotezę zerową, innymi słowy: badane grupy różnią się pod względem częstotliwości chodzenia o kościoła, zależność jest istotna statystycznie na poziomie £ = 0,05
str. 4