Testy nieparametryczne - cz. II
|
|
Podstawy statystyki dla prowadzących badania naukowe
Odcinek 12: Testy nieparametryczne - cz. II
mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof. dr hab. Andrzej Żarnecki)
Data utworzenia: 13.10.2000
Ostatnia modyfikacja: 30.04.2007
Opublikowano w Medycyna Praktyczna 1999/10
W części I tego odcinka zostały przedstawione różne testy nieparametryczne dla prób niezależnych. Możemy je szeroko stosować wszędzie tam, gdzie niespełnione są założenia wymagane dla testów parametrycznych. Stosujemy je również wówczas, gdy nasze dane są jakościowe lub można je tylko uporządkować według określonych kryteriów oraz dla grup o małej liczebności. Siła testów nieparametrycznych jest jednak mniejsza niż siła testów parametrycznych. Stosujemy je więc tylko wówczas, gdy nie możemy się posłużyć testem parametrycznym. Poniżej omówię testy nieparametryczne dla prób zależnych. Należą do nich:
test znaków
test kolejności par Wilcoxona
test McNemary
Stanowią one nieparametryczną alternatywę testu t-Studenta dla zmiennych powiązanych. Stosujemy je, gdy dysponując dwoma pomiarami (przed jakimś wydarzeniem i po), chcemy dowieść, że pomiary te się różnią. Inaczej mówiąc, testy te są przeznaczone do sprawdzania istotności różnic między dwoma zależnymi pomiarami. Te dwa zależne pomiary to albo dwie obserwacje u tej samej osoby (np. przed zabiegiem i po), albo obserwacje u par osób o tych samych właściwościach (tzw. równoważne dwójki). Hipoteza zerowa mówi, że wyniki obu pomiarów są jednakowe. Testy te stosujemy również wtedy, gdy nie są spełnione założenia testu t dla zmiennych powiązanych. Za ich pomocą możemy stwierdzić, czy próby różnią się między sobą pod względem pewnych własności. Te łatwe w użyciu testy wymagają jedynie założenia, że wartości badanych zmiennych możemy uporządkować (są mierzalne na skali porządkowej).
Załóżmy, że przeprowadziliśmy badanie ciężaru ciała w grupie 20 kobiet przed 7-tygodniową dietą odchudzającą i po niej. Otrzymane dane przedstawiono w tabeli 1.
Chcemy sprawdzić, czy otrzymane wyniki przeczą hipotezie, że dieta nie powoduje zmniejszenia ciężaru ciała.
Ponieważ nasze dane to dwie obserwacje u tej samej osoby, więc do weryfikacji postawionej hipotezy wykorzystamy testy nieparametryczne dla zmiennych powiązanych.
Jako pierwszy zastosujemy test znaków. Test ten, jak sama nazwa wskazuje, oparty jest na znakach różnic między kolejnymi parami wyników (czy są ujemne, czy dodatnie). Otrzymamy ustaloną liczbę wyników w jednym zbiorze, które są mniejsze od swych odpowiedników w drugim zbiorze oraz liczbę wyników, które są większe. Tym samym dowiadujemy się, ile danych zostało "przesuniętych" w jednym kierunku w naszym eksperymencie. Gdy wszystkie, to w porządku. Test daje wynik istotny. Gdy tak nie jest, to sytuacja przestaje być oczywista. Jednak możemy podać prawdopodobieństwa związane ze wszystkimi proporcjami (wystąpienia znaków +/-), które mogłyby wystąpić. Znając więc prawdopodobieństwo każdej naszej kierunkowej zmiany, możemy ocenić, czy nasze wyniki są istotne.
Podsumowując, test znaków to ustalenie liczby plusów i minusów oraz porównanie ich z wartością teoretyczną podaną w odpowiednich tablicach. Test ten stosujemy więc przede wszystkim dla cech jakościowych. Wystarczy bowiem sprawdzić, że dana jednostka charakteryzuje się obecnością ("+") lub nieobecnością ("-") danego zjawiska. Dla danych mierzalnych nie uwzględniamy wartości różnic, lecz jedynie ich znaki. Różnice o wartości zero są pomijane.
Dalszy opis testów nieparametrycznych przeprowadzimy, posługując się pakietem STATISTICA. Po wprowadzeniu danych i uruchomieniu analizy otrzymujemy arkusz wyników przedstawiony na rysunku 1.
Poszczególne wartości oznaczają:
[1] - nazwy zmiennych
[2] - liczebność grup
[3] - procent liczebności zmiennych, dla których różnica ma wartość ujemną (znak "-")
[4] - wartość testu znaków
[5] - poziom istotności dla testu znaków
Jak widać w naszym przykładzie hipotezę zerową odrzucamy na poziomie istotności p = 0,033895, co oznacza, że proponowana dieta istotnie zmniejsza ciężar ciała. Potwierdza to graficznie wykres ramkowy (rys. 2).
Rys. 2. Wykres ramkowy dla danych z przykładu 1
W teście znaków tracimy informację niesioną przez liczbowe wartości różnic. Ta informacja jest w pełni wykorzystywana przez test Wilcoxona. Staje się on więc w tym wypadku testem mocniejszym niż test znaków, jest więc godny uwagi.
Test kolejności par Wilcoxona uwzględnia znak różnic, ich wielkość, jak również ich kolejność (stąd nazwa). Po uporządkowaniu różnic w szereg rosnący przypisujemy im rangi. Następnie osobno sumujemy rangi różnic dodatnich i ujemnych. Mniejsza z otrzymanych sum to wartość testu Wilcoxona, która po porównaniu z odpowiednią wartością teoretyczną w tablicach decyduje o odrzuceniu hipotezy zerowej lub nie.
Zastosowanie testu kolejności par Wilcoxona do danych z naszego przykładu dostarcza następujący arkusz wyników (rys. 3):
Poszczególne wartości oznaczają:
[1] - nazwy zmiennych
[2] - liczebność grup
[3] - wartość testu Wilcoxona dla grup n =<25
[4] - wartość testu Wilcoxona dla grup n >25
[5] - poziom istotności dla testu Wilcoxona
Otrzymane wyniki dla testu Wilcoxona potwierdzają hipotezę, że proponowana dieta istotnie zmniejsza ciężar ciała. Zauważmy, że poziom istotności w przypadku testu Wilcoxona, wynoszący p = 0,002855, jest o wiele niższy niż w przypadku testu znaków.
Jako drugi przykład rozważmy miana przeciwciał przed szczepieniem i po szczepieniu. Wyniki badań dla 9 pacjentów zawiera tabela 2.
Tabela 2
miano przeciwciał przed |
65 |
45 |
52 |
66 |
49 |
73 |
66 |
55 |
75 |
miano przeciwciał po |
68 |
47 |
59 |
67 |
48 |
77 |
66 |
59 |
75 |
Chcemy na podstawie tych danych dokonać oceny skuteczności szczepienia. Jak pokazują poniższe arkusze wyników, test znaków daje wynik nieistotny (p = 0,131), podczas gdy test kolejności par Wilcoxona okazuje się istotny (p = 0,0346) - (rys 4.).
Zatem w tym ostatnim przypadku możemy odrzucić hipotezę zerową, że szczepienie nie miało wpływu na miano przeciwciał.
Nasz przykład raz jeszcze potwierdza, że test Wilcoxona jest z tych dwóch mocniejszy, ponieważ przy wartościach istotnie różnych, ale o tym samym rozstępie, odrzuca hipotezę zerową, podczas gdy test znaków tego nie czyni. Test Wilcoxona jest precyzyjniejszym narzędziem, gdyż używa więcej informacji ("działa" na wartościach z rangowanych różnic).
Skąd mamy wiedzieć, jaki test wybrać?
Zawsze kiedy możemy mówić o różnicach elementów, bardziej pożądany będzie test Wilcoxona. Jednakże na podstawie testu Wilcoxona widać, że czasami możliwe jest otrzymanie nieistotnej różnicy pomiędzy zbiorami danych, gdy jest wiele czynników rosnących (lub malejących), ale różniących się tylko nieznacznie, a pojedynczy duży wynik "w przeciwnym kierunku" decyduje o nieistotności. Zachęca on tym samym badacza do wyciągnięcia wniosku, że dane pochodzą z jednej populacji. Taki pojedynczy wynik nazywamy "samotnikiem". Czy taki pojedynczy, ekstremalnie wielki wynik może być odrzucony podczas analizy? Jeśli jesteśmy całkowicie pewni, że ten w jakiś sposób nietypowy element możemy odrzucić, zróbmy to. Jeśli nie możemy usprawiedliwić tej decyzji, nie róbmy tego, aby nie być posądzonym o naciąganie danych.
Czasami jednak dane mogą być faktycznie wyrażone tylko słownie, jak na przykład ocena dotycząca jakiejś metody - "lepsza", "taka sama", "gorsza". Zawsze kiedy możemy ustalić, że wyniki rosną (lub maleją), ale nie jesteśmy w stanie określić ilościowo tego przyrostu, wówczas test znaków jest jedynym do zastosowania. Test znaków jest zatem narzędziem użytecznym dla wielu typów badań w naukach medycznych, w których gromadzi się dane nieliczbowe.