ANOVA nieparametryczna


0x01 graphic

ANOVA nieparametryczna

Podstawy statystyki dla prowadzących badania naukowe
Odcinek 20: ANOVA nieparametryczna

mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof. dr hab. med. Andrzej Żarnecki)
Data utworzenia: 05.06.2001
Ostatnia modyfikacja: 30.04.2007
Opublikowano w
Medycyna Praktyczna 2000/09

W poprzednich odcinkach przedstawiłem różne obszary zastosowań analizy wariancji. Ich wykorzystanie do opracowywania wyników badań naukowych jest ograniczone określonymi założeniami (zmienne mierzalne o rozkładzie normalnym, jednorodność zbioru itd.). Warunkiem użycia tych testów jest więc sprawdzenie założeń. Jeśli nie zostały one spełnione, wyciągnięte wnioski nie są w pełni poprawne lub tracą wiarygodność. Testy te stają się też bezużyteczne dla danych jakościowych i danych typu porządkowego. W tych wszystkich przypadkach stosujemy odpowiednie testy nieparametryczne. Do nieparametrycznych odpowiedników analizy wariancji zaliczamy:

test ANOVA rang Kruskala-Wallisa

test ANOVA Friedmana

Każdy z nich ma inny obszar zastosowań.

Test Kruskala-Wallisa jest nieparametrycznym odpowiednikiem jednoczynnikowej analizy wariancji. Za pomocą tego testu sprawdzamy czy n niezależnych próbek pochodzi z tej samej populacji, czy z populacji z taką samą medianą. Poszczególne próbki nie muszą mieć takiej samej liczebności. Maksymalnie możemy porównywać 10 grup.

Test Friedmana jest nieparametrycznym odpowiednikiem jednoczynnikowej analizy wariancji dla pomiarów powtarzanych. Uważany jest za najlepszy nieparametryczny test dla danych tego rodzaju. Najczęściej są to wyniki dla tych samych osób otrzymane w n (n >>2) różnych badaniach lub wyniki równoważnych grup osób. Oba testy są dostępne w pakiecie STATISTICA. Można je znaleźć w module Statystyki nieparametryczne (rys. 1).

0x01 graphic

Rys. 1. Okno wyboru statystyk nieparametrycznych

Najpierw omówię przykład zastosowania testu Kruskala-Wallisa. Załóżmy, że przeprowadzono badania w celu porównania 4 metod leczenia pewnej choroby. Pobrano 5-elementowe próby losowe spośród chorych na daną chorobę, których leczono odpowiednio metodą I, II, III i IV. Wyniki terapii oceniono w specjalnym teście. Wartości testu podane w umownej punktacji przedstawia tabela 1. Podano w niej też rangi nadane wynikom obserwacji. Są one bowiem punktem wyjścia do wyliczenia wartości opisywanych testów. Proces rangowania przebiega następująco:

  1. Porządkujemy rosnąco wartości obu prób.

  2. Zaczynając od wartości najmniejszej (lub największej), przyporządkowujemy poszczególnym obserwacjom kolejne liczby naturalne.

  3. W przypadku wystąpienia wartości jednakowych przyporządkowujemy im tzw. rangi wiązane (średnia arytmetyczna z rang, jakie powinno się im przypisać).

Tabela 1.

Metoda I

Rangi

Metoda II

Rangi

Metoda III

Rangi

Metoda IV

Rangi

57

2

74

20

63

8,5

62

6,5

58

3

66

11,5

68

15

63

8,5

67

13

65

10

59

4,5

66

11,5

50

1

72

19

59

4,5

71

18

62

6,5

68

15

68

15

70

17

 

25,5

 

75,5

 

47,5

 

61,5

W podanym przykładzie chcemy zweryfikować hipotezę, że wszystkie metody leczenia dają jednakowe wyniki. Musimy więc zastosować test sprawdzający hipotezę, że k niezależnych próbek pochodzi z tej samej populacji. Użyjemy w tym celu testu sumy rang Kruskala-Wallisa. Dane powinny być podobnie rozmieszczone jak w analizie wariancji. Jedna zmienna (WYNIKI) zawiera wyniki oceny, a druga (METODA) - kod (numer metody) do jednoznacznej identyfikacji grup. Test uruchamiamy poprzez dwukrotne kliknięcie jego nazwy w oknie Statystyki nieparametryczne (rys. 1).

Po wprowadzeniu danych i ewentualnym ustawieniu potrzebnych opcji klikamy OK, co powoduje wykonanie analizy i pojawienie się (jako pierwszego) okna pokazanego na rysunku 2. Zawiera ono wyniki analizy statystycznej. W 3 kolejnych kolumnach są podane: kod, liczba przypadków, suma rang. Powyżej w nagłówku podana jest wartość testu Kruskala-Wallisa H = 7,841454 i poziom istotności p = 0,0494, który pozwala odrzucić naszą hipotezę zerową. Na podstawie wyników analizy można (na poziomie istotności p = 0,049) wyciągnąć wniosek, że metody leczenia mają statystycznie istotny wpływ na wynik terapii.

0x01 graphic

Rys. 2. Arkusz wyników testu Kruskala-Wallisa

Do uzyskania interpretacji graficznej wykorzystamy przyciski Wykres ramkowy w oknie ANOVA Kruskala-Wallisa i test mediany. Po wybraniu rodzaju "pudełka" i wciśnięciu OK otrzymamy rysunek 3.

0x01 graphic

Rys. 3. Wykres ramkowy dla danych z pierwszego przykładu

W tym samym polu co test Kruskala-Wallisa znajduje się jego mniej dokładna wersja, test mediany. STATISTICA oblicza dla każdej z prób liczbę przypadków, które wypadają powyżej lub poniżej mediany. Następnie wyliczana jest wartość statystyki 2 (p. następny odcinek).

Kolejny przykład posłuży do omówienia testu Friedmana. Zakładamy, że w pewnym eksperymencie medycznym oceniano różnice między średnimi stężeniami kortyzolu w kolejnych etapach leczenia chorych na udar mózgu. Oznaczono w tym celu 4-krotnie (w stałych odstępach czasowych) stężenie kortyzolu (w g/dl) u 17 pacjentów. Otrzymane wyniki są przedstawione w tabeli 2. Chcemy wiedzieć, czy między średnimi stężeniami kortyzolu występują istotne różnice.

Tabela 2.

 

Kortyzol_I

Kortyzol_II

Kortyzol_III

Kortyzol_IV

1

5,4

16,8

6,8

22,5

2

21,2

34

30

18

3

6,4

5,3

21,69

4,3

4

12,5

33

10,8

16,8

5

26,4

26,4

23

20

6

33,3

22,5

27,7

40

7

23,5

13,5

8,8

15,5

8

26,6

11

16,4

27

9

21

12,5

12,5

10,2

10

16,8

8

7,5

6,5

11

15,6

14,6

11,4

14,4

12

40

42,4

31,4

36,6

13

46,6

55,5

34,5

25,5

14

19,8

25,8

23

18,4

15

28,4

23

25,4

10

16

20

25,5

20,1

17,2

17

37,2

24,5

28,8

15,5

Hipoteza zerowa, którą chcemy odrzucić, zakłada że kolumny danych zawierają próby pobrane z tej samej populacji. Dane wprowadzamy kolumnami, tzn. wyniki kolejnych pomiarów są zapisane w nowej kolumnie (nowa zmienna). Po uruchomieniu testu (dwukrotnie klikając nazwę) i wybraniu zmiennych otrzymujemy arkusz wyników (rys. 4).

0x01 graphic

Rys. 4. Arkusz wynikowy testu Friedmana

Zawiera on wyniki analizy statystycznej. W 4 kolejnych kolumnach są podane dla każdej zmiennej: średnia ranga, suma rang i średnia arytmetyczna z odchyleniem standardowym. Powyżej w nagłówku jest podana wartość testu 2 ANOVA = 9,232142 oraz poziom istotności p = 0,02637, który pozwala odrzucić hipotezę zerową.

Na podstawie wyników analizy można (na poziomie istotności p = 0,026) wyciągnąć wniosek, że istnieje statystycznie istotna różnica między średnimi stężenia kortyzolu w kolejnych etapach leczenia. W arkuszu wynikowym mamy również obliczony współczynnik zgodności Kendalla (p. następny odcinek). Jako interpretację graficzną wykorzystamy również wykres ramkowy (skrzynkę z wąsami). Po wybraniu rodzaju "pudełka" i wciśnięciu OK otworzy się okno jak na rysunku 5.

0x01 graphic

Rys. 5. Wykres ramkowy dla danych z drugiego przykładu



Wyszukiwarka

Podobne podstrony:
testy nieparametryczne
ANOVA hierarch odp folia Word2003, Elementy matematyki wyższej
ANOVA - A - powtarzane pomiary (2), SWPS, ROK 2, Metodologia ze statystyką - Brzeziński
ANOVA-AB-interakcja 1, SWPS, ROK 2, Metodologia ze statystyką - Brzeziński
MP 8 hipot nieparam 2
hipotezy nieparametryczne 13 01 Nieznany
ANOVA-AB-interakcja 2, SWPS, ROK 2, Metodologia ze statystyką - Brzeziński
ANOVA ? powtarzanie ?
ANOVA ? powtarzanie omega kwadrat
Rozwiązania z testowania hipotez nieparametrycznych 3, statystyka
ANOVA - A - powtarzanie - df (3), SWPS, ROK 2, Metodologia ze statystyką - Brzeziński
ANOVA A kawa nie kawa
Testy nieparametryczne cz I medycyna praktyczna
ANOVA, Przykłady ANOVA, Problem badawczy
10. Nieparametryczne testy istotności
powtorka ANOVA, 1
15 testy nieparametryczne
Statystyki nieparametryczne, PSYCHOLOGIA, I ROK, semestr II, podstawy metodologii badań psychologicz

więcej podobnych podstron