Medycyna Praktyczna - portal dla lekarzy
Porównania zaplanowane
Podstawy statystyki dla prowadzących badania naukowe
Odcinek 17: Porównania zaplanowane
mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof. dr hab. Andrzej Żarnecki)
Data utworzenia: 08.03.2001
Ostatnia modyfikacja: 30.04.2007
Opublikowano w Medycyna Praktyczna 2000/05
Dotychczas po otrzymaniu istotnego wyniku testu ogólnego F w analizie wariancji podejmowaliśmy dalsze kroki, zmierzające do ustalenia, między którymi średnimi występuje znamienna różnica. Wykorzystywaliśmy do tego celu testy po fakcie opisane w poprzednim odcinku.
Możemy jednak postąpić inaczej. Formułujemy na początku szczegółową hipotezę, a następnie staramy się ją zweryfikować. Często też wcześniejsze badania podpowiadają nam określone przypuszczenia (hipotezę zerową) dotyczące wyników eksperymentu. Możemy na przykład chcieć porównać tylko wybrane pary średnich bądź konkretny podzbiór średnich z innym podzbiorem średnich. Mówimy wówczas o porównaniach zaplanowanych.
Istnieje wyraźna różnica między porównaniami zaplanowanymi a porównaniami po fakcie. Te pierwsze (zwane też porównaniami a priori) planuje się bowiem przed przeprowadzeniem eksperymentu. Wynikają one z teorii, na której się opierają nasze eksperymenty. Natomiast porównań po fakcie się nie planuje, lecz dokonuje post hoc. Na ich przeprowadzenie decydujemy się po wstępnej analizie danych, gdy otrzymamy istotny wynik w ogólnym teście F w analizie wariancji.
Celem tego odcinka jest przybliżenie Czytelnikowi bardzo przydatnych metod porównań zaplanowanych. Z oczywistych powodów nie wyczerpuje on całości tematu.
Na początku należy podkreślić, że porównania zaplanowane są zgodne z podstawowymi zasadami testowania statystycznych hipotez. Zasady te nakazują bowiem formułowanie hipotez przed zanalizowaniem danych, na podstawie których się je testuje. Mówiąc pokrótce, porównania zaplanowane umożliwiają nam testowanie statystycznej istotności prognozowanych szczegółowych różnic w przeprowadzanym przez nas eksperymencie. Jest to jeden z ważniejszych i niezastąpionych elementów analizy wariancji.
Te szczegółowe hipotezy testujemy za pomocą analizy kontrastów. Kontrastem nazywamy sumę ważoną średnich:
gdzie jest średnią i-tej grupy, a ci - współczynnikiem (wagą) i-tej średniej. Współczynniki ci spełniają ponadto warunek
. Nie oznacza to jednak, że wszystkie ci są równe zero. Przy ich określaniu stosujemy następujące zasady:
dany kontrast musi zawierać tyle współczynników, ile wynosi liczba poziomów analizowanego czynnika;
średnim, które zostaną pominięte, przypisujemy wartość zero;
średnim, które mają zostać połączone, przypisujemy jednakowe wartości całkowite (np. 1);
średnim, które będą porównywane, przypisujemy wartości całkowite o przeciwnych znakach;
suma wszystkich współczynników musi wynosić zero.
Rozważmy jako przykład jednoczynnikowy eksperyment z 4 grupami o średnich
.
Wówczas kontrast porównujący
przyjmuje postać:
.
Analogicznie kontrast:
służy do porównania średniej
.
Po zdefiniowaniu kontrastu badamy istotność różnicy wyrażonej przez ten kontrast, czyli weryfikujemy hipotezę zerową zakładającą, że kontrast przyjmuje wartość zero (Ho: K = 0). Dokonujemy tego poprzez statystykę F w postaci stosunku 2 średnich kwadratów odchyleń, przy czym średni kwadrat odchyleń, za który odpowiedzialny jest kontrast, umieszczamy w liczniku, a średni kwadrat odchyleń błędu (wewnątrzgrupowy) - w mianowniku.
Moduł ANOVA/MANOVA pakietu STATISTICA posiada niezwykle wygodne narzędzie do przeprowadzania analizy kontrastów, umożliwiające dokonywanie dowolnego typu porównań. Dlatego też konkretne przykłady omówione poniżej zostaną przeanalizowane w tym pakiecie.
Jako pierwszy przykład rozważmy dane z poprzednich artykułów przedstawiające badania czasu krzepnięcia 4 różnymi metodami u 10 losowo wybranych pacjentów (ANOVA jednoczynnikowa).
Przypuśćmy, że chcemy porównać metodę 4. z połączonymi metodami 1. i 2. Musimy zbudować kontrast:
.
Dokonujemy tego po kliknięciu przycisku
w oknie Wyniki ANOVA. Otworzy się wówczas okno Określ kontrasty, w którym wprowadzamy odpowiednie współczynniki kontrastu (rys. 1).
Rys. 1. Okno określania kontrastów
Współczynniki kontrastu dla danego efektu możemy wpisać bezpośrednio lub wykorzystać opcję szybkiego wypełnienia. Zaleca się tę drugą metodę, gdyż pozwala ona szybko wprowadzić współczynniki kontrastu. Na przykład dla naszego kontrastu wystarczy nacisnąć sekwencje przycisków: 1; 1; 0; -2 (patrz rys. 1).
Następnie klikamy OK, aby otrzymać wyniki testu istotności analizowanego kontrastu. Otworzy się wówczas arkusz wyników widoczny na rysunku 2.
Rys. 2. Arkusz wyników istotności pierwszego kontrastu
Kontrast ten okazał się statystycznie istotny (p = 0,00076), więc różnica pomiędzy metodą 4. a 1. i 2. jest istotna.
Natomiast kontrast opisujący porównanie metody 3. z połączonymi metodami 1. i 2., wyrażony wzorem:
okazał się nieistotny. Przedstawia to następny arkusz wyników (rys. 3).
Rys. 3. Arkusz wyników istotności drugiego kontrastu
Zatem różnica pomiędzy metodą 3. a 1. i 2. nie jest statystycznie istotna. Do podobnych wniosków doszliśmy również inną, dłuższą drogą w poprzednich odcinkach.
W wieloczynnikowej analizie wariancji porównania zaplanowane określa się dokładnie w taki sam sposób, jak w jednoczynnikowej ANOVA. Jednak zamiast określania zbioru kontrastów dla jednego czynnika, określamy zbiory kontrastów osobno dla każdego z analizowanych czynników.
Oprócz zasad stosowanych w przypadku określania kontrastów, omówionych wyżej dla analizy jednoczynnikowej, jest także możliwe (a czasami nawet konieczne) wprowadzenie współczynników kontrastu, których suma nie równa się zero. Sytuację taką przedstawia następny przykład.
Załóżmy, że badamy czas działania leku przeciwbólowego w zależności od płci i wieku pacjenta. Wyniki tego eksperymentu dla 24 pacjentów i 3 grup wiekowych przedstawia tabela. Jeśli interesuje nas głównie efekt wpływu płci, nie musimy przeprowadzać "pełnej" analizy wariancji, wystarczy sprawdzić istotność poniższego kontrastu:
1 -1 dla czynnika pierwszego "płeć" (suma współczynników musi wynosić zero)
1 1 1 dla czynnika drugiego "wiek" (suma współczynników nie musi wynosić zero)
Jak widać, wszystkim poziomom czynnika drugiego (grupa wiekowa) przypisano te same wagi, podczas gdy współczynniki kontrastu dla pierwszego czynnika przeciwstawiają mężczyzn kobietom. Kontrast ten okazuje się istotny, co wynika z rysunku 4.
Rys. 4. Arkusz wyników istotności "złożonego" kontrastu
Oznacza to, że istnieje statystycznie istotna różnica pomiędzy średnimi czasu działania leku przeciwbólowego u kobiet i mężczyzn, niezależnie od grupy wiekowej. Jak można się przekonać, wyliczając średnie, lek działa istotnie dłużej u mężczyzn.
Gdybyśmy natomiast chcieli określić wpływ wieku tylko wśród mężczyzn, powinniśmy zbudować kontrasty tak jak na rysunku 5.
Rys. 5. Określanie złożonych kontrastów
Dla czynnika pierwszego (płci) wprowadzono jeden kontrast, który przypisuje zero drugiemu poziomowi tego czynnika, czyli kobietom. Dla czynnika drugiego wprowadzono 2 kontrasty, które będą testowane jednocześnie. Te 2 kontrasty równocześnie porównują wszystkie poziomy drugiego czynnika. Tak więc kobiety zostaną pominięte, a powstała analiza stanowi test efektu wieku tylko dla mężczyzn.
W podobny sposób możemy określać bardziej złożone kontrasty w przypadku układów wyższych rzędów. Zauważmy też, że okno służące do wprowadzania kontrastów zawiera także opcje przeznaczone do określania odpowiednich wstępnie zdefiniowanych kontrastów. Szczególną uwagę należy zwrócić na kontrasty wielomianowe, pozwalające testować występowanie liniowych i nieliniowych trendów w obrębie poziomów odpowiedniego czynnika.
Wybieramy je w oknach dialogowych pokazanych na rysunku 6.
Rys. 6. Okna wyboru predefiniowanych kontrastów
Analiza trendu jest szczególną metodą porównań za pomocą kontrastów. Ma zastosowanie w eksperymentach, w których stawiamy pytania w rodzaju: Czy średnie grupowe znamiennie wzrastają (maleją) liniowo wraz ze wzrostem zmiennej manipulacyjnej? Czy linia prosta dobrze oddaje zmiany średnich grupowych, czy też zauważamy istotne odchylenia od liniowości? Czy zmianę ilustruje krzywa o kształcie litery U (kwadratowa)? Analiza trendu daje odpowiedź na te i podobne pytania.
Na przykład można by zapytać, czy czas działania leku wydłuża się wprost proporcjonalnie do wieku pacjentów i czy zależność ta ma charakter liniowy. Aby odpowiedzieć na to pytanie, wybieramy kontrast wielomian liniowy dla czynnika "wiek". Okazuje się, że kontrast ten jest istotny (p = 0,004899). Pokazuje to arkusz wyników (rys. 7).
Rys. 7. Arkusz wyników dla trendu liniowego
Nasze rozważania potwierdza wykres średnich w poszczególnych grupach wiekowych pokazany na rysunku 8.
Rys. 8. Interakcyjny wykres średnich dla drugiego przykładu
Czytelnikowi jako ćwiczenie pozostawiam sprawdzenie braku istotności tendencji wzrostowej (czasu działania leku) o charakterze kwadratowym.
Więcej informacji znajdą Państwo na stronie http://www.mp.pl
Copyright © 1996 - 2007 Medycyna Praktyczna
3