166
Wybrane procedury statystyczne
mezczyzna
piec
Niepowodzenia
Rysunek 3.23: Modelowe przykłady braku interakcji (po lewej stronie) i interakcji pomiędzy czynnikami (po prawej stronie)
W formule opisującej model interakcję pomiędzy zmiennymi oznacza się symbolem : (dwukropek, tylko interakcja) lub symbolem » (gwiazdka, interakcja i efekty addytywne). Więcej o możliwościach definiowania formuł przeczytać można w podrozdziale 2.1.8. W poniższym przykładzie weryfikujemy hipotezę o wpływie dzielnicy i typu budynku na cenę mieszkania. Z tej analizy wynika, że obie zmienne na cenę mieszkania mają wyłącznie wpływ addytywny.
> tt wszystkie poniższe formuły opisują model z efektami addytywnymi
i interakcją
> a4 = anova(lm(cena~dzielnica*typ.budynku, data = mieszkania))
> a4 = anova(lm(cena"(dzielnica+typ.budynku)"2, data = mieszkania))
> (a4 = anova(lm(cena"dzielnica+typ.budynku+dzielnica:typ.budynku, data -
mieszkania)))
Analysis of Variance Table
Response: cena
dzielnica typ.budynku dzielnica:typ.budynku Residuals
Df Sum Sq Mean Sq F value Pr(>F)
2 i.7995e+10 8.9977e+09 5.2461 0.006054 **
2 2.2719e+10 1.1359e+10 4 9.9528e+08 2.4882e+08 191 3.2759e+ll ł.7151e+09
6.6231 0.001656 »» 0.1451 0.964995
Signif. codes: 0 '***' 0.001 ■*»’ 0.01 '*• 0.05
> # wynik funkcji anovaO to ramka danych, sprawdźmy p-wartoSci w modelu
addytywnym i w modelu z sama dzielnicą
> anova(lm(cena~dzielnica+typ.budynku, data * mieszkania))[1:2,5]
Cl] 0.005524071 0.001475884
> anova(lm(cena"dzielnica, data « mieszkania))[1,5]
[1] 0.007294371
ANOVA, regresja liniowa i logistyczna
167
W wielokierunkowej analizie wariancji można również rozpatrywać interakcje wyższych stopni pomiędzy większą liczbą zmiennych.'Jednak w przypadku interakcji wielu zmiennych pojawiają się problemy z interpretacją, przez co takie modele są rzadko rozważane. Podobnie jak dla jednokierunkowej analizy wariancji również dla wielokierunkowej można wykonać testy post koc, np. test HSD Tukeya.
3.4.3.3 Wielowymiarowa analiza wariancji (MANOVA)
W pewnych zagadnieniach zmienna obserwowana opisana jest wielowymiarowym wektorem zmiennych. Przykładowo, jeżeli mierzymy mleczność w trzech kolejnych latach/laktacjach dla różnych ras krów, to zmienna objaśniana określona jest przez wektor trzech liczb/zmiennych, a zmienną grupującą jest rasa krowy. Oczywiście, możemy dla każdej laktacji wykonać osobno analizę wariancji w sposób, który już poznaliśmy. Najczęściej jednak nie interesuje nas to, czy średnia mleczność krowy w drugim roku różni się dla różnych podpopnlacji (tutaj dla różnych ras krów), ale interesuje nas czy mleczność w obserwowanym okresie (a więc wektor trzech zmiennych) różni się w poszczególnych podpopulacjach. W takich sytuacjach należy wykonać wielowymiarową analizę war iancji. Podobnie w medycynie, gdy analizujemy ciśnienie skurczowe i ciśnienie rozkurczowe najczęściej nie chcemy analizować każdego z tych ciśnień osobno, ale razem jako jedną zmienną dwuwymiarową.
Analiza cech wielowymiarowych to bardzo zaawansowane i skomplikowane zagadnienie, wykraczające znacznie poza zakres tej książki, dlatego poniżej przedstawimy jedynie prosty przykład. Do przeprowadzania wielowymiarowej analizy wariancji (MANOVA) można wykorzystać funkcję manova(stats). Poniżej przykład wywołania dla modelu z dwuwymiarową zmienną objaśnianą zawierającą cenę mieszkania i jego powierzchnię.
> # model MANOVA dla dwuwymiarowej zmiennej zależnej
> model = manova(cbind(cena,powierzchnia)“dzielnica+typ.budynku)
> tt korzystamy z przeciążonej funkcji summary()
> summary(model, test“"Hotelling-Lawley")
Df Hotelling-Lawley approx F num Df den Df Pr(>F)
dzielnica 2 0.863 41.658 4 386 < 2.2e-16 ***
typ.budynku 2 0.322 15.560 4 386 8.198e-12 ***
Residuals 195
Signif. codes: 0 '***’ 0.001 '**’ 0.01 0.05 0.1 ‘ ’ 1
Do testowania różnicy w średnich wartościach wielowymiarowych zmiennych wykorzystać można różne testy. W funkcji summary. manova () dostępne są między innymi: test Hotellinga, Roya i Wilksa. Aby wybrać test, który ma być użyty, należy za argument test podać jedną z wartości: "Pillai", "Wilks", "Hotelling-Lawley” lub "Roy". Więcej informacji o analizie MANOVA (dużo bardziej zaawansowanej, niż to wygląda na podstawie powyższego przykładu) znaleźć można w książce [21]. Rozdział czwarty, poświęcony analizie wariancji dostępny jest w Internecie w postaci elektronicznej.