przewodnikPoPakiecieR7

przewodnikPoPakiecieR7



166


Wybrane procedury statystyczne

mezczyzna

piec

Niepowodzenia


Rysunek 3.23: Modelowe przykłady braku interakcji (po lewej stronie) i interakcji pomiędzy czynnikami (po prawej stronie)

W formule opisującej model interakcję pomiędzy zmiennymi oznacza się symbolem : (dwukropek, tylko interakcja) lub symbolem » (gwiazdka, interakcja i efekty addytywne). Więcej o możliwościach definiowania formuł przeczytać można w podrozdziale 2.1.8. W poniższym przykładzie weryfikujemy hipotezę o wpływie dzielnicy i typu budynku na cenę mieszkania. Z tej analizy wynika, że obie zmienne na cenę mieszkania mają wyłącznie wpływ addytywny.

>    tt wszystkie poniższe formuły opisują model z efektami addytywnymi

i interakcją

>    a4 = anova(lm(cena~dzielnica*typ.budynku, data = mieszkania))

>    a4 = anova(lm(cena"(dzielnica+typ.budynku)"2, data = mieszkania))

>    (a4 = anova(lm(cena"dzielnica+typ.budynku+dzielnica:typ.budynku, data -

mieszkania)))

Analysis of Variance Table

Response: cena

dzielnica typ.budynku dzielnica:typ.budynku Residuals


Df Sum Sq Mean Sq F value Pr(>F)

2 i.7995e+10 8.9977e+09    5.2461    0.006054    **

2 2.2719e+10 1.1359e+10 4 9.9528e+08 2.4882e+08 191 3.2759e+ll ł.7151e+09


6.6231 0.001656 »» 0.1451 0.964995


Signif. codes:    0 '***' 0.001 ■*»’ 0.01 '*• 0.05


0.1



>    # wynik funkcji anovaO to ramka danych, sprawdźmy p-wartoSci w modelu

addytywnym i w modelu z sama dzielnicą

>    anova(lm(cena~dzielnica+typ.budynku, data * mieszkania))[1:2,5]

Cl] 0.005524071 0.001475884

>    anova(lm(cena"dzielnica, data « mieszkania))[1,5]

[1] 0.007294371

ANOVA, regresja liniowa i logistyczna

167


W wielokierunkowej analizie wariancji można również rozpatrywać interakcje wyższych stopni pomiędzy większą liczbą zmiennych.'Jednak w przypadku interakcji wielu zmiennych pojawiają się problemy z interpretacją, przez co takie modele są rzadko rozważane. Podobnie jak dla jednokierunkowej analizy wariancji również dla wielokierunkowej można wykonać testy post koc, np. test HSD Tukeya.

3.4.3.3 Wielowymiarowa analiza wariancji (MANOVA)

W pewnych zagadnieniach zmienna obserwowana opisana jest wielowymiarowym wektorem zmiennych. Przykładowo, jeżeli mierzymy mleczność w trzech kolejnych latach/laktacjach dla różnych ras krów, to zmienna objaśniana określona jest przez wektor trzech liczb/zmiennych, a zmienną grupującą jest rasa krowy. Oczywiście, możemy dla każdej laktacji wykonać osobno analizę wariancji w sposób, który już poznaliśmy. Najczęściej jednak nie interesuje nas to, czy średnia mleczność krowy w drugim roku różni się dla różnych podpopnlacji (tutaj dla różnych ras krów), ale interesuje nas czy mleczność w obserwowanym okresie (a więc wektor trzech zmiennych) różni się w poszczególnych podpopulacjach. W takich sytuacjach należy wykonać wielowymiarową analizę war iancji. Podobnie w medycynie, gdy analizujemy ciśnienie skurczowe i ciśnienie rozkurczowe najczęściej nie chcemy analizować każdego z tych ciśnień osobno, ale razem jako jedną zmienną dwuwymiarową.

Analiza cech wielowymiarowych to bardzo zaawansowane i skomplikowane zagadnienie, wykraczające znacznie poza zakres tej książki, dlatego poniżej przedstawimy jedynie prosty przykład. Do przeprowadzania wielowymiarowej analizy wariancji (MANOVA) można wykorzystać funkcję manova(stats). Poniżej przykład wywołania dla modelu z dwuwymiarową zmienną objaśnianą zawierającą cenę mieszkania i jego powierzchnię.

>    # model MANOVA dla dwuwymiarowej zmiennej zależnej

>    model = manova(cbind(cena,powierzchnia)“dzielnica+typ.budynku)

>    tt korzystamy z przeciążonej funkcji summary()

>    summary(model, test“"Hotelling-Lawley")

Df    Hotelling-Lawley    approx F    num    Df    den Df    Pr(>F)

dzielnica    2    0.863    41.658    4    386    < 2.2e-16    ***

typ.budynku    2    0.322    15.560    4    386    8.198e-12    ***

Residuals 195

Signif. codes:    0 '***’ 0.001 '**’ 0.01    0.05    0.1 ‘ ’ 1

Do testowania różnicy w średnich wartościach wielowymiarowych zmiennych wykorzystać można różne testy. W funkcji summary. manova () dostępne są między innymi: test Hotellinga, Roya i Wilksa. Aby wybrać test, który ma być użyty, należy za argument test podać jedną z wartości: "Pillai", "Wilks", "Hotelling-Lawley” lub "Roy". Więcej informacji o analizie MANOVA (dużo bardziej zaawansowanej, niż to wygląda na podstawie powyższego przykładu) znaleźć można w książce [21]. Rozdział czwarty, poświęcony analizie wariancji dostępny jest w Internecie w postaci elektronicznej.


Wyszukiwarka

Podobne podstrony:
przewodnikPoPakiecieR4 140 Wybrane procedury statystyczne >    U ustawiamy ziarno
przewodnikPoPakiecieR 3 I 178 Wybrane procedury statystyczno W powyższym przykładzie wygląda na to,
przewodnikPoPakiecieR 1 I m 174 Wybrane procedury statystyczne. P So good «dvice here is: Bewarc
przewodnikPoPakiecieR 3 I 178 Wybrane procedury statystyczno W powyższym przykładzie wygląda na to,
75190 przewodnikPoPakiecieR 1 I m 174 Wybrane procedury statystyczne. P So good «dvice here is: B
przewodnikPoPakiecieR 3 I 178 Wybrane procedury statystyczno W powyższym przykładzie wygląda na to,
przewodnikPoPakiecieR7 126 Wybrane procedury statystyczne Statystyki opisowe127 Tabela 3.1: Statyst
przewodnikPoPakiecieR8 128 Wybrane procedury statystyczne 128 Wybrane procedury statystyczne 3.1.1.
przewodnikPoPakiecieR9 130 Wybrane procedury statystyczne Histogram zmiennej wiek Histogram zmienne
przewodnikPoPakiecieR1 134 Wybrane procedury statystyczne Domyślnie, przedział ufności dla med
przewodnikPoPakiecieR3 138 Wybrane procedury statystyczne 138 Wybrane procedury statystyczne Za aut
przewodnikPoPakiecieR4 —■4 140 Wybrane proceduiy statystyczne >    # ustawiamy zi
przewodnikPoPakiecieR5 142 Wybrane procedury statystyczne Funkcje do generowania liczb i wyznaczani

więcej podobnych podstron