11
interaction.plot(dzielnica, typ.budynku, cena, lvd=3)
Wybrane procedury statystyczne
m
Biskupin - |
niski blok - | |
kamienica - | ||
Śródmieście -Krzyki - |
wieżowiec -1 |
dzielnica
Factors
llyHimck 3.21: Wykres efektów plot.design() na przykładzie danych o cenach mieszkań mamy podstawy sądzić, że występują różnice pomiędzy średnimi wartościami Y. Zauważmy, że dla obu zmiennych p-wartość jest mniejsza niż dla testu z rozdziału 3.4.2. Oceny poszczególnych czynników można przedstawić graficznie za pomocą wykresu czynnikowego wygenerowanego przez funkcję plot. design(graphics). Przedstawia ona ocenę addytywnych efektów dla każdego poziomu danej zmiennej. Przykładowe wywołanie poniższego kodu przedstawiamy na rysunku 3.21. Pozioma linia odpowiada średniej wartości cechy cena.
plot.design(data.frame(dzielnica, typ.budynku, cena)) 3.4.3.2 Model z interakcją w analizie wariancji
Nie zawsze dwa czynniki wpływają addytywnie na średnią wartość cechy Y. Do " graficznego porównywania średnich wartości zmiennej objaśnianej Y w zależno-: ści od kombinacji poziomów zmiennych objaśniających wykorzystać można wykres interaction.plot(stats). Efekt przykładowego wywołania poniższych instrukcji przedstawiono na rysunku 3.22.
# czy są interakcje pomiędzy dzielnicą a typem budynku?
Na wykresie narysowanym przez funkcję interaction.plot() możemy sprawdzić, czy wpływ poszczególnych czynników na średnią wartość zmiennej zależnej jest ad-
ANOVA, n'nnvilii /liliowa i logistyczna
165
Rysunek 3.22: Wykres interakcji mterar.tion.plotf) dla danych o cenach mieszkań
dytywny (o addytywności świadczą równolegle krzywe odpowiadające różnym czynnikom), czy też obserwujemy interakcje, czyli sytuację, gdy wypadkowa Wartość cechy nie jest prostym złożeniem efektu każdego z czynników (krzywe na wykresie {przecinają się lub mają istotnie różne nachylenia).
Na rysunku 3.23 przedstawiamy modelowe sytuacje dla zmiennych wpływających addytywnie na cechę zależną i zmiennych wpływających poprzez interakcje. Na lewym wykresie obserwujemy dwie zmienne objaśniające (zbiór danych daneSoc, . zmienne stan cywilny i płeć), które istotnie różnicują średni wiek osób w zbio-: rze danych. Oba czynniki mają wpływ addytywny, proste odpowiadające poziomom zmiennej stan cywilny są równoodległe. Na prawym wykresie przedstawiono wyniki dla innego zbioru danych (zbiór daneO zmienne Niepowodzenia i Węzły. chłonne). W tym przypadku proste się przecinają, co oznacza, że średnie wartości zmiennej Rozmiar. guza różnią się w grupie pacjentek z powodzeniem leczenia i w grupie pa-r cjentck, w której wystąpiła wznowa, jednak ta różnica zależy od wartości zmiennej Wezly.chłonne (czy były przerzuty do węzłów)- W grupie, w której leczenie się powiodło (bez wznowy), guzy u pacjentek bez przerzutów są mniejsze niż u pacjentek ' z przerzutami. W grupie niepowodzeń leczenia (ze wznową) jest odwrotnie.
W sytuacji, gdy spodziewamy się bardziej złożonego niż addytywny wpływu róż-uych zmiennych na cechę Y można wykonać analizę wariancji z interakcją. Nawiązując do równania 3.4 wartość oczekiwaną £(Y|X) modeluje się jako
(3.7)
E(Y\X — (O, 6)) = fl + Ha + Hb + H(ab),
gdzie u to wartość bazowa, p0 to efekt czynnika a, fib to efekt czynnika b, lĄob) to efekt interakcji czynników o i b. Aby istniało jednoznaczne rozwiązanie przyjmuje się dodatkowe ograniczenia Za /t0 = 0, Zk l>b = 0, Za H(«b) = 0 oraz Zb IH«k) = 0.