162
Wybrane procedury statystyczne
Kontrasty postępujących różnic. Kontrast ?ty porównuj),. pierwsze i średnich z pozostałymi
ais
■M
Tabela 3.4: Wybrane funkcje do tworzenia kontrastów contr.sdif(MASS)
... - 1 pk.
Li = (fc - i)px + .. + (fc - i)m - i m+i Współczynniki (01,02,03,04) dia 4 grup: -3111 -2-2 2 2 -1 -1 -1 3
contr. treatment (stats) |
Kontrasty dla wszystkich średnich z wyjątkiem pierwszej (pierwsza średnia traktowana jest jako wartość bazowa) Li = pi. Współczynniki (01,02,03,04) dla 4 grup: 0 10 0 0 0 10 0 0 0 1 |
contr.sum(stats) |
Kontrasty z porównaniem do ostał niego czynnika. Wszystkie średnie są porównywane z ostatnią Li = Pi - Pk- Współczynniki (01,02,03,04) dla 4 grup: 10 0-1 0 10-1 0 0 1-1 |
contr.helmert(stats) |
Kontrasty Helmerta. Kontrast «ty porównuje średnią z i pierwszych średnich ze średnią 2 + 1, Li = pi + .. + pi - ipi+i- Współczynniki (01,02,03,04) dla 4 grup: -110 0 -1-120 -1 -1 -1 3 |
contr.poły(stats) |
Kontrasty na bazie ortogonalnych wielomianów. Przykładowe współczynniki (01,02,03,04) dla 4 grup: •L -0.671 -0.224 0.224 0.671 •Q 0.500 -0.500 -0.500 0.500 .C -0.224 0.671 -0.671 0.224 |
contr.SAS(stats) |
Kontrasty identyczne z contr .treatment(stats), z tą róż-’ nicą, że stosowane jest kodowanie SASa. Współczynniki, (ci,02,03,04) dla 4 grup: 10 0 0 0 10 0 0 0 10 |
4 |
........-.............. -1 |
W analizie jednokierunkowej badaliśmy średnie wartości cechy Y dla różnych poziomów jednej zmiennej jakościowej. W analizie, wielokierunkowej badamy średnie wartości danej cechy w różnych kombinacjach czynników dla dwóch lub większej liczby zmiennych jakościowych. W tej sytuacji rozważać możemy model addytywny (bez interakcji) lub model z interakcją/interakcjami.
3.4.3.1 Model addytywny w analizie wariancji
G<lV chcemy sprawdzić, czy średnia wartość cechy Y różni sig pomiędzy populacjami określonymi przez poziomy dla dwóch lub większej liczby zmiennych jakościowych, to oczywiście możemy dla każdej ze zmiennych objaśniających przeprowadzić osobną analizę jednoczy unikową, 'lak właśnie czyniliśmy w poprzednim podrozdziale, efekty typu budynku i efekt dzielnicy ocenialiśmy niezależnie. W takim postępowaniu tracimy dodatkowe informacje o zależnościach pomiędzy zmiennymi objaśniającymi- Dlatego też znacznie lepiej wnioskować o różnicach w oczekiwanych wartościach zmiennej Y uwzględniając obie (lub więcej) zmienne w jednym modelu. Oczywiście w granicach rozsądku, zmiennych nie powinno być też zbyt dużo. Wraz ze wzrostem liczby zmiennych maleje dokładność oceny efektów w modelu. Dobrze jest zapewnić przynajmniej około 30 obserwacji na każdą kombinację czynników rozważanych zmiennych.
Nawiązując do równania 3.4 rodziną rozkładów T jest rodzina rozkładów normalnych o wariancji o2. Dla dwukierunkowej analizy wariancji wartość oczekiwaną Y modeluje się następująco
gdzie /i to wartość bazowa, to efekt czynnika a pierwszej zmiennej, a ;«* to efekt czynnika b drugiej zmiennej. Aby istniało jednoznaczne rozwiązanie przyjmuje się, że E„ Ha = 0 i E6 = 0.
Aby sprawdzić, czy efekty różnych czynników oddziałują addytywnie na cechę T, to w formule opisującej model należy zmienne rozdzielić znakiem +. Poniżej zamieszczamy przykład wykonania dwukierunkowej analizy wariancji.
> tt efekt identyczny z: aov(cena~ dzielnica+typ. budynku, data=mieszkania)
> (a3 “ anova(lm(cena"dzielnica+typ.budynku, data = mieszkania)))
Analysis of Variance Tąble
Response: cena
Df Sum Sq Mean Sq F value Pr(>F) dzielnica 2 1.7995e+10 8.9977e+09 5.3397 0.005524 **
typ.budynku 2 2.2719e+10 1.13S9e+10 6.7413 0.001476 **
Residuals 195 3.2858e+ll 1.6850e+09
Signif. codes: 0 '***’ 0.001 0.01 '*> 0.05 *,» 0.1 ‘ ’ 1
> a3[l:2,5] # a teraz wyciągamy z wyniku tylko p-wartości
El] 0.005524071 0.001475884
Te wyniki warto porównać z wynikami z podrozdziału 3.4.2 dla jednokierunkowej analizy wariancji dla obu zmiennych. Podobnie jak poprzednio dla obu zmiennych