Moderator – efekt
interakcyjny w regresji
“różne linie dla różnych ludzi”
1
Wprowadzenie
• Występowanie moderatora jest różnie
nazywane
Interakcja (ANOVA)
Zależność multiplikatywna
Zależność nieaddytywna
Moderator występuje wtedy, gdy wpływ jednej
zmiennej zmienia się na różnych poziomach drugiej
2
e.g. Prawdopodobieństwo zranienia w wypadku
samochodowym zależy od:
x
1
: prędkość samochodu
x
2
: czy badany miał zapięte pasy
Ale jeśli prędkość jest niska to zapięcie pasów nie ma
wielkiego znaczenia.
3
Skąd wiemy, że szukamy moderatora?
Podstawy teoretyczne – interesuje
nas kiedy, w jakich warunkach, na
jakiej grupie osób dany efekt
występuje
Występowanie
heteroscedastyczności
4
Jak przeprowadzić analizę
Niezależnie od tego jaki jest poziom pomiaru zmiennych
niezależnych oraz ich liczba należy utworzyć dodatkową
zmienną – składnik interakcyjny
1 krok – przygotowanie predyktorów (centrowanie)
2 krok – utworzenie składnika interakcyjnego
• Dwie zmienne jakościowe
Rekodujemy ich wartości na -1 i 1 (centrujemy) a następnie tworzymy
zmienną mnożąc obie zmienne przez siebie)
• Dwie zmienne ilościowe
Centrujemy (odnosimy wartości zmiennych do ich średnich lub
standaryzujemy a następnie przekształcone zmienne mnożymy przez
siebie)
• Jedna zmienna jakościowa i jedna ilościowa – kombinacja
obu podejść
5
Analiza regresji ze składnikiem interakcyjnym
• Analiza regresji hierarchiczna
W pierwszym kroku wprowadzamy
zmienne niezależne (efekt główne)
W drugim kroku wprowadzamy efekty
interakcyjne
6
Dwa predyktory: jakościowy i
ilościowy
7
Przykład – „depresja”
• Poszukujemy relacji między
natężeniem depresji, płcią oraz
ilością wrażeń. Dane regr_int.sav
• Robimy analizę jednoczynnikową –
liczba wrażeń (wrazenia) a
depresja (depresja)
• Czy istnieje zależność?
• Spróbujmy wykorzystać zmienną
płeć
8
Kroki analizy:
Rekodujemy zmienną „plec” na
dwuwartościową zmienną centrowaną
-1 = mężczyzna
1 = kobieta
Tworzymy składnik interakcyjny
Wykonujemy analizę hierarchiczną
9
Efekty interakcyjne w regresji - przykład
10
Szukamy predyktorów depresji
Czy ilość wrażeń jakich dostarcza życie wiąże
się z poziomem depresji w dwóch grupach
płciowych
Szukamy efektu interakcyjnego tych dwóch
zmiennych: płeć i ilość wrażeń na zmienną
poziom depresji?
Rekodujemy zmienną płeć na
zmienną o wartościach -1 i 1
RECODE
płec
(0=-1) (1=1) INTO
dumy .
EXECUTE .
DESCRIPTIVES
VARIABLES=wrazenia /
SAVE
/STATISTICS=MEAN
STDDEV MIN MAX .
COMPUTE int = dumy *
Zwrazenia .
EXECUTE .
11
Rekodujemy
zmienną
jakościową
Standaryzujem
y zmienną
ilościową
Obliczamy
składnik
interakcyjny
Analiza hierarchiczna
12
W pierwszym kroku
wprowadzamy predyktory
– rodzaj efektów
głównych
W drugim kroku
wprowadzamy składnik
interakcyjny – rodzaj
efektu interakcyjnego
Wydruk 1
13
Zmienne wprowadzone/usunięte
b
dumy,
wrazenia
a
.
Wprowad
zanie
int
a
.
Wprowad
zanie
Model
1
2
Zmienne
wprowadzone
Zmienne
usunięte
Metoda
Wszystkie wyspecyfikowane zmienne
zostały wprowadzone.
a.
Zmienna zależna: depresja
b.
Analiza wariancji
c
8,100
2
4,050
,283
,755
a
529,000
37
14,297
537,100
39
387,232
3
129,077
31,006
,000
b
149,868
36
4,163
537,100
39
Regresja
Reszta
Ogółem
Regresja
Reszta
Ogółem
Model
1
2
Suma
kwadratów
df
Średni
kwadrat
F
Istotność
Predyktory: (Stała), dumy, wrazenia
a.
Predyktory: (Stała), dumy, wrazenia, int
b.
Zmienna zależna: depresja
c.
Pierwszy model jest nieistotny
statystycznie a zatem nie mamy efektów
głównych wprowadzonych predyktorów.
Dopiero drugi model jest istotny
statystycznie a zatem mamy
prawdopodobnie do czynienia z istotną
interakcją
Wydruk 2 – współczynniki
14
Współczynniki
a
11,342
1,963
5,778
,000
,001
,155
,001
,004
,997
,450
,598
,123
,753
,456
11,137
1,059
10,511
,000
,014
,084
,015
,172
,864
,449
,323
,123
1,393
,172
3,119
,327
,840
9,543
,000
(Stała)
wrazenia
dumy
(Stała)
wrazenia
dumy
int
Model
1
2
B
Błąd
standardowy
Współczynniki
niestandaryzowane
Beta
Współczynniki
standaryzowa
ne
t
Istotność
Zmienna zależna: depresja
a.
W drugim modelu mamy istotny statystycznie
współczynnik beta dla zmiennej oznaczającej
składnik interakcyjny. Ten współczynnik nie jest
interpretowalny. Najważniejsze, że jest istotna beta.
Uznajemy, że mamy istotną interakcję
.
Analiza zależności osobno w grupach
płciowych
15
Współczynniki
a,b
20,317
1,904
10,673
,000
-,785
,151
-,775
-5,200
,000
(Stała)
wrazenia
Model
1
B
Błąd
standardowy
Współczynniki
niestandaryzowane
Beta
Współczynniki
standaryzowa
ne
t
Istotność
Zmienna zależna: depresja
a.
Wybrano tylko te obserwacje, dla których płec = kobieta
b.
Współczynniki
a,b
1,956
,894
2,188
,042
,814
,070
,939
11,551
,000
(Stała)
wrazenia
Model
1
B
Błąd
standardowy
Współczynniki
niestandaryzowane
Beta
Współczynniki
standaryzowa
ne
t
Istotność
Zmienna zależna: depresja
a.
Wybrano tylko te obserwacje, dla których płec = mężczyzna
b.
Interpretacja
• Rysujemy wykresy z liniami najlepszego
dopasowania osobno dla obu grup
16
Gdy nie ma interakcji…
• Sprawdzamy, czy ciśnienie
skurczowe krwi zależy od wieku i płci
pacjentów
• Płeć (0-mężczyzna, 1 – kobieta)
• Wiek zmienna ilościowa
17
Wyniki analizy wariancji – dopasowanie
modelu
• Analiza wariancji okazała się istotna
statystyczne F(2, 66)=114,25; p<0,001
• Oznacza to, że model regresji jest dobrze
dopasowany do danych
18
Analiza wariancji
b
18009,779
2 9004,890
114,249
,000
a
5201,989
66
78,818
23211,768
68
Regresja
Reszta
Ogółem
Model
1
Suma
kwadratów
df
Średni
kwadrat
F
Istotność
Predyktory: (Stała), wiek, plec
a.
Zmienna zależna: cisnienie
b.
Współczynniki
• Oba predyktory okazały się istotne statystyczne a więc
wpływają na wartości zmiennej zależnej.
• Silniejszym predyktorem zmiennej zależnej jest wiek.
Zależność ta jest dodatnia i bardzo silna
• Zależność między płcią a ciśnieniem jest ujemna. Aby
zinterpretować tę wartość beta trzeba pamiętać jak
była kodowana zmienne niezależna. 0 to mężczyźni 1 to
kobiety a więc im wyższe wartości tym bardziej osoba
badana jest kobietą. A zatem im bardziej jest kobietą
tym ma niższe wartości ciśnienia.
19
Współczynniki
a
110,287
3,638
30,313
,000
-13,513
2,169
-,364
-6,229
,000
,956
,072
,780
13,366
,000
(Stała)
plec
wiek
Model
1
B
Błąd
standardowy
Współczynniki
niestandaryzowane
Beta
Współczynniki
standaryzowa
ne
t
Istotność
Zmienna zależna: cisnienie
a.
Współczynniki
• Model można opisać za pomocą następującego
równania:
• Ciśnienie=110,29 + 0,96*wiek-13,51* płeć
• Zwiększenie wieku o rok pociąga za sobą niewielki
wzrost ciśnienia o 0,956 jednostki
• W modelu dla mężczyzn otrzymujemy równanie
Ciśnienie=110,29 + 0,96*wiek
• Dla kobiet otrzymujemy równanie Ciśnienie=110,29 +
0,96*wiek – 13,51 = 0,96*wiek +96,77
20
Współczynniki
a
110,287
3,638
30,313
,000
-13,513
2,169
-,364
-6,229
,000
,956
,072
,780
13,366
,000
(Stała)
plec
wiek
Model
1
B
Błąd
standardowy
Współczynniki
niestandaryzowane
Beta
Współczynniki
standaryzowa
ne
t
Istotność
Zmienna zależna: cisnienie
a.
Procent wyjaśnionej
wariancji
• Za pomocą modelu udaje się
wyjaśnić 77% wariancji zmiennej
zależnej
21
Model - Podsumowanie
,881
a
,776
,769
8,87795
Model
1
R
R-kwadrat
Skorygowane
R-kwadrat
Błąd
standardowy
oszacowania
Predyktory: (Stała), wiek, plec
a.
Linie regresji
22
Dwie zmienne ciągłe
23
Badanie perfekcjonizm
• Przewidujemy bezradność
intelektualna na podstawie
wymiarów perfekcjonizmu w
podejściu Frost oraz stylu nauczania
opartego na promowaniu
zrozumienia materiału. Wszystkie
zmienne są mierzone
kwestionariuszowo.
• Dwa ilościowe predyktory i ilościowa
zmienna zależna
Tworzenie składnika
interakcyjnego
Kroki w regresji
hierachicznej
Model ze składnikiem interakcyjnym
Poprawa wyjasniania
Regresja dla poszczególnych
podgrup
Interakcja na wykresie
rozrzutu
Dychotomizacja zmiennych
ciągłych
• Wielu ludzie mając do dyspozycji
zmienne ciągłe sztucznie jest
dychotomizuje, na przykład:
zmienna wiek mierzona w latach
przedstawiana jest w przedziałach
wiekowych
Analiza robi się prostsza ale niestety
traci się istotne informacje i siła
efektów jest słabsza
33
Wady dychotomizacji zmiennych
ciągłych
Maxwell, Delaney (1993)
Wady podziału medianowego:
• Osłabienie siły efektu
• Mniejsza moc analiz
• Zwiększenie się wielkości błędu
pierwszego rodzaju – odrzucenia hipotezy
zerowej, gdy jest ona prawdziwa (alfa)
• Uzyskuje się istotne rezultaty mimo, że
nie ma zależności.
Dane
Wyniki regresji
• Brak efektu głównego zmiennej szybkosc, brak
efektu interakcyjnego.
• Symulacja pokazuje, że dychotomizacja zmiennych
potrafi „wyprodukować” efekty, których nie ma.
Dlaczego pojawia się taki
efekt?
• Predyktory silnie skorelowane: w regresji jeden przejmuje
całkowity wpływ
• W analizie wariancji nie sposób tego zauważyć i uwzględnić w
modelu
• Silne skorelowanie predyktorów powoduje inflację błędu I
rodzaju
DeCoster, Iselin i Galucci
2009
• Peters i Van Voorhis (1940) dzielenie
zmiennyc ciągłych powoduje zmniejszenie
się siły powiązań – dychotomizacja o 20%,
na trzy grupy o 14%.
• Logiczne problemy – osoba, której wynik
znajduje się nieco poniżej punktu odcięcia
nie rożni się bardzo od tej lekko ponad
punktem odcięcia a lądują w dwóch
skrajnych grupach – mniejsze szanse na
detekcję różnic
Decoster, Iselin i Galucci
2009
Czemu badacze dychotomizują?
• Łatwiejsze obliczenia: zwykle otrzymuje się takie same
wyniki, łatwiej zaprezentować wyniki, łatwiejsza
interpretacja interakcji
• Teoria: zidentyfikowane i znaczące teoretycznie punkty
odcięcia, tradycja dychotomizacji
• Rozkład:
– Rozkład nieregularny
– Zmienna teoretyczna mierzona jest tak naprawdę
dychotomiczna
– Obserwowana zmienna ma słabą rzetelność
– Zmienna mierzona obejmuje jedynie skrajne grupy
– Relacja zmiennej niezaleznej i zaleznej jest nieliniowa