Otwórz plik: Dane o zatrudnieniu.sav. Metodą regresji będziemy sprawdzać czy predykatory:
- Wykształcenie (w latach nauki) – X1
- Staż pracy (miesiące) – X2
- Poprzednie zatrudnienie (miesiące) – X3
-Początkowe wynagrodzenie – X4
różnicują zmienną zależną: Bieżące wynagrodzenie. - Y
I. Wybierz :Analiza – regresja – liniowa.
1. Wprowadzamy zmienną zależną (Y) i zmienne niezależne(X1, X2….) 2. W statystykach dodatkowo zaznaczamy:
- zmiana R kwadrat
- korelacje semicząstkowe i cząstkowe
3. Wybieramy metodę : WPROWADZANIA.
4. OK
II. Sprawdzamy, czy predykatory wywołują istotną zmianę zmiennej zależnej:
Analiza wariancji(b)
Suma
Średni
Model
kwadratów
df
kwadrat
F
Istotność
1
Regresja
1117799195
27944979
4
501.450
.000(a)
24.267
881.067
Reszta
2613657591
55728306.
469
2.074
849
Ogółem
1379164954
473
36.340
a Predyktory: (Stała), Początkowe wynagrodzenie, Staż pracy (miesiące), Poprzednie zatrudnienie (miesiące), Wykształcenie (w latach nauki)
b Zmienna zależna: Bieżące wynagrodzenie
Istotność dla F (mniejsza od 0.05) pozwala stwierdzić, iż predykatory wywołują istotną zmianę Y
III. Sprawdzamy, jaki procent zmiennej Y wyjaśniają zmienne niezależne: Model - Podsumowanie
Statystyki zmiany
Błąd
Skorygowane
standardowy
Zmiana R-
Istotność
Model
R
R-kwadrat
R-kwadrat
oszacowania
kwadrat
Zmiana F
df1
df2
zmiany F
1
.900(a)
.810
.809
$7,465.139
.810
501.450
4
469
a Predyktory: (Stała), Początkowe wynagrodzenie, Staż pracy (miesiące), Poprzednie zatrudnienie (miesiące), Wykształcenie (w latach nauki)
R-kwadrat wynosi 0,81 (81 %) Dla porównania R kwadrat w kilku modelach dobrze jest użyć miary Skorygowane R Kwadrat, który bierze pod uwagę liczbę użytych predykatorów.
IV Ustalamy czy wszystkie predykatory wywołują istotną zmianę Y.
Współczynniki(a)
Współczynniki
Współczynniki
standaryzowan
Model
niestandaryzowane
e
t
Istotność
Błąd
Rzędu
B
standardowy
Beta
zerowego
Cząstkowa
1
(Stała)
-16149.671
3255.470
-4.961
.000
Staż pracy (miesiące)
161.486
34.246
.095
4.715
.000
.084
Poprzednie zatrudnienie
(miesiące)
-17.303
3.528
-.106
-4.904
.000
-.097
Wykształcenie (w latach
nauki)
669.914
165.596
.113
4.045
.000
.661
Początkowe
wynagrodzenie
1.768
.059
.815
30.111
.000
.880
Istotność dla testu t dla poszczególnych predykatorów pozwala stwierdzić, które z nich wywołują istotną zmianę poszczególnych X. W naszym przykładzie wszystkie predykatory
„działają” w modelu (wywołują istotną zmianę zmiennej zależnej Y).
V Wyznaczamy równanie regresji.
Na podstawie niestandaryzowanych współczynników B wyznaczamy równanie regresji wg wzoru:
Y = b1X1 + b2X2 + b3X3 + b4X4 + a
W naszym przykładzie ma ono postać:
Y= 161.486 X1 -17.303 X2 + 669.914 X3 + 1.768 X4 - 16149.671
VI. Porównujemy korelację rzędu zerowego, korelację cząstkową i semicząstkową.
Współczynniki(a)
Współczynniki
Model
niestandaryzowane
Korelacje
Błąd
Rzędu
Semicząst
B
standardowy
zerowego
Cząstkowa
kowa
1
(Stała)
-16149.671
3255.470
Staż pracy (miesiące)
161.486
34.246
.084
.213
.095
Poprzednie zatrudnienie
(miesiące)
-17.303
3.528
-.097
-.221
-.099
Wykształcenie (w latach
nauki)
669.914
165.596
.661
.184
.081
Początkowe
wynagrodzenie
1.768
.059
.880
.812
.605
a Zmienna zależna: Bieżące wynagrodzenie
Korelacja rzędu zerowego . To po prostu współczynnik r Pearsona. Podniesiony do kwadratu wskazuje na część wariancji wyjaśnianej przez dany predykator (samodzielnie, bądź wspólnie z innymi predykatorami).
Korelacja cząstkowa. Korelacja między dwiema zmiennymi pozostająca po uwzględnieniu wpływu innej zmiennej (jednej lub większej ilości).
Korelacja semicząstkowa (lub częściowa). Korelacja semicząstkowa lub częściowa jest podobna do korelacji cząstkowej. Podobnie jak współczynnik korelacji cząstkowej stanowi ona miarę skorelowania dwóch zmiennych jaka pozostaje po uwzględnieniu (tzn. wyeliminowaniu) wpływów jednej lub wielu innych predyktorów. Współczynnik korelacji semicząstkowej lub częściowej jest lepszym wskaźnikiem "faktycznego oddziaływania" predyktora ponieważ zostaje wyskalowany (tzn. odniesiony do) całkowitej zmienności zmiennej zależnej (odpowiedzi).
VII. Wybierz :Analiza – regresja – liniowa.
3. Wprowadzamy zmienną zależną (Y) i zmienne niezależne(X1, X2….) 4. W statystykach dodatkowo zaznaczamy:
- zmiana R kwadrat
- korelacje semicząstkowe i cząstkowe
3. Wybieramy metodę : KROKOWA
4. OK.
W metodzie krokowej do modelu predykatory wprowadzane są po kolei (począwszy od najsilniej związanego ze zmienną zależną). Zmienne niezależne, które nie wywołują istotnej zmiany zmiennej zależnej ZOSTAJĄ WYKLUCZONE Z MODELU.
Model - Podsumowanie
Statystyki zmiany
Błąd
Skorygowane
standardowy
Zmiana R-
Istotność
Model
R
R-kwadrat
R-kwadrat
oszacowania
kwadrat
Zmiana F
df1
df2
zmiany F
1
.880(a)
.775
.774
$8,115.356
.775
1622.118
1
472
2
.891(b)
.793
.793
$7,776.652
.019
43.010
1
471
3
.897(c)
.804
.803
$7,586.187
.010
24.948
1
470
4
.900(d)
.810
.809
$7,465.139
.007
16.366
1
469
a Predyktory: (Stała), Początkowe wynagrodzenie b Predyktory: (Stała), Początkowe wynagrodzenie, Poprzednie zatrudnienie (miesiące) c Predyktory: (Stała), Początkowe wynagrodzenie, Poprzednie zatrudnienie (miesiące), Staż pracy (miesiące) d Predyktory: (Stała), Początkowe wynagrodzenie, Poprzednie zatrudnienie (miesiące), Staż pracy (miesiące), Wykształcenie (w latach nauki)
Omów trzeci model analizy krokowej:
- Jakie zmienne zostały uwzględnione w tym modelu ?
- Jaki procent wariancji zmiennej Y wyjaśniają wszystkie uwzględnione predykatory ?
- Jaką postać ma równanie regresji ?
- Jaki procent wariancji zmiennej Y wyjaśnia samodzielnie predykator „Staż pracy”, a jaki procent po wyłączeniu wpływu innych zmiennych ?