Otwórz plik: Dane o zatrudnieniu.sav. Metodą regresji będziemy sprawdzać czy predykatory:

- Wykształcenie (w latach nauki) – X1

- Staż pracy (miesiące) – X2

- Poprzednie zatrudnienie (miesiące) – X3

-Początkowe wynagrodzenie – X4

różnicują zmienną zależną: Bieżące wynagrodzenie. - Y

I. Wybierz :Analiza – regresja – liniowa.

1. Wprowadzamy zmienną zależną (Y) i zmienne niezależne(X1, X2….) 2. W statystykach dodatkowo zaznaczamy:

- zmiana R kwadrat

- korelacje semicząstkowe i cząstkowe

3. Wybieramy metodę : WPROWADZANIA.

4. OK

II. Sprawdzamy, czy predykatory wywołują istotną zmianę zmiennej zależnej:

Analiza wariancji(b)

Suma

Średni

Model

kwadratów

df

kwadrat

F

Istotność

1

Regresja

1117799195

27944979

4

501.450

.000(a)

24.267

881.067

Reszta

2613657591

55728306.

469

2.074

849

Ogółem

1379164954

473

36.340

a Predyktory: (Stała), Początkowe wynagrodzenie, Staż pracy (miesiące), Poprzednie zatrudnienie (miesiące), Wykształcenie (w latach nauki)

b Zmienna zależna: Bieżące wynagrodzenie

Istotność dla F (mniejsza od 0.05) pozwala stwierdzić, iż predykatory wywołują istotną zmianę Y

III. Sprawdzamy, jaki procent zmiennej Y wyjaśniają zmienne niezależne: Model - Podsumowanie

Statystyki zmiany

Błąd

Skorygowane

standardowy

Zmiana R-

Istotność

Model

R

R-kwadrat

R-kwadrat

oszacowania

kwadrat

Zmiana F

df1

df2

zmiany F

1

.900(a)

.810

.809

$7,465.139

.810

501.450

4

469

a Predyktory: (Stała), Początkowe wynagrodzenie, Staż pracy (miesiące), Poprzednie zatrudnienie (miesiące), Wykształcenie (w latach nauki)

R-kwadrat wynosi 0,81 (81 %) Dla porównania R kwadrat w kilku modelach dobrze jest użyć miary Skorygowane R Kwadrat, który bierze pod uwagę liczbę użytych predykatorów.

IV Ustalamy czy wszystkie predykatory wywołują istotną zmianę Y.

Współczynniki(a)

Współczynniki

Współczynniki

standaryzowan

Model

niestandaryzowane

e

t

Istotność

Błąd

Rzędu

B

standardowy

Beta

zerowego

Cząstkowa

1

(Stała)

-16149.671

3255.470

-4.961

.000

Staż pracy (miesiące)

161.486

34.246

.095

4.715

.000

.084

Poprzednie zatrudnienie

(miesiące)

-17.303

3.528

-.106

-4.904

.000

-.097

Wykształcenie (w latach

nauki)

669.914

165.596

.113

4.045

.000

.661

Początkowe

wynagrodzenie

1.768

.059

.815

30.111

.000

.880

Istotność dla testu t dla poszczególnych predykatorów pozwala stwierdzić, które z nich wywołują istotną zmianę poszczególnych X. W naszym przykładzie wszystkie predykatory

„działają” w modelu (wywołują istotną zmianę zmiennej zależnej Y).

V Wyznaczamy równanie regresji.

Na podstawie niestandaryzowanych współczynników B wyznaczamy równanie regresji wg wzoru:

Y = b1X1 + b2X2 + b3X3 + b4X4 + a

W naszym przykładzie ma ono postać:

Y= 161.486 X1 -17.303 X2 + 669.914 X3 + 1.768 X4 - 16149.671

VI. Porównujemy korelację rzędu zerowego, korelację cząstkową i semicząstkową.

Współczynniki(a)

Współczynniki

Model

niestandaryzowane

Korelacje

Błąd

Rzędu

Semicząst

B

standardowy

zerowego

Cząstkowa

kowa

1

(Stała)

-16149.671

3255.470

Staż pracy (miesiące)

161.486

34.246

.084

.213

.095

Poprzednie zatrudnienie

(miesiące)

-17.303

3.528

-.097

-.221

-.099

Wykształcenie (w latach

nauki)

669.914

165.596

.661

.184

.081

Początkowe

wynagrodzenie

1.768

.059

.880

.812

.605

a Zmienna zależna: Bieżące wynagrodzenie

Korelacja rzędu zerowego . To po prostu współczynnik r Pearsona. Podniesiony do kwadratu wskazuje na część wariancji wyjaśnianej przez dany predykator (samodzielnie, bądź wspólnie z innymi predykatorami).

Korelacja cząstkowa. Korelacja między dwiema zmiennymi pozostająca po uwzględnieniu wpływu innej zmiennej (jednej lub większej ilości).

Korelacja semicząstkowa (lub częściowa). Korelacja semicząstkowa lub częściowa jest podobna do korelacji cząstkowej. Podobnie jak współczynnik korelacji cząstkowej stanowi ona miarę skorelowania dwóch zmiennych jaka pozostaje po uwzględnieniu (tzn. wyeliminowaniu) wpływów jednej lub wielu innych predyktorów. Współczynnik korelacji semicząstkowej lub częściowej jest lepszym wskaźnikiem "faktycznego oddziaływania" predyktora ponieważ zostaje wyskalowany (tzn. odniesiony do) całkowitej zmienności zmiennej zależnej (odpowiedzi).

VII. Wybierz :Analiza – regresja – liniowa.

3. Wprowadzamy zmienną zależną (Y) i zmienne niezależne(X1, X2….) 4. W statystykach dodatkowo zaznaczamy:

- zmiana R kwadrat

- korelacje semicząstkowe i cząstkowe

3. Wybieramy metodę : KROKOWA

4. OK.

W metodzie krokowej do modelu predykatory wprowadzane są po kolei (począwszy od najsilniej związanego ze zmienną zależną). Zmienne niezależne, które nie wywołują istotnej zmiany zmiennej zależnej ZOSTAJĄ WYKLUCZONE Z MODELU.

Model - Podsumowanie

Statystyki zmiany

Błąd

Skorygowane

standardowy

Zmiana R-

Istotność

Model

R

R-kwadrat

R-kwadrat

oszacowania

kwadrat

Zmiana F

df1

df2

zmiany F

1

.880(a)

.775

.774

$8,115.356

.775

1622.118

1

472

2

.891(b)

.793

.793

$7,776.652

.019

43.010

1

471

3

.897(c)

.804

.803

$7,586.187

.010

24.948

1

470

4

.900(d)

.810

.809

$7,465.139

.007

16.366

1

469

a Predyktory: (Stała), Początkowe wynagrodzenie b Predyktory: (Stała), Początkowe wynagrodzenie, Poprzednie zatrudnienie (miesiące) c Predyktory: (Stała), Początkowe wynagrodzenie, Poprzednie zatrudnienie (miesiące), Staż pracy (miesiące) d Predyktory: (Stała), Początkowe wynagrodzenie, Poprzednie zatrudnienie (miesiące), Staż pracy (miesiące), Wykształcenie (w latach nauki)

Omów trzeci model analizy krokowej:

- Jakie zmienne zostały uwzględnione w tym modelu ?

- Jaki procent wariancji zmiennej Y wyjaśniają wszystkie uwzględnione predykatory ?

- Jaką postać ma równanie regresji ?

- Jaki procent wariancji zmiennej Y wyjaśnia samodzielnie predykator „Staż pracy”, a jaki procent po wyłączeniu wpływu innych zmiennych ?