Sandra Kelcz- sandrakelcz@yahoo.pl
Katarzyna Kędzierawska- katarzyna.kedzierawska@gmail.com
Gr. 2
Ocena: 4
Do budowy modelu regresji liniowej zastosujemy metodę wprowadzania zmiennych objaśniających polegającą na jednoczesnym wprowadzeniu do modelu wszystkich zmiennych objaśniających.
Zmienna GHQ_suma - zmienna objaśniana
Zmienne: SOC, brak_snu, znużenie, BMI - zmienne objaśniające.
Zmienne wprowadzone/usunięte(b)
Model |
Zmienne wprowadzone |
Zmienne usunięte |
Metoda |
1 |
BMI, GHQ_suma, liczba dni bezsennych, znużenie(a) |
. |
Wprowadzanie |
a Wszystkie wyspecyfikowane zmienne zostały wprowadzone.
b Zmienna zależna: GHQ_suma
Formułujemy H0: R2=0
H1: R2>0
Weryfikujemy je opierając się na wynikach analizy wariancji???.
Model - Podsumowanie
Model |
R |
R-kwadrat |
Skorygowane R-kwadrat |
Błąd standardowy oszacowania |
1 |
,721(a) |
,520 |
,515 |
7,3405 |
a Predyktory: (Stała), BMI, SOC, liczba dni bezsennych, znużenie
Analiza wariancji(b)
Model |
|
Suma kwadratów |
df |
Średni kwadrat |
F |
Istotność |
1 |
Regresja |
24041,786 |
4 |
6010,446 |
111,547 |
,000(a) |
|
Reszta |
22199,600 |
412 |
53,883 |
|
|
|
Ogółem |
46241,386 |
416 |
|
|
|
a Predyktory: (Stała), BMI, SOCi, liczba dni bezsennych, znużenie
b Zmienna zależna: GHQ_suma
Współczynniki(a)
Model |
|
Współczynniki niestandaryzowane |
Współczynniki standaryzowane |
T |
Istotność |
95% przedział ufności dla B |
Korelacje |
||||
|
|
B |
Błąd standardowy |
Beta |
|
|
Dolna granica |
Górna granica |
Rzędu zerowego |
Cząstkowa |
Semicząstkowa |
1 |
(Stała) |
40,869 |
4,393 |
|
9,303 |
,000 |
32,233 |
49,505 |
|
|
|
|
SOC |
-,192 |
,019 |
-,427 |
-10,258 |
,000 |
-,229 |
-,155 |
-,647 |
-,451 |
-,350 |
|
liczba dni bezsennych |
,163 |
,207 |
,028 |
,789 |
,430 |
-,243 |
,569 |
,172 |
,039 |
,027 |
|
znużenie |
,761 |
,084 |
,381 |
9,115 |
,000 |
,597 |
,926 |
,627 |
,410 |
,311 |
|
BMI |
,014 |
,105 |
,005 |
,136 |
,892 |
-,192 |
,220 |
,074 |
,007 |
,005 |
a Zmienna zależna: GHQ_suma
Tabela „analiza wariancji” ujawnia wynik testowania hipotezy:
H0: R2=0
H1: R2>0
Współczynnik determinacji z próby wynosi 0,520. Ponieważ prawdopodobieństwo gdzie? jest mniejsze od 0,0005 to prawdziwy współczynnik determinacji jest istotnie większy od zera. Model w sensie statystycznym jest zatem dopasowany wystarczająco dobrze do danych empirycznych by warto zajmować się oceną poszczególnych współczynników regresji.
Współczynnik determinacji interpretujemy również jako odsetek wariancji zmiennej objaśnianej wyjaśnianej przez zmienne objaśniające. Wartość współczynnika obliczona na podstawie wyniku próby = 0,520 czyli 52% zmienności GHQ_suma jest wyjaśniane przez zespół zmiennych SOC, brak_snu, znużenie, BMI. Oznacza to, że 48% zmienności GHQ_suma jest wyjaśniane przez czynniki których nie uwzględniłyśmy w modelu.
H0: Bi=0 i=0,1,…,k
H1: Bi≠0
Prawdopodobieństwo w kolumnie Istotność dla współczynnika:
Liczba dni bezsennych = 0,430 jest większe niż dopuszczalny poziom istotności. Nie widzimy podstaw do odrzucenia H0. Zatem nie istnieją przesłanki dotyczące liniowego związku liczby dni bezsennych ze zmienną GHQ_suma. Tym samym traktujemy tę zmienną jako nieistotną statystycznie dla tego modelu.
Prawdopodobieństwo w kolumnie Istotność dla współczynnika:
BMI=0,892 jest większe niż dopuszczalny poziom istotności. Nie widzimy podstaw do odrzucenia H0. Zatem nie istnieją przesłanki dotyczące liniowego związku BMI ze zmienną GHQ_suma. Tym samym traktujemy tę zmienną jako nieistotną statystycznie dla tego modelu.
Prawdopodobieństwa w kolumnie Istotność dla współczynników:
SOC, znużenie są mniejsze od 0,0005 co oznacza iż te współczynniki regresji są różne od zera.
Odrzucamy hipotezę zerową i przyjmujemy alternatywną. Zmienne te mogą być związane liniowo ze zmienną GHQ_suma.
Warość??? współczynnika B pokazuje nam tez kierunkowość i siłę zależności jmiędzy zmiennymi objaśniającymi a zmienną objaśnianą, Jednak przed tą oceną w związku z tym, że 2 zmienne uzyskały prawdopodobieństwo większe od 0,05 postanawiamy zbudować nowy model regresji liniowej wyłączający zmienne nie związane z zmienną objaśnianą. W tym celu posłużymy się metodą krokową:
Regresja
[ZbiórDanych1] C:\Documents and Settings\Kasia\Moje dokumenty\Downloads\mundur05.sav
Zmienne wprowadzone/usunięte(a)
Model |
Zmienne wprowadzone |
Zmienne usunięte |
Metoda |
1 |
SOC |
. |
Krokowa (Kryterium: Prawdopodobieństwo F-wprowadzenia <= ,050, Prawdopodobieństwo F-usunięcia >= ,051). |
2 |
znuzenie |
. |
Krokowa (Kryterium: Prawdopodobieństwo F-wprowadzenia <= ,050, Prawdopodobieństwo F-usunięcia >= ,051). |
a Zmienna zależna: GHQ_suma
Model - Podsumowanie
Model |
R |
R-kwadrat |
Skorygowane R-kwadrat |
Błąd standardowy oszacowania |
1 |
,647(a) |
,419 |
,417 |
8,0481 |
2 |
,721(b) |
,519 |
,517 |
7,3283 |
a Predyktory: (Stała), SOC
b Predyktory: (Stała), SOC, znuzenie
Analiza wariancji(c)
Model |
|
Suma kwadratów |
df |
Średni kwadrat |
F |
Istotność |
1 |
Regresja |
19361,338 |
1 |
19361,338 |
298,919 |
,000(a) |
|
Reszta |
26880,048 |
415 |
64,771 |
|
|
|
Ogółem |
46241,386 |
416 |
|
|
|
2 |
Regresja |
24008,030 |
2 |
12004,015 |
223,523 |
,000(b) |
|
Reszta |
22233,356 |
414 |
53,704 |
|
|
|
Ogółem |
46241,386 |
416 |
|
|
|
a Predyktory: (Stała), SOC
b Predyktory: (Stała), SOC, znuzenie
c Zmienna zależna: GHQ_suma
Współczynniki(a)
Model |
|
Współczynniki niestandaryzowane |
Współczynniki standaryzowane |
t |
Istotność |
Korelacje |
|||
|
|
B |
Błąd standardowy |
Beta |
|
|
Rzędu zerowego |
Cząstkowa |
Semicząstkowa |
1 |
(Stała) |
63,179 |
2,469 |
|
25,588 |
,000 |
|
|
|
|
SOC |
-,291 |
,017 |
-,647 |
-17,289 |
,000 |
-,647 |
-,647 |
-,647 |
2 |
(Stała) |
41,856 |
3,211 |
|
13,036 |
,000 |
|
|
|
|
SOC |
-,194 |
,019 |
-,430 |
-10,401 |
,000 |
-,647 |
-,455 |
-,354 |
|
znuzenie |
,769 |
,083 |
,384 |
9,302 |
,000 |
,627 |
,416 |
,317 |
a Zmienna zależna: GHQ_suma
Zmienne wykluczone(c)
Model |
|
Beta w modelu |
t |
Istotność |
Korelacja cząstkowa |
Statystyki współliniowości |
|
|
|
|
|
|
Tolerancja |
1 |
znuzenie |
,384(a) |
9,302 |
,000 |
,416 |
,680 |
|
BMI |
,028(a) |
,750 |
,453 |
,037 |
,995 |
|
liczba dni bezsennych |
,058(a) |
1,536 |
,125 |
,075 |
,968 |
2 |
BMI |
,002(b) |
,061 |
,951 |
,003 |
,988 |
|
liczba dni bezsennych |
,027(b) |
,781 |
,435 |
,038 |
,959 |
a Predyktory w modelu: (Stała), SOC
b Predyktory w modelu: (Stała), SOC, znuzenie
c Zmienna zależna: GHQ_suma
W tym modelu wynik testowania hipotezy:
H0: R2=0
H1: R2>0
przynosi taki sam rezultat jak poprzednio (istotność??? w tabeli „Analiza wariancji” jest mniejsza od 0,05), więc ten model również jest wystarczająco dopasowany do danych empirycznych.
Aby sprawdzić kierunkowowść i siłę zależnosći mędzy zmiennymi objaśniającymi a zmienną objaśniana analizujemy dla wartości tych zmiennych w kolumnie B (współczynniki niestandaryzowane)
SOC
B1= -0,194
W w związku z czym wraz ze wzrostem wartości zmiennej „SOC” o 1 punkt ocena GHQ_suma maleje średnio o 0,194 punktu, przy założeniu, że pozostałe czynniki nie ulegną zmianie.
Znużenie:
B2= 0,769
W w związku z czym wraz ze wzrostem wartości zmiennej „znuzenie” o 1 punkt ocena GHQ_suma rośnie średnio o 0,769 punktu, przy założeniu, że pozostałe czynniki nie ulegną zmianie.
W tabeli „Współczynniki” zostały nam już tylko zmienne, których współczynniki regresji są istotnie różne od zera (SOC, znużenie).
Wobec tego jesteśmy już w stanie zbudować równanie, które opisuje zależność miedzy zmienną objaśnianą (GHQ_suma) a zmiennymi objaśniającymi (SOC, znużenie):
GHQ_suma= 41,856-0,194 ∙ SOC + 0,769 ∙ znużenie
Do czego nam takie równanie?