zadanie 2- regresja liniowa, Statyst. zadania


Sandra Kelcz- sandrakelcz@yahoo.pl

Katarzyna Kędzierawska- katarzyna.kedzierawska@gmail.com

Gr. 2

Ocena: 4

Do budowy modelu regresji liniowej zastosujemy metodę wprowadzania zmiennych objaśniających polegającą na jednoczesnym wprowadzeniu do modelu wszystkich zmiennych objaśniających.

Zmienna GHQ_suma - zmienna objaśniana

Zmienne: SOC, brak_snu, znużenie, BMI - zmienne objaśniające.

Zmienne wprowadzone/usunięte(b)

Model

Zmienne wprowadzone

Zmienne usunięte

Metoda

1

BMI, GHQ_suma, liczba dni bezsennych, znużenie(a)

.

Wprowadzanie

a Wszystkie wyspecyfikowane zmienne zostały wprowadzone.

b Zmienna zależna: GHQ_suma

Formułujemy H0: R2=0

H1: R2>0

Weryfikujemy je opierając się na wynikach analizy wariancji???.

Model - Podsumowanie

Model

R

R-kwadrat

Skorygowane R-kwadrat

Błąd standardowy oszacowania

1

,721(a)

,520

,515

7,3405

a Predyktory: (Stała), BMI, SOC, liczba dni bezsennych, znużenie

Analiza wariancji(b)

Model

Suma kwadratów

df

Średni kwadrat

F

Istotność

1

Regresja

24041,786

4

6010,446

111,547

,000(a)

Reszta

22199,600

412

53,883

Ogółem

46241,386

416

a Predyktory: (Stała), BMI, SOCi, liczba dni bezsennych, znużenie

b Zmienna zależna: GHQ_suma

Współczynniki(a)

Model

Współczynniki niestandaryzowane

Współczynniki standaryzowane

T

Istotność

95% przedział ufności dla B

Korelacje

B

Błąd standardowy

Beta

Dolna granica

Górna granica

Rzędu zerowego

Cząstkowa

Semicząstkowa

1

(Stała)

40,869

4,393

9,303

,000

32,233

49,505

SOC

-,192

,019

-,427

-10,258

,000

-,229

-,155

-,647

-,451

-,350

liczba dni bezsennych

,163

,207

,028

,789

,430

-,243

,569

,172

,039

,027

znużenie

,761

,084

,381

9,115

,000

,597

,926

,627

,410

,311

BMI

,014

,105

,005

,136

,892

-,192

,220

,074

,007

,005

a Zmienna zależna: GHQ_suma

Tabela „analiza wariancji” ujawnia wynik testowania hipotezy:

H0: R2=0

H1: R2>0

Współczynnik determinacji z próby wynosi 0,520. Ponieważ prawdopodobieństwo gdzie? jest mniejsze od 0,0005 to prawdziwy współczynnik determinacji jest istotnie większy od zera. Model w sensie statystycznym jest zatem dopasowany wystarczająco dobrze do danych empirycznych by warto zajmować się oceną poszczególnych współczynników regresji.

Współczynnik determinacji interpretujemy również jako odsetek wariancji zmiennej objaśnianej wyjaśnianej przez zmienne objaśniające. Wartość współczynnika obliczona na podstawie wyniku próby = 0,520 czyli 52% zmienności GHQ_suma jest wyjaśniane przez zespół zmiennych SOC, brak_snu, znużenie, BMI. Oznacza to, że 48% zmienności GHQ_suma jest wyjaśniane przez czynniki których nie uwzględniłyśmy w modelu.

H0: Bi=0 i=0,1,…,k

H1: Bi≠0

Prawdopodobieństwo w kolumnie Istotność dla współczynnika:

Liczba dni bezsennych = 0,430 jest większe niż dopuszczalny poziom istotności. Nie widzimy podstaw do odrzucenia H0. Zatem nie istnieją przesłanki dotyczące liniowego związku liczby dni bezsennych ze zmienną GHQ_suma. Tym samym traktujemy tę zmienną jako nieistotną statystycznie dla tego modelu.

Prawdopodobieństwo w kolumnie Istotność dla współczynnika:

BMI=0,892 jest większe niż dopuszczalny poziom istotności. Nie widzimy podstaw do odrzucenia H0. Zatem nie istnieją przesłanki dotyczące liniowego związku BMI ze zmienną GHQ_suma. Tym samym traktujemy tę zmienną jako nieistotną statystycznie dla tego modelu.

Prawdopodobieństwa w kolumnie Istotność dla współczynników:

SOC, znużenie są mniejsze od 0,0005 co oznacza iż te współczynniki regresji są różne od zera.

Odrzucamy hipotezę zerową i przyjmujemy alternatywną. Zmienne te mogą być związane liniowo ze zmienną GHQ_suma.

Warość??? współczynnika B pokazuje nam tez kierunkowość i siłę zależności jmiędzy zmiennymi objaśniającymi a zmienną objaśnianą, Jednak przed tą oceną w związku z tym, że 2 zmienne uzyskały prawdopodobieństwo większe od 0,05 postanawiamy zbudować nowy model regresji liniowej wyłączający zmienne nie związane z zmienną objaśnianą. W tym celu posłużymy się metodą krokową:

Regresja

[ZbiórDanych1] C:\Documents and Settings\Kasia\Moje dokumenty\Downloads\mundur05.sav

Zmienne wprowadzone/usunięte(a)

Model

Zmienne wprowadzone

Zmienne usunięte

Metoda

1

SOC

.

Krokowa (Kryterium: Prawdopodobieństwo F-wprowadzenia <= ,050, Prawdopodobieństwo F-usunięcia >= ,051).

2

znuzenie

.

Krokowa (Kryterium: Prawdopodobieństwo F-wprowadzenia <= ,050, Prawdopodobieństwo F-usunięcia >= ,051).

a Zmienna zależna: GHQ_suma

Model - Podsumowanie

Model

R

R-kwadrat

Skorygowane R-kwadrat

Błąd standardowy oszacowania

1

,647(a)

,419

,417

8,0481

2

,721(b)

,519

,517

7,3283

a Predyktory: (Stała), SOC

b Predyktory: (Stała), SOC, znuzenie

Analiza wariancji(c)

Model

Suma kwadratów

df

Średni kwadrat

F

Istotność

1

Regresja

19361,338

1

19361,338

298,919

,000(a)

Reszta

26880,048

415

64,771

Ogółem

46241,386

416

2

Regresja

24008,030

2

12004,015

223,523

,000(b)

Reszta

22233,356

414

53,704

Ogółem

46241,386

416

a Predyktory: (Stała), SOC

b Predyktory: (Stała), SOC, znuzenie

c Zmienna zależna: GHQ_suma

Współczynniki(a)

Model

Współczynniki niestandaryzowane

Współczynniki standaryzowane

t

Istotność

Korelacje

B

Błąd standardowy

Beta

Rzędu zerowego

Cząstkowa

Semicząstkowa

1

(Stała)

63,179

2,469

25,588

,000

SOC

-,291

,017

-,647

-17,289

,000

-,647

-,647

-,647

2

(Stała)

41,856

3,211

13,036

,000

SOC

-,194

,019

-,430

-10,401

,000

-,647

-,455

-,354

znuzenie

,769

,083

,384

9,302

,000

,627

,416

,317

a Zmienna zależna: GHQ_suma

Zmienne wykluczone(c)

Model

Beta w modelu

t

Istotność

Korelacja cząstkowa

Statystyki współliniowości

Tolerancja

1

znuzenie

,384(a)

9,302

,000

,416

,680

BMI

,028(a)

,750

,453

,037

,995

liczba dni bezsennych

,058(a)

1,536

,125

,075

,968

2

BMI

,002(b)

,061

,951

,003

,988

liczba dni bezsennych

,027(b)

,781

,435

,038

,959

a Predyktory w modelu: (Stała), SOC

b Predyktory w modelu: (Stała), SOC, znuzenie

c Zmienna zależna: GHQ_suma

W tym modelu wynik testowania hipotezy:

H0: R2=0

H1: R2>0

przynosi taki sam rezultat jak poprzednio (istotność??? w tabeli „Analiza wariancji” jest mniejsza od 0,05), więc ten model również jest wystarczająco dopasowany do danych empirycznych.

Aby sprawdzić kierunkowowść i siłę zależnosći mędzy zmiennymi objaśniającymi a zmienną objaśniana analizujemy dla wartości tych zmiennych w kolumnie B (współczynniki niestandaryzowane)

SOC

B1= -0,194

W w związku z czym wraz ze wzrostem wartości zmiennej „SOC” o 1 punkt ocena GHQ_suma maleje średnio o 0,194 punktu, przy założeniu, że pozostałe czynniki nie ulegną zmianie.

Znużenie:

B2= 0,769

W w związku z czym wraz ze wzrostem wartości zmiennej „znuzenie” o 1 punkt ocena GHQ_suma rośnie średnio o 0,769 punktu, przy założeniu, że pozostałe czynniki nie ulegną zmianie.

W tabeli „Współczynniki” zostały nam już tylko zmienne, których współczynniki regresji są istotnie różne od zera (SOC, znużenie).

Wobec tego jesteśmy już w stanie zbudować równanie, które opisuje zależność miedzy zmienną objaśnianą (GHQ_suma) a zmiennymi objaśniającymi (SOC, znużenie):

GHQ_suma= 41,856-0,194 ∙ SOC + 0,769 ∙ znużenie

Do czego nam takie równanie?



Wyszukiwarka

Podobne podstrony:
06.regresja liniowa, STATYSTYKA
Algorytm analizy korelacji i regresji liniowej, Statystyka opisowa
06.regresja liniowa, STATYSTYKA
statystyka, Korelacja i regresja liniowa, Korelacja i regresja liniowa
Statystyka i demografia Regresja liniowa 2011 2012 Kubiczek
Regresja liniowa dwoch zmiennych, materiały z roku 2011-2012, Semestr II, Statystyka opisowa - ćwicz
Regresja liniowa, Płyta farmacja Bydgoszcz, statystyka, pozostałe
L4 regresja liniowa klucz (2)
3 Istotność parametrów modelu regresji liniowej
3-Estymacja parametrów modelu regresji liniowej, # Studia #, Ekonometria
11 regresja liniowa bis, Wariancja empirycznych współczynników a i b regresji liniowej
Estymacja parametrów modelu regresji liniowej 2
regresje i zaleĹĽnosci statystyczne, Twierdzenia statystyczne dotycz˙ce zale˙no˙ci mi˙dzy zmienymi s

więcej podobnych podstron