Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 15 Wprowadzenie do regresji w

background image

Prosta analiza regresji

Prosta analiza regresji

i

i

wprowadzenie do

wprowadzenie do

regresji wielokrotnej

regresji wielokrotnej

Wykład 8

Wykład 8

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Możliwości przewidywania średnich

Możliwości przewidywania średnich

zarobków, pogody w majowy

zarobków, pogody w majowy

weekend…

weekend…

Zdanie się na wróżkę – nie polecamy

Zdanie się na wróżkę – nie polecamy

Spojrzenie na średni wynik

Spojrzenie na średni wynik

Jeśli mamy zmienną, która jest

Jeśli mamy zmienną, która jest

skorelowana ze zmienną, którą chcemy

skorelowana ze zmienną, którą chcemy

przewidzieć, możemy sprawdzić,

przewidzieć, możemy sprawdzić,

czy przewidywanie będzie lepsze, gdy

czy przewidywanie będzie lepsze, gdy

uwzględnimy predyktor,

uwzględnimy predyktor,

na ile przewidywany wynik będzie różnił się od

na ile przewidywany wynik będzie różnił się od

wyniku, jaki przewidzielibyśmy na podstawie średniej

wyniku, jaki przewidzielibyśmy na podstawie średniej

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

.

.

.

.

.

.

.

.

.

.

.

.

.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Założenia do liniowej analizy

Założenia do liniowej analizy

regresji

regresji

Odpowiednia liczba badanych (co najmniej

Odpowiednia liczba badanych (co najmniej

po 15 osób na 1 predyktor)

po 15 osób na 1 predyktor)

Zmienne z populacji o rozkładzie

Zmienne z populacji o rozkładzie

normalnym (patrzymy na histogramy)

normalnym (patrzymy na histogramy)

Zmienne w liniowym związku z zależną

Zmienne w liniowym związku z zależną

Czasem trzeba wyrzucić outlierów (dewiantów)

Czasem trzeba wyrzucić outlierów (dewiantów)

Najlepiej, jeśli zmienne niezależne

Najlepiej, jeśli zmienne niezależne

(predyktory) są związane tylko z zależną,

(predyktory) są związane tylko z zależną,

a nie ma związku między predyktorami

a nie ma związku między predyktorami

(jeśli jest to oznacza, że tak naprawdę mierzą

(jeśli jest to oznacza, że tak naprawdę mierzą

to samo)

to samo)

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Analiza regresji

Analiza regresji

Pozwala na przewidywanie poziomu

Pozwala na przewidywanie poziomu

jednej zmiennej na podstawie

jednej zmiennej na podstawie

poziomu drugiej zmiennej.

poziomu drugiej zmiennej.

Nie ma sensu przeprowadzać prostej

Nie ma sensu przeprowadzać prostej

analizy regresji, kiedy nie ma

analizy regresji, kiedy nie ma

korelacji między zmiennymi

korelacji między zmiennymi

Im silniejsza korelacja między

Im silniejsza korelacja między

zmiennymi, tym lepsza możliwość

zmiennymi, tym lepsza możliwość

przewidywania

przewidywania

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Y=2x+1

Y=2x+1

Jak wzrasta

Jak wzrasta

wartość X o 1,

wartość X o 1,

wartość Y

wartość Y

wzrasta o 2

wzrasta o 2

Idealna

Idealna

predykcja, w

predykcja, w

większości

większości

przypadków

przypadków

mamy do

mamy do

czynienia z

czynienia z

błędem

błędem

predykcji

predykcji

X

12

11

10

9

8

7

6

5

4

3

2

1

0

Y

24

22

20

18

16

14

12

10

8

6

4

2
0

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Staramy się minimalizować błąd

Staramy się minimalizować błąd

oszacowania

oszacowania

STRES

60

50

40

30

20

10

0

S

Y

M

P

T

O

M

Y

7

6

5

4

3

2

1

0

Reszta

Predykcj
a

stala

nachylenia

ˆ

B

X

B

Y

Chcemy aby Y’ było jak najbliższe

otrzymanym Y

(Y-Y’) błąd oszacowania (reszty)

Szukamy współczynników b i b

0

,

tak, aby linia minimalizowała błąd

oszacowania

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Linia prosta w regresji

Linia prosta w regresji

W analizie regresji poszukujemy

W analizie regresji poszukujemy

takiej linii, która najlepiej pasuje do

takiej linii, która najlepiej pasuje do

naszych danych

naszych danych

Szacujemy współczynniki regresji:

Szacujemy współczynniki regresji:

Współczynnik b – nachylenie tej

Współczynnik b – nachylenie tej

prostej, wielkość zmiany Y, gdy X

prostej, wielkość zmiany Y, gdy X

zmieni się o jednostkę

zmieni się o jednostkę

Standaryzowany współczynnik beta

Standaryzowany współczynnik beta

Stałą

Stałą b

0

– punkt przecięcia z osią y,

– punkt przecięcia z osią y,

sytuacja, gdy osoba nie odczuwa

sytuacja, gdy osoba nie odczuwa

stresu (x=0)

stresu (x=0)

Znając te wartości możemy

Znając te wartości możemy

przewidywać w oparciu o

przewidywać w oparciu o

konkretne wartości predyktora, ile

konkretne wartości predyktora, ile

wyniesie wartość zmiennej

wyniesie wartość zmiennej

zależnej

zależnej

Zmienna wynikowa Y jest

Zmienna wynikowa Y jest

przewidywana na podstawie

przewidywana na podstawie

równania prostej

równania prostej

X

b

Y

b

0

x

y

s

s

r

b

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Dokładność przewidywania

Dokładność przewidywania

Nie wiedząc nic o poziomie stresu,

Nie wiedząc nic o poziomie stresu,

wnioskowalibyśmy na podstawie średniej liczby

wnioskowalibyśmy na podstawie średniej liczby

odczuwanych symptomów

odczuwanych symptomów

(odchylenie wyników od średniej)

(odchylenie wyników od średniej)

Mając informację o poziomie stresu możemy

Mając informację o poziomie stresu możemy

przewidywać na podstawie tej zmiennej, ile będzie

przewidywać na podstawie tej zmiennej, ile będzie

dana osoba odczuwać symptomów

dana osoba odczuwać symptomów

Błąd standardowy oszacowania – uśredniona suma

Błąd standardowy oszacowania – uśredniona suma

kwadratów Y-Y’, SK reszt

kwadratów Y-Y’, SK reszt

Na ile nasza predykcja jest lepsza od przewidywania w

Na ile nasza predykcja jest lepsza od przewidywania w

oparciu tylko o średnią

oparciu tylko o średnią

SK regresji – suma kwadratów odchyleń wyników

SK regresji – suma kwadratów odchyleń wyników

przewidywanych od średniej

przewidywanych od średniej

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Wspólna zmienność, istotność

Wspólna zmienność, istotność

modelu

modelu

Model - Podsumowanie

,818

a

,668

,632

,8623

Model
1

R

R-kwadrat

Skorygowane

R-kwadrat

Błąd

standardowy

oszacowania

Predyktory: (Stała), STRES

a.

Analiza wariancji

b

13,490

1 13,49 18,14

,002

a

6,692

9

,744

20,182

10

Regresja

Reszta

Ogółem

Model
1

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Predyktory: (Stała), STRES

a.

Zmienna zależna: SYMPTOMY

b.

ogolem

regresja

SK

SK

R

2

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Błąd przewidywania

Błąd przewidywania

Wariancja reszty

Wariancja reszty

Zmienność przewidywanych wartości

Zmienność przewidywanych wartości

Błąd standardowy oszacowania

Błąd standardowy oszacowania

Odchylenie standardowe

Odchylenie standardowe

przewidywanych wartości od

przewidywanych wartości od

rzeczywistych

rzeczywistych

2

)

'

(

2

2

'

N

Y

Y

s

Y

Y

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Błąd standardowy

Błąd standardowy

oszacowania

oszacowania

Miara dokładności naszego

Miara dokładności naszego

oszacowania

oszacowania

Chcemy, żeby był jak najmniejszy

Chcemy, żeby był jak najmniejszy

2

)

'

(

2

'

N

Y

Y

s

Y

Y

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynniki regresji

Współczynniki regresji

Testujemy hipotezę, że współczynnik regresji b

Testujemy hipotezę, że współczynnik regresji b

jest istotnie różny od zera

jest istotnie różny od zera

Ho: b=0

Ho: b=0

Ho: b

Ho: b

0

0

=0

=0

Współczynniki

a

1,328

,620

2,140

,061

,072

,017

,818 4,259

,002

(Stała)

STRES

Model
1

B

Błąd

standardowy

Współczynniki

niestandaryzowane

Beta

Współczy

nniki

standaryz

owane

t

Istotność

Zmienna zależna: SYMPTOMY

a.

Wyrażona zmiana w

jednostkach

odchylenia

standardowego,

w przypadku prostej

regresji = r,

background image

Predykcja zmiennej zależnej w

Predykcja zmiennej zależnej w

oparciu o wiele predyktorów

oparciu o wiele predyktorów

(2 i więcej)

(2 i więcej)

Regresja

wielokrotna

Multiple

Regression

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Regresja wielokrotna

Regresja wielokrotna

Znalezienie miary ogólnego

Znalezienie miary ogólnego

dopasowania naszego modelu

dopasowania naszego modelu

Oszacowanie współczynników dla

Oszacowanie współczynników dla

każdego predyktora

każdego predyktora

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Obie zmienne sytuacje stresowe i liczba wypalanych papierosów są istotnie związane

Obie zmienne sytuacje stresowe i liczba wypalanych papierosów są istotnie związane

z umieralnością na CW, ale również predyktory są ze sobą związane

z umieralnością na CW, ale również predyktory są ze sobą związane

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynnik korelacji

Współczynnik korelacji

wielokrotnej

wielokrotnej

Współczynnik analogiczny do

Współczynnik analogiczny do

r

r

Zawsze oznaczany przez

Zawsze oznaczany przez

R

R

Zawsze pozytywny

Zawsze pozytywny

• Korelacja konstruktu stworzonego ze

wszystkich predyktorów łącznie ze
zmienna zależną

• Często zamiast R podaje się R

2

, które

łatwiej zinterpretować

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

R

R

2

2

R

2

has tak samo się interpretuje jak R

2

przy prostej

regresji
51% wariancji w CW jest wyjaśnione przez zmienność
w liczbie wypalanych papierosów i sytuacjach
stresowych
R-skorygowane: 45,8%

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Czy model jest istotny?

Czy model jest istotny?

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynniki regresji

Współczynniki regresji

Stała i współczynniki dla każdego

Stała i współczynniki dla każdego

predyktora

predyktora

Przy szacowaniu współczynnika dla

Przy szacowaniu współczynnika dla

danej zmiennej wartości pozostałych

danej zmiennej wartości pozostałych

są utrzymywane na stałym poziomie

są utrzymywane na stałym poziomie

Najczęściej przyjmowana jest średnia

Najczęściej przyjmowana jest średnia

Równanie regresji wielokrotnej jest

Równanie regresji wielokrotnej jest

rozszerzeniem regresji prostej.

rozszerzeniem regresji prostej.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Interpretacja stałej nie ma zwykle sensu.

Interpretacja stałej nie ma zwykle sensu.

Przewidywanie zmiennej zależnej, gdy

Przewidywanie zmiennej zależnej, gdy

wszystkie predyktory równe 0

wszystkie predyktory równe 0

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Równanie regresji

Równanie regresji

Oddzielne współczynniki dla każdej

Oddzielne współczynniki dla każdej

zmiennej

zmiennej

Punkt przecięcia

Punkt przecięcia

Współczynnik dla papierosów jesdt

Współczynnik dla papierosów jesdt

dodatni, ale współczynnik dla stresu

dodatni, ale współczynnik dla stresu

jest negatywny

jest negatywny

Dlaczego?

Dlaczego?

979

,

1

368

.

346

,

2

ˆ

0

2

2

1

1

str

pap

b

X

b

X

b

Y

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Przewidywanie

Przewidywanie

Załóżmy, że

Załóżmy, że

liczba

liczba

papierosów

papierosów

=

=

1

1

0,

0,

syt.

syt.

stresowych

stresowych

= 5,

= 5,

10000

6

,

23

979

,

1

84

,

1

46

,

23

ˆ

na

Y

979

,

1

368

.

346

,

2

ˆ

0

2

2

1

1

str

pap

b

X

b

X

b

Y

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Problem skorelowanych

Problem skorelowanych

predyktorów

predyktorów

Korelacja cząstkowa –

Korelacja cząstkowa –

korelacja między dwiema zmiennymi Y i

korelacja między dwiema zmiennymi Y i

X1, po odrzuceniu z obu zmiennych,

X1, po odrzuceniu z obu zmiennych,

jakiejkolwiek wariancji, którą można

jakiejkolwiek wariancji, którą można

przypisać trzeciej zmiennej (X2).

przypisać trzeciej zmiennej (X2).

Patrzymy na związek dwóch zmiennych,

Patrzymy na związek dwóch zmiennych,

przy kontroli trzeciej

przy kontroli trzeciej

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Silniejszy wygrywa?

Silniejszy wygrywa?

R

2

=30,

8

R

2

=50,

8

R

2

=70

%

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Idea korelacji cząstkowej

Idea korelacji cząstkowej

p

a

p

ie

ro

s

y

50,8%

Umieralność na CW

Syt. stresowe

30,8%

Unikalna
wariancja
w zmiennej
zależnej
wyjaśniona przez
papierosy

Unikalna
wariancja
w zmiennej
zależnej
wyjaśniona przez
syt. stresowe

Wariancja
w zmiennej
zależnej
wyjaśniona przez
oba predyktory

Przy korelacji
cząstkowej
kontrolujemy efekt
trzeciej zmiennej na
obie pozostałe

Umieralność na CW

Umieralność na CW

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Korelacje

Korelacje

cząstkowe

cząstkowe

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Nasi sąsiedzi

Nasi sąsiedzi

Jak widać, to, czy dana zmienna będzie dobrym

Jak widać, to, czy dana zmienna będzie dobrym

predyktorem zależy od sąsiedztwa z innymi zmiennymi w

predyktorem zależy od sąsiedztwa z innymi zmiennymi w

modelu i tego, czy są one ze sobą skorelowane

modelu i tego, czy są one ze sobą skorelowane

(gdyby nie były, wtedy nie zmieniałyby się współczynniki

(gdyby nie były, wtedy nie zmieniałyby się współczynniki

regresji w zależności od tego, która zmienna jest w modelu. (ta

regresji w zależności od tego, która zmienna jest w modelu. (ta

informacja jest ważna przy stosowaniu różnych metod

informacja jest ważna przy stosowaniu różnych metod

wprowadzania danych).

wprowadzania danych).

Patrząc na cząstkowe korelacje dostajemy czysty obraz

Patrząc na cząstkowe korelacje dostajemy czysty obraz

związku, przy kontroli innych zmiennych i widać, które

związku, przy kontroli innych zmiennych i widać, które

zmienne są lepszymi, a które gorszymi predyktorami.

zmienne są lepszymi, a które gorszymi predyktorami.

Sugerowane jest zrobienie regresji jeszcze raz, tym razem z

Sugerowane jest zrobienie regresji jeszcze raz, tym razem z

uwzględnieniem w równaniu tylko istotnych predyktorów

uwzględnieniem w równaniu tylko istotnych predyktorów

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Pytanka

Pytanka

Jaka jest różnica między regresją

Jaka jest różnica między regresją

wielokrotną a regresją prostą

wielokrotną a regresją prostą

?

?

Czy

Czy

R

R

2

2

może zmaleć jak wprowadzimy

może zmaleć jak wprowadzimy

kolejne predyktory do modelu

kolejne predyktory do modelu

?

?

A co będzie z wartością współczynnika R

A co będzie z wartością współczynnika R

Co to oznacza, że kontrolujemy wpływ

Co to oznacza, że kontrolujemy wpływ

trzeciej zmiennej

trzeciej zmiennej

?

?

W jaki sposób obliczamy wynik

W jaki sposób obliczamy wynik

przewidywany w regresji wielokrotnej

przewidywany w regresji wielokrotnej

?

?

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Sprzedaż balsamu do opalania

Sprzedaż balsamu do opalania

w majowy weekend

w majowy weekend

Interesuje nas przewidywana sprzedaż

Interesuje nas przewidywana sprzedaż

balsamu do opalania w majowy weekend w 15

balsamu do opalania w majowy weekend w 15

regionach Polski na podstawie dwóch

regionach Polski na podstawie dwóch

predyktorów:

predyktorów:

Liczby mieszkańców

Liczby mieszkańców

Średniego dochodu na głowę w danym regionie

Średniego dochodu na głowę w danym regionie

Możemy przeprowadzić dwie niezależne

Możemy przeprowadzić dwie niezależne

regresje liniowe dla każdego z predyktorów, a

regresje liniowe dla każdego z predyktorów, a

następnie sprawdzić pełny model z dwoma

następnie sprawdzić pełny model z dwoma

predyktorami

predyktorami

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Model - Podsumowanie

,993

a

,987

,986

7,3271

Model
1

R

R-kwadrat

Skorygowane

R-kwadrat

Błąd

standardowy

oszacowania

Predyktory: (Stała), POPULACJ

a.

Analiza wariancji

b

52069,001

1 52069,001

969,860

,000

a

697,933

13

53,687

52766,933

14

Regresja
Reszta
Ogółem

Model
1

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Predyktory: (Stała), POPULACJ

a.

Zmienna zależna: SPRZEDAZ

b.

Istotność modelu

98% wspólnej wariancji

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynniki

a

23,748

4,472

5,311

,000

,522

,017

,993

31,143

,000

(Stała)
POPULACJ

Model
1

B

Błąd

standardowy

Współczynniki

niestandaryzowane

Beta

Współczy

nniki

standaryz

owane

t

Istotność

Zmienna zależna: SPRZEDAZ

a.

Patrzymy na współczynnik b=0,522, istotny

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

POPULACJ

500

400

300

200

100

0

S

P

R

ZE

D

A

Z

300

200

100

0

Y’=23,748 +0,522X

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Wykres rozrzutu reszt i zmiennej niezależnej wskazuje na brak
związku i tak być powinno, gdy mamy dobry predyktor

•Stosuje się go do sprawdzenia, czy jest jakiś

•nieliniowy związek między zależną i predyktorem

•Reszty i predyktor nie powinny być skorelowane, ponieważ linia
regresji wyjaśnia większość wariancji zmiennej zależnej, to co
pozostaje to losowy szum w danych

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Sprawdźmy czy coś jeszcze może

Sprawdźmy czy coś jeszcze może

wyjaśnić druga zmienna

wyjaśnić druga zmienna

niezależna

niezależna

Można to zobaczyć robiąc

Można to zobaczyć robiąc

wykres rozrzutu reszt z

wykres rozrzutu reszt z

pierwszej regresji z drugim

pierwszej regresji z drugim

predyktorem

predyktorem

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

DOCHOD

5000

4000

3000

2000

S

ta

nd

ar

di

ze

d

R

es

id

ua

l

2

1

0

-1

-2

-3

Jeśli druga zmienna niezależna byłaby nieistotnym
predyktorem wykres ten powinien wyglądać losowo
Widać liniowy związek

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

DOCHOD

5000

4000

3000

2000

S

P

R

ZE

D

A

Z

300

200

100

0

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Model - Podsumowanie

b

,652

a

,425

,381

48,3161

Model
1

R

R-kwadrat

Skorygowane

R-kwadrat

Błąd

standardowy

oszacowania

Predyktory: (Stała), DOCHOD

a.

Zmienna zależna: SPRZEDAZ

b.

Analiza wariancji

b

22419,103

1 22419,103

9,604

,008

a

30347,831

13 2334,449

52766,933

14

Regresja
Reszta
Ogółem

Model
1

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Predyktory: (Stała), DOCHOD

a.

Zmienna zależna: SPRZEDAZ

b.

Współczynniki

a

-12,288

53,813

-,228

,823

5,477E-02

,018

,652

3,099

,008

(Stała)
DOCHOD

Model
1

B

Błąd

standardowy

Współczynniki

niestandaryzowane

Beta

Współczy

nniki

standaryz

owane

t

Istotność

Zmienna zależna: SPRZEDAZ

a.

Widać po R2, że
dopasowanie
tego modelu jest
mniejsze od
poprzedniego
modelu, widać to
również po
błędzie
standardowym

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Wprowadźmy obie zmienne do
modelu

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Model - Podsumowanie

b

,999

a

,998

,998

2,9903

Model
1

R

R-kwadrat

Skorygowane

R-kwadrat

Błąd

standardowy

oszacowania

Predyktory: (Stała), POPULACJ, DOCHOD

a.

Zmienna zależna: SPRZEDAZ

b.

Analiza wariancji

b

52659,632

2 26329,816 2944,578

,000

a

107,302

12

8,942

52766,933

14

Regresja
Reszta
Ogółem

Model
1

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Predyktory: (Stała), POPULACJ, DOCHOD

a.

Zmienna zależna: SPRZEDAZ

b.

Przy dodaniu
kolejnej
zmiennej do
modelu R2
zawsze wzrasta

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Model - Podsumowanie

b

,999

a

,998

,998

2,9903

Model
1

R

R-kwadrat

Skorygowane

R-kwadrat

Błąd

standardowy

oszacowania

Predyktory: (Stała), POPULACJ, DOCHOD

a.

Zmienna zależna: SPRZEDAZ

b.

Model - Podsumowanie

,993

a

,987

,986

7,3271

Model
1

R

R-kwadrat

Skorygowane

R-kwadrat

Błąd

standardowy

oszacowania

Predyktory: (Stała), POPULACJ

a.

Jeżeli R2 skorygowane z modelu z dwiema zmiennymi
jest mniejsze niż w modelu z 1 zmienną

wtedy nie ma sensu włączać drugiej zmiennej do

modelu

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Analiza wariancji

b

52659,632

2 26329,816 2944,578

,000

a

107,302

12

8,942

52766,933

14

Regresja
Reszta
Ogółem

Model
1

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Predyktory: (Stała), POPULACJ, DOCHOD

a.

Zmienna zależna: SPRZEDAZ

b.

Analiza wariancji

b

52069,001

1 52069,001

969,860

,000

a

697,933

13

53,687

52766,933

14

Regresja
Reszta
Ogółem

Model
1

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Predyktory: (Stała), POPULACJ

a.

Zmienna zależna: SPRZEDAZ

b.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynniki

a

1,029

3,338

,308

,763

1,081E-02

,001

,129

8,127

,000

,484

,008

,920

58,154

,000

(Stała)
DOCHOD
POPULACJ

Model
1

B

Błąd

standardowy

Współczynniki

niestandaryzowane

Beta

Współczy

nniki

standaryz

owane

t

Istotność

Zmienna zależna: SPRZEDAZ

a.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Metody wprowadzenia

Metody wprowadzenia

zmiennych - krokowa

zmiennych - krokowa

Model - Podsumowanie

c

,993

a

,987

,986

7,3271

,987

969,860

1

13

,000

,999

b

,998

,998

2,9903

,011

66,053

1

12

,000

Model
1
2

R

R-kwadrat

Skorygowane

R-kwadrat

Błąd

standardowy

oszacowania

Zmiana

R-kwadrat

Zmiana F

df1

df2

Istotność

zmiany F

Statystyki zmiany

Predyktory: (Stała), POPULACJ

a.

Predyktory: (Stała), POPULACJ, DOCHOD

b.

Zmienna zależna: SPRZEDAZ

c.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Analiza wariancji

c

52069,001

1 52069,001

969,860

,000

a

697,933

13

53,687

52766,933

14

52659,632

2 26329,816 2944,578

,000

b

107,302

12

8,942

52766,933

14

Regresja
Reszta
Ogółem
Regresja
Reszta
Ogółem

Model
1

2

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Predyktory: (Stała), POPULACJ

a.

Predyktory: (Stała), POPULACJ, DOCHOD

b.

Zmienna zależna: SPRZEDAZ

c.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynniki

a

23,748

4,472

5,311

,000

,522

,017

,993

31,143

,000

1,029

3,338

,308

,763

,484

,008

,920

58,154

,000

1,081E-02

,001

,129

8,127

,000

(Stała)
POPULACJ
(Stała)
POPULACJ
DOCHOD

Model
1

2

B

Błąd

standardowy

Współczynniki

niestandaryzowane

Beta

Współczy

nniki

standaryz

owane

t

Istotność

Zmienna zależna: SPRZEDAZ

a.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Zwróćmy uwagę również na to, że

Zwróćmy uwagę również na to, że

zmieniły się współczynniki b i bety

zmieniły się współczynniki b i bety

(zależne od tego, co wprowadzimy do

(zależne od tego, co wprowadzimy do

modelu)

modelu)

stąd jeśli interesuje nas predykcja

stąd jeśli interesuje nas predykcja

lepiej pozostać na poziomie prostej

lepiej pozostać na poziomie prostej

analizy regresji z 1 predyktorem, góra

analizy regresji z 1 predyktorem, góra

dwoma predyktorami – życie staje się

dwoma predyktorami – życie staje się

prostsze.

prostsze.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Regresja wielokrotna

Regresja wielokrotna

Rozszerzenie prostej regresji liniowej

Rozszerzenie prostej regresji liniowej

Sposób na stwierdzenie, w jaki sposób wiele

Sposób na stwierdzenie, w jaki sposób wiele

zmiennych wyjaśniających (predyktorów) jest

zmiennych wyjaśniających (predyktorów) jest

związanych ze zmienną wyjaśnianą (zależną)

związanych ze zmienną wyjaśnianą (zależną)

Zmienna zależna

Zmienna zależna

y,

y,

ale wiele predyktorów:

ale wiele predyktorów:

x1, x2, x3....

x1, x2, x3....

Daje informację o tym, jaki jest wpływ wszystkich

Daje informację o tym, jaki jest wpływ wszystkich

zmiennych wyjaśniających i każdej z osobna na

zmiennych wyjaśniających i każdej z osobna na

zmienną zależną

zmienną zależną

y= b1*x1 + b2*x2 + b3*x3.... + stała

y= b1*x1 + b2*x2 + b3*x3.... + stała

stała, jeśli wszystkie predyktory = 0

stała, jeśli wszystkie predyktory = 0

Przeprowadza się tak jak regresję liniową prostą,

Przeprowadza się tak jak regresję liniową prostą,

dodaje się tylko więcej zmiennych wyjaśniających

dodaje się tylko więcej zmiennych wyjaśniających


Document Outline


Wyszukiwarka

Podobne podstrony:
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 7 Wprowadzenie do analizy war
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 3 Rozkład normalny
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 17 Analiza kowariancji i anal
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 18 Analiza czynnikowa i anali
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 12 Analiza danych z eksperyme
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 19 Wykład powtórkowy
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 4 Pojęcie korelacji
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 5 Testowanie hipotez Test T
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 1 Rodzaje skal pomiarowych
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 10 Dwuczynnikowa analiza wari
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 11a Dwuczynnikowa analiza war
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 11 Dwuczynnikowa analiza wari
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 2 Miary tendencji centralnej
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 13 Plan mieszany
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 9 Zaawansowane plany eksperym
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 8 Jednoczynnikowa analiza war
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 6 Test T dla prób niezależnyc

więcej podobnych podstron