Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 16 Regresja wielozmiennowa

background image

Regresja

Regresja

wielozmiennowa

wielozmiennowa

spotkanie 10

spotkanie 10

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Poruszane zagadnienia

Poruszane zagadnienia

Regresja wielokrotna

Regresja wielokrotna

Interpretacja R i R

Interpretacja R i R

2

2

Problem skorelowanych predktorów

Problem skorelowanych predktorów

korelacja cząstkowa i semicząstkowa

korelacja cząstkowa i semicząstkowa

Metody wprowadzania zmiennych do

Metody wprowadzania zmiennych do

analizy regresji

analizy regresji

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Sprawdzamy założenia do

Sprawdzamy założenia do

analizy regresji

analizy regresji

Zmienna zależna – mierzona na skali

Zmienna zależna – mierzona na skali

ilościowej

ilościowej

Predyktory – ilościowe lub kategorialne

Predyktory – ilościowe lub kategorialne

(0,1)

(0,1)

Liniowy związek między predyktorem a

Liniowy związek między predyktorem a

zmienną zależną (wykresy rozrzutu)

zmienną zależną (wykresy rozrzutu)

Brak silnych korelacji między predyktorami

Brak silnych korelacji między predyktorami

Silna korelacja między predyktorami – podobną

Silna korelacja między predyktorami – podobną

część wariancji będą wyjaśniać w zmiennej

część wariancji będą wyjaśniać w zmiennej

zależnej - będą się znosić w modelu

zależnej - będą się znosić w modelu

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Regresja wielokrotna

Regresja wielokrotna

Rozszerzenie jednozmiennowej

Rozszerzenie jednozmiennowej

Poszukujemy liniowej kombinacji predyktorów,

Poszukujemy liniowej kombinacji predyktorów,

która najsilniej koreluje ze zmienną wyjaśnianą,

która najsilniej koreluje ze zmienną wyjaśnianą,

wyjaśnia jak najwięcej jej zmienności

wyjaśnia jak najwięcej jej zmienności

Patrzymy na współczynniki b dla różnych

Patrzymy na współczynniki b dla różnych

predyktorów

predyktorów

(porównujemy wystandaryzowane

(porównujemy wystandaryzowane

współczynniki - bety)

współczynniki - bety)

W przypadku dwóch predyktorów model regresji

W przypadku dwóch predyktorów model regresji

można przedstawić jako płaszczyznę w przestrzeni

można przedstawić jako płaszczyznę w przestrzeni

Tak dopasowana, aby jak najdokładniej przewidywać

Tak dopasowana, aby jak najdokładniej przewidywać

uzyskane wyniki

uzyskane wyniki

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Równanie regresji

Równanie regresji

wielokrotnej

wielokrotnej

W drugim równaniu nie mamy stałej, (stała = 0)

W drugim równaniu nie mamy stałej, (stała = 0)

Patrzenie na wystandaryzowane współczynniki –

Patrzenie na wystandaryzowane współczynniki –

sprowadzone do jednej skali pozwala na

sprowadzone do jednej skali pozwala na

porównywanie ich wkładu do modelu

porównywanie ich wkładu do modelu

2

2

1

1

0

2

2

1

1

Z

Z

Z

b

X

b

X

b

Y

y

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Korelacja wielokrotna

Korelacja wielokrotna

Przy wielu predyktorach nie mamy do

Przy wielu predyktorach nie mamy do

czynienia z prostą korelacją

czynienia z prostą korelacją

Uzyskujemy współczynnik korelacji

Uzyskujemy współczynnik korelacji

wielokrotnej….

wielokrotnej….

Korelacja zmiennej zależnej ze wszystkimi

Korelacja zmiennej zależnej ze wszystkimi

predyktorami łącznie

predyktorami łącznie

Jeśli R=1 – model idealnie przewiduje

Jeśli R=1 – model idealnie przewiduje

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Korelacja wielokrotna R

Korelacja wielokrotna R

Opisuje stopień liniowego związku

Opisuje stopień liniowego związku

między dwiema zmiennymi

między dwiema zmiennymi

Zależną

Zależną

Druga jest liniowym agregatem zmiennych

Druga jest liniowym agregatem zmiennych

predykcyjnych (niezależnych)

predykcyjnych (niezależnych)

ß

ß

– wystandaryzowane współczynniki

– wystandaryzowane współczynniki

regresji

regresji

xk

k

x

x

r

r

r

R

...

2

2

1

1

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

R

R

2

2

Pozwala na oszacowanie dokładności

Pozwala na oszacowanie dokładności

przewidywania wyników w oparciu o

przewidywania wyników w oparciu o

model regresji

model regresji

Interpretujemy R

Interpretujemy R

2

2

jak w prostej korelacji

jak w prostej korelacji

Wielkość wariancji w zmiennej zależnej

Wielkość wariancji w zmiennej zależnej

wyjaśniony przez nasz model (wszystkie

wyjaśniony przez nasz model (wszystkie

predyktory łącznie)

predyktory łącznie)

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Problem skorelowanych

Problem skorelowanych

predyktorów

predyktorów

Szukamy unikalnej wspólnej wariancji

Szukamy unikalnej wspólnej wariancji

dwóch zmiennych, przyglądamy się:

dwóch zmiennych, przyglądamy się:

Korelacji cząstkowej

Korelacji cząstkowej

Patrzymy na związek dwóch zmiennych, przy

Patrzymy na związek dwóch zmiennych, przy

kontroli trzeciej

kontroli trzeciej

korelacja między dwiema zmiennymi Y i X

korelacja między dwiema zmiennymi Y i X

1

1

, po

, po

odrzuceniu z obu zmiennych, jakiejkolwiek

odrzuceniu z obu zmiennych, jakiejkolwiek

wariancji, którą można przypisać trzeciej zmiennej

wariancji, którą można przypisać trzeciej zmiennej

(X

(X

2

2

).

).

background image

Przewidywanie 1

Przewidywanie 1

zmiennej na podstawie

zmiennej na podstawie

dwu i więcej

dwu i więcej

predyktorów

predyktorów

background image

Przewidywanie

Przewidywanie

wyników w

wyników w

eksperymencie …

eksperymencie …

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Zmienna wyjaśniana i

Zmienna wyjaśniana i

wyjaśniająca

wyjaśniająca

Zmienna wyjaśniana:

Zmienna wyjaśniana:

Wielkość przydzielanych szoków

Wielkość przydzielanych szoków

elektrycznych

elektrycznych

Zmienna wyjaśniająca:

Zmienna wyjaśniająca:

Zmienne temperamentalne

Zmienne temperamentalne

Wytrzymałość

Wytrzymałość

Wrażliwość emocjonalna

Wrażliwość emocjonalna

Reaktywność

Reaktywność

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Statystyki opisowe

128,15 13,8406

100

12,220

4,6266

100

14,820

4,9265

100

SZOKI_Y

WYTRZ_X1

WRAZL_X2

Średnia

Odchylenie

standardowe

N

Zmienne wprowadzone/usunięte

a

WYTRZ_X1

Krokowa (Kryterium: Prawdopodobieñstwo

F-wprowadzenia <= ,050, Prawdopodobieñstwo

F-usuniêcia >= ,100).

WRAZL_X2

Krokowa (Kryterium: Prawdopodobieñstwo

F-wprowadzenia <= ,050, Prawdopodobieñstwo

F-usuniêcia >= ,100).

Mode
l
1

2

Zmienne

wprowadzone

Metoda

Zmienna zależna: SZOKI_Y

a.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Model - Podsumowanie

,456

a

,208

,200

12,3818

,208 25,702

1

98

,000

,505

b

,255

,240

12,0693

,047

6,141

1

97

,015

Model
1
2

R

R-kwadrat

Skorygowane

R-kwadrat

Błąd

standardowy

oszacowania

Zmiana

R-kwadrat

Zmiana F

df1

df2

Istotność

zmiany F

Statystyki zmiany

Predyktory: (Stała), WYTRZ_X1

a.

Predyktory: (Stała), WYTRZ_X1, WRAZL_X2

b.

Analiza wariancji

c

3940,4

1 3940,4 25,702

,000

a

15024

98 153,31

18965

99

4834,9

2 2417,5 16,596

,000

b

14130

97 145,67

18965

99

Regresja

Reszta

Ogółem

Regresja

Reszta

Ogółem

Model
1

2

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Predyktory: (Stała), WYTRZ_X1

a.

Predyktory: (Stała), WYTRZ_X1, WRAZL_X2

b.

Zmienna zależna: SZOKI_Y

c.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Testy istotności

Testy istotności

F – test korelacji wielokrotnej, dodanie

F – test korelacji wielokrotnej, dodanie

predyktora czy zmienia korelację

predyktora czy zmienia korelację

każdy nowy predyktor coś dodaje, ale

każdy nowy predyktor coś dodaje, ale

niekoniecznie sensownie

niekoniecznie sensownie

może być istotny nawet jeśli predyktory

może być istotny nawet jeśli predyktory

nic nie wnoszą do zrozumienia zmiennej

nic nie wnoszą do zrozumienia zmiennej

zależnej.

zależnej.

Przy małych próbach i dużej liczbie

Przy małych próbach i dużej liczbie

predyktorów jest większa szansa na uzyskanie

predyktorów jest większa szansa na uzyskanie

korelacji wielokrotnej istotnie większej od zera,

korelacji wielokrotnej istotnie większej od zera,

nawet jeśli w populacji takowa nie istnieje. Stąd

nawet jeśli w populacji takowa nie istnieje. Stąd

sugestie żeby stosunek wielkości próby do

sugestie żeby stosunek wielkości próby do

predyktorów był co najmniej 15 do1

predyktorów był co najmniej 15 do1

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynniki

a

111,49

3,512

31,742

,000

1,364

,269

,456 5,070

,000

121,33

5,243

23,141

,000

1,302

,263

,435 4,943

,000

-,613

,247

-,218 -2,478

,015

(Stała)

WYTRZ_X1

(Stała)

WYTRZ_X1

WRAZL_X2

Model
1

2

B

Błąd

standardowy

Współczynniki

niestandaryzowane

Beta

Współczy

nniki

standaryz

owane

t

Istotność

Zmienna zależna: SZOKI_Y

a.

Statystyka t testuje h zerową, że poszczególne współczynniki nie różnią się od zera

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Korelacje

1,000

,456**

-,259**

-,232*

,

,000

,009

,020

100

100

100

100

,456** 1,000

-,095

-,312**

,000

,

,348

,002

100

100

100

100

-,259**

-,095

1,000

,010

,009

,348

,

,919

100

100

100

100

-,232*

-,312**

,010

1,000

,020

,002

,919

,

100

100

100

126

Korelacja Pearsona
Istotność (dwustronna)
N
Korelacja Pearsona
Istotność (dwustronna)
N
Korelacja Pearsona
Istotność (dwustronna)
N
Korelacja Pearsona
Istotność (dwustronna)
N

SZOKI_Y

WYTRZ_X1

WRAZL_X2

REAKT_X3

SZOKI_Y

WYTRZ_X1

WRAZL_X2

REAKT_X3

Korelacja jest istotna na poziomie 0.01 (dwustronnie).

**.

Korelacja jest istotna na poziomie 0.05 (dwustronnie).

*.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Model - Podsumowanie

,515

a

,265

,242 12,0521

Model
1

R

R-kwadrat

Skorygowane

R-kwadrat

Błąd

standardowy

oszacowania

Predyktory: (Stała), REAKT_X3, WRAZL_X2, WYTRZ_X1

a.

Model - Podsumowanie

,456

a

,208

,200

12,3818

,208 25,702

1

98

,000

,505

b

,255

,240

12,0693

,047

6,141

1

97

,015

Model
1
2

R

R-kwadrat

Skorygowane

R-kwadrat

Błąd

standardowy

oszacowania

Zmiana

R-kwadrat

Zmiana F

df1

df2

Istotność

zmiany F

Statystyki zmiany

Predyktory: (Stała), WYTRZ_X1

a.

Predyktory: (Stała), WYTRZ_X1, WRAZL_X2

b.

Błąd oszacowania nie zmalał

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Analiza wariancji

b

5020,4

3 1673,5 11,521

,000

a

13944

96 145,25

18965

99

Regresja

Reszta

Ogółem

Model
1

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Predyktory: (Stała), REAKT_X3, WRAZL_X2, WYTRZ_X1

a.

Zmienna zależna: SZOKI_Y

b.

Współczynniki

a

125,85

6,593

19,088

,000

1,204

,277

,402 4,348

,000

-,619

,247

-,220 -2,504

,014

-,296

,262

-,104 -1,130

,261

(Stała)

WYTRZ_X1

WRAZL_X2

REAKT_X3

Model
1

B

Błąd

standardowy

Współczynniki

niestandaryzowane

Beta

Współczy

nniki

standaryz

owane

t

Istotność

Zmienna zależna: SZOKI_Y

a.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Co nam daje korelacja

Co nam daje korelacja

cząstkowa?

cząstkowa?

Możemy spojrzeć na związek dwóch

Możemy spojrzeć na związek dwóch

zmiennych, kiedy efekty trzeciej zmiennej są

zmiennych, kiedy efekty trzeciej zmiennej są

kontrolowane

kontrolowane

Przeprowadza się w celu znalezienia wspólnej

Przeprowadza się w celu znalezienia wspólnej

unikalnej wariancji (zmienności) dwóch

unikalnej wariancji (zmienności) dwóch

zmiennych, bardziej prawdziwy, oczyszczony

zmiennych, bardziej prawdziwy, oczyszczony

związek między dwiema zmiennymi

związek między dwiema zmiennymi

Korelacja cząstkowa I stopnia

Korelacja cząstkowa I stopnia

Korelujemy dwie zmienne przy kontroli trzeciej

Korelujemy dwie zmienne przy kontroli trzeciej

Korelacja cząstkowa II stopnia

Korelacja cząstkowa II stopnia

Korelujemy dwie zmienne przy jednoczesnej kontroli

Korelujemy dwie zmienne przy jednoczesnej kontroli

dwóch zmiennych

dwóch zmiennych

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Korelacja cząstkowa

Korelacja cząstkowa

A

B

C

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Kontrolujemy wpływ trzeciej zmiennej

Kontrolujemy wpływ trzeciej zmiennej

Odrzucamy jej wspólną wariancję z pierwszą i

Odrzucamy jej wspólną wariancję z pierwszą i

drugą zmienną

drugą zmienną

Korelujemy ze sobą oczyszczone reszty

Korelujemy ze sobą oczyszczone reszty

zmienności pierwszej i drugiej zmiennej ( po

zmienności pierwszej i drugiej zmiennej ( po

usunięciu wpływu trzeciej zmiennej)

usunięciu wpływu trzeciej zmiennej)

A

B

C

C

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Unikalny związek między A i B przy

Unikalny związek między A i B przy

wyłączeniu wpływu trzeciej zmiennej

wyłączeniu wpływu trzeciej zmiennej

A

B

C

Korelacja cząstkowa

między A i B

przy kontroli

zmiennej C

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Korelacje

1,000

,456**

-,259**

-,232*

,

,000

,009

,020

100

100

100

100

,456** 1,000

-,095

-,312**

,000

,

,348

,002

100

100

100

100

-,259**

-,095

1,000

,010

,009

,348

,

,919

100

100

100

100

-,232*

-,312**

,010

1,000

,020

,002

,919

,

100

100

100

126

Korelacja Pearsona
Istotność (dwustronna)
N
Korelacja Pearsona
Istotność (dwustronna)
N
Korelacja Pearsona
Istotność (dwustronna)
N
Korelacja Pearsona
Istotność (dwustronna)
N

SZOKI_Y

WYTRZ_X1

WRAZL_X2

REAKT_X3

SZOKI_Y

WYTRZ_X1

WRAZL_X2

REAKT_X3

Korelacja jest istotna na poziomie 0.01 (dwustronnie).

**.

Korelacja jest istotna na poziomie 0.05 (dwustronnie).

*.

R2= 20%

R2= 5%

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Idea korelacji cząstkowej

Idea korelacji cząstkowej

Szoki elektryczne

w

y

tr

zy

m

a

ło

ść

20%

Szoki elektryczne

reaktywność

5%

Szoki elektryczne

Unikalna
wariancja
w zmiennej
zależnej
wyjaśniona przez
reaktywność

Unikalna
wariancja
w zmiennej
zależnej
wyjaśniona przez
wytrzymałość

Wariancja
w zmiennej
zależnej
wyjaśniona przez
oba predyktory

Przy korelacji cząstkowej kontrolujemy efekt trzeciej zmiennej na obie pozostałe

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Korelacja semicząstkowa a

Korelacja semicząstkowa a

cząstkowa

cząstkowa

W semicząstkowej korelacji kontrolujemy

W semicząstkowej korelacji kontrolujemy

wpływ trzeciej zmiennej, który ma ona tylko

wpływ trzeciej zmiennej, który ma ona tylko

na jedną ze zmiennych branych do korelacji

na jedną ze zmiennych branych do korelacji

Semicząstkowe, kiedy interesuje nas

Semicząstkowe, kiedy interesuje nas

wyjaśnienie zmienności zmiennej zależnej na

wyjaśnienie zmienności zmiennej zależnej na

podstawie kilku predyktorów.

podstawie kilku predyktorów.

Przy korelacji cząstkowej kontrolujemy

Przy korelacji cząstkowej kontrolujemy

wpływ trzeciej zmiennej na obie zmienne

wpływ trzeciej zmiennej na obie zmienne

Korelacje cząstkowe są bardziej użyteczne, gdy

Korelacje cząstkowe są bardziej użyteczne, gdy

chcemy przyjrzeć się unikalnemu związkowi

chcemy przyjrzeć się unikalnemu związkowi

dwóch zmiennych

dwóch zmiennych

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Korelacja semicząstkowa

Korelacja semicząstkowa

(częściowa)

(częściowa)

Korelacja semicząstkowa między A i B przy

Korelacja semicząstkowa między A i B przy

wyłączeniu wspólnej zmienności zmiennej C z

wyłączeniu wspólnej zmienności zmiennej C z

ze zmienną B

ze zmienną B

Korelujemy resztę ze zmiennej B ze zmienną A

Korelujemy resztę ze zmiennej B ze zmienną A

A

B

C

zależna

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Korelacje cząstkowe przy

Korelacje cząstkowe przy

regresji

regresji

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynniki

a

125,85

6,593

19,088

,000

1,204

,277

,402 4,348

,000

,456

,406

,381

-,619

,247

-,220 -2,504

,014

-,259

-,248

-,219

-,296

,262

-,104 -1,130

,261

-,232

-,115

-,099

(Stała)

WYTRZ_X1

WRAZL_X2

REAKT_X3

Model
1

B

Błąd

standardowy

Współczynniki

niestandaryzowane

Beta

Współczy

nniki

standaryz

owane

t

Istotność

Rzędu

zerowego

Cząstkowa

Semicząs

tkowa

Korelacje

Zmienna zależna: SZOKI_Y

a.

Korelacje rzędu zerowego to zwykłe korelacje poszczególnych

Korelacje rzędu zerowego to zwykłe korelacje poszczególnych

zmiennych ze zmienną zależną. Korelacje cząstkowe to w tym

zmiennych ze zmienną zależną. Korelacje cząstkowe to w tym

przypadku korelacja tych dwóch zmiennych, przy kontroli

przypadku korelacja tych dwóch zmiennych, przy kontroli

pozostałych zmiennych, czyli odrzucenia wspólnej wariancji.

pozostałych zmiennych, czyli odrzucenia wspólnej wariancji.

Analizując istotności współczynników regresji i korelacje

Analizując istotności współczynników regresji i korelacje

cząstkowe, widzimy, że dany predyktor przestaje dodawać coś

cząstkowe, widzimy, że dany predyktor przestaje dodawać coś

istotnego do zrozumienia zmiennej zależnej, jeśli jego korelacja

istotnego do zrozumienia zmiennej zależnej, jeśli jego korelacja

cząstkowa jest zdecydowanie mniejsza od oryginalnej. Oznacza

cząstkowa jest zdecydowanie mniejsza od oryginalnej. Oznacza

to, że po wyeliminowaniu zmienności wspólnej z innymi

to, że po wyeliminowaniu zmienności wspólnej z innymi

predyktorami ze związku między np. reaktywnością i zmienną

predyktorami ze związku między np. reaktywnością i zmienną

zależną niewiele pozostaje im wspólnego.

zależną niewiele pozostaje im wspólnego.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Rola korelacji cząstkowych

Rola korelacji cząstkowych

Patrząc na cząstkowe korelacje

Patrząc na cząstkowe korelacje

dostajemy czysty obraz związku,

dostajemy czysty obraz związku,

przy kontroli innych zmiennych i

przy kontroli innych zmiennych i

widać, które zmienne są lepszymi, a

widać, które zmienne są lepszymi, a

które gorszymi predyktorami.

które gorszymi predyktorami.

Sugerowane jest zrobienie regresji jeszcze

Sugerowane jest zrobienie regresji jeszcze

raz, tym razem z uwzględnieniem w

raz, tym razem z uwzględnieniem w

równaniu tylko istotnych predyktorów

równaniu tylko istotnych predyktorów

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

współczynniki b i bety zmieniają się

współczynniki b i bety zmieniają się

zależne od tego, które zmienne

zależne od tego, które zmienne

wprowadzimy do modelu

wprowadzimy do modelu

stąd jeśli interesuje nas predykcja

stąd jeśli interesuje nas predykcja

lepiej pozostać na poziomie prostej

lepiej pozostać na poziomie prostej

analizy regresji z 1 predyktorem,

analizy regresji z 1 predyktorem,

góra dwoma predyktorami – życie

góra dwoma predyktorami – życie

staje się prostsze.

staje się prostsze.

background image

Metody wprowadzania

Metody wprowadzania

zmiennych

zmiennych

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Model regresji z większą liczbą

Model regresji z większą liczbą

predyktorów

predyktorów

Musimy się zastanowić jakie zmienne i w

Musimy się zastanowić jakie zmienne i w

jaki sposób wprowadzić zmienne do

jaki sposób wprowadzić zmienne do

modelu

modelu

Współczynniki regresji zależą od

Współczynniki regresji zależą od

zmiennych wprowadzonych do modelu

zmiennych wprowadzonych do modelu

Zmieniając konfigurację predyktorów w

Zmieniając konfigurację predyktorów w

modelu, zmieniamy współczynniki regresji

modelu, zmieniamy współczynniki regresji

Wybieramy predyktory ważne z ważne z

Wybieramy predyktory ważne z ważne z

perspektywy teorii

perspektywy teorii

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Kolejność zmiennych w

Kolejność zmiennych w

modelu

modelu

Kiedy predyktory nie są ze sobą

Kiedy predyktory nie są ze sobą

skorelowane a jedynie ze zmienną

skorelowane a jedynie ze zmienną

zależną

zależną

Kolejność wprowadzanie zmiennych

Kolejność wprowadzanie zmiennych

predykcyjnych nie ma znaczenia

predykcyjnych nie ma znaczenia

Rzeczywistość nie jest tak łaskawa

Rzeczywistość nie jest tak łaskawa

Rzadko mamy do czynienia z

Rzadko mamy do czynienia z

nieskorelowanymi predyktorami

nieskorelowanymi predyktorami

Wybór metody jest kluczową sprawą

Wybór metody jest kluczową sprawą

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Metoda wprowadzania

Metoda wprowadzania

Wszystkie predyktory są

Wszystkie predyktory są

wprowadzane do modelu

wprowadzane do modelu

jednocześnie

jednocześnie

Nie podejmujemy decyzji, które

Nie podejmujemy decyzji, które

zmienne mają wejść jako pierwsze do

zmienne mają wejść jako pierwsze do

modelu

modelu

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Metoda regresji

Metoda regresji

hierarchicznej

hierarchicznej

W regresji hierarchicznej predyktory

W regresji hierarchicznej predyktory

do modelu dobieramy na podstawie

do modelu dobieramy na podstawie

przeszłej wiedzy

przeszłej wiedzy

Badacz decyduje sam, w jakim porządku

Badacz decyduje sam, w jakim porządku

wprowadzić predyktory do modelu

wprowadzić predyktory do modelu

Najważniejsze pod względem siły

Najważniejsze pod względem siły

przewidywania powinny wejść na początku

przewidywania powinny wejść na początku

Potem nowe predyktory

Potem nowe predyktory

background image

Przewidywanie

Przewidywanie

sprzedaży płyt

sprzedaży płyt

Na podstawie kwoty przeznaczonej na

Na podstawie kwoty przeznaczonej na

reklamę, częstości puszczania piosenek

reklamę, częstości puszczania piosenek

z tej płyty w rozgłośniach radiowych i

z tej płyty w rozgłośniach radiowych i

atrakcyjności zespołu

atrakcyjności zespołu

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynniki regresji dla wszystkich predyktorów

Współczynniki regresji dla wszystkich predyktorów

Stała

Stała

Jak obliczymy współczynniki, będziemy mogli

Jak obliczymy współczynniki, będziemy mogli

dokonać predykcji sprzedaży nie tylko na

dokonać predykcji sprzedaży nie tylko na

podstawie wydanych pieniędzy na reklamę,

podstawie wydanych pieniędzy na reklamę,

ale również i częstości puszczania danej

ale również i częstości puszczania danej

muzyki w radio i atrakcyjności zespołu

muzyki w radio i atrakcyjności zespołu

sc

atrakcyjno

radio

reklama

plyt

sprzedaz

3

2

1

0

b

b

b

b

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Korelacje

1,000

,578** ,102

,081

,

,000

,151

,256

200

200

200

200

,578** 1,000

,599**

,326**

,000

,

,000

,000

200

200

200

200

,102

,599** 1,000

,182**

,151

,000

,

,010

200

200

200

200

,081

,326** ,182**

1,000

,256

,000

,010

,

200

200

200

200

Korelacja Pearsona

Istotność (dwustronna)

N

Korelacja Pearsona

Istotność (dwustronna)

N

Korelacja Pearsona

Istotność (dwustronna)

N

Korelacja Pearsona

Istotność (dwustronna)

N

budżet w tysiącach

sprzedaż w tysiącach

liczba piosenek w
tygodniu

atrakcyjność grupy

budżet w

tysiącach

sprzedaż w

tysiącach

liczba

piosenek

w tygodniu

atrakcyjność

grupy

Korelacja jest istotna na poziomie 0.01 (dwustronnie).

**.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Metoda hierarchiczna

Metoda hierarchiczna

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

W drugim kroku…

W drugim kroku…

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Zmienne wprowadzone/usunięte

b

bud¿et w tysi¹cach

a

,

Wprowadzanie

atrakcyjnoϾ grupy, liczba

piosenek w tygodniu

a

,

Wprowadzanie

Model
1
2

Zmienne wprowadzone

Zmienne

usunięte

Metoda

Wszystkie wyspecyfikowane zmienne zostały wprowadzone.

a.

Zmienna zależna: sprzedaż w tysiącach

b.

Model - Podsumowanie

,578

a

,335

,331 65,9914

,335 99,587

1

198

,000

,815

b

,665

,660 47,0873

,330 96,447

2

196

,000

Model
1

2

R

R-kwadrat

Skorygowane

R-kwadrat

Błąd

standardowy

oszacowania

Zmiana

R-kwadrat

Zmiana F

df1

df2

Istotność

zmiany F

Statystyki zmiany

Predyktory: (Stała), budżet w tysiącach

a.

Predyktory: (Stała), budżet w tysiącach, atrakcyjność grupy, liczba piosenek w tygodniu

b.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Analiza wariancji

c

433688

1 433688 99,587

,000

a

862264

198 4354,9

1295952

199

861377

3 287126 129,498

,000

b

434575

196 2217,2

1295952

199

Regresja
Reszta
Ogółem
Regresja
Reszta
Ogółem

Model
1

2

Suma

kwadratów

df

Średni

kwadrat

F

Istotność

Predyktory: (Stała), budżet w tysiącach

a.

Predyktory: (Stała), budżet w tysiącach, atrakcyjność grupy, liczba piosenek w
tygodniu

b.

Zmienna zależna: sprzedaż w tysiącach

c.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynniki

a

134,14

7,537

17,799

,000

,096

,010

,578 9,979

,000

-26,61

17,350

-1,534

,127

,085

,007

,511 12,261

,000

3,367

,278

,512 12,123

,000

11,086

2,438

,192 4,548

,000

(Stała)

budżet w tysiącach

(Stała)

budżet w tysiącach

liczba piosenek w
tygodniu
atrakcyjność grupy

Model
1

2

B

Błąd

standardowy

Współczynniki

niestandaryzowane

Beta

Współczy

nniki

standaryz

owane

t

Istotność

Zmienna zależna: sprzedaż w tysiącach

a.

sc

atrakcyjno

09

,

11

radio)

37

,

3

(

reklama)

85

,

0

(

61

,

26

plyt

sprzedaz

Statystyki t - pokazują, czy predyktor przyczynia się istotnie do predykcji zmiennej zależnej

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynnik b dla reklamy=0,085

Współczynnik b dla reklamy=0,085

Oznacza, że jeśli zwiększymy budżet na reklamę o jednostkę,

Oznacza, że jeśli zwiększymy budżet na reklamę o jednostkę,

sprzedaż płyt wzrośnie o 0,085 jednostek. Obie zmienne były w

sprzedaż płyt wzrośnie o 0,085 jednostek. Obie zmienne były w

tysiącach stąd, z każdym nowym tysiącem wydanym na

tysiącach stąd, z każdym nowym tysiącem wydanym na

reklamę sprzedaż wzrośnie o 0,085 tysiąca płyt (o 85 płyt)

reklamę sprzedaż wzrośnie o 0,085 tysiąca płyt (o 85 płyt)

Zakładając oczywiście, że pozostałe predyktory są na stałym

Zakładając oczywiście, że pozostałe predyktory są na stałym

poziomie

poziomie

Współczynnik b dla radia=3,367

Współczynnik b dla radia=3,367

Oznacza, że każde dodatkowe puszczenie piosenki w radiu

Oznacza, że każde dodatkowe puszczenie piosenki w radiu

przed sprzedażą na rynku płyt spowoduje, że sprzedaż

przed sprzedażą na rynku płyt spowoduje, że sprzedaż

wzrośnie o 3,367 jednostek ( o 3367 płyt )

wzrośnie o 3,367 jednostek ( o 3367 płyt )

Zakładając oczywiście, że pozostałe predyktory są na stałym

Zakładając oczywiście, że pozostałe predyktory są na stałym

poziomie

poziomie

łatwiejsze w interpretacji są wystandaryzowane

łatwiejsze w interpretacji są wystandaryzowane

współczynniki b

współczynniki b

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Metody regresji krokowej

Metody regresji krokowej

Decyzje o tym, które zmienne

Decyzje o tym, które zmienne

wchodzą do modelu są podejmowane

wchodzą do modelu są podejmowane

w oparciu o kryteria matematyczne

w oparciu o kryteria matematyczne

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Stepwise - krokowa

Stepwise - krokowa

Po dodaniu nowego predyktora do

Po dodaniu nowego predyktora do

modelu, sprawdzamy, czy któryś z

modelu, sprawdzamy, czy któryś z

predyktorów nie stracił czasem na

predyktorów nie stracił czasem na

ważności

ważności

Predyktor raz włączony do równania

Predyktor raz włączony do równania

może zostać z niego wyrzucony

może zostać z niego wyrzucony

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Zmienne wprowadzone/usunięte

a

liczba
piosenek w
tygodniu

,

Krokowa (Kryterium:
Prawdopodobieństwo F-wprowadzenia
<= ,050, Prawdopodobieństwo
F-usunięcia >= ,100).

budżet w
tysiącach

,

Krokowa (Kryterium:
Prawdopodobieństwo F-wprowadzenia
<= ,050, Prawdopodobieństwo
F-usunięcia >= ,100).

atrakcyjność
grupy

,

Krokowa (Kryterium:
Prawdopodobieństwo F-wprowadzenia
<= ,050, Prawdopodobieństwo
F-usunięcia >= ,100).

Model
1

2

3

Zmienne

wprowadzone

Zmienne

usunięte

Metoda

Zmienna zależna: sprzedaż w tysiącach

a.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Współczynniki

a

84,873 11,267

7,533 ,000

3,939

,374 ,599 10,5 ,000

41,124 9,331

4,407 ,000

3,589

,287 ,546 12,5 ,000

,087

,007 ,523 12,0 ,000

-26,61 17,350

-1,53 ,127

3,367

,278 ,512 12,1 ,000

,085

,007 ,511 12,3 ,000

11,086 2,438 ,192 4,548 ,000

(Stała)

liczba piosenek w
tygodniu
(Stała)

liczba piosenek w
tygodniu
budżet w tysiącach

(Stała)

liczba piosenek w
tygodniu
budżet w tysiącach

atrakcyjność grupy

Model
1

2

3

B

Błąd

standardowy

Współczynniki

niestandaryzowane

Beta

Współczy

nniki

standaryz

owane

t

Istotność

Zmienna zależna: sprzedaż w tysiącach

a.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Metoda selekcji postępującej -

Metoda selekcji postępującej -

forward

forward

Początkowo model zawiera tylko stałą,

Początkowo model zawiera tylko stałą,

Spośród dostępnych predyktorów

Spośród dostępnych predyktorów

wyszukiwany jest ten, który najlepiej

wyszukiwany jest ten, który najlepiej

przewiduje zmienną wynikową

przewiduje zmienną wynikową

Na podstawie współczynnika korelacji –

Na podstawie współczynnika korelacji –

wchodzi ta zmienna, która najsilniej koreluje

wchodzi ta zmienna, która najsilniej koreluje

Potem szukamy kolejnego najlepszego

Potem szukamy kolejnego najlepszego

predyktora

predyktora

Taki, który ma największą korelację semicząstkową ze

Taki, który ma największą korelację semicząstkową ze

zmienną wynikową –

zmienną wynikową –

Usuwany wariancję wspólną drugiego predyktora z

Usuwany wariancję wspólną drugiego predyktora z

pierwszym i korelujemy ze zmienną zależną

pierwszym i korelujemy ze zmienną zależną

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Jeśli pierwszy predyktor wyjaśnił 60%

Jeśli pierwszy predyktor wyjaśnił 60%

wariancji w zmiennej zależnej

wariancji w zmiennej zależnej

Pozostaje jeszcze 40% do wyjaśnienia

Pozostaje jeszcze 40% do wyjaśnienia

Szukamy takiej zmiennej, która pozwoli

Szukamy takiej zmiennej, która pozwoli

nam wyjaśnić coś z pozostałych 40%

nam wyjaśnić coś z pozostałych 40%

wariancji

wariancji

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Eliminacja wsteczna

Eliminacja wsteczna

Procedura doboru zmiennych do

Procedura doboru zmiennych do

modelu, w ramach której wszystkie

modelu, w ramach której wszystkie

zmienne są wprowadzane do modelu,

zmienne są wprowadzane do modelu,

a następnie kolejno usuwane.

a następnie kolejno usuwane.

Zmienna, która ma najmniejszy

Zmienna, która ma najmniejszy

współczynnik korelacji semicząstkowej

współczynnik korelacji semicząstkowej

ze zmienną objaśnianą jest rozważana

ze zmienną objaśnianą jest rozważana

jako pierwsza do usunięcia.

jako pierwsza do usunięcia.

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Którą wybrać?

Którą wybrać?

Przy metodach krokowych – komputer

Przy metodach krokowych – komputer

podejmuje za nas decyzję o tym,

podejmuje za nas decyzję o tym,

które zmienne wejdą do modelu

które zmienne wejdą do modelu

Wchodzą te najsilniejsze – niekoniecznie

Wchodzą te najsilniejsze – niekoniecznie

najważniejsze z teoretycznego punktu

najważniejsze z teoretycznego punktu

Stosowane w modelach eksploracyjnych

Stosowane w modelach eksploracyjnych

Lepiej oprzeć się o przeszłe wyniki i

Lepiej oprzeć się o przeszłe wyniki i

teorię

teorię

background image

Materiały do wykładu

Materiały do wykładu

Izabela Krejtz

Izabela Krejtz

Im mniej predyktorów tym

Im mniej predyktorów tym

lepiej

lepiej

Nie należy włączać zbyt wielu

Nie należy włączać zbyt wielu

predyktorów do modelu

predyktorów do modelu

Te, które mają znaczenie teoretyczne

Te, które mają znaczenie teoretyczne

Po przeprowadzeniu analizy z wszystkimi

Po przeprowadzeniu analizy z wszystkimi

predyktorami, jeszcze raz wykluczając

predyktorami, jeszcze raz wykluczając

zmienne nieistotnie przyczyniające się

zmienne nieistotnie przyczyniające się

wyjaśnienia zmienności zmiennej

wyjaśnienia zmienności zmiennej

zależnej

zależnej

Co najmniej po 15 osób na predyktor

Co najmniej po 15 osób na predyktor


Document Outline


Wyszukiwarka

Podobne podstrony:
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 7 Wprowadzenie do analizy war
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 3 Rozkład normalny
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 17 Analiza kowariancji i anal
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 18 Analiza czynnikowa i anali
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 12 Analiza danych z eksperyme
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 19 Wykład powtórkowy
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 4 Pojęcie korelacji
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 15 Wprowadzenie do regresji w
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 5 Testowanie hipotez Test T
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 1 Rodzaje skal pomiarowych
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 10 Dwuczynnikowa analiza wari
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 11a Dwuczynnikowa analiza war
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 11 Dwuczynnikowa analiza wari
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 2 Miary tendencji centralnej
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 13 Plan mieszany
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 9 Zaawansowane plany eksperym
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 8 Jednoczynnikowa analiza war

więcej podobnych podstron