Regresja II rodzaju
Regresja II rodzaju
(liniowa)
(liniowa)
Regresja II rodzaju (liniowa)
Regresja II rodzaju (liniowa)
X
-
W
y
s
o
k
o
ś
ć
o
s
ta
tn
ie
j
p
re
m
ii
Y- lata w zawodzie
Regresja II rodzaju (liniowa)
Regresja II rodzaju (liniowa)
- Jak wytłumaczymy fakt, że dla osób z 4-o letnim stażem przewidujemy
niższą premię niż dla osób z 3-letnim doświadczeniem?
- Czy nie lepiej byłoby gdybyśmy w naszych przewidywaniach premii dla osób z np. 4-o letnim
doświadczeniem wykorzystali wiedzę o tych z 3-letnim i 5-letnim stażem?
- Możemy zauważyć tendencję: wraz ze wzrostem doświadczenia wzrasta też wysokość premii
X
-
W
y
s
o
k
o
ś
ć
o
s
ta
tn
ie
j
p
re
m
ii
Y- lata w zawodzie
Regresja II rodzaju (liniowa)
Regresja II rodzaju (liniowa)
Y-E(Y)<0
Y-E(Y)>0
E(Y)
E(X)
(1)
(2)
Y
b
a
X
y
x
y
x
|
|
^
- Gdzie a
x|y
i b
x|y
są ustalonymi
stałymi parametrami (regresji)
-
Model regresji liniowej jest prosty: niezależnie od tego, ile wartości przyjmują
zmienne X i Y, regresję liniową zawsze określają dwa parametry
a
x|y
i b
x|y ,
podczas gdy model regresji
średnich ma ich tyle, ile jest średnich warunkowych
- Model ten łatwo jest zinterpretować: X
y
= 704+129*Y
-
Inaczej niż w regresji średnich pozwala formułować przewidywania także dla wartości Y, które nie
występowały w oryginalnym zbiorze danych np. dla pracownika o stażu 4,5 roku premia będzie wynosić 1285
- Regresja liniowa daje mniej dokładne przewidywania aniżeli regresja średnich.
-
Regresja liniowa stawia mocniejsze wymagania pomiarowe: zarówno zmienna zależna i niezależna trzeba
mierzyć na skali przedziałowej
Regresja II rodzaju (liniowa)
Regresja II rodzaju (liniowa)
Y
b
a
X
y
x
y
x
|
|
^
-Wartość parametru b
x|y
(tzw. „współczynnik kierunkowy”) mówi nam ile mniejsza
bądź większa będzie wartość przewidywana X dla jednostki obserwacji
-Wartość parametru ax|y (tzw. wyraz wolny” albo „stała”) możemy interpretować jako
oczekiwanie X dla jednostki obserwacji.
-Jak wyznaczyć parametry a i b? naszym celem jest wyznaczenie takiej funkcji liniowej
która będzie charakteryzować się najmniejszym średnim kwadratem błędu przewidywania
spośród wszystkich możliwych funkcji Y
-Inaczej mówiąc szukamy takiej prostej, która wykreślona na wykresie regresji średnich
będzie przechodziła możliwie najbliżej punktów reprezentujących średnie warunkowe
Regresja II rodzaju (liniowa)
Regresja II rodzaju (liniowa)
Y
b
a
X
y
x
y
x
|
|
^
Y
D
Y
X
C
b
y
x
2
|
)
,
(
Y
E
b
X
E
a
y
x
y
x
|
|
X
D
XY
C
b
yx
2
)
(
Y-E(Y)<0
Y-E(Y)>0
E(Y)
E(X)
Y
D
XY
C
b
xy
2
)
(
2
2
2
2
2
2
)
(
)
(
)
(
r
Y
D
X
D
XY
C
Y
D
XY
C
X
D
XY
C
b
b
xy
yx
1
)
(
1
Y
D
X
D
XY
C
r
Współczynnik korelacji liniowej C. Pearsona
Zadanie 1
Zadanie 1
Dany jest rozkład łączny liczebności zmiennej X – dochody (w tys. zł) i Y
– liczba przyjaciół.
a) Wyznacz regresję liniową Y od X i zinterpretuj współczynniki.
Przedstaw uzyskaną funkcję na wykresie.
b) Oblicz kwadrat współczynnika korelacji liniowej i zinterpretuj jego
wartość
Zadanie 1
Zadanie 1
Dany jest rozkład łączny liczebności zmiennej X – dochody (w tys. zł) i Y – liczba
przyjaciół.
a) Wyznacz regresję liniową Y od X i zinterpretuj współczynniki. Przedstaw
uzyskaną funkcję na wykresie.
b) Oblicz kwadrat współczynnika korelacji liniowej i zinterpretuj jego wartość
Co potrzebujemy:
-Średnie zmiennej X i Y
-Średnią iloczynu zmiennych
-Wariancję zmiennej X
X
b
a
Y
x
y
x
y
|
|
^
X
D
Y
X
C
b
x
y
2
|
)
,
(
X
E
b
Y
E
a
x
y
x
y
|
|
Zadanie 2
Zadanie 2
Dany jest rozkład łączny liczebności zmiennych X – staż pracy od
zmiennej Y – wiek pracownika..
a) Wyznacz regresję liniową Y od X i zinterpretuj współczynniki.
Przedstaw uzyskaną funkcję na wykresie.
b) Oblicz kwadrat współczynnika korelacji liniowej i zinterpretuj jego
wartość