Regresja I rodzaju oraz
Regresja I rodzaju oraz
mierniki siły zależności
mierniki siły zależności
Regresja zmiennej X ze względu na zmienną Y jest to funkcja zmiennej Y służąca do
przewidywania (opisu) wartości zmiennej X, optymalna przy danej funkcji błędu l w określonej
klasie funkcji zmiennej Y. Będzie ona oznaczana przez
^
Y
X
X
Y
X
Y
X
Y
Nie ma zależności statystycznej
Zależność statystyczna
jest, ale
jak silna
?
Maksymalna zależność
statystyczna –
niezależnie od
kształtu funkcji!
X=f(Y)
Regresja I rodzaju
Regresja I rodzaju
X
-
W
y
s
o
k
o
ś
ć
o
s
ta
tn
ie
j
p
re
m
ii
Y- lata w zawodzie
Regresja I rodzaju
Regresja I rodzaju
- Jak wytłumaczymy fakt, że dla osób z 4-o letnim stażem przewidujemy
niższą premię niż dla osób z 3-letnim doświadczeniem?
- Czy nie lepiej byłoby gdybyśmy w naszych przewidywaniach premii dla osób z np. 4-o letnim
doświadczeniem wykorzystali wiedzę o tych z 3-letnim i 5-letnim stażem?
- Możemy zauważyć tendencję: wraz ze wzrostem doświadczenia wzrasta też wysokość premii
X
-
W
y
s
o
k
o
ś
ć
o
s
ta
tn
ie
j
p
re
m
ii
Y- lata w zawodzie
1
2
3
11
0
1
1
0
2
11
5
0
2
2
4
12
0
0
1
1
2
12
5
0
0
2
2
1
4
5
y
i
x
i
1
2
3
11
0
0,1
0,1
0
0,2
11
5
0
0,2
0,2
0,4
12
0
0
0,1
0,1
0,2
12
5
0
0
0,2
0,2
0,1
0,4
0,5
1
1
2
3
110
1
0,25 0
115
0
0,5
0,4
120
0
0,25 0,2
125
0
0
0,4
1
1
1
y
i
x
i
y
i
x
i
N(X = x
i Λ
Y= y
i)
P(X = x
i Λ
Y= y
i)
P(X = x
i |
Y= y
i)
Mo(X)
=
b(X) =
Me(X)
=
d(X) =
E(X) =
(X) =
D
2
Mo(X|Y=1) =
b(X|Y=1) =
Me(X|Y=1) =
d(X|Y=1) =
E(X|Y=1) =
(X|Y=1) =
Mo(X|Y=2) =
b(X|Y=2) =
Me(X|Y=2) =
d(X|Y=2) =
E(X|Y=2) =
(X|Y=2) =
Mo(X|Y=3) =
b(X|Y=3) =
Me(X|Y=3) =
d(X|Y=3) =
E(X|Y=3) =
(X|Y=3) =
D
2
D
2
D
2
1
2
3
11
0
1
1
0
2
11
5
0
2
2
4
12
0
0
1
1
2
12
5
0
0
2
2
1
4
5
y
i
x
i
1
2
3
11
0
0,1
0,1
0
0,2
11
5
0
0,2
0,2
0,4
12
0
0
0,1
0,1
0,2
12
5
0
0
0,2
0,2
0,1
0,4
0,5
1
1
2
3
110
1
0,25 0
115
0
0,5
0,4
120
0
0,25 0,2
125
0
0
0,4
1
1
1
y
i
x
i
y
i
x
i
N(X = x
i Λ
Y= y
i)
P(X = x
i Λ
Y= y
i)
P(X = x
i |
Y= y
i)
Mo(X)
= 115
b(X) = 0,6
Me(X)
= 115
d(X) = 4
E(X) = 117
(X) = 26
D
2
Mo(X|Y=1) = 110
b(X|Y=1) = 0
Me(X|Y=1) = 110
d(X|Y=1) = 0
E(X|Y=1) = 110
(X|Y=1) = 0
Mo(X|Y=2) = 115
b(X|Y=2) = 0,5
Me(X|Y=2) = 115
d(X|Y=2) = 2,5
E(X|Y=2) = 115
(X|Y=2) = 12,5
Mo(X|Y=3)
E
{115,125}
b(X|Y=3) = 0,6
Me(X|Y=3) = 120
d(X|Y=3) = 4
E(X|Y=3) = 120
(X|Y=3) = 20
D
2
D
2
D
2
X
Y
Ania
110
2
115
-5
1
115
-5
1
Basia
115
2
115
0
0
115
0
0
Czesiek
115
3
115
0
0
125
-10
1
Darek
115
2
115
0
0
115
0
0
Ewa
120
2
115
5
1
115
5
1
Franek
125
3
115
10
1
125
0
0
Iwona
125
3
115
10
1
125
0
0
Jola
110
1
115
-5
1
110
0
0
Krzyś
115
3
115
0
0
125
-10
1
Leon
120
3
115
5
1
125
-5
1
E[l
1
(e
x
)]=0,6
E[l
1
(e
x
|Y
)]=0,5
b(X|Y=1)=0
P(Y=1)=0,1
b(X|Y=2)=0,4
P(Y=2)=0,4
b(X|Y=3)=0,6
P(Y=3)=0,5
E[l
1
(e
x
|Y
)]= E[b(X|Y)]
E[b(X|Y)]= 0*0,1 + 0,5*0,4 + 0,6*0,5 = 0 + 0,2 + 0,3 = 0,5
a
i
P[b(X|Y)=a
i
]
0
0,1
0,5
0,4
0,6
0,5
1
)
(
^
X
Mo
X
^
X
X
e
x
)
(
1
x
e
l
)
|
(
^
Y
X
Mo
X
Y
)
^
|
Y
Y
X
X
X
e
)
(
|
1
Y
X
e
l
X
Y
Ania
110
2
115
-5
5
115
-5
5
Basia
115
2
115
0
0
115
0
0
Czesiek
115
3
115
0
0
120
-5
5
Darek
115
2
115
0
0
115
0
0
Ewa
120
2
115
5
5
115
5
5
Franek
125
3
115
10
10
120
5
5
Iwona
125
3
115
10
10
120
5
5
Jola
110
1
115
-5
5
110
0
0
Krzyś
115
3
115
0
0
120
-5
5
Leon
120
3
115
5
5
120
0
0
E[l
2
(e
x
)]= 4
E[l
2
(e
x
|Y
)]= 3
)
(
^
X
Me
X
^
X
X
e
x
|
|
)
(
2
x
x
e
e
l
)
|
(
^
Y
X
Me
X
Y
)
^
|
Y
Y
X
X
X
e
|
|
)
(
|
|
2
Y
X
Y
X
e
e
l
b(X|Y=1)=0
P(Y=1)=0,1
b(X|Y=2)=2,5
P(Y=2)=0,4
b(X|Y=3)=4
P(Y=3)=0,5
E[l
1
(e
x
|Y
)]= E[d(X|Y)]
E[b(X|Y)]= 0*0 + 2,5*0,4 + 4*0,5 = 3
a
i
P[d(X|Y)=a
i
]
0
0,1
2,5
0,4
4
0,5
1
X
Y
Ania
110
2
115
-5
5
115
-5
5
Basia
115
2
115
0
0
115
0
0
Czesiek
115
3
115
0
0
120
-5
5
Darek
115
2
115
0
0
115
0
0
Ewa
120
2
115
5
5
115
5
5
Franek
125
3
115
10
10
120
5
5
Iwona
125
3
115
10
10
120
5
5
Jola
110
1
115
-5
5
110
0
0
Krzyś
115
3
115
0
0
120
-5
5
Leon
120
3
115
5
5
120
0
0
E[l
3
(e
x
)]= 26
E[l
3
(e
x
|Y
)]= 15
)
(
^
X
E
X
^
X
X
e
x
2
3
)
(
)
(
x
x
e
e
l
)
|
(
^
Y
X
E
X
Y
Y
Y
X
X
X
e
^
|
2
|
|
2
)
(
)
(
Y
X
Y
X
e
e
l
E(X|Y=1)=110
P(Y=1)=0,1
E(X|Y=2)=115
P(Y=2)=0,4
E(X|Y=3)=120
P(Y=3)=0,5
E[l
1
(e
x
|Y
)]= E[d(X|Y)]
E[b(X|Y)]= 110*0,1 + 115*0,4 + 120*0,5 = 117
a
i
P[d(X|Y)=a
i
]
110
0,1
115
0,4
120
0,5
1
X
Y
X =2x+1
E
x
= X - X
l
1
(e
x
)
X
Y
= Mo(X|Y)
e
X|Y
=X - X
Y
l
1
(e
x
|Y
)
Ania
110
2
221
-111
1
115
-5
1
Basia
115
2
231
-116
0
115
0
0
Czesiek
115
3
231
-116
0
125
-10
1
Darek
115
2
231
-116
0
115
0
0
Ewa
120
2
231
-111
1
115
5
1
Franek
125
3
231
-106
1
125
0
0
Iwona
125
3
231
-106
1
125
0
0
Jola
110
1
231
-121
1
110
0
0
Krzyś
115
3
231
-116
0
125
-10
1
Leon
120
3
231
-111
1
125
-5
1
E[l
1
(e
x
)]=0,6
E[l
1
(e
x
|Y
)]=0,5
b(X|Y=1)=0
P(Y=1)=0,1
b(X|Y=2)=0,4
P(Y=2)=0,4
b(X|Y=3)=0,6
P(Y=3)=0,5
E[l
1
(e
x
|Y
)]= E[b(X|Y)]
E[b(X|Y)]= 0*0,1 + 0,5*0,4 + 0,6*0,5 = 0 + 0,2 + 0,3 = 0,5
a
i
P[b(X|Y)=a
i
]
0
0,1
0,5
0,4
0,6
0,5
1
X
Y
X
Y
X
Y
Nie ma zależności statystycznej
Zależność statystyczna
jest, ale
jak silna
?
Maksymalna zależność
statystyczna –
niezależnie od
kształtu funkcji!
X=f(Y)
1
)
(
)]
/
(
[
)
(
0
/
X
b
Y
X
b
E
X
b
y
x
1
)
(
)]
/
(
[
)
(
0
/
X
d
Y
X
d
E
X
d
y
x
1
)
(
)]
/
(
[
)
(
0
2
2
2
/
2
X
D
Y
X
D
E
X
D
y
x
0
/
y
x
0
/
y
x
0
/
2
y
x
1
/
y
x
1
/
y
x
1
/
2
y
x
Skala nominalna
Skala porządkowa
Skala interwałowa
Zadanie 1
Zadanie 1
Mamy rozkład łączny liczebności zmiennych X i Y określony w10-
osobowej zbiorowości, gdzie X oznacza liczbę przyjaciół, a Y – zarobki w
tysiącach złotych.
1
)
(
)]
/
(
[
)
(
0
2
2
2
/
2
X
D
Y
X
D
E
X
D
y
x
Wyznacz:
a) Regresję modalnych X|Y i Y|X
b) Regresję median X|Y i Y|X
c) Regresję średnich X|Y i Y|X
d) Oblicz Eta2
Zadanie 3 – Oblicz kowariancję
Zadanie 3 – Oblicz kowariancję
oraz sumę wariancji zmiennych
oraz sumę wariancji zmiennych
X i Y i współczynnik Eta2
X i Y i współczynnik Eta2