background image

 

 

Regresja I rodzaju oraz

Regresja I rodzaju oraz

mierniki siły zależności

mierniki siły zależności

background image

 

 

Regresja zmiennej X ze względu na zmienną Y jest to funkcja zmiennej Y służąca do 
przewidywania (opisu) wartości zmiennej X, optymalna przy danej funkcji błędu l w określonej 
klasie funkcji zmiennej Y. Będzie ona oznaczana przez 

^

Y

X

X

Y

X

Y

X

Y

Nie ma zależności statystycznej

Zależność statystyczna 

jest, ale 

jak silna

?

Maksymalna zależność 

statystyczna – 

niezależnie od 

kształtu funkcji!

X=f(Y)

background image

 

 

Regresja I rodzaju

Regresja I rodzaju

X

 -

 W

y

s

o

k

o

ś

ć

 o

s

ta

tn

ie

p

re

m

ii

Y- lata w zawodzie

background image

 

 

Regresja I rodzaju

Regresja I rodzaju

- Jak wytłumaczymy fakt, że dla osób z 4-o letnim stażem przewidujemy 

niższą premię niż dla osób z 3-letnim doświadczeniem?

- Czy nie lepiej byłoby gdybyśmy w naszych przewidywaniach premii dla osób z np. 4-o letnim 

doświadczeniem wykorzystali wiedzę o tych z 3-letnim i 5-letnim stażem?

- Możemy zauważyć tendencję: wraz ze wzrostem doświadczenia wzrasta też wysokość premii

X

 -

 W

y

s

o

k

o

ś

ć

 o

s

ta

tn

ie

p

re

m

ii

Y- lata w zawodzie

background image

 

 

1

2

3

11
0

1

1

0

2

11
5

0

2

2

4

12
0

0

1

1

2

12
5

0

0

2

2

1

4

5

y

i

x

i

1

2

3

11
0

0,1

0,1

0

0,2

11
5

0

0,2

0,2

0,4

12
0

0

0,1

0,1

0,2

12
5

0

0

0,2

0,2

0,1

0,4

0,5

1

1

2

3

110

1

0,25 0

115

0

0,5

0,4

120

0

0,25 0,2

125

0

0

0,4

1

1

1

y

i

x

i

y

i

x

i

N(X = x

i Λ 

Y= y

i)

P(X = x

i Λ 

Y= y

i)

P(X = x

i | 

Y= y

i)

Mo(X)

=

b(X) = 
Me(X)

d(X) = 
E(X) = 
   (X) = 

D

2

Mo(X|Y=1) = 
b(X|Y=1) = 
Me(X|Y=1) = 
d(X|Y=1) = 
E(X|Y=1) = 
   (X|Y=1) = 

Mo(X|Y=2) = 
b(X|Y=2) = 
Me(X|Y=2) = 
d(X|Y=2) = 
E(X|Y=2) = 
   (X|Y=2) = 

Mo(X|Y=3)  =
b(X|Y=3) = 
Me(X|Y=3) = 
d(X|Y=3) = 
E(X|Y=3) = 
   (X|Y=3) = 

D

2

D

2

D

2

background image

 

 

1

2

3

11
0

1

1

0

2

11
5

0

2

2

4

12
0

0

1

1

2

12
5

0

0

2

2

1

4

5

y

i

x

i

1

2

3

11
0

0,1

0,1

0

0,2

11
5

0

0,2

0,2

0,4

12
0

0

0,1

0,1

0,2

12
5

0

0

0,2

0,2

0,1

0,4

0,5

1

1

2

3

110

1

0,25 0

115

0

0,5

0,4

120

0

0,25 0,2

125

0

0

0,4

1

1

1

y

i

x

i

y

i

x

i

N(X = x

i Λ 

Y= y

i)

P(X = x

i Λ 

Y= y

i)

P(X = x

i | 

Y= y

i)

Mo(X)

= 115

b(X) = 0,6
Me(X)

= 115

d(X) = 4
E(X) = 117
   (X) = 26

D

2

Mo(X|Y=1) = 110
b(X|Y=1) = 0
Me(X|Y=1) = 110
d(X|Y=1) = 0
E(X|Y=1) = 110
   (X|Y=1) = 0

Mo(X|Y=2) = 115
b(X|Y=2) = 0,5
Me(X|Y=2) = 115
d(X|Y=2) = 2,5
E(X|Y=2) = 115
   (X|Y=2) = 12,5

Mo(X|Y=3) 

{115,125}

b(X|Y=3) = 0,6
Me(X|Y=3) = 120
d(X|Y=3) = 4
E(X|Y=3) = 120
   (X|Y=3) = 20

D

2

D

2

D

2

background image

 

 

X

Y

Ania

110

2

115

-5

1

115

-5

1

Basia

115

2

115

0

0

115

0

0

Czesiek

115

3

115

0

0

125

-10

1

Darek

115

2

115

0

0

115

0

0

Ewa

120

2

115

5

1

115

5

1

Franek

125

3

115

10

1

125

0

0

Iwona

125

3

115

10

1

125

0

0

Jola

110

1

115

-5

1

110

0

0

Krzyś

115

3

115

0

0

125

-10

1

Leon

120

3

115

5

1

125

-5

1

E[l

1

(e

x

)]=0,6

E[l

1

(e

x

|Y

)]=0,5

b(X|Y=1)=0
P(Y=1)=0,1

b(X|Y=2)=0,4
P(Y=2)=0,4

b(X|Y=3)=0,6
P(Y=3)=0,5

E[l

1

(e

x

|Y

)]= E[b(X|Y)]

E[b(X|Y)]= 0*0,1 + 0,5*0,4 + 0,6*0,5 = 0 + 0,2 + 0,3 = 0,5

a

i

P[b(X|Y)=a

i

]

0

0,1

0,5

0,4

0,6

0,5

1

)

(

^

X

Mo

^

X

X

e

x

)

(

1

x

e

)

|

(

^

Y

X

Mo

X

Y

)

^

|

Y

Y

X

X

X

e

)

(

|

1

Y

X

e

background image

 

 

X

Y

Ania

110

2

115

-5

5

115

-5

5

Basia

115

2

115

0

0

115

0

0

Czesiek

115

3

115

0

0

120

-5

5

Darek

115

2

115

0

0

115

0

0

Ewa

120

2

115

5

5

115

5

5

Franek

125

3

115

10

10

120

5

5

Iwona

125

3

115

10

10

120

5

5

Jola

110

1

115

-5

5

110

0

0

Krzyś

115

3

115

0

0

120

-5

5

Leon

120

3

115

5

5

120

0

0

E[l

2

(e

x

)]= 4

E[l

2

(e

x

|Y

)]= 3

)

(

^

X

Me

^

X

X

e

x

|

|

)

(

2

x

x

e

e

l

)

|

(

^

Y

X

Me

X

Y

)

^

|

Y

Y

X

X

X

e

|

|

)

(

|

|

2

Y

X

Y

X

e

e

l

b(X|Y=1)=0
P(Y=1)=0,1

b(X|Y=2)=2,5
P(Y=2)=0,4

b(X|Y=3)=4
P(Y=3)=0,5

E[l

1

(e

x

|Y

)]= E[d(X|Y)]

E[b(X|Y)]= 0*0 + 2,5*0,4 + 4*0,5 = 3

a

i

P[d(X|Y)=a

i

]

0

0,1

2,5

0,4

4

0,5

1

background image

 

 

X

Y

Ania

110

2

115

-5

5

115

-5

5

Basia

115

2

115

0

0

115

0

0

Czesiek

115

3

115

0

0

120

-5

5

Darek

115

2

115

0

0

115

0

0

Ewa

120

2

115

5

5

115

5

5

Franek

125

3

115

10

10

120

5

5

Iwona

125

3

115

10

10

120

5

5

Jola

110

1

115

-5

5

110

0

0

Krzyś

115

3

115

0

0

120

-5

5

Leon

120

3

115

5

5

120

0

0

E[l

3

(e

x

)]= 26

E[l

3

(e

x

|Y

)]= 15

)

(

^

X

E

^

X

X

e

x

2

3

)

(

)

(

x

x

e

e

l

)

|

(

^

Y

X

E

X

Y

Y

Y

X

X

X

e

^

|

2

|

|

2

)

(

)

(

Y

X

Y

X

e

e

l

E(X|Y=1)=110
P(Y=1)=0,1

E(X|Y=2)=115
P(Y=2)=0,4

E(X|Y=3)=120
P(Y=3)=0,5

E[l

1

(e

x

|Y

)]= E[d(X|Y)]

E[b(X|Y)]= 110*0,1 + 115*0,4 + 120*0,5 = 117

a

i

P[d(X|Y)=a

i

]

110

0,1

115

0,4

120

0,5

1

background image

 

 

X

Y

X =2x+1

E

= X - X

l

1

(e

x

)

X

Y

 = Mo(X|Y)

e

X|Y

=X - X

Y

l

1

(e

x

|Y

)

Ania

110

2

221

-111

1

115

-5

1

Basia

115

2

231

-116

0

115

0

0

Czesiek

115

3

231

-116

0

125

-10

1

Darek

115

2

231

-116

0

115

0

0

Ewa

120

2

231

-111

1

115

5

1

Franek

125

3

231

-106

1

125

0

0

Iwona

125

3

231

-106

1

125

0

0

Jola

110

1

231

-121

1

110

0

0

Krzyś

115

3

231

-116

0

125

-10

1

Leon

120

3

231

-111

1

125

-5

1

E[l

1

(e

x

)]=0,6

E[l

1

(e

x

|Y

)]=0,5

b(X|Y=1)=0
P(Y=1)=0,1

b(X|Y=2)=0,4
P(Y=2)=0,4

b(X|Y=3)=0,6
P(Y=3)=0,5

E[l

1

(e

x

|Y

)]= E[b(X|Y)]

E[b(X|Y)]= 0*0,1 + 0,5*0,4 + 0,6*0,5 = 0 + 0,2 + 0,3 = 0,5

a

i

P[b(X|Y)=a

i

]

0

0,1

0,5

0,4

0,6

0,5

1

background image

 

 

X

Y

X

Y

X

Y

Nie ma zależności statystycznej

Zależność statystyczna 

jest, ale 

jak silna

?

Maksymalna zależność 

statystyczna – 

niezależnie od 

kształtu funkcji!

X=f(Y)

1

)

(

)]

/

(

[

)

(

0

/

X

b

Y

X

b

E

X

b

y

x

1

)

(

)]

/

(

[

)

(

0

/

X

d

Y

X

d

E

X

d

y

x

1

)

(

)]

/

(

[

)

(

0

2

2

2

/

2

X

D

Y

X

D

E

X

D

y

x

0

/

y

x

0

/

y

x

0

/

2

y

x

1

/

y

x

1

/

y

x

1

/

2

y

x

Skala nominalna

Skala porządkowa

Skala interwałowa

background image

 

 

Zadanie 1

Zadanie 1

Mamy rozkład łączny liczebności zmiennych X i Y określony w10-
osobowej zbiorowości, gdzie X oznacza liczbę przyjaciół, a Y – zarobki w 
tysiącach złotych.

1

)

(

)]

/

(

[

)

(

0

2

2

2

/

2

X

D

Y

X

D

E

X

D

y

x

Wyznacz:
a) Regresję modalnych X|Y i Y|X
b) Regresję median X|Y i Y|X
c) Regresję średnich X|Y i Y|X
d) Oblicz Eta2

background image

 

 

Zadanie 3 – Oblicz kowariancję 

Zadanie 3 – Oblicz kowariancję 

oraz sumę wariancji zmiennych 

oraz sumę wariancji zmiennych 

X i Y i współczynnik Eta2

X i Y i współczynnik Eta2


Document Outline