Regresja liniowa 1 rzecz to łaczny rozkład częstośći!!!!
X=ax|y+bx|y*y
Musimy mięć
E(X) – liczoną z łącznego rozkładu częstości
(*)
x/y | 1 | 2 | 3 | 4 | |
---|---|---|---|---|---|
1 2 3 |
2/18 3/18 0 |
2/18 0 2/18 |
2/18 0 2/18 |
0 3/18 2/318 |
1/3 1/3 1/3 |
5/18 | 4/18 | 4/18 | 5/18 | 1 |
E(X)= 1*1/3+2*1/3+3*1/3=2
D2(X)=12*1/3+22*1/3+32*1/3-E(X)2=0,667
E(Y)=1*5/18+2*4/18+3*4/18+4*5/18=2,5
D2(Y)= 12*5/18+22*4/18+32*4/18+42*5/18- E(Y)2=1,36
E(XY)
xy | 1 | 2 | 3 | 4 |
---|---|---|---|---|
1 2 3 |
2/18 | 2/18 3/18 | 6/18 0 | 0 |
2/18 | 4/18 0 | 0 2/18 | 12/18 |
2/18 | 6/18 0 | 0 2/18 | 18/18 |
0 | 0 3/18 | 24/18 2/18 | 24/18 |
5/18| 8/18 | 4/18 | 16/18 | 4/18 | 24/18 | 5/18 | 48/18 |
E(XY)=8/18+16/18+24/18+48/18=96/18=5,33
C(XY)=E(XY)-E(X)*E(Y)=5,33-2*2,5=0,33
bx|y=$\frac{C(XY)}{D2(Y)}$=$\frac{0,33}{1,36} = 0,24$
ax|y=E(X)- bx|y*E(Y)=2-0,24*2,=1,4
X= ax|y+ bx|y*y = > x=1,4+0,24y
Regresja średnich
Zwrócić uwagę czy jest rozkład warunkowy X|Y czy Y|X Można liczyć również z łącznego rozkładu liczebności
Przykład dla rozkładu X|Y z rozkładu częstości powyżej* tworzymy rozkład warunkowy X|Y
x/y | 1 | 2 | 3 | 4 |
---|---|---|---|---|
1 2 3 |
0,4 0,6 0 |
0,5 0 0,5 |
0,5 0 0,5 |
0 0,6 0,4 |
1 | 1 | 1 | 1 |
0,4= 2/18:5/18=2/18*18/5
E(X|Y=1)=1*0,4+2*0,6+3*0=1,6
Xy E(X|Y=2)=1*0,5+2*0+3*0,5=2
E(X|Y=3)= 1*0,5+2*0+3*0,5=2
E(X|Y=4)=1*0+2*0,6+3*0,4=2,4
Miernik siły zależności przy regresji liniowej
= $\frac{0,33}{0,0667*1,36} = 0,12$
W 12% zmienna Y wykorzystywana jest do przewidywania zmiennej X w regresji liniowej, redukuje średni kwadrat błędu przewidywania zmiennej X
Miernik siły zależności przy regresji średnich
η2=$\frac{D^{2}\lbrack E(X|Y)}{D^{2}(X)}$ D2[E(X|Y)]=∑[E(X|Y=yi]2-E(X)]*P(y=yi)
D2[E(X|Y)]=(1,6-2)2*5/18+(2-2)2*4/18+(2-2)2*4/18+(2,4-2)2*5/18=0,089
η2=$\frac{0,089}{0,667} = 0,133$ W 13,3% zmienna Y wykorzystana jest do przewidywania zmiennej X w regresji średnich, redukuje średni kwadrat błędu przewidywania.
Interpretacja Parametrów
$$\hat{X} = 1,4 + 0,24y$$
0,24 - jeżeli czas poświęcony na naukę wzrośnie o 1 tydzień to przewidywana liczba zdanych egzaminów wzrośnie o 0,24
1,4 – jeżeli nie będziemy się uczyć o sesji to przewidywana liczba zdanych egzaminów wyniesie 1,4
Przedział ufności dla średniej
Standaryzujemu
Poziom ufności = 1-α zazwyczaj podany w zadaniu α=1-ten poziom
F(Uα)=1-$\frac{\propto}{2}$ później odczytać z tablic E(X)-Uα*$\frac{D(X)}{\sqrt{N}}$≤m≤E(X)+ Uα*$\frac{D(X)}{\sqrt{N}}\ $
Liczebność również podana N
Trzeba obliczyć D2(X) żeby później wyciągnąć pierwiastek i otrzymać D(X)
Minimalna liczebność próby
d- dokładność oszacowania
nmin=$\frac{U_{\propto}*D^{2}(X)}{d}$