Zadanie:
Tabela podaje zależność miedzy rocznym dochodem netto (na jedną osobę), a wydatkami na odzież w 10 rodzinach.
Wyznaczyć:
liniowy model regresji wydatków od dochodu dla danych z próby;
ocenić adekwatność modelu liniowego do obserwowanych danych;
ocenić istotność statystyczną zależności miedzy badanymi cechami (czyli wielkościami);
oszacować przedziałowo wartość wydatków na odzież w rodzinach o dochodzie 25,5 tys. zł oraz 15 tys. zł.
Dochody w tys. zł |
Wydatki |
|
|
|
|
|
|
|
|
6 |
0,7 |
36 |
0,49 |
-9 |
-0,9 |
8,1 |
0,74 |
-0,04 |
0,0016 |
8 |
1,0 |
64 |
1,00 |
-7 |
-0,6 |
4,2 |
0,94 |
0,06 |
0,0036 |
10 |
1,1 |
100 |
1,21 |
-5 |
-0,5 |
2,5 |
1,14 |
-0,04 |
0,0016 |
12 |
1,3 |
144 |
1,69 |
-3 |
-0,3 |
0,9 |
1,34 |
-0,04 |
0,0016 |
14 |
1,5 |
196 |
2,25 |
-1 |
-0,1 |
0,1 |
1,54 |
-0,04 |
0,0016 |
16 |
1,6 |
256 |
2,56 |
1 |
0,0 |
0,0 |
1,74 |
-0,14 |
0,0196 |
18 |
1,9 |
324 |
3,61 |
3 |
0,3 |
0,9 |
1,94 |
-0,04 |
0,0016 |
20 |
2,1 |
400 |
4,41 |
5 |
0,5 |
2,5 |
2,14 |
-0,04 |
0,0016 |
22 |
2,3 |
484 |
5,29 |
7 |
0,7 |
4,9 |
2,34 |
-0,04 |
0,0016 |
24 |
2,5 |
576 |
6,25 |
9 |
0,9 |
8,1 |
2,54 |
-0,04 |
0,0016 |
150 |
16,0 |
2580 |
28,76 |
0 |
0 |
32,2 |
|
|
0,0360 |
współczynniki liniowej funkcji regresji
dla danych z próby - są one estymatorami
odpowiednich ich parametrów liniowej
funkcji regresji w populacji
ad. 1
Liniowy model regresji próby ma postać:
⇑
liniowy model regresji wydatków
ad. 2
Miarą jakości dopasowania danych jest współczynnik determinacji.
⇑
współczynnik korelacji liniowej Pearsona
⇐ współczynnik determinacji
Interpretacja współczynnika determinacji:
Współczynnik determinacji informuje w jakim stopniu zmiany cechy Y są wyjaśnione zmiennością cechy X.
Dochód roczny netto w 99,4% decyduje o wysokości wydatków na odzież.
Badamy czy współczynnik *1 w populacji może przyjmować wartość „0”.
[inaczej - weryfikujemy hipotezę o wartości zerowej współczynnika regresji w populacji ⇒ *1=0 ]
Budujemy przedział ufności dla współczynnika *1. Jest to przedział, który z wysokim prawdopodobieństwem obejmuje współczynnik *1 w populacji.
Jeżeli przedział nie zawiera wartości zerowej - oznacza to, że współczynnik *1 z dużym prawdopodobieństwem jest różny od „0”.
Przedział ufności ma postać:
Dla *1
↑ ↑
błąd standardowy estymatora *1
gdzie:
Obliczamy
Przybliżony przedział ufności:
[ 0,1 - 2⋅0,0027 , 0,1 + 2⋅0,0027 ]
[ 0,0946 , 0,1054 ]
Ponieważ wyznaczony przedział ufności nie obejmuje „0” mamy 75% ufności, iż w populacji współczynnik regresji *1 jest różny od „0”.
Zależność cechy endogenicznej od cechy egzogenicznej jest statystycznie istotna.
EKONOMETRIA - LABORATORIUM
ĆWICZENIA 4 - 04.11.2006
4
xi
yi