Zadanie
Oszacować liniowy model obrazujący związek między dochodem narodowym a odsetkiem pracujących w rolnictwie w wybranych krajach dawnego układu RWPG w 1990r.
Przyjęto następujące oznaczenia:
yi - dochód narodowy w USD na 1 mieszkańca i-tego kraju,
xi - odsetek pracujących w rolnictwie i-tego kraju.
Niezbędne informacje zamieszczono w tablicy poniżej ( tablica posortowana rosnąco względem xi).
i |
Kraj |
yi |
xi |
1 |
Czechosłowacja |
3400 |
12 |
2 |
Węgry |
2600 |
19 |
3 |
Bułgaria |
2300 |
20 |
4 |
Polska |
1900 |
27 |
5 |
Rumunia |
1400 |
28 |
Za cel postawiliśmy sobie osiągnięcie modelu, który będzie w jak najlepszym stopniu odpowiadał rzeczywistości. W jego szacowaniu posłużymy się MNK. Przy weryfikacji hipotez istotności zakładamy współczynnik α=0,05.
Graficzna prezentacja danych do zadania
W celu zaproponowania modelu analitycznego, przeprowadzimy analizę danych po przez :
funkcję liniową,
funkcję wykładniczą
Ad.1
Parametry funkcji liniowej, przedstawionej poniżej :
Rozwiązujemy wg MNK, czyli:
za macierz X podstawiamy odsetek pracujących w rolnictwie, otrzymując macierz X. Macierz Y - to dochód narodowy
Macierz XT mnożymy przez macierz X :
Obliczamy wyznacznik macierzy: 854 . Macierz odwrotna istnieje:
Następnym krokiem jest obliczenie ilorazu XTY:
Ostatnim krokiem w celu obliczenia rozwiązań równania jest obliczenie iloczynu macierzy
(XTX)-1(XTY), czyli wektor rozwiązań:
Powyższa macierz jest macierzą parametrów naszego równania.
Nasz model możemy zapisać:
Oszacujmy parametry rozkładu składnika losowego pozwalające wnioskować o dobroci dopasowania modelu do danych empirycznych. Do pierwszego parametru należą średnie błędów szacunku estymatorów modelu. Aby to obliczyć, musimy najpierw obliczyć wariancje resztową
:
gdzie:
n - liczba obserwacji (dla naszego przykładu 5),
k - liczba parametrów modelu (dla naszego przypadku 2).
Obliczmy najpierw iloczyn macierzy YTY, który wynosi 29180000. Iloczyn macierzy XTY mamy już obliczony powyżej. Musimy, więc obliczyć iloczyn tej macierzy i wektora rozwiązań, czyli
wynosi on: 29074813. Przejdźmy do obliczenia
Możemy już teraz przejść do obliczenia średnich błędów szacunku modelu, które liczymy wg wzoru:
gdzie cji to elementy stojące na przekątnej macierzy (XT X)-1.
Obliczamy średnie błędy szacunku dla poszczególnych parametrów strukturalnych modelu:
dla a0
dla a1
Nasz model możemy więc zapisać:
Saj: (315,079) (14,328)
W celu zbadania istotności parametrów strukturalnych modelu weryfikujemy hipotezę
wobec alternatywnej
W tym celu wyznaczamy ze statystyki
t0 dla a0, które wynosi :
oraz t1 dla a1
Z tablic rozkładu t-Studenta dla n-k stopni swobody i α = 0,05 odczytujemy: t0,05,3 = 3,182.
Wyniki mówią nam, że parametr a0 dla którego przyjmujemy hipotezę H0 jest statystycznie różny od zera, parametr a1 również. Mają one wpływ na wielkość dochodu narodowego.
Zapiszemy nasz model w postaci:
Saj: (315,079) (14,328)
: (14,935) (-7,854)
Aby sprawdzić dopasowanie oszacowanego modelu do danych rzeczywistych wyznaczamy współczynnik determinacji R2 oraz odchylenie standardowe składnika resztowego modelu s.
w naszym przypadku wynosi ono 187,24 i mówi nam że przeciętne odchylenie wartości empirycznych od wartości rzeczywistych wynosi 187,25USD na 1 mieszkańca.
Współczynnik determinacji obliczamy wg wzoru:
n - liczba obserwacji (5)
- średnia z macierzy = 2320
Pozostałe wartości tego równania mamy już obliczone powyżej i po podstawieniu otrzymujemy
Model nasz jest więc dobrze dopasowany do danych empirycznych, bo wyjaśnia aż 83,2 % obserwacji. Posiadając obliczony współczynnik determinacji
możemy obliczyć współczynnik zbieżności
, który liczymy jako różnice : 1 - R2 .
Niska wartość współczynnik zbieżności mówi nam o bardzo dobrym dopasowaniu modelu do danych empirycznych. Współczynnik korelacji wielorakiej jest - on pierwiastkiem kwadratowym z R2. Dla naszego modelu:
Ostatnią miarą dopasowania modelu jest współczynnik zmienności losowej, czyli
Dla naszego modelu, uzyskujemy
Współczynnik ten jest niższy od umownej wartości 10% co oznacza, że cechy wykazują zróżnicowanie statystycznie nieistotne.
Zastosujmy statystykę Durbina-Watsona.
Musimy wykonać obliczenia pomocnicze
x |
yt |
Yt |
et |
et2 |
et-1 |
et-12 |
et -et-1 |
et et-1 |
(et -et-1)2 |
12 |
3400 |
3355,27 |
44,73 |
2000,50 |
- |
- |
- |
- |
- |
19 |
2600 |
2567,57 |
32,43 |
1051,70 |
44,73 |
2000,50 |
-12,30 |
1450,50 |
151,22 |
20 |
2300 |
2455,04 |
-155,04 |
24037,71 |
32,43 |
1051,70 |
-187,47 |
-5027,98 |
35145,38 |
27 |
1900 |
1667,34 |
232,66 |
54131,61 |
-155,04 |
24037,71 |
387,70 |
-36072,15 |
150313,62 |
28 |
1400 |
1554,81 |
-154,81 |
23965,83 |
232,66 |
54131,61 |
-387,47 |
-36018,17 |
150133,78 |
|
- |
- |
- |
105187,35 |
- |
81221,53 |
- |
-75667,80 |
335743,98 |
Dla zastosowania tej statystyki musimy zastosować poniższe wzory
Estymator współczynnika autokorelacji
co po podstawieniu naszych danych z tabeli daje nam r = -0,819 (jeśli występuje autokorelacja, to jest ona ujemna)
Statystyka Durbina-Watsona
po podstawieniu danych z tabeli pomocniczej otrzymujemy d =3,192. Współczynnik d>2, musimy wprowadzić d*=4-d, dla naszego przypadku d*=0,808
Z tablic wartości krytycznych statystyki Durbina-Watsona, dla α=0,05 oraz n=7 (najbliższa znaleziona przez nas wartość ) i k=2 odczytujemy odpowiednie statystyki dL=0,467 oraz du=1,897. Testujemy hipotezę
wobec hipotezy alternatywnej
Nanieśmy nasze dane na wykres.
Z powyższego wynika, że nie możemy przyjąć żadnych z hipotez, gdyż d*=0,808 znajduje się w obszarze nieokreśloności, Liczebność próby jest zbyt mała, by odpowiedzieć na pytania o autokorelację.
Poniżej przedstawiamy graficzną prezentację danych oryginalnych i danych obliczonych za pomocą naszego wzoru:
Ad.2 Model z funkcją wykładniczą
Aby zastosować MNK, musimy dokonać pewnych podstawień: y' =ln(yoblicz) oraz a'=ln(a0)
Model ten po dokonanych podstawieniach, tak jak i poprzedni możemy obliczyć MNK, czyli wg wzoru:
Wynik naszej operacji na macierzach (XTX)-1, jest macierz:
Macierz XTY:
Po wymnożeniu naszych macierzy, uzyskujemy wektor rozwiązań naszego modelu, czyli
:
Aby wstawić dane naszego rozwiązania do wzoru musimy wykonać jeszcze jedną operację. Mianowicie a0 musimy obliczyć odwrotność do ln() czyli e(a0) . Model nasz możemy zapisać w postaci:
Kolejnym krokiem będzie obliczenie wariancji resztowej
:
gdzie:
n - liczba obserwacji (dla naszego przykładu 5),
k - liczba parametrów modelu (dla naszego przypadku 2).
Iloczyn macierzy YTY wynosi: 297,3461, natomiast iloczyn
: 297,3095. Po obliczeniu wg powyższego wzoru uzyskujemy, więc
=0,012.
Możemy już teraz przejść do obliczenia średnich błędów szacunku modelu, które liczymy wg wzoru:
gdzie cji to elementy stojące na przekątnej macierzy (XT X)-1
Obliczamy średnie błędy szacunku dla poszczególnych parametrów strukturalnych modelu:
dla a0
dla a1
Zapiszmy nasz model (postać liniową) :
Saj : (0,184) (0,00838)
W celu zbadania istotności parametrów strukturalnych modelu weryfikujemy hipotezę
wobec alternatywnej
W tym celu wyznaczamy ze statystyki
t0 dla a0, które wynosi :
oraz t1 dla a1
Z tablic rozkładu t-Studenta dla n-k stopni swobody i α = 0,05 odczytujemy: t0,05,3 = 3,182.
Wszystkie nasze parametry modelu są istotnie różne od zera. Oszacowane przez nas parametry modelu mają istotny wpływ na wielkość dochodu narodowego.
Zapiszemy nasz model w postaci:
Saj : (0,184) (0,00838)
: (47,5) (-5,835)
Aby sprawdzić dopasowanie oszacowanego modelu do danych rzeczywistych wyznaczamy współczynnik determinacji R2 oraz odchylenie standardowe składnika resztowego modelu s.
Odchylenie standardowe reszt jest niczym innym jak pierwiastkiem kwadratowym z
czyli
w naszym przypadku wynosi ono 0,1095 co oznacza, że przeciętne odchylenie wartości empirycznych od wartości rzeczywistych wynosi 0,1095 USD. Obliczmy
, który obliczamy wg wzoru:
n - liczba obserwacji (5)
- średnia z macierzy = 7,7059
Pozostałe wartości tego równania mamy już obliczone powyżej i po podstawieniu otrzymujemy
Model nasz jest więc bardzo dobrze dopasowany do danych empirycznych, bo wyjaśnia aż 91,71 % obserwacji. Posiadając obliczony współczynnik determinacji
możemy obliczyć współczynnik zbieżności
Niska wartość współczynnik zbieżności świadczy o dokładnym dopasowaniu modelu do danych empirycznych.
Współczynnik korelacji wielorakiej, to kolejna miara dopasowania modelu do danych empirycznych. Dla naszego modelu:
Ostatnią miarą dopasowania modelu jest współczynnik zmienności losowej, czyli
Dla naszego modelu, uzyskujemy
Współczynnik ten (jego wartość) jest bardzo mały co oznacza, że cechy nie wykazują zróżnicowania statystycznie istotnego.
Zastosujmy statystykę Durbina-Watsona.
Musimy wykonać obliczenia pomocnicze, które prezentujemy w tabeli poniżej.
x |
yt |
Yt |
et |
et2 |
et-1 |
et-12 |
et -et-1 |
et et-1 |
(et -et-1)2 |
12 |
3400 |
3482,13 |
-82,13 |
6745,63 |
- |
- |
- |
- |
- |
19 |
2600 |
2472,78 |
127,22 |
16183,88 |
-82,13 |
6745,63 |
209,35 |
-10448,47 |
43826,45 |
20 |
2300 |
2354,77 |
-54,77 |
3000,17 |
127,22 |
16183,88 |
-181,99 |
-6968,10 |
33120,26 |
27 |
1900 |
1672,21 |
227,79 |
51889,36 |
-54,77 |
3000,17 |
282,57 |
-12477,06 |
79843,66 |
28 |
1400 |
1592,40 |
-192,40 |
37019,22 |
227,79 |
51889,36 |
-420,20 |
-43828,11 |
176564,81 |
|
- |
- |
- |
114838,26 |
- |
77819,05 |
- |
-73721,74 |
333355,17 |
Dla obliczenia tej statystyki musimy zastosować prezentowane już powyżej wzory
Estymator współczynnika autokorelacji r = -0,78 liczony wg wzoru:
Statystyka Durbina-Watsona d = 2,903 liczony wg wzoru:
Współczynnik d>2, musimy wprowadzić d*=4-d, dla naszego przypadku d*=0,903
Z tablic wartości krytycznych statystyki Durbina-Watsona, jak poprzednio dla α=0,05 oraz n=7 i k=2 odczytujemy odpowiednie statystyki dL=0,467 oraz du=1,897.
Testujemy hipotezę
wobec hipotezy alternatywnej
Nanieśmy nasze dane na wykres.
Z powyższego wynika, że nie możemy przyjąć żadnych z hipotez, gdyż d*=0,903 znajduje się w obszarze nieokreśloności, Liczebność próby jest zbyt mała, by odpowiedzieć na pytania o autokorelację
Przede wszystkim w modelu tym nie występuje autokorelacja co jest również bardzo ważne przy wyborze odpowiedniej postaci funkcji analitycznej.
Poniżej przedstawiamy graficzną prezentację danych oryginalnych i danych obliczonych za pomocą naszego wzoru:
14
6
t0=47,5
t1=-5,835
tj
H0
H1
H1
H1
t0=14,935
t1=-7,854
tα
-tα
tj
H0
H1