Zadanie
Oszacować liniowy model obrazujący związek między dochodem narodowym a odsetkiem pracujących w rolnictwie w wybranych krajach dawnego układu RWPG w 1990r.
Przyjęto następujące oznaczenia:
yi - dochód narodowy w USD na 1 mieszkańca i-tego kraju,
xi - odsetek pracujących w rolnictwie i-tego kraju.
Niezbędne informacje zamieszczono w tablicy poniżej ( tablica posortowana rosnąco względem xi).
i |
Kraj |
yi |
xi |
1 |
Czechosłowacja |
3400 |
12 |
2 |
Węgry |
2600 |
19 |
3 |
Bułgaria |
2300 |
20 |
4 |
Polska |
1900 |
27 |
5 |
Rumunia |
1400 |
28 |
Za cel postawiliśmy sobie osiągnięcie modelu, który będzie w jak najlepszym stopniu odpowiadał rzeczywistości. W jego szacowaniu posłużymy się MNK. Przy weryfikacji hipotez istotności zakładamy współczynnik α=0,05.
Graficzna prezentacja danych do zadania
W celu zaproponowania modelu analitycznego, przeprowadzimy analizę danych po przez :
funkcję liniową,
funkcję wykładniczą
Ad.1
Parametry funkcji liniowej, przedstawionej poniżej :
![]()
Rozwiązujemy wg MNK, czyli:
![]()
za macierz X podstawiamy odsetek pracujących w rolnictwie, otrzymując macierz X. Macierz Y - to dochód narodowy


![]()
Macierz XT mnożymy przez macierz X :
![]()
Obliczamy wyznacznik macierzy: 854 . Macierz odwrotna istnieje:
![]()
Następnym krokiem jest obliczenie ilorazu XTY:
![]()
Ostatnim krokiem w celu obliczenia rozwiązań równania jest obliczenie iloczynu macierzy
(XTX)-1(XTY), czyli wektor rozwiązań:
![]()
Powyższa macierz jest macierzą parametrów naszego równania.
Nasz model możemy zapisać:
![]()
![]()
Oszacujmy parametry rozkładu składnika losowego pozwalające wnioskować o dobroci dopasowania modelu do danych empirycznych. Do pierwszego parametru należą średnie błędów szacunku estymatorów modelu. Aby to obliczyć, musimy najpierw obliczyć wariancje resztową ![]()
:
![]()
![]()
gdzie:
n - liczba obserwacji (dla naszego przykładu 5),
k - liczba parametrów modelu (dla naszego przypadku 2).
Obliczmy najpierw iloczyn macierzy YTY, który wynosi 29180000. Iloczyn macierzy XTY mamy już obliczony powyżej. Musimy, więc obliczyć iloczyn tej macierzy i wektora rozwiązań, czyli ![]()
wynosi on: 29074813. Przejdźmy do obliczenia ![]()
![]()
Możemy już teraz przejść do obliczenia średnich błędów szacunku modelu, które liczymy wg wzoru:
![]()
gdzie cji to elementy stojące na przekątnej macierzy (XT X)-1.
Obliczamy średnie błędy szacunku dla poszczególnych parametrów strukturalnych modelu:
dla a0
![]()
![]()
dla a1
![]()
Nasz model możemy więc zapisać:
![]()
Saj: (315,079) (14,328)
W celu zbadania istotności parametrów strukturalnych modelu weryfikujemy hipotezę
![]()
wobec alternatywnej
![]()
W tym celu wyznaczamy ze statystyki
![]()
t0 dla a0, które wynosi :
![]()
oraz t1 dla a1
![]()
Z tablic rozkładu t-Studenta dla n-k stopni swobody i α = 0,05 odczytujemy: t0,05,3 = 3,182.
Wyniki mówią nam, że parametr a0 dla którego przyjmujemy hipotezę H0 jest statystycznie różny od zera, parametr a1 również. Mają one wpływ na wielkość dochodu narodowego.
Zapiszemy nasz model w postaci:
![]()
Saj: (315,079) (14,328)
![]()
: (14,935) (-7,854)
Aby sprawdzić dopasowanie oszacowanego modelu do danych rzeczywistych wyznaczamy współczynnik determinacji R2 oraz odchylenie standardowe składnika resztowego modelu s.
![]()
w naszym przypadku wynosi ono 187,24 i mówi nam że przeciętne odchylenie wartości empirycznych od wartości rzeczywistych wynosi 187,25USD na 1 mieszkańca.
Współczynnik determinacji obliczamy wg wzoru:
![]()
n - liczba obserwacji (5)
![]()
- średnia z macierzy = 2320
Pozostałe wartości tego równania mamy już obliczone powyżej i po podstawieniu otrzymujemy
![]()
Model nasz jest więc dobrze dopasowany do danych empirycznych, bo wyjaśnia aż 83,2 % obserwacji. Posiadając obliczony współczynnik determinacji ![]()
możemy obliczyć współczynnik zbieżności ![]()
, który liczymy jako różnice : 1 - R2 .
![]()
Niska wartość współczynnik zbieżności mówi nam o bardzo dobrym dopasowaniu modelu do danych empirycznych. Współczynnik korelacji wielorakiej jest - on pierwiastkiem kwadratowym z R2. Dla naszego modelu:
![]()
![]()
Ostatnią miarą dopasowania modelu jest współczynnik zmienności losowej, czyli
![]()
Dla naszego modelu, uzyskujemy
![]()
Współczynnik ten jest niższy od umownej wartości 10% co oznacza, że cechy wykazują zróżnicowanie statystycznie nieistotne.
Zastosujmy statystykę Durbina-Watsona.
Musimy wykonać obliczenia pomocnicze
x |
yt |
Yt |
et |
et2 |
et-1 |
et-12 |
et -et-1 |
et et-1 |
(et -et-1)2 |
12 |
3400 |
3355,27 |
44,73 |
2000,50 |
- |
- |
- |
- |
- |
19 |
2600 |
2567,57 |
32,43 |
1051,70 |
44,73 |
2000,50 |
-12,30 |
1450,50 |
151,22 |
20 |
2300 |
2455,04 |
-155,04 |
24037,71 |
32,43 |
1051,70 |
-187,47 |
-5027,98 |
35145,38 |
27 |
1900 |
1667,34 |
232,66 |
54131,61 |
-155,04 |
24037,71 |
387,70 |
-36072,15 |
150313,62 |
28 |
1400 |
1554,81 |
-154,81 |
23965,83 |
232,66 |
54131,61 |
-387,47 |
-36018,17 |
150133,78 |
|
- |
- |
- |
105187,35 |
- |
81221,53 |
- |
-75667,80 |
335743,98 |
Dla zastosowania tej statystyki musimy zastosować poniższe wzory
Estymator współczynnika autokorelacji

co po podstawieniu naszych danych z tabeli daje nam r = -0,819 (jeśli występuje autokorelacja, to jest ona ujemna)
Statystyka Durbina-Watsona

po podstawieniu danych z tabeli pomocniczej otrzymujemy d =3,192. Współczynnik d>2, musimy wprowadzić d*=4-d, dla naszego przypadku d*=0,808
Z tablic wartości krytycznych statystyki Durbina-Watsona, dla α=0,05 oraz n=7 (najbliższa znaleziona przez nas wartość ) i k=2 odczytujemy odpowiednie statystyki dL=0,467 oraz du=1,897. Testujemy hipotezę
![]()
wobec hipotezy alternatywnej
![]()
Nanieśmy nasze dane na wykres.
Z powyższego wynika, że nie możemy przyjąć żadnych z hipotez, gdyż d*=0,808 znajduje się w obszarze nieokreśloności, Liczebność próby jest zbyt mała, by odpowiedzieć na pytania o autokorelację.
Poniżej przedstawiamy graficzną prezentację danych oryginalnych i danych obliczonych za pomocą naszego wzoru:
Ad.2 Model z funkcją wykładniczą
![]()
![]()
Aby zastosować MNK, musimy dokonać pewnych podstawień: y' =ln(yoblicz) oraz a'=ln(a0)
![]()


Model ten po dokonanych podstawieniach, tak jak i poprzedni możemy obliczyć MNK, czyli wg wzoru:
![]()
Wynik naszej operacji na macierzach (XTX)-1, jest macierz:
![]()
Macierz XTY:
![]()
Po wymnożeniu naszych macierzy, uzyskujemy wektor rozwiązań naszego modelu, czyli ![]()
:
![]()
Aby wstawić dane naszego rozwiązania do wzoru musimy wykonać jeszcze jedną operację. Mianowicie a0 musimy obliczyć odwrotność do ln() czyli e(a0) . Model nasz możemy zapisać w postaci:
![]()
Kolejnym krokiem będzie obliczenie wariancji resztowej ![]()
:
![]()
![]()
gdzie:
n - liczba obserwacji (dla naszego przykładu 5),
k - liczba parametrów modelu (dla naszego przypadku 2).
Iloczyn macierzy YTY wynosi: 297,3461, natomiast iloczyn ![]()
: 297,3095. Po obliczeniu wg powyższego wzoru uzyskujemy, więc ![]()
=0,012.
Możemy już teraz przejść do obliczenia średnich błędów szacunku modelu, które liczymy wg wzoru:
![]()
gdzie cji to elementy stojące na przekątnej macierzy (XT X)-1
Obliczamy średnie błędy szacunku dla poszczególnych parametrów strukturalnych modelu:
dla a0
![]()
![]()
dla a1
![]()
Zapiszmy nasz model (postać liniową) :
![]()
Saj : (0,184) (0,00838)
W celu zbadania istotności parametrów strukturalnych modelu weryfikujemy hipotezę
![]()
wobec alternatywnej
![]()
W tym celu wyznaczamy ze statystyki
![]()
t0 dla a0, które wynosi :
![]()
oraz t1 dla a1
![]()
Z tablic rozkładu t-Studenta dla n-k stopni swobody i α = 0,05 odczytujemy: t0,05,3 = 3,182.
Wszystkie nasze parametry modelu są istotnie różne od zera. Oszacowane przez nas parametry modelu mają istotny wpływ na wielkość dochodu narodowego.
Zapiszemy nasz model w postaci:
![]()
Saj : (0,184) (0,00838)
![]()
: (47,5) (-5,835)
Aby sprawdzić dopasowanie oszacowanego modelu do danych rzeczywistych wyznaczamy współczynnik determinacji R2 oraz odchylenie standardowe składnika resztowego modelu s.
Odchylenie standardowe reszt jest niczym innym jak pierwiastkiem kwadratowym z ![]()
czyli
![]()
w naszym przypadku wynosi ono 0,1095 co oznacza, że przeciętne odchylenie wartości empirycznych od wartości rzeczywistych wynosi 0,1095 USD. Obliczmy ![]()
, który obliczamy wg wzoru:
![]()
n - liczba obserwacji (5)
![]()
- średnia z macierzy = 7,7059
Pozostałe wartości tego równania mamy już obliczone powyżej i po podstawieniu otrzymujemy
![]()
Model nasz jest więc bardzo dobrze dopasowany do danych empirycznych, bo wyjaśnia aż 91,71 % obserwacji. Posiadając obliczony współczynnik determinacji ![]()
możemy obliczyć współczynnik zbieżności ![]()
![]()
Niska wartość współczynnik zbieżności świadczy o dokładnym dopasowaniu modelu do danych empirycznych.
Współczynnik korelacji wielorakiej, to kolejna miara dopasowania modelu do danych empirycznych. Dla naszego modelu:
![]()
![]()
Ostatnią miarą dopasowania modelu jest współczynnik zmienności losowej, czyli
![]()
Dla naszego modelu, uzyskujemy
![]()
Współczynnik ten (jego wartość) jest bardzo mały co oznacza, że cechy nie wykazują zróżnicowania statystycznie istotnego.
Zastosujmy statystykę Durbina-Watsona.
Musimy wykonać obliczenia pomocnicze, które prezentujemy w tabeli poniżej.
x |
yt |
Yt |
et |
et2 |
et-1 |
et-12 |
et -et-1 |
et et-1 |
(et -et-1)2 |
12 |
3400 |
3482,13 |
-82,13 |
6745,63 |
- |
- |
- |
- |
- |
19 |
2600 |
2472,78 |
127,22 |
16183,88 |
-82,13 |
6745,63 |
209,35 |
-10448,47 |
43826,45 |
20 |
2300 |
2354,77 |
-54,77 |
3000,17 |
127,22 |
16183,88 |
-181,99 |
-6968,10 |
33120,26 |
27 |
1900 |
1672,21 |
227,79 |
51889,36 |
-54,77 |
3000,17 |
282,57 |
-12477,06 |
79843,66 |
28 |
1400 |
1592,40 |
-192,40 |
37019,22 |
227,79 |
51889,36 |
-420,20 |
-43828,11 |
176564,81 |
|
- |
- |
- |
114838,26 |
- |
77819,05 |
- |
-73721,74 |
333355,17 |
Dla obliczenia tej statystyki musimy zastosować prezentowane już powyżej wzory
Estymator współczynnika autokorelacji r = -0,78 liczony wg wzoru:

Statystyka Durbina-Watsona d = 2,903 liczony wg wzoru:

Współczynnik d>2, musimy wprowadzić d*=4-d, dla naszego przypadku d*=0,903
Z tablic wartości krytycznych statystyki Durbina-Watsona, jak poprzednio dla α=0,05 oraz n=7 i k=2 odczytujemy odpowiednie statystyki dL=0,467 oraz du=1,897.
Testujemy hipotezę
![]()
wobec hipotezy alternatywnej
![]()
Nanieśmy nasze dane na wykres.
Z powyższego wynika, że nie możemy przyjąć żadnych z hipotez, gdyż d*=0,903 znajduje się w obszarze nieokreśloności, Liczebność próby jest zbyt mała, by odpowiedzieć na pytania o autokorelację
Przede wszystkim w modelu tym nie występuje autokorelacja co jest również bardzo ważne przy wyborze odpowiedniej postaci funkcji analitycznej.
Poniżej przedstawiamy graficzną prezentację danych oryginalnych i danych obliczonych za pomocą naszego wzoru:
14
6
t0=47,5
t1=-5,835
tj
H0
H1
H1
H1
t0=14,935
t1=-7,854
tα
-tα
tj
H0
H1