EKONOMETRIA
laboratorium
Model ekonometryczny do zagadnienia:
Ceny drobiu w latach 1990-2006
Spis treści:
Specyfikacja zmiennych wraz z gromadzeniem danych
Dobór zmiennych
Wybór klasy modelu
Estymacja parametrów strukturalnych
Weryfikacja modelu
Dopasowanie modelu do danych empirycznych
Istotność poszczególnych współczynników regresji
Własności składników losowych:
Normalność
Autokorelacja
Symetria reszt modelu
Losowość reszt
Homoskedstyczność reszt
Wnioskowanie na podstawie modelu
Specyfikacja zmiennych wraz z gromadzeniem danych
Poniżej przedstawiam wytypowane przeze mnie zmienne:
- rok
-pasze
-PKB
-ludność
-mięso wołowe
-mięso wieprzowe
-choroby
Wszystkie dane dostępne są w Rocznikach Statystycznych.
Dane potrzebne do modelu określone są w Tabeli1.
Dla każdego kompletu danych zostały przyjęte potencjalne zmienne objaśniające.
Y |
Cena drobiu |
X1 |
rok |
X2 |
pasze |
X3 |
PKB |
X4 |
ludność |
X5 |
Mięso wołowe |
X6 |
Mięso wieprzowe |
X7 |
choroby |
Tabela1
Cena drobiu |
rok |
pasze |
PKB |
ludność |
Mięso wołowe |
Mięso wieprzowe |
choroby |
1,5 |
1990 |
11,68 |
102,9637 |
38073 |
1,63 |
2,84 |
0 |
1,82 |
1991 |
13,78 |
177 |
38144 |
2,06 |
3,01 |
0 |
2,71 |
1992 |
28,96 |
293,5 |
38203 |
3,31 |
3,77 |
0 |
3,92 |
1993 |
34,72 |
399,5 |
38239 |
5,01 |
5,66 |
0 |
4,34 |
1994 |
39,4 |
532,8 |
38265 |
5,84 |
6,56 |
0 |
5,45 |
1995 |
48,65 |
702,62 |
38284 |
7,35 |
6,92 |
0 |
6,39 |
1996 |
68,61 |
873 |
38294 |
8,45 |
8,7 |
0 |
6,09 |
1997 |
69,66 |
1061,93 |
38290 |
8,75 |
10 |
0 |
5,19 |
1998 |
67,71 |
1239,49 |
38277 |
8,69 |
9,32 |
0 |
4,71 |
1999 |
67,37 |
1706,74 |
38263 |
9,2 |
9,52 |
0 |
5,88 |
2000 |
74,25 |
1923,81 |
38254 |
10,76 |
14,28 |
0 |
4,88 |
2001 |
76,11 |
2061,85 |
38242,2 |
10,75 |
14,44 |
0 |
4,33 |
2002 |
75,44 |
2133,21 |
38218,5 |
10,62 |
12,57 |
0 |
4,89 |
2003 |
82,04 |
2201,47 |
38190,6 |
11,07 |
12,37 |
0 |
5,7 |
2004 |
83,81 |
2289,57 |
38173,8 |
15,84 |
14,78 |
0 |
4,63 |
2005 |
80,22 |
2380,29 |
38157,1 |
16,72 |
13,07 |
1 |
4,89 |
2006 |
81,12 |
2477,23 |
38146,6 |
16,93 |
13,34 |
0 |
II. Dobór zmiennych
Pierwszym krokiem było obliczenie zmienności poszczególnych zmiennych oraz eliminacja tych, których zmienność
nie przekracza przyjętego minimalnego progu w wysokości 10%. Następnie przy pomocy metody Analizy współczynników korelacji. Dzięki niej wyeliminowałam zmienne które były poniżej krytycznej wartości współczynnika korelacji
r*= 0,482146. Ponieważ współczynniki zmienności dla zmiennych X1 i X4 były równe 0,03% i 0,02% i były one mniejsze od 10%, więc w dalszych rozważaniach pominęłam te zmienne.
n = |
17 |
Liczba okresów dla których zgromadzono dane. |
|
|
|
||||||
alfa = |
0,05 |
|
|
|
|
|
|
|
|||
I = |
2,13 |
Wartość statystyki t Studenta dla poziomu istotności 0,05 i n-2 stopni swobody. |
|||||||||
r* = |
0,48 |
Wartość krytyczna |
|
|
|
|
|
Potencjalne zmienne: {X1,X2,X3,X4,X5,X6,X7} |
Zmienne do modelu: {} |
|
|
Zmienne wyeliminowane: {} |
Krok 1.
Ze zbioru potencjalnych zmiennych objaśniających eliminujemy zmienne, które są słabo skorelowane ze zmienną objaśnianą (Y), czyli zmienne dla których zachodzi:
|
Y |
Moduł współczynnika korelacji |
|
X1 |
0,610 |
0,610 |
|
X2 |
0,823 |
0,823 |
maksimum |
X3 |
-0,457 |
0,457 |
<r* |
X4 |
0,743 |
0,743 |
|
X5 |
0,684 |
0,684 |
|
X6 |
0,710 |
0,710 |
|
X7 |
0,015 |
0,015 |
<r* |
Krok 2:
Wybieram zmienną najsilniej skorelowaną ze zmienną objaśnianą (Y).
Potencjalne zmienne: { X5, X6} |
Zmienne do modelu: {X2} |
|
Zmienne wyeliminowane: {X1, X3, X4, X7} |
Krok 3:
Eliminujemy zmienne silnie skorelowane ze zmienną wybraną do zbioru zmiennych na podstawie których zostanie zbudowany model (w przykładzie: pozostała zmienna: X5,X6, wybrana zmienna do budowy modelu: X2).
Ponieważ moduł współczynnika korelacji zmiennych X2, X5, X6 jest większy od wartości krytycznej r*, to zmienne X2, X5, X6 uważamy za silnie skorelowane. Do budowy modelu wystarczy jedna z nich (reprezentant). Silniej skorelowana
ze zmienną objaśnianą (Y) jest X2 i została już dodana do zbioru zmiennych na podstawie których będzie budowany model. Eliminuje zmienne X5 i X6.
Tym sposobem otrzymałam zmienna do modelu. Jest nią X2.
Wybór klasy modelu
Następnie wyznaczyłam liniową postać z jedną zmienną objaśniającą metoda MNK.
Estymacja parametrów strukturalnych
Następnym moim krokiem było wykonanie wykresu zależności Y(cena drobiu) do X2 (cen pasz) .
PODSUMOWANIE - WYJŚCIE |
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
Statystyki regresji |
|
|
|
|
|
|
|
|
|
|||||||||
Wielokrotność R |
0,813627008 |
|
|
|
|
|
|
|
|
|
||||||||
R kwadrat |
0,661988908 |
model wyjaśnia 66% zmienności badanego zjawiska |
|
|
|
|
|
|||||||||||
Dopasowany R kwadrat |
0,639454835 |
|
|
|
|
|
|
|
|
|
||||||||
Błąd standardowy |
0,836748602 |
|
|
|
|
|
|
|
|
|
||||||||
Obserwacje |
17 |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
ANALIZA WARIANCJI |
|
|
|
|
|
|
|
|
|
|||||||||
|
df |
SS |
MS |
F |
Istotność F |
|
|
|
|
|
||||||||
Regresja |
1 |
20,56842371 |
20,56842 |
29,3772419 |
0,000071 |
|
||||||||||||
Resztkowy |
15 |
10,50222335 |
0,700148 |
|
|
|
|
|
|
|
||||||||
Razem |
16 |
31,07064706 |
|
|
|
|
|
|
|
|
|
Współczynniki |
Błąd standardowy |
t Stat |
Wartość-p |
Dolne 95% |
Górne 95% |
Dolne 95,0% |
Górne 95,0% |
||
Przecięcie |
1,801576377 |
0,545882052 |
3,30030337 |
0,004855885 |
0,638056331 |
2,965096424 |
0,638056331 |
2,965096424 |
||
X2 |
0,046528954 |
0,008584555 |
5,42007766 |
7,09485E-05 |
0,028231409 |
0,0648265 |
0,028231409 |
0,0648265 |
||
|
|
|
obie wartości ponizej przyjetego poziomu istotności |
|
|
Na podstawie tych danych wyznaczyłam wzór prostej regresji:
Y=1,8016+0,163*X2
Weryfikacja modelu
VI. Dopasowanie modelu do danych empirycznych
Kolejnym krokiem moich badań było dopasowanie modelu do danych rzeczywistych, obliczenie współczynników zbieżności, determinacji i badanie koincydencji.
Współczynnik zbieżności Φ2
Φ2 = 0,338011
W spółczynnik determinacji R2
R2= 0,661989
Badanie koincydencji
współczynnik korelacji |
|
znak współczynnika .korelacji |
współczynnik w modelu |
znak współczynnika w modelu |
|
|
||||||||||
|
Y |
|
|
|
|
|
|
|
|
|
||||||
X2 |
0,813627 |
|
+ |
|
0,04652895 |
|
+ |
|
ZGODNOŚĆ ZNAKÓW |
VII. Istotność układu współczynników regresji
Dla współczynnika modelu regresji stawiamy hipotezę
Wyznaczona wartość empiryczna statystyki F=11,701286 jest większa od wartości krytycznej Falfa=4,5430771,
odrzucam hipotezę zerową, czyli uznaje, że pomiędzy zmienną objaśnianą i zmienną objaśniającą (z modelu)
zachodzi zależność liniowa.
Dla współczynnika modelu regresji stawiamy hipotezę
H0= j=0 H1= j0
Sprawdzianem zespołu hipotez jest statystyka:
współczynnik |
wartość |
błąd standardowy |
t |
moduł t |
wartość p |
A2 |
0,046529 |
0,008584555 |
5,420077664 |
5,420078 |
7,0948E-05 |
|
|
|
|
|
|
|
|
|
|
|
|
Moduł wyznaczonej wartości statystyki t=5,420077664 jest większy od wartości krytycznej talfa=2,13145, odrzucam hipotezę zerową i uznaję, że pomiędzy zmienną objaśnianą i objaśniającą zachodzi zależność liniowa.
VIII. Własności składników losowych
VIIIa. Normalność
Hipotezę o rozkładzie normalnym składników losowych zweryfikuję za pomocą testu Dawida-Hellwiga.
Cele stanowi 17 odcinków o długości przedstawionej w tabeli poniżej, następnie określam wartość dystrybuanty hipotetycznej dla wszystkich wartości reszt modelu i sprawdzam do których cel wpadają te wartości.
nr celi |
początek |
koniec |
1 |
0 |
0,058824 |
2 |
0,0588235 |
0,117647 |
3 |
0,1176471 |
0,176471 |
4 |
0,1764706 |
0,235294 |
5 |
0,2352941 |
0,294118 |
6 |
0,2941176 |
0,352941 |
7 |
0,3529412 |
0,411765 |
8 |
0,4117647 |
0,470588 |
9 |
0,4705882 |
0,529412 |
10 |
0,5294118 |
0,588235 |
11 |
0,5882353 |
0,647059 |
12 |
0,6470588 |
0,705882 |
13 |
0,7058824 |
0,764706 |
14 |
0,7647059 |
0,823529 |
15 |
0,8235294 |
0,882353 |
16 |
0,8823529 |
0,941176 |
17 |
0,9411765 |
1 |
Składniki resztkowe |
Rozkład normalny |
nr celi |
-0,84503 |
0,15627 |
3 |
-0,62275 |
0,22836 |
4 |
-0,43905 |
0,29989 |
6 |
0,502938 |
0,72610 |
13 |
0,705183 |
0,80032 |
14 |
1,38479 |
0,95103 |
17 |
1,396072 |
0,95239 |
17 |
1,047217 |
0,89463 |
16 |
0,237948 |
0,61194 |
11 |
-0,22623 |
0,39344 |
7 |
0,623649 |
0,77196 |
14 |
-0,4629 |
0,29006 |
5 |
-0,98172 |
0,12035 |
3 |
-0,72881 |
0,19188 |
4 |
-0,00117 |
0,49944 |
9 |
-0,90413 |
0,13995 |
3 |
-0,68601 |
0,20615 |
4 |
Po analizie cel okazuje się, że istnieje 6 cel pustych – są to następujące cele: 1,2,8,10,12,15
Krytyczne liczby pustych cel dla 17 obserwacji, dla poziomu istotności α=0,05 wynoszą K1=3 oraz K2=8
(K1=3)<(K=6)<(K2=8)
oznacza to, że odchylenia losowe mają rozkład normalny.
VIIIb. Autokorelacja
Kolejnym testem sprawdzę, czy w modelu występuje autokorelacja składników losowych rzędu pierwszego.
Test Durbina-Watsona
Stawiam następujące hipotezy:
et |
et-1 |
et-et-1 |
(et-et-1)^2 |
et^2 |
-0,84503 |
|
|
|
0,714083 |
-0,62275 |
-0,84503 |
0,222289 |
0,049412 |
0,387812 |
-0,43905 |
-0,62275 |
0,18369 |
0,033742 |
0,192769 |
0,502938 |
-0,43905 |
0,941993 |
0,887351 |
0,252947 |
0,705183 |
0,502938 |
0,202244 |
0,040903 |
0,497283 |
1,38479 |
0,705183 |
0,679607 |
0,461866 |
1,917643 |
1,396072 |
1,38479 |
0,011282 |
0,000127 |
1,949017 |
1,047217 |
1,396072 |
-0,34886 |
0,1217 |
1,096663 |
0,237948 |
1,047217 |
-0,80927 |
0,654916 |
0,056619 |
-0,22623 |
0,237948 |
-0,46418 |
0,215463 |
0,051181 |
0,623649 |
-0,22623 |
0,849881 |
0,722297 |
0,388938 |
-0,4629 |
0,623649 |
-1,08654 |
1,180578 |
0,214272 |
-0,98172 |
-0,4629 |
-0,51883 |
0,26918 |
0,963776 |
-0,72881 |
-0,98172 |
0,252909 |
0,063963 |
0,531167 |
-0,00117 |
-0,72881 |
0,727644 |
0,529465 |
1,36E-06 |
-0,90413 |
-0,00117 |
-0,90296 |
0,815339 |
0,817449 |
-0,68601 |
-0,90413 |
0,218124 |
0,047578 |
0,470603 |
|
|
|
6,093881 |
10,50222 |
d= |
0,580247 |
|
r = |
0,709877 |
|
H0 |
ς(et,et-1)=0 |
|
H1 |
ς(et,et-1)>0 |
|
n |
17 |
|
k |
1 |
|
dl |
1,13 |
d<du |
du |
1,38 |
|
Wniosek : Istnieje korelacja pierwszego rzędu
VIIIc. Symetria reszt modelu
Do sprawdzenia symetrii składnika losowego stosuję test symetrii składników losowych. Test ten sprawdza, czy frakcja reszt dodatnich p+ i ujemnych p- równa się 0,5. Przez m oznaczyłam liczbę reszt dodatnich, przez n liczbę reszt ogółem.
Stawiam hipotezy:
Statystyka ta, przy prawdziwości hipotezy H0, ma rozkład t Studenta o (n-1=16) stopniach swobody. Empiryczna wartość statystyki wynosi -0,01121. Wartość krytyczna 2,119905. Ponieważ wartość empiryczna statystyki jest mniejsza w module od wartości krytycznej, to nie ma podstaw do odrzucenia hipotezy H0, na korzyść hipotezy H1. Wniosek jest taki, że składniki losowe modelu są symetryczne.
VIIId. Losowość reszt
Będę teraz weryfikowała losowość rozkładu reszt modelu ekonometrycznego. Zweryfikuję ją testem liczby serii. Porządkuję reszty względem rosnących wartości wielkości jednej ze zmiennych i zliczam liczbę serii.
|
5 |
wartość empiryczna statystyki (liczba serii) |
|||||||||||||||||||||||||||||||||||||
= |
0,05 |
przyjęty poziom istotności |
|
||||||||||||||||||||||||||||||||||||
n1 = |
7 |
liczba dodatnich składników losowych |
|||||||||||||||||||||||||||||||||||||
n2 = |
10 |
liczba ujemnych składników losowych |
|||||||||||||||||||||||||||||||||||||
L1 = |
5 |
wartość krytyczna statystyki (lewa granica) |
|||||||||||||||||||||||||||||||||||||
L2 = |
13 |
wartość krytyczna statystyki (prawa granica) |
Liczba serii wynosi L=5. Krytyczne wartości liczby serii dla 7 reszt dodatnich i 10 reszt ujemnych, na przyjętym poziomie istotności wynoszą L1=5 oraz L2=13. Ponieważ L jest równe L1 , dlatego są podstawy do odrzucenia hipotezy o losowości reszt modelu.
VIIIe. Homoskedstyczność reszt
Kolejnym krokiem jest badanie równości wariancji w podpróbach homogenicznych ze względu na wariancję składników losowych.
Do tych badan wykorzystam Test korelacji rangowej Spearmana
x2 |
ranga x2 |
moduł reszt |
ranga reszt |
D |
D^2 |
Składniki resztowe |
i |
11,68 |
1 |
0,845035 |
12 |
-11 |
121 |
-0,84503 |
1 |
13,78 |
2 |
0,622745 |
7 |
-5 |
25 |
-0,62275 |
2 |
28,96 |
3 |
0,439055 |
4 |
-1 |
1 |
-0,43905 |
3 |
34,72 |
4 |
0,502938 |
6 |
-2 |
4 |
0,502938 |
4 |
39,4 |
5 |
0,705183 |
10 |
-5 |
25 |
0,705183 |
5 |
48,65 |
6 |
1,38479 |
16 |
-10 |
100 |
1,38479 |
6 |
68,61 |
7 |
1,396072 |
17 |
-10 |
100 |
1,396072 |
7 |
69,66 |
8 |
1,047217 |
15 |
-7 |
49 |
1,047217 |
8 |
67,71 |
9 |
0,237948 |
2 |
7 |
49 |
0,237948 |
9 |
67,37 |
10 |
0,226232 |
1 |
9 |
81 |
-0,22623 |
10 |
74,25 |
11 |
0,623649 |
8 |
3 |
9 |
0,623649 |
11 |
76,11 |
12 |
0,462895 |
3 |
9 |
81 |
-0,4629 |
12 |
75,44 |
13 |
0,981721 |
14 |
-1 |
1 |
-0,98172 |
13 |
82,04 |
14 |
0,728812 |
11 |
3 |
9 |
-0,72881 |
14 |
83,81 |
15 |
0,001168 |
1 |
14 |
196 |
-0,00117 |
15 |
80,22 |
16 |
0,904129 |
13 |
3 |
9 |
-0,90413 |
16 |
81,12 |
17 |
0,686005 |
9 |
8 |
64 |
-0,68601 |
17 |
|
|
|
|
Suma= |
924 |
|
|
gdzie D to różnica rang zmiennej x oraz modułu reszt modelu dla i-tej obserwacji
r=1,132
5,662
Z powodu nie dokończenia testu nie mogę dokonać dalszych obliczeń.