PODSTAWY EKONOMETRII
Wykład I (16.03.2003)
POJĘCIE MODELU EKONOMETRYCZNEGO.
Modelem ekonometrycznym nazywamy konstrukcję formalną, która za pomocą jednego równania bądź też wielu równań odwzorowuje zasadnicze powiązania ilościowe zachodzące między badanymi zjawiskami ekonomicznymi.
Elementami modelu będą:
zmienne objaśniane
zmienne objaśniające
składnik losowy
parametry strukturalne modelu
Zmienne objaśniane - to wyróżnione zjawiska ekonomiczne, które są opisywane (wyjaśniane) przez poszczególne równania modelu. Zmienne te noszą także nazwę zmiennych endogenicznych.
Zmienne objaśniające - to zmienne służące do opisu (wyjaśniania) zmian zmiennych objaśnianych. W modelach wielorównaniowych zmienne objaśniające dzielą się na zmienne egzogeniczne oraz endogeniczne innych równań.
Zmienne egzogeniczne to takie zmienne objaśniające, które nie są wyjaśniane przez żadne równania modelu.
Zmienne endogeniczne innych równań to takie zmienne, które w danym równaniu pełnią rolę zmiennych objaśniających i są opisywane przez inne równanie modelu.
W grupie zmiennych egzogenicznych i endogenicznych pełniących rolę zmiennych objaśniających mogą się pojawić zmienne opóźnione w czasie.
Opóźnioną zmienną egzogeniczną (endogeniczną) nazywamy zmienną odnoszącą się do wcześniejszych okresów niż okres bieżący „t”.
Zmienne opóźnione w czasie wraz ze zmiennymi egzogenicznymi tworzą grupę zmiennych z góry ustalonych.
Przykład I
Zbudujemy jednorównaniowy model ekonomiczny popytu na dobro A. Jeżeli model potraktujemy jako „układ hipotez” to konstrukcja modelu będzie się opierała na hipotezach:
popyt na dobro A w okresie t zależy od poziomu dochodów przypadających na 1 mieszkańca, ceny dobra A oraz ceny dobra substytucyjnego B.
Yt = ƒ ( x1t, x2t, x3t, ξt) (1)
gdzie:
Yt - poziom popytu na dobro A w okresie t
x1t - poziom dochodów na 1 mieszkańca w okresie t
x2t - poziom ceny dobra A w okresie t
x3t - poziom ceny dobra substytucyjnego B w okresie t
ξt - składnik losowy modelu.
popyt na dobra A w okresie t zależy od poziomu popytów w okresie poprzednim ceny dobra A oraz ceny dobra komplementarnego C w okresie t.
Yt = ƒ ( Yt-1, x2t, x4t, ξt ) (2)
gdzie:
Yt - popyt na dobra A w okresie t
Yt-1 - poziom popytu na dobro A w okresie poprzednim
X2t - poziom ceny dobra A w okresie t
X4t - poziom ceny dobra komplementarnego C w okresie t
ξt - składnik losowy modelu.
Ogólny zapis modelu 1 i 2 wymaga określenia typu funkcji f.
Typ zależności f jest określany na podstawie danych empirycznych.
Celem ekonometryka na ogół nie jest weryfikacja jednej hipotezy lecz ustalenie takiej hipotezy, która byłaby dobrze uzasadniona przez materiał statystyczny, a więc w wykresie pewnej ilościowej prawidłowości ekonomicznej.
Przykładem modelu wielorównaniowego jest np. układ 3 funkcji liniowych:
Pt = α11 Zt + α12 Mt-1 + α13 It + α10 + ξ1t
Zt = α21 Zt-1 + α22 It + α23 Mt-1 + α20 + ξ2t
It = α31 It-1 + α32 Pt + α30 + ξ3t (3)
Model ten wyjaśnia wzajemne zależności między wielkością produktu krajowego brutto (P), zatrudnieniem (Z), inwestycjami (I) oraz produkcyjnym majątkiem trwałym (M).
W I równaniu zmienną objaśniającą jest zmienna mierząca poziom produktu krajowego brutto w okresie t (Pt jest zmienna endogeniczna), natomiast zmiennymi objaśniającymi są zmienne mierzące rozmiary zatrudnienia (Z), wartość majątku trwałego w okresie poprzednim i poziom inwestycji w okresie t.
II równanie - zmienna mierząca rozmiary zatrudnienia jest wyjaśniane przez II równanie modelu. Czyli zmienna Zt jest zmienną endogeniczną drugiego równania. Podobnie zmienna mierząca poziom inwestycji jest wyjaśniona przez III równanie modelu .czyli poziom inwestycji jest zmienną objaśniającą I równania i zmienną endogeniczną III równania jednocześnie.
Zmienna mierząca wartość majątku trwałego nie jest wyjaśniona przez żadne równanie modelu, a więc jest zmienną egzogeniczną, jest opóźnioną zmienną egzogeniczną.
Lewa strona: zmienne objaśniane; prawa strona: zmienne objaśniające
Parametry αij to parametry strukturalne modelu, natomiast ξ1t , ξ2t, ξ3t to składniki losowe.
Parametry strukturalne modelu są to parametry wyrażające ilościowy wpływ danej zmiennej przy której występują na zmienną endogeniczną.
Są one szacowane na podstawie danych statystycznych.
Składnik losowy ξ (ksi) w modelu wynika z konieczności uwzględnienia:
wpływu wszystkich czynników mało istotnych nie wyspecyfikowanych w równaniu, a które oddziałują na zmienną endogeniczną.
różnic między przyjętą postacią analityczną modelu a istniejącą zależnością rzeczywistości
błędów pomiarów zmiennych
czynników losowych wywołujących wpływ na zmienną endogeniczną.
Składnik losowy ξ jest zmienną losową a wartości oczekiwanej = 0. Jest to zmienna o rozkładzie normalnym.
KLASYFIKACJA MODELI EKONOMETRYCZNYCH.
Istnieje wiele kryteriów klasyfikacji modeli ekonometrycznych.
Ze względu na postać analityczną związków zmiennych i parametrów modele dzielą się na :
liniowe
nieliniowe sprowadzane do liniowych (wykładnicze, potęgowe, logarytmiczne)
nieliniowe nie sprowadzalne do liniowych.
Yt = α tβ
model trendu potęgowego, sprowadzany do liniowego poprzez logarytmowanie
ln Yt = ln α + β ln t
Yt = a + bt + ct2 trend paraboliczny, niesprowadzalny do liniowego
Podział ten jest istotny z punktu widzenia estymacji parametrów modelu, gdyż modele liniowe i sprowadzalne do liniowych można szacować stosunkowo prostymi metodami (metoda najmniejszych kwadratów).
Modele nieliniowe nie sprowadzalne do liniowych wymagają specjalnych metod estymacji nieliniowej.
Ze względu na udział czynnika czasu, a tym samym na własności dynamiczne czasu, modele dzielą się na statystyczne i dynamiczne.
Model statystyczny - to taki model, w którym zmienne endogeniczne występują bez ograniczeń czasowych, a w zbiorze zmiennych objaśniających nie występuje zmienna czasowa.
Przykładem modelu statystycznego jest ekonometryczny model kosztów całkowitych w przedsiębiorstwie. Ma on postać:
Kt = α0 + α1 Qt + ξt (4)
Kt - poziom kosztów całkowitych w okresie t
Qt - poziom produkcji w okresie t.
Model dynamiczny to każdy model w którym występuje zmienna losowa jako zmienna egzogeniczna lub wystepują zmienne z opóxnieniem losowym.
Przykład:
Kt = α0 + α1 Qt + α2 t + ξt (5) - model kosztów całkowitych
Wprowadzony czas wynika z faktu, dlatego, że koszty całkowite często wykazują trend wzrostowy lub spadkowy. Często się tez zdarza, że koszty całkowite zależą również od kosztów w okresie poprzednim.
Kt = α0 + α1 Qt + β1 Kt-1 + ξt
Ze względu na walory poznawcze modele ekonometryczne dzielimy na:
przyczynowo - opisowe
symptomatyczne
tendencje rozwojowe
Modele przyczynowo - opisowe to takie modele w których odzwierciedlone są powiązania przyczynowo -skutkowe między zmiennymi. Oznacza to, że zmienne endogeniczne Y pełnią rolę skutku, a zmienne objaśniające role przyczyn.
Modele symptomatyczne to modele w których jedyna zmienną endogeniczną a zmiennymi objaśniającymi zachodzi silna korelacja. Modele takie stosuje się wtedy, gdy brak jest podstaw do orzekania o przyczynowości badanej relacji ekonomicznej.
Modele tendencji rozwojowej to takie modele w których jedyną zmienną objaśniającą jest zmienna czasowa t. Zadaniem tych modeli jest wyjaśnianie zmian w czasie zmiennych endogenicznych.
Ponieważ bardzo wiele procesów ekonomicznych charakteryzuje się regularnymi zmianami w czasie, poznanie tych zmian ma bardzo istotne znaczenie dla oceny ich przebiegu.
Ze względu na sposób powiązań między nieopóźnionymi zmiennymi endogenicznymi modele wielorównaniowe dzielą się na :
proste
rekurencyjne
o równaniach współzależnych
Modele proste to takie modele w których zbiorze zmiennych objaśniających występują zmienne egzogeniczne i opóźnione zmienne endogeniczne.
W modelach rekurencyjnych występuje jednokierunkowy charakter między zmiennymi endogenicznymi.
Y1t → Y2t →Y3t
Y1t ← Y2t ←Y3t
W modelach o równaniach współzależnych występuje sprężania zwrotne (bezpośrednie lub pośrednie) między zmiennymi endogenicznymi np.
Y1t ↔ Y2t →Y3t
Y1t → Y2t ↔Y3t
Y1t ↔ Y2t ↔Y3t
W celu zbadania czy model jest prosty rekurencyjny czy o równaniach współzależnych należy stwierdzić jaką postać ma macierz parametrów przy nieopóźnionych zmiennych endogenicznych.
Jeżeli macierz parametrów przy nieopóźnionych zmiennych endogenicznych B jest diagonalna to model jest prosty. Jeżeli jest trójkątna to model jest rekurencyjny. Jeżeli nie jest diagonalna i nie trójkątna to model jest o równaniach współzależnych.
W celu uzyskania macierzy B należy wszystkie zmienne wraz z parametrami przenieść na lewa stronę poszczególnych równań.
Model III
Pt - α11 Zt - α12 Mt-1 It - α10 = ξ1t
Zt - α21 Zt-1 - α22 It - α23 Mt-1 - α20 = ξ2t
It - α31 It-1 - α32 Pt - α30 = ξ3t
Macierz B przy nieopóźnionych zmiennych endogenicznych będzie miała postać:
1 -α11 -α13
B= 0 1 -α22 - macierz ta nie jest ani diagonalna ani nie jest trójkątna. Jest to model o równaniach współzależnych.
-α32 0 1
Zt →Pt ↔ It -między zmiennymi Pt i It występuje sprzężenie zwrotne.
Przykład modelu rekurencyjnego + powiązania między zmiennymi przedstawione są równaniami:
Pt = α11Zt + α12 Mt-1 + α13 It + α10 +ξ1t
Zt = α21Zt-1 + α22 It + α23 Mt-1 + α20 +ξ2t
It = α31 It-1 + α32 Pt-1 + α30 +ξ3t
Tworzymy macierz B
1 -α11 -α13
B = 0 1 -α22 -jest to macierz trójkątna więc jest to model rekurencyjny
0 0 1
Powiązania między zmiennymi endogenicznymi w modelu maja postać:
It →Pt ← Z
Przykład modelu prostego:
Pt = α11 Mt + α12 It-1 + α10 +ξ1t
Zt = α21Zt-1 + α22 It-1 + α23 Mt-1 + α20 +ξ2t
It = α31 It-1 + α32 Pt-1 + α30 +ξ3t przy nieopóźnionych zmiennych endogenicznych
1 0 0
B = 0 1 0 - macierz diagonalna , model prosty
0 0 1
WYBÓR ZMIENNYCH OBJAŚNIAJĄCYCH DO LINIOWEGO MODELU EKONOMERTYCZNEGO
Formalne etapy doboru zmiennej do modelu można sformułować następująco:
ustalenie listy potencjalnych zmiennych objaśniających
zebranie danych statystycznych będących realizacjami zmiennej objaśniającej i potencjalnych zmiennych objaśniających
eliminacja potencjalnych zmiennych objaśniających oznaczających się niskim poziomem zmienności
ustalenie miernika jakości modelu ekonomicznego
obliczenie współczynników korelacji między wszystkimi rozpatrywanymi zmiennymi
redukcja zbioru potencjalnych zmiennych objaśniających tzn. ustalenie kombinacji zmiennych objaśniających osiągających najkorzystniejszą wartość miernika jakości modelu.
Najczęściej stosowaną metodą jest metoda Z. Hellwiga.
Nośnikiem informacji o zmiennej endogenicznej jest potencjalna objaśniająca.
Y - zmienna objaśniana
X1, ..., Xk - zmienne objaśniające.
I. Tworzymy kombinacje wszystkich zmiennych objaśniających; wybieramy wszystkie podzbiory tego zbioru
X1, X2 ,..., Xk
K = 3 X1, X2, X3
K1 = X1 K2 = X2 K3 = X3
K4 = X1, X2 K5 = X1, X3 K6 = X2, X3
K7 = X1, X2, X3
L = 2K - 1 - ilość kombinacji
II. Obliczamy współczynnik korelacji Pearsona pomiędzy zmienną endogeniczną Y i zmiennymi X1, ..., Xk - oznaczamy je roj
roj = ry,xj j=1...k
r01
R0 = r02
...
r0k
III. Obliczamy wsp. korelacji
ri,j = rxi , xj i,j = 1...k
1 r12 ... r1k
R = r21 1 ... r2k
rk1 ... 1
UWAGA!!! ri,j = rj,i i ≠ j ri,i = 1
Następnie obliczamy pojemność indywidualną dla danej zmiennej i danej kombinacji.
Ta pojemność indywidualna ma postać:
r0j2
hi,j = ----pl----------- ( l = 1,2,...L, l - numer kombinacji
1 + Σ rij j = 1,2,...p1 j = numer zmiennej wyst. w tej kombinacji)
i=1
r012
K1 = X1 h1,1 = -------
1+0
r022
K2 = X2 h2,2 = -------
1+0
r032
K3 = X3 h3,3 = -------
1+0
r012 r022
K4 = X1, X2 h4,1 = ------- h4,2 = -------
1+r12 1+r21
W mianowniku są współczynniki korelacji pomiędzy zmienną Xj , która występuje w liczniku, a pozostałymi zmiennymi występującymi w kombinacji Kl .
r012 r032
K5 = X1, X3 h5,1 = ------- h5,3 = -------
1+ r13 1+r31
r022 r032
h6,2 = ------- h6,3 = -------
1+ r23 1+ r32
r012 r022 r032
h7,1 = ---------------- h7,2 = --------------- h7,2 = ----------------
1+r12+ r13 1+r21+ r23 1+ r13+ r32
Na podstawie powyższych pojemności indywidualnych obliczamy pojemności integralne.
Pojemnością integralną kombinacji potencjalnych zmiennych objaśniających jest wyrażenie:
pl
Hl = Σ hl,j dla l = 1,2,...L
j=1
Hl - pojemność integralna dla kombinacji hl
l - numer kombinacji
Pojemność integralna stanowi kryterium wyboru odpowiedniego zestawu zmiennych objaśniających.
Wybiera się tę kombinację zmiennej objaśniającej dla której pojemność integralna jest maksymalna.
UWAGA!!! Indywidualne i integralne wskaźniki pojemności informacyjnej przyjmują wartości z przedziału obu stron domkniętych [0,1].
Pojemności te przyjmują tym większe wartości im zmienne objaśniające są silnie skorelowane zmienną objaśnianą (im większe r0j) oraz im słabiej są skorelowane między sobą (im mniejsze są wartości rij).
Przykład.
Zakłada się, że do opisu zmian endogenicznej Y w modelu jednorównaniowym, zbiór potencjalnych zmiennych objaśnianych tworzą zmienne x1, x2, x3, x4.
Y - rozmiar produkcji w mln zł
X1 - wartość zainstalowanych maszyn i urządzeń w mln zł
X2 - średni czas przestoju maszyn i urządzeń w setkach godzin
X3 - zatrudnienie w setkach osób
X4 - średnia powierzchnia hal produkcyjnych w tys. m2.
Dane umowne:
Y |
X1 |
X2 |
X3 |
X4 |
3,0 |
2,0 |
5,0 |
1,0 |
14, |
4,0 |
2,0 |
4,0 |
3,0 |
12,0 |
3,0 |
1,0 |
5,0 |
2,0 |
10,0 |
2,0 |
1,0 |
5,0 |
4,0 |
8,0 |
5,0 |
3,0 |
4,0 |
3,0 |
12,0 |
7,0 |
4,0 |
3,0 |
5,0 |
15,0 |
8,0 |
4,0 |
2,0 |
7,0 |
12,0 |
10,0 |
5,0 |
1,0 |
6,0 |
10,0 |
5,0 |
3,0 |
4,0 |
7,0 |
8,0 |
12,0 |
6,0 |
1,0 |
7,0 |
6,0 |
0,979 1 -0,948 0,736 -0,182
-0,979 -0,948 1 -0,760 0,229
R0 = 0,739 R0 = 0,736 0,760 1 -0,468
-0,267 -0,182 0,229 -0,468 1
Mamy 4 potencjalne zmienne objaśniające. Z nich tworzymy kombinacje. Wszystkich kombinacji będzie 15.
K1 = X1 K2 = X2 K3 = X3 K4 = X4
K5 = X1, X2 K6 = X1, X3 K7 = X1, X4 K8 = X2, X3 K9 = X2, X4 K10 = X3, X4
K11 = X1 X2 X3 K12 = X1 X2 X4 K13 = X1 X3 X4 K14 = X2 X3 X4 K15 = X1 X2 X3 X4
Następnie obliczamy dla poszczególnych kombinacji pojemności indywidualne a następnie integralne.
(0,979)2 (-0,979)2
h11 = ---------- = 0,9584 h22 = ---------- = 0,9584
1 1
(0,739)2 (-0,267)2
h33 = ---------- = 0,5461 h44 = ---------- = 0,0713
1 1
(0,979)2 (-0,979)2
h51 = ---------------- = 0,4920 h53 = -------------- = 0,4920
1+ -0,948 1+-0,948
(0,979)2 (0,739)2
h61 = ------------ = 0,5521 h63 = ---------- = 0,3146
1+ 0,739 1+0,736
(0,979)2 (-0,267)2
h71 = -------------- = 0,8109 h74 = ---------------- = 0,0603
1+-0,182 1+-0,182
(-0,979)2 (0,739)2
h82 = ---------------- = 0,5446 h83 = ---------------- = 0,3103
1+ -0,760 1+-0,760
(-0,979)2 (-0,267)2
h92 = ------------- = 0,7798 h94 = ------------ = 0,0580
1+ 0,229 1+0,229
(0,979)2
h111 = ----------------------- = 0,3571
1+ -0,948+0,736
(-0,979)2
h112 = ----------------------------- = 0,7798
1+ -0,948+-0,760
(0,739)2
h113 = ----------------------- = 0,7798
1+ 0,736+-760
(0,979)2
h151= ------------------------------------ = 0,3336
1+-0,948+0,736+-0,182
(-0,979)2
h152= ------------------------------------ = 0,3255
1+-0,948+0,229+-0,760
(0,739)2
h153= ------------------------------------ = 0,1842
1+-0,760+-0,468+0,736
(-0,267)2
h154= ------------------------------------ = 0,0379
1+-0,182+0,229+-468
Pojemności integralne dla poszczególnych kombinacji są równe.
H1 = 0,9584 H2 = 0,9584 H3 = 0,5461 H4 = 0,0713
H5 = 0,9840 H6 = 0,8667 H7 = 0,8712 H8 = 0,8549
H9 = 0,8378 H10 = 0,4206 H11 = 0,9289 H12 = 0,9407
H13 = 0,7894 H14 = 0,7677 H15 = 0,8812
Wykład II (30.03.2003)
METODA NAJMNIEJSZYCH KWADRATÓW. MODEL EKONOMETRYCZNY JEDNORÓWNANIOWY
MNK - najczęściej stosowana metoda wyznaczania parametrów modelu ekonometrycznego. Stosować ją będziemy dla modeli jednorównaniowych następujących postaci:
Yi = α1x1i + α2x2i + ... + αk-1xk-1i + ξi (1)
Ostatnia zmienna xk przyjmuje wartość 1, przy czym i = 1,2...n, ξ - to jest czynnik losowy.
x1i, x2i, xk-1i - dla i = 1,2,...,n to wartości zmiennych objaśniających w modelu
α1...αk to nieznane parametry strukturalne powyższego modelu, będziemy je szacować przez zastosowanie metody najmniejszych kwadratów, a więc szukamy minimum wyrażenia Ψ.
W tym celu rozważmy następującą sumę:
n
Ψ = Σ (yi - yi* )2 → min (2)
i=1
gdzie
yi* = a1x1i + a2x2i + ... + ak-1 xk-1i + ak
Funkcję Ψ można przedstawić w tej postaci:
Ψ = (y - xa)T (y - xa) ⇒ min
gdzie:
x - macierz obserwacji w której poszczególne kolumny są złożone z obserwacji poszczególnych zmiennych objaśniających.
a1...ak - estymatory nieznanych parametrów α1 - αk, są wyznaczane met. najmniejszych kwadratów wtedy i tylko wtedy gdy spełniają następujący układ równań normalnych.
n n n n
a1 Σ x1i2 + a2 Σ x1i x2i + ... + ak Σ x1i = Σ x1i yi
i=1 i=1 i=1 i=1
n n n n
a1 Σ x1ix2i + a2 Σ x2i2 + ... + ak Σ x2i = Σ x2i yi
i=1 i=1 i=1 i=1
n n n
a1 Σ x1i + a2 Σ x2i + ... + nak = Σ yi
i=1 i=1 i=1
Niech y będzie wektorem zmiennej endogenicznej, a „a” wektorem nieznanych parametrów
y1 a1
y = y2 a = a2
… ...
yn ak
Oznaczymy X macierz obserwacji ustalonych zmiennych objaśniających modelu
x11 x21 ... xk-1,1 1
x = x12 x22 ... xk-1,2 1
... ... ... ... ...
x1n x2n ... xk-1,n 1
Pierwsza kolumna - kolumna obserwacji zmiennej x1
Druga kolumna - kolumna obserwacji zmiennej x2
Trzecia kolumna - kolumna obserwacji zmiennej jedynek dlatego, że występuje wyraz wolny αk
Założenia dotyczące macierzy X są następujące:
n > k + 1
rząd macierzy x = k + 1
Przy powyższych założeniach otrzymujemy następującą postać macierzową układu równań normalnych
(XTX)a = XTy
Jeżeli rząd macierzy równa się x = k + 1 to układ posiada dokładnie 1 rozwiązanie i jest ono następującej postaci:
a = (XTX)-1 = XTy (macierz odwrotna)
Macierz wariancji i kowariancji estymatora parametrów modelu jest następującej postaci:
D2(a) = σ2 (XTX)-1
gdzie σ - wariancja składnika losowego.
Parametr σ2 nie jest znany w modelu i zastępuje się go wariancją resztową
1 n
S2u = ------ Σ (yi - yi*)2
n - k i=1
gdzie yi* - to wartości teoretyczne zmiennej endogenicznej określone wzorem (2),wyliczone z modelu ekonometrycznego czyli to składowe wektora y* = xa
Wariancja resztowa - jest to średniokwadratowe odchylenie wartości teoretycznych zmiennej endogenicznej od jej wartości empirycznych wyznaczonych z modelu ekonometrycznego. Wartości teoretyczne są zawsze wyznaczane z modelu !!!
Pierwiastek z wariancji resztowej nazywamy odchyleniem standardowym reszt.
Odchylenie standardowe reszt oznaczamy s(u) = √Su2
1
Su2 = ------- [yTy - yTXa]
n - k
Odchylenie standardowe reszt informuje o ile średnio ± odchylają się realizacje zmiennej endogenicznej od wartości teoretycznych wyznaczonych przez oszacowany model. Do oceny stopnia zgodności oszacowanego modelu z danymi rzeczywistymi wykorzystuje się współczynnik zbieżności ϕ2 obliczany ze wzoru:
n
Σ (yi - yi*)2
ϕ2 = --i=1-------_---
Σ (yi - y)2
i=1
_ 1 n
gdzie y = ---- Σ yi
n i=1
Można też obliczyć z innego wzoru:
(n - k)S2u
ϕ2 = ---------------
n (Σyi)2
Σ yi2 - -------
i = 1 n
Współczynnik ϕ2 przyjmuje wartości od 0 do 1 i określa jaka część wariancji zmiennej endogenicznej nie została wyjaśniona przez powyższy model ekonometryczny, a więc zależy od innych czynników niż te, które uwzględniono w modelu.
ϕ2 - przyjmuje wartości 0 wtedy gdy wszystkie wartości teoretyczne zmiennej endogenicznej sa równe wartościom zaobserwowanym.
Im bliższa jest wartość ϕ2 0 tym dokładniejszy jest model ekonometryczny.
Alternatywna miarą zgodności jest współczynnik determinacji R2 = 1 - ϕ2 ,współczynnik ten przyjmuje wartość od 0 - 1 i określa jaka częśc wariancji zmiennej endogenicznej została wyjaśniona przez zmienne objaśniające uwzględnione w oszacowanym modelu ekonometrycznym.
Im bliższa jest wartość R2 liczbie 1 tym dokładniejsze jest równanie modelu ekonometrycznego.
Przykład:
Z metody Helwiga zastosowanej na poprzednim wykładzie wynika, że zmiennymi objaśniającymi rozmiar produkcji są zmienne X1 określające wartości maszyn i urządzeń:
x1 to jest wielkość zainstalowanych maszyn, urządzeń w mln zł,
x2 - średni czas przestoju maszyn i urządzeń w setkach godzin.
Będziemy rozważać model ekonometryczny postaci.
Yi = α1 x1i + α2 x2i + α3 + ξi
Na podstawie następujących danych empirycznych (dane umowne) oszacować parametry strukturalne modelu i zbadać jego dokładność.
Y |
X1 |
X2 |
3,0 |
2,0 |
5,0 |
4,0 |
2,0 |
4,0 |
3,0 |
1,0 |
5,0 |
2,0 |
1,0 |
5,0 |
5,0 |
3,0 |
4,0 |
7,0 |
4,0 |
3,0 |
8,0 |
4,0 |
2,0 |
10,0 |
5,0 |
1,0 |
5,0 |
3,0 |
4,0 |
12,0 |
6,0 |
1,0 |
Niech a - to wektor estymatorów nieznanych parametrów modelu otrzymanych metodą najmniejszych kwadratów (MNK).
a1
a = a2 a = (XTX)-1 XTY
a3
2 5 1 3
2 4 1 4
1 5 1 3
x = 1 5 1 y = 2
3 4 1 5
4 3 1 7
4 2 1 8
5 1 1 10
3 4 1 5
6 1 1 12
Σx12 Σ1x2 Σx1
XTX = Σx1x2 Σxx2 Σx2 macierz symetryczna
Σx1 Σx2 n
Σ X1Y
XTY = Σ X2Y
Σ Y
X1 |
X2 |
Y |
X12 |
X22 |
X1X2 |
X1Y |
X2Y |
YI2 |
2 |
5 |
3 |
4 |
25 |
10 |
6 |
15 |
9 |
2 |
4 |
4 |
4 |
16 |
8 |
8 |
16 |
16 |
1 |
5 |
3 |
1 |
25 |
5 |
3 |
15 |
9 |
1 |
5 |
2 |
1 |
25 |
5 |
2 |
10 |
4 |
3 |
4 |
5 |
9 |
16 |
12 |
15 |
20 |
25 |
4 |
3 |
7 |
16 |
9 |
12 |
28 |
21 |
49 |
4 |
2 |
8 |
16 |
4 |
8 |
32 |
16 |
64 |
5 |
1 |
10 |
25 |
1 |
5 |
50 |
10 |
100 |
3 |
4 |
5 |
9 |
16 |
12 |
15 |
20 |
25 |
6 |
1 |
12 |
36 |
1 |
6 |
72 |
12 |
144 |
31 |
34 |
59 |
121 |
138 |
83 |
231 |
155 |
445 |
Tworzymy macierz XTX
121 83 31 131
XTX = 83 138 34 XTY = 155
31 34 10 59
d11 = 224 d12 = 224 d13 = -1456
d21 = 224 d22 = 249 d23 = -1541
d31 = -1456 d32 = -1541 d33 = 9809
Wyznacznik macierzy wynosi 560.
224 224 -1456
------ ------ --------
560 560 560
224 249 -1541
XTX = ------ ------ --------
560 560 560
-1456 154 1 9809
------ ------ --------
560 560 560
Możemy wyznaczyć wektor estymatorów parametrów modelu czyli wektora „a”.
224 224 -1456 28
------ ------ -------- -----
560 560 560 28
231 -1,0000
224 249 -1541 29
a = (XTX)-1 XTY = ------ ------ -------- 155 = --- = -1,0357
560 560 560 28
59 6,3214
-1456 154 1 9809 177
------ ------ -------- ------
560 560 560 28
Równanie modelu jest ostatecznie takie:
y*i = 1x1i - 1,0357x2i + 6,3214 dla i = 1,2,...,10
Interpretacja współczynnika modelu:
Jeżeli wartość zainstalowanych maszyn i urządzeń nie ulegnie zmianie, a czas przestoju maszyn i urządzeń wzrośnie o 100 godzin to wartość produkcji zmaleje o 1,0357 mln zł.
Jeżeli wartość zainstalowanych maszyn i urządzeń wzrośnie o 1 mln zł, a średni czas przestoju maszyn i urządzeń nie ulegnie zmianie to wartość produkcji wzrośnie o 1 mln zł.
Wartość produkcji wynosi 6,3214 mln zł.
231
aT XTy = (1; -1,0357; 6,3214) 155 = 231 - 1,0357 * 155 + 6,3214 * 59 = 443,4291
59
1
Wariancja resztowa S2u = --------- [ 445 - 443,4291 ] = 0,2244
10 - 3
√ S2u = √0,2244 = 0,4737
Wartości rzeczywiste rozmiarów produkcji różnią się od wartości teoretycznych o ± 0,4737 mln zł.
Zbadać czy występują wahania przypadkowe w rozważanym modelu. W tym celu obliczamy współczynnik zmienności resztowych wg wzoru:
S (u)
Vu = --_--- . 100%
y
_ 59
Σ yi = 59 n = 10 y = ---- = 5,9
10
0,4737
Vu = ---------- . 100% = 8,03%
5,9
Wahania przypadkowe stanowią 8,03% średniego poziomu rozmiarów produkcji.
Zbadać dokładność modelu:
(10 - 3) 0,2244 7 * 0,2244
ϕ2 = ---------------------- = --------------- = 0,0162
445 - (59)2/10 445 - 348,1
ϕ2 * 100% = 1,62%
Możemy stwierdzić, że 1,62% rozmiarów produkcji nie zostało wyjaśnione przez powyższy model.
R2 = 1 - 0,01623 = 0,9838
R2 * 100% = 98,38%
98.38% wartości rozmiarów produkcji zostało wyjaśnione przez powyższy model.
Znaczenie błędów szacunku parametrów modelu: błędy szacunku parametrów modelu wyznacza się na podstawie macierzy
D2 (a) = S2u (XTX)-1
224 224 -1456
------ ------ --------
560 560 560
0,08976 0,08976 -0,5834
224 249 -1541
D2 (a) = 0,2244 ------ ------ -------- = 0,08976 0,09978 -0,6175
560 560 560
-0,58344 -0,6175 3,9306
-1456 154 1 9809
------ ------ --------
560 560 560
Błąd szacunku parametrów
D2 (a) = √D2(ai)
i - ty element diagonalny powyższej macierzy
D(a1) = √0,08976 = 0,2993
D(a2) = √0,09978 = 0,3159
D(a3) = √3,9306 = 1,9826
Ostatecznie powyższy model zapisać można w postaci:
y*i = 1,0000 x1i - 1,0357x2i + 6,3214
(0,2996) (0,3159) (1,9826)
Su = 0,4737
ϕ2 = 0,0162
BADANIE ISTOTNOŚCI WPŁYWU POSZCZEGÓLNYCH ZMIENNYCH OBJAŚNIAJĄCYCH NA ZMIENNĄ ENDOGENICZNĄ.
Zbadać czy zmienna objaśniająca Xi ma istotny wpływ na zmienna endogeniczna y.
Testujemy hipotezę H0 określającą, że parametr przy zmiennej Xi jest = 0.
H0: αi = 0
H1: αi ≠ 0
H0 mówi, że zmienna xi nie ma istotnego wpływu na zmienną endogeniczną, a H1 - zmienna x1 ma istotny wpływ na zmienną endogeniczną.
W celu zweryfikowania H0 wobec H1 obliczamy wartość statystyki wg wzoru:
ai
ti = ------
D(ai)
Następnie z tablic rozkładu t-studenta dla n - k stopni swobody odczytujemy wartość krytyczną tα dla z góry zadanego poziomu istotności α.
Następnie porównujemy obliczoną wartość statystyki ti z wartością krytyczną tα.
Gdy ti > tα to H0 odrzucamy na korzyść H1 i wnioskujemy, że parametr αi ≠ 0, a zatem zmienna xi ma istotny wpływ na zmienną endogeniczną y.
Jeżeli natomiast ti ≤ tα to nie ma podstaw do odrzucenia H0 , a zatem wnioskujemy, że zmienna xi nie ma istotnego wpływu na zmienną endogeniczną y.
Zatem t nie bierzemy w dalszej analizie modelu.
Pytanie empiryczne:
Zbadać czy wartość zainstalowanych maszyn i urządzeń ma istotny wpływ na rozmiar produkcji.
W tym celu stosujemy hipotezę H0
H0: α1 = 0
H1: α1 ≠ 0
a1 1
t1 = ------ = ---------- = 3,3378
D(a1) 0,2996
Wartość krytyczna dla α = 0,05 wynosi tα = 2,0365
t1= 3,3378 > 2,365 = t0,05
Hipotezę H0 odrzucamy na korzyść H1 i wnioskujemy, że wartość zainstalowanych maszyn i urządzeń maja istotny wpływ na rozmiar produkcji.
Zbadać czy czas przestoju maszyn i urządzeń mają istotny wpływ na rozmiar produkcji.
H0: α2 = 0
H1: α2 ≠ 0
a2 - 1,0357
t2 = ------ = ---------- = -3,2786 t0,005 = 2,365
D(a2) 0,3159
t2= -3,2786= 3,2786 > 2,365 = t0,05
H0 odrzucamy na korzyść H1 i wnioskujemy, że czas przestoju maszyn i urządzeń maja istotny wpływ na wartość produkcji.
Aby stwierdzić czy dopasowanie oszacowanego modelu do danych empirycznych jest wystarczające można zweryfikować hipotezę o istotności współczynnika korelacji wielokrotnej.
Współczynnik korelacji wielokrotnej
Rw = √ R2 określa korelację pomiędzy zmienną endogeniczną y , a wszystkimi zmiennymi objaśniającymi.
H0: Rw = 0
H1: Rw ≠ 0
W celu zweryfikowania tej hipotezy obliczamy wartość statystyki F wg wzoru:
R2w n - k
F = ---------- * -------
1 - R2w k - 1
współ. determinacji
Z tablic rozkładu F. Fishera - Snadecora o k-1 i n-k stopniach swobody odczytujemy wartość krytyczną Fα.
Następnie porównujemy wartość obliczoną F z wartością krytyczną Fα.
Gdy F > Fα to H0 odrzucamy na korzyść H1 i wnioskujemy, żę wszystkie zmienne mają istotny wpływ na zmienną endogeniczną, albo że dopasowanie modelu jest wystarczające.
Gdy F ≤ Fα to możemy stwierdzić, że dopasowanie modelu nie jest wystarczające.
0,9838 10 - 3
F = ------- * ------- = 212,549
0,0162 3 - 1
α = 0,05
F0,05 = 4,74
F = 212,549 > 4,74 = F0,05
Dopasowanie modelu jest wystarczające.
Wykład III - (12.04.2003)
Założenia MNK:
rozkład reszt jest losowy
rozkład reszt jest symetryczny
nie występuje autokorelacja składnika reszt
wariancja składnika reszt jest jednorodna
rozkład reszt jest normalny.
BADANIE AUTOKORELACJI RESZT
Mówimy, że występuje autokorelacja rzędu I, jeżeli zachodzi związek:
ξt = σ ξt-1+ ηt
Jeżeli zachodzi korelacja między zmienną w czasie t i w czasie posuniętym o 1 jednostkę do tyłu
wsp. autokorelacji liczymy wg wzoru
E(ξt * ξt-1) - E(ξt) * E(ξt-1)
P1 (ro) = -----------------------------------
D(ξt) D(ξt-1)
Rozważać będziemy hipotezę:
H0: ς1 = 0
H1: ς1 ≠ 0
Test służący do weryfikowania tej hipotezy to test Durbina - Watsona
Na podstawie tych reszt wyznaczonych z modelu obliczamy wartość statystyki „d” wg wzoru:
n
Σ (ut - ut-1)2
d = --t = 2--------------
Σ u2t
t = 1
ut - reszty dla danego modelu ekonometrycznego
Następnie w zależności od wartości statystyki „d” stawiać będziemy różne hipotezy alternatywne
Z tablic testu Durbina -Watsona odczytujemy 2 wartości krytyczne dz i du.
d ∈[0 , 4]
ς1 > 0 ↔ d∈ [0,2]
ς2 < 0 ↔ d∈ (2,4]
Z tablic rozkładu Durbina-Watsona odczytujemy dwie wielkości du i dL dla z góry zadanego poziomu istotności α i dla ustalonej liczby zmiennych objaśniających „K”.
Obliczoną wartość statystyki d porównujemy z wartościami krytycznymi dL i du.
odrzucamy H0 NIC nie ma podstaw do odrzucenia H0
+
• •
dz du
(ς1 > 0) Wniosek (ς1 = 0)
odrzucamy model NIC brak autokorelacji reszt
W przypadku kiedy występuje autokorelacja ujemna czyli gdy d >2 obliczamy statystykę d' wg wzoru:
d' = 4 - d i postępujemy dalej tak jak poprzednio
Przykład 2:
Na podstawie danych z przykładu 1 zbadajmy czy reszty modelu wykazują autokorelację.
Yi koszty całkowite w mln zł |
Xi skala produkcji w tys. szt |
yi* |
ut reszta |
ut - 1 |
(ut - ut-1)2 |
u2t |
11 |
1 |
12 |
-1 |
- |
- |
1 |
13 |
1 |
12 |
1 |
-1 |
4 |
1 |
16 |
2 |
14 |
2 |
1 |
1 |
4 |
12 |
2 |
14 |
-2 |
2 |
16 |
4 |
13 |
3 |
16 |
-3 |
-2 |
1 |
9 |
19 |
3 |
16 |
3 |
-3 |
36 |
9 |
22 |
4 |
18 |
4 |
3 |
1 |
16 |
14 |
4 |
18 |
-4 |
4 |
64 |
16 |
15 |
5 |
20 |
-5 |
-4 |
1 |
25 |
25 |
5 |
20 |
5 |
-5 |
100 |
25 |
28 |
6 |
22 |
6 |
5 |
1 |
36 |
16 |
6 |
22 |
-6 |
6 |
144 |
36 |
17 |
7 |
24 |
-7 |
-6 |
1 |
49 |
31 |
7 |
24 |
7 |
-7 |
196 |
49 |
34 |
8 |
26 |
8 |
7 |
1 |
64 |
18 |
8 |
26 |
-8 |
8 |
256 |
64 |
|
|
|
0 |
|
823 |
408 |
n
Σ (ut - ut-1)2
d = --t = 2--------------
Σ u2t
t = 1
823
d = ----- = 2,017
408
d > 2 zatem rozważamy H1: ς1 < 0
d' = 4 - 2,017 = 1,983
Z tablic odczytujemy dla 16 obserwacji (n=16) i jednej zmiennej objaśniającej (k=1) wartości dL = 1,10 i du = 1,37
Ponieważ d' > du więc nie ma podstaw do odrzucenia hipotezy zerowej ς1 = 0 (autokorelacja nie jest istotna - nie wystepuje).
W takim razie założenie dotyczące autokorelacji reszt w metodzie MNK jest spełnione
Zadanie: czy reszty maja charakter losowy
TEST serii:
H0: reszty modelu są losowe
H1: reszty modelu nie są losowe.
Jeśli reszta jest dodatnia to przyporządkowujemy jej symbol A,
jeśli reszta jest ujemna to przyporządkowujemy jej symbol B.
W ten sposób otrzymujemy ciąg symboli A i B.
Jeżeli dany podciąg tego ciągu tego ciągu składa się z samych symboli A lub samych symboli B to uważamy go za 1 serię.
Oznaczamy przez C empiryczną liczbę serii.
Niech:
n1 - liczba reszt dodatnich
n2 - liczba reszt ujemnych
Z tablic dla testu serii dla powyższych liczb n1 i n2 i dla poziomu istotności α/2 i 1-α/2 odczytuje się dwie wartości krytyczne C1 i C2.
odrzucamy H0 nie ma podstaw do odrzucenia H0 odrzucamy H0
• •
C1 C2
C1 i C2 mieszczą się w obszarze do odrzucenia. W przypadku odrzucenia H0 stwierdzamy, że reszty nie mają rozkładu losowego i wtedy nic nie można stwierdzić (model jest źle dobrany).
C = 9
n1 = 8
n2 = 8
α = 0,025 C1 = 4 C2 = 13
nie ma podstaw do odrzucenia H0, możemy stwierdzić że rozkład reszty jest losowy.
BADANIE SYMETRII ROZKŁADU RESZT.
Stosujemy test dla wskaźnika struktury i stawiamy H0 i H1
H0: p = ½
H1: p ≠ ½
W tym celu obliczamy statystykę t wg wzoru:
m/n - 1/2
t = --------------------
m/n (1 - m/n)
√ ----------------
n - 1
Statystyka ta ma przy założeniu prawdziwości H0 i przy założeniu że próba jest mała rozkład t-studenta o m-1 stopniach swobody.
Natomiast w przypadku dużej próby rozkład normalny standardowy.
Z tablic tego rozkładu odczytujemy wartość krytyczną tα.
Gdy t> tα to H0 odrzucamy na korzyść H1 i wnioskujemy, że reszty nie mają rozkładu symetrycznego.
Gdy t< tα to nie ma podstaw do odrzucenia H0 i wnioskujemy, że reszty mają rozkład symetryczny.
m - liczba reszt
n - ilość obserwacji
BADANIE JEDNORODNOŚCI WARIANCJI
Test Gordfielda - Quandta - test ten służy do badania jednorodności wariancji składnika resztowego.
Stawiamy hipotezę:
H0: σ21 = σ22 (sigma)
H1: σ21 > σ22 (sigma)
Postępowanie jest następujące:
Zbiór reszt dzielimy na 2 części o liczebnościach n1 i n2.
n/2 gdy n - parzyste
n1 = n2 =
(n-1)/2 gdy n - nieparzyste
Obliczamy wariancje resztowe:
Σ u2t
S2u1 = ------------
n1 - (k+1)
Σ u2t
S2u2 = ------------
n2 - (k+1) gdzie k - ilość zmiennych
Obliczamy wartość statystyki F wg wzoru:
S2u1
F = -------
S2u2 gdzie S2u1 > S2u2
Statystyka ta służy do weryfikowania hipotezy H0 wobec H1:
H0: σ1 = 0
H1: σ1 > 0
Statystyka ta ma przy założeniu prawdziwości H0 rozkład F. Snedecora o (n1 - (k+1)) stopniach swobody dla licznika
i (n2 - (k+1)) stopniach swobody dla mianownika.
Z tablic tego rozkładu dla powyższej ilości stopni swobody i dla z góry zadanego poziomu istotności α otrzymuje się wartość krytyczną Fα tak, aby zachodził warunek:
Fα
P F ≥ Fα = α
Gdy F ≥ Fα to H0 odrzucamy na korzyść H1 i wnioskujemy, że wariancja składnika resztowego nie jest jednorodna. W tym przypadku zastosowanie metody MNK było niesłuszne.
Gdy F < Fα to nie ma podstaw do odrzucenia hipotezy zerowej i wówczas wariancja składnika resztowego jest jednorodna, słuszne jest zastosowanie metody MNK.
Przykład:
Rozważmy model ekonometryczny postaci, gdzie:
yi = 2,00 x1 + 10,00 + ui S2u = 29,1429
(0,589) (2,974)
Nr obserwacji |
ut |
u2t |
u2t |
1 |
-1 |
1 |
- |
2 |
1 |
1 |
- |
3 |
2 |
4 |
- |
4 |
-2 |
4 |
- |
5 |
-3 |
9 |
- |
6 |
3 |
9 |
- |
7 |
4 |
16 |
- |
8 |
-4 |
16 |
- |
9 |
-5 |
60 |
25 |
10 |
5 |
|
25 |
11 |
6 |
|
36 |
12 |
-6 |
|
36 |
13 |
-7 |
|
49 |
14 |
7 |
|
49 |
15 |
8 |
|
64 |
16 |
-8 |
|
64 |
|
|
|
348 |
ui = yi - ŷi
yi = 2xi + 10
yi - wartości empiryczne Y.
16
Σ u2i
S2u = -------------- = 29,1429
16 - (1+1)
H0: σ21 = σ22
H1: σ21 > σ22 i = 1,2,...,8
n1 = n2 = 8
8
Σ u21 1
S2u1 = --------- = --------- * 60 = 10,00 i = 9,..., 16
8-2 8 - 2
16
Σ u22 1
S2u2 = --------- = ------ * 348 = 58,00 i = 9,..., 16
8-2 6
S2u1 58,00
F = ------- = --------- = 5,8
S2u2 10,00
Jeżeli F > Fα H0 odrzucamy na korzyść H1i wnioskujemy, że wariancja nie jest jednorodna
Wariancja składnika resztowego nie jest jednorodna, nie można zastosować MNK.
BADANIE ISTOTNOŚCI WPŁYWU POSZCZEGÓLNYCH ZMIENNYCH OBJAŚNIAJĄCYCH NA ZMIENNĄ ENDOGENICZNĄ
Yt = α0 + α1x1 + ... + αkxk
Chcemy zbadać czy zmienna xi ma istotny wpływ na zmienną endogeniczną y.
Ho: αi = 0
H1: αi ≠ 0
H0 mówi nam, że zmienna xi nie ma wpływu na zmienna Y.
H1 ma istotny wpływ na Y.
Do zweryfikowania Ho wobec H1 służy tekst ti postaci:
ai - estymator parametru 2i
ti = ----------
D (ai ) - błąd szacunku tego parametru
Z tablic rozkładu t-studenta odczytuje się wartość krytyczną tα następnie porównujemy obliczoną wartość statystyki ti z wartością tα.
Gdy ti > tα αi ≠ 0 to hipotezę H0 odrzucamy na korzyść H1 i wnioskujemy, że parametr αi ≠ 0 , a zatem zmienna xi ma istotny wpływ na zmienną y.
Gdy ti ≤ tα to nie ma podstaw do odrzucenia H0 i wnioskujemy, że parametr αi = 0, a co za tym idzie nie ma wpływu na zmienną y.
Yi = 1,000x1i - 1,0357x2i + 6,3214
(0,2996) (0,3159) (1,9826)
1) Czy wartość zainstalowanych maszyn i urządzeń ma istotny wpływ na wielkość produkcji?
Będzie odpowiadać temu pytaniu hipoteza
H0: α1 = 0
H1: α1 ≠ 0
Obliczamy wartość t1
a1 1,000
t1 = ---------- = -------- = 3,3378
D (a1 ) 0,2996
Wartość krytyczna odczytana z tablic rozkładu t-studenta dla poziomu istotności α = 0,05 i 7 stopni swobody wynosi tu = 2,365
t1 = 3,3378 > 2,365 = t0,05
Ho odrzucamy na korzyść H1 i wnioskujemy, że α1 ≠ 0 , w takim razie wartość zainstalowanych maszyn i urządzeń ma istotny wpływ na wielkość produkcji.
2) Czy czas przestoju maszyn i urządzeń ma istotny wpływ na wielkość produkcji.
H0: α2 = 0
H1: α2 ≠ 0
Obliczamy wartość t1
a2, -1,0357
t2 = ---------- = --------- = -3,2786
D (a2 ) 0,3159
t0,05 = 2,365
t2 = -3,2786= 3,2786 < 2,365 = t0,05
Zmienna określająca czas przestoju maszyn i urządzeń ma istotny wpływ na wielkość produkcji.
TREND LINIOWY I PROGNOZOWANIE ZA POMOCĄ TRENDU LINIOWEGO
Równanie trendu liniowego obliczamy na podstawie obserwacji zmiennej w przeszłości
T = n+1 (n+2, ..., n+h)
Y*T = a + bT -prognoza ta jest obarczona pewnymi błędami zwanymi ex ante i ex post
gdzie T - czas prognozy, czas w przyszłości
h - horyzont prognozy
Równanie trendu liniowego
ŷt = a + bt
gdzie t - czas zmieniający się od 1 do n t = 1,2,...n
określa zależność liniowa zmiennej objaśniającej od zmiennej czasowej t1.
Współczynniki tego trendu są wyjaśnione MNK i maja postać:
n __ _
Σ(yt - y )(t - t) _ _
b = ---t=1-------_---------- a = y - bt
Σ (t - t)2
lub równoważną postać:
12Σyt * t 6Σyt _ _
b = -------------- - -------- a = y - bt
n3 - n n2 -n
Średnie błędy szacunku współczynników trendu liniowego są następujące:
3,4641 s(u)
D(b) = ---------------
√n(n2 -1)
2n + 1
D(a) = 1,4142 √-------- s(u)
n (n-1)
Σ(yt - ŷt )2
S2u = -------------------
n - 2
s(u) = √ S2u gdzie S2u to wariancja resztowa
yt - wartość empiryczna zmiennej y
ŷt -wartość teoretyczna zmiennej y, wyznaczona na podstawie równania trendu
Prognoza zmiennej Y wyznaczona na podstawie trendu liniowego wynosi:
YT* = a + bT
Prognoza ta obarczona jest błędami zwanymi błędami eksante.
Rozróżniamy 2 rodzaje błędów eksante:
błąd bezwzględny eksante
błąd względny eksante
Błąd bezwzględny ex ante jest określany wobec wzoru:
_
1 (T - t )2
DT = s√ 1 + --- + -------_--- gdzie s = s(u)
n Σ(t - t)2
Interpretacja: rzeczywiste wartości zmiennej prognozowanej odchylają się od prognoz ± DT.
Błąd względny ex ante
DT
VT = ------ * 100%
YT*
Interpretacja: określa jaki popełniamy błąd w prognozowaniu w stosunku do jednej jednostki prognozy.
Często przyjmujemy, że w prognoza jest dopuszczalna gdy VT ≤ 5%
Przykład:
ŷt= a0 + a1t
_ _
a0 = y - a1t
12 ∑yt * t 6∑ yt
a1 = -------------- - ---------
n3 - n n2 - n
Średnie wartości akcji od 01 do 09 wynoszą:
Czas t |
Yt |
Yt * t |
1 |
5 |
5 |
2 |
6 |
12 |
3 |
8 |
24 |
4 |
7 |
28 |
5 |
9 |
45 |
6 |
10 |
60 |
7 |
11 |
77 |
8 |
12 |
96 |
9 |
13 |
117 |
45 |
81 |
464 |
_ 45
t = ---- = 5
9
średnia wartość akcji w tych miesiącach
_ 81
y = ---- = 9
9
12 * 464 6 * 81
a1 = ------------- - --------- = 1
93 - 9 92 - 9
a0 = 9 - 1*5 = 4
Ŷt = 4 + t równanie przedstawia wielkość produkcji w latach 1992 - 2000
Wyznaczamy prognozę akcji na rok 2001 i 2002:
T = 10 n = 9
Y*10 = 4 + 10 = 14 Y*11 = 4 + 11 = 15 Prognoza produkcji na 2001 wynosi 14 mln zł a na 2002 15 mln zł.
Ŷt = 4t _
Czas t |
Yt |
Ŷt |
ut = Yt - Ŷt |
u2t |
(t - t)2 |
1 |
5 |
5 |
0 |
0 |
16 |
2 |
6 |
6 |
0 |
0 |
9 |
3 |
8 |
7 |
1 |
1 |
4 |
4 |
7 |
8 |
-1 |
1 |
1 |
5 |
9 |
9 |
0 |
0 |
0 |
6 |
10 |
10 |
0 |
0 |
1 |
7 |
11 |
11 |
0 |
0 |
4 |
8 |
12 |
12 |
0 |
0 |
9 |
9 |
13 |
13 |
0 |
0 |
16 |
- |
- |
- |
Σ0 |
Σ2 |
Σ60 |
Obliczenie wariancji resztowej dla tego trendu
Σ u2t
S2u = ----------------
9 - 2
gdyż występują 2 parametry w trendzie liniowym
2 2
S2u = ------ = ---- = 0,29
7
s(u) = √0,29 = 0,54
Wartości teoretyczne akcji wyznaczonej z trendu liniowego różnią się od wartości empirycznych o ± 0,54 złotówki.
(10 + 5)2
D10 = 0,54 √ 1 + 1/9 + -----------
60
DT = 10 = 0,666
Prognoza wartości produkcji na 2001r wynosi: 14 zł ± 0,66 złotówki.
Czy ta prognoza jest dopuszczalna?
0,666
VT = 10 = -------- * 100% = 4,7% - błąd jaki popełniamy w stosunku do 1 mln produkcji w roku 2001 wynosi 4,7%
14
Powyższa prognoza jest dopuszczalna bo jest poniżej 5%.
Σ yt
XTY = Σ x1t yt
Σ x2t yt suma y jest w wektorze na początku gdy wyraz wolny jest na początku, suma y jest na końcu gdy wyraz wolny jest na końcu.
TRENDY KRZYWOLINIOWE
W przypadku gdy rozwój danego zjawiska odbywa się w tempie przyspieszonym np. gdy nowy wyrób zdobywa rynek i jego sprzedaż rośnie coraz szybciej do opisu tendencji rozwojowej można wykorzystać następującą funkcję:
funkcja wykładnicza o postaci
Y = e α + βt gdzie β > 0
lub Y = αβt β > 1
funkcja potęgowa o postaci
Y = αtβ β > 1
funkcja paraboliczna
Y = α0 + α1t + α2t2 gdzie α 2 > 0
Jeżeli obserwuje sie, że w długim okresie czasu wzrost zjawiska jest coraz wolniejszy (np. kształtowanie się popytu na wybrane dobro gdy zwiększa się nasycenie rynku) do opisu jego kształtowania się można zaproponować funkcje logarytmiczną bądź potęgową o potędze mniejszej od 1.
logarytmiczna
Y = α + βlnt gdzie β >0
potęgowa
Y = αtβ gdzie 0 < β < 1
W praktyce życia gospodarczego występują również takie zjawiska, które charakteryzują się coraz wolniejszym wzrostem z jednoczesnym dążeniem do pewnego poziomu. W takich przypadkach występuje funkcja liniowo odwrotnościowa o postaci:
αt
Y = --------
β + t gdzie α, β > 0
3