Postać analityczna modelu ekonometrycznego
Yt = f(X1t, X2t , …, Xkt, ξt) Yt - zmienna endogeniczna (objaśniana)
f - postać matematyczna modelu (np. liniowy)
X1t, X2t , …, Xkt - zbiór zmiennych objaśniających
ξt - składnik losowy
Liniowy model ekonometryczny z jedną zmienną objaśniającą
Yt = α1 • X1t + α0 + ξt α0, α1 - parametry strukturalne modelu
Liniowy model ekonometryczny z dwiema zmiennymi objaśniającymi
Yt = α0 + α1 • X1t + α2 • X2t + ξt
Indywidualny wskaźnik pojemności informacyjnej
$h_{\text{lj}} = \frac{{r_{\text{oj}}}^{2}}{1 + \sum_{}^{}{|r_{\text{ij}}|}}$ l - l -ta kombinacja zmiennych objaśniających
0 ≤ h ≤ 1 j - j-ta zmienna objaśniająca
roj - wsp. korelacji Pearsona pomiędzy zmienną
endogeniczną Yt a - j-tą zmienną objaśniającą
rij - wsp. korelacji Pearsona pomiędzy i-tą a j-tą zmienną objaśniającą
Integralny wskaźnik pojemności informacyjnej
$H_{l} = \sum_{}^{}h_{\text{lj}}$
0 ≤ H ≤ 1
Koincydencja zmiennych
musi być spełniony warunek - wtedy możemy interpretować parametry strukturalne modelu
sgn(rYXi) = sgn(ai) → znak wsp. korelacji Pearsona musi być taki sam jak znak parametru
Badanie istotności współczynnika korelacji liniowej
H0 : rxy = 0 n - liczba obserwacji (realizacji zmiennych)
H1 : rxy ≠ 0
$t = \frac{|r_{\text{xy}}|}{\sqrt{1 - r_{\text{xy}}^{2}}} \bullet \sqrt{n - 2}$
decyzja:
tα ≥ t → brak podstaw do odrzucenia H0, głoszącej brak istotnej korelacji (zmienne są od siebie niezależne i mogą pełnić role zmiennych objaśniających w modelu)
tα < t → H0 odrzucamy na korzyść H1, głoszącej istotną korelację
Funkcja kryterium Metody Najmniejszych Kwadratów (MNK)
$\Psi = \sum_{t = 1}^{n}{{(Y_{t} - a_{1} \bullet X_{1} - a_{0})}^{2} \rightarrow min}$ Yt* - świat teoretyczny
$\Psi = \sum_{t = 1}^{n}{{(Y_{t} - {Y_{t}}^{*})}^{2} \rightarrow min}$ Yt - świat empiryczny
$\Psi = \sum_{t = 1}^{n}{{(u}_{t})}^{2} \rightarrow min$ ut - składnik resztowy (reszta modelu)
Yt* = a1 • X1 + a0
ut = Yt − Yt*
Wektor ocen parametrów strukturalnych
a = (X′X)−1 • X′Y
Miary struktury stochastycznej - wariancja resztowa i odchylenie standardowe reszt
$\text{Su}^{2} = \frac{1}{n - k} \bullet \sum_{}^{}{(Y_{t} - {Y_{t}}^{*})}^{2}$ n - liczba obserwacji
$\text{Su}^{2} = \frac{1}{n - k} \bullet \sum_{}^{}{u_{t}}^{2}$ k - liczba szacowanych parametrów
$Su = \sqrt{\text{Su}^{2}}$ Su - odchylenie standardowe reszt
Interpretacja Su: Rzeczywiste realizacje zmiennej endogenicznej Yt odchylają się średnio rzecz biorąc o +/- (wartość Su) jednostki od wartości teoretycznych wyznaczonych przez model
Badanie precyzji oszacowania parametrów strukturalnych - macierz wariancji i kowariancji
D2(a) = Su2 • (X′X)−1
główna przekątna to wariancje estymatorów
odchylenia standardowe z głównej przekątnej to średnie błędy szacunku parametrów
Interpretacja: jeżeli błąd jest bardzo wysoki to najprawdopodobniej taki parametr jest nieistotny statystycznie (równy 0), wtedy należy usunąć zmienną, przy której stał ten parametr
Współczynnik zbieżności
$\varphi^{2} = \frac{\sum_{}^{}{(Y_{t} - {Y_{t}}^{*})}^{2}}{\sum_{}^{}{{(Y}_{t} - \overset{\overline{}}{Y})}^{2}} = \frac{\sum_{}^{}{u_{t}}^{2}}{\sum_{}^{}{{(Y}_{t} - \overset{\overline{}}{Y})}^{2}}$
Interpretacja: Jaki procent zmian (wariancji) zmiennej endogenicznej Yt nie został wyjaśniony przez model ekonometryczny
Współczynnik determinacji
R2 = 1 − φ2
Stosowany wyłącznie dla modeli liniowych
Interpretacja: Jaki procent zmian (wariancji) zmiennej endogenicznej Yt został wyjaśniony przez model ekonometryczny
Skorygowany współczynnik determinacji
${\tilde{R}}^{2} = 1 - \frac{n - 1}{n - m - 1} \bullet (1{- R}^{2})$ n - liczba obserwacji
${\tilde{R}}^{2} < R^{2}$ m - liczba zmiennych objaśniających
Liczy się go najczęściej, gdy model ma mieć zastosowanie prognostyczne
Współczynnik zmienności losowej
$V_{s} = \frac{\text{Su}}{\overset{\overline{}}{Y}} \bullet 100\%$
Im wyższy Vs, tym niższy R2
Interpretacja: Informuje o poziomie losowości w przeciętnym poziomie Yt
Przedział ufności dla parametrów strukturalnych modelu
{ai−tα•D(ai)<ai<ai+tα•D(ai)} = γ α - poziom istotności
γ - poziom ufności (γ = 1 − α)
n - liczba obserwacji
k - liczba szacowanych parametrów
tα - z tablic t-Studenta (α - poziom istotności, n-k stopni swobody)
Test Fishera Snedecora - test F
H0:a, a1, …, ak = 0 → parametry nieistotne N - liczba obserwacji
H1:a, a1, …, ak ≠ 0 → parametry istotne K - liczba zmiennych objaśniających
$F = \frac{R^{2}}{1 - R^{2}} \bullet \frac{N - K - 1}{K}$
r1 = K; r2 = N − K − 1
Decyzja:
F ≥ Fα → H0 odrzucamy na korzyść H1 głoszącej, że przynajmniej jedna zmienna objaśniająca wpływa na zmienną endogeniczną (i tak trzeba przeprowadzić dokładniejszy test)
F < Fα → brak podstaw do odrzucenia H0 głoszącej, że wszystkie zmienne nieistotnie wpływają na zmienną endogeniczną
Test na istotność parametrów strukturalnych - test t-Studenta
H0 : ai = 0 → parametr nieistotny
H1 : ai ≠ 0 → parametr istotny
$t = \frac{a_{i}}{D(a_{i})}$
Decyzja:
|t| > tα → H0 odrzucamy na korzyść H1 głoszącej istotność parametru
|t| < tα → brak podstaw do odrzucenia H0 głoszącej, że parametr ai jest nieistotny statystycznie (równy zero) co oznacza, że zmienna objaśniająca przy tym parametrze nieistotnie wpływa na zmienną endogeniczną Yt i należy ją usunąć z modelu
Test autokorelacji Durbina - Watsona (autokorelacji 1 rzędu)
$d = \frac{\sum_{}^{}{(u_{t} - u_{t - 1})}^{2}}{\sum_{}^{}{u_{t}}^{2}}$ lub d = 2(1 − r1)
d = 0 → r ≈ 1
d ∈ <0, 2) → autokorelacja dodatnia dL - dolna wartość krytyczna
d = 2 → brak autokorelacji (r = 0) dU - górna wartość krytyczna
d ∈ (2, 4> → autokorelacja ujemna dL, dU - odczytujemy z tablic dla k st. swobody
d = 4 → r ≈ −1 k - liczba zmiennych objaśniających
d′ = 4 − d → przy autokorelacji ujemnej
Decyzja:
d(d′)≤dL → H0 odrzucamy na korzyść H1
dL < d(d′)<dU → brak możliwości podjęcia decyzji (obszar niekonkluzywności)
dU ≤ d(d′) → brak podstaw do odrzucenia H0
Integracyjna statystyka testu Durbina - Watsona
$IDW = \frac{\sum_{t = 2}^{T}{(y_{t} - y_{t - 1})}^{2}}{\sum_{t = 1}^{T}{(y_{t} - \overset{\overline{}}{y})}^{2}}$
IDW < 0, 5 → istnienie pierwiastka jednostkowego
IDW ≅ 2 → integracja stopnia 0, czyli proces jest stacjonarny w zakresie wariancji
Testowanie poprawności postaci analitycznej modelu poprzez pryzmat losowości reszt modelu - test serii
H0 : [Yt* = f(X1t, X2t,…, Xkt)] → model właściwy, losowe reszty
H1 : [Yt* ≠ f(X1t, X2t,…, Xkt)] → postać analityczna błędna, reszty nie są losowe
Seria - każdy podciąg reszt, złożony wyłącznie z elementów dodatnich bądź ujemnych. Reszty równe zero nie są brane pod uwagę!
ut > 0 to "a" ; ut < 0 to "b" → określamy liczbę serii, tzw. k empiryczne
Z tablic odczytujemy n1 dla liczby symboli "a", oraz n2 dla liczby symboli "b"
P{k≤kα} = α → na poziomie istotności α
Decyzja:
k ≤ kα → H0 odrzucamy na korzyść H1 głoszącej, że postać analityczna modelu jest błędna, reszty nie są losowe
k > kα → brak podstaw do odrzucenia H0 głoszącej, że postać analityczna modelu jest właściwa, reszty są losowe
Średni błąd predykcji (ex ante)
$V = \sqrt{X_{T}^{'} \bullet D^{2}\left( a \right)X_{T} + \text{Su}^{2}}$ XT - kolumnowy wektor przyszłych realizacji X
błąd ex ante - uwzględnia przeszłość i przyszłość
Interpretacja: rzeczywiste realizacje zmiennej prognozowanej Yt odchylają się średnio o +/- (wartość V) od postawionych prognoz
Względny błąd predykcji (ex ante)
$V^{*} = \frac{V}{Y_{T}^{P}} \bullet 100\%$ YTP - prognoza punktowa na okres T
Interpretacja: Jaki procent przeciętnego poziomu prognozy stanowi średni błąd predykcji
Liniowy model trendu
Yt = α1t + α0 + ξt
f(t) = α1t + α0 → postać analityczna modelu
Średni względny błąd ex post prognoz wygasłych (MAPE - Mean Absolute Percentage Error)
$MAPE = \frac{1}{m}\sum_{i = 1}^{m}\frac{|Y_{t} - {Y_{t}}^{*}|}{Y_{t}}$
Model Kleina (uwzględnia sezonowość addytywną)
Yt = α1t + β(V1−V2) + α0 + ξt V1 - odpowiedzialny za 1 półrocza
V2 - odpowiedzialny za 2 półrocza
Ogólna postać modeli adaptacyjnych
Yt = nt + ut Yt - zmienna prognozowana
nt - funkcja trendu (nieznana jego postać analityczna)
ut - błąd
ut nie jest resztą modelu! Nie musi spełniać warunków obowiązujących dla reszt; ut nie muszą sumować się do 0!
Model wyrównywania wykładniczego Browna
mt = αyt + (1 − α)•mt − 1 mt - ocena trendu na okres bieżący t
0 ≤ α ≤ 1 mt − 1 - ocena trendu na moment poprzedni t − 1
YTp = mt + (mt−mt − 1) • h m1 - pierwsza ocena trendu
m1 = y1 lub $m_{1} = \overset{\overline{}}{y}$ α - parametr wygładzania
yt- realizacja zmiennej prognozowanej w momencie t
YTp - prognoza (równanie prognozy)
h - horyzont prognozy
Szybkie tempo zmian zmiennej prognozowanej → α ≈ 1
Niskie tempo zmian zmiennej prognozowanej → α ≈ 0
Bez uwzględnienia horyzontu prognozy, prognozy na kolejne okresy miałyby ciągle tę samą wartość
Zastosowanie: zmienna prognozowana wykazuje trend i wahania przypadkowe (brak sezonowości)
Model Holta - postać klasyczna
Ft − 1 = αyt − 1 + (1−α) • (Ft − 2 + St − 2)
St − 1 = β(Ft − 1−Ft − 2) + (1 − β)•St − 2
0 ≤ α, β ≤ 1
YTp = Fn + Sn(t−n), gdzie t > n