Procedura testu Liunga-Boxa (dokładniejsza niż integralna D-W)
Statystyka portfelowa- testuje brak autokorelacji dla dowolnego modelu.
Hipotezy: H0 :pj = 0
H1 :pj ≠ 0
Statystyka:
T- liczba obserwacji
P - autokorelacja rzędu j
Test Jarquea - Bery (JB)
Testowanie normalności rozkładu reszt
Hipotezy:
H0: F(ui) = FN(ui)
H1: F(ui) ≠ FN(ui)
Statystyka testu:
→ b. p. d. o. H0. Rozkład składnika losowego jest rozkładem normalnym
→ hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej. Rozkład składnika losowego nie jest rozkładem normalnym
Testem alternatywnym dla testu JB jest test zgodności chi-kwadrat.
Test Fishera - Snedecora (F)
Hipotezy:
H0: σ2 = σ2
H1: σ2 ≠ σ2
Statystyka testowa
Statystyka F jest zbieżna do rozkładu Fishera- Snedecora o n1, n2 ssw
u1 = n1 - (k+1)
u2 = n2 - (k+1)
F ≥ F → hipoteza zerowa odrzucona na korzyść hipotezy alternatywnej. Oznacza to, że wariancje prób istotnie różnią się od zera, co oznacza heteroscedastyczne składniki losowe
F < F → b. p. d o. H0. Wariancja składników losowych jest jednorodna. Oznacza to, że składniki losowe modelu mają charakter homoscedastyczny
Wybór modelu poprzez kryterium informacyjne:
Kryterium informacyjne Akaike'a (AIC): \
T - liczba obserwacji
- estymator wariancji reszt uzyskany metodą największej
wiarygodności
k - liczba szacowanych parametrów
Wybrany zostaje model, dla którego AIC jest najmniejsze.
Bayesowskie rozszerzenie minimum AIC (BIC):
Kryterium BIC koryguje skłonność AIC do używania zbyt dużej liczby parametrów
- estymator wariancji szeregu czasowego
Wybrany zostaje model, dla którego BIC jest najmniejsze.
Jeżeli AIC i BIC mają wartości minimalne dla różnych rzędów opóźnień, wybierając model należy kierować się kryterium BIC.
WYKŁAD
Prognozowanie
zdarzenie nastąpi, ponieważ nastąpiło w przeszłości
zdarzenie nastąpi, ponieważ wskazuje na to częstość jego występowania
zdarzenie nastąpi, ponieważ wskazuje na to silne powiązanie z innymi zdarzeniami, które wystąpiły
metody takie jak prognoza naiwna i średnia ruchoma umożliwiają budowę prognoz tylko na jeden okres przyszłości
Metody mechaniczne
prognoza naiwna
zastosowanie: w przypadku, gdy zmienna prognozowana wskazuje stały przeciętny poziom przy niewielkich wahaniach przypadkowych, którego poziom mierzony jest współczynnikiem zmienności
zalety: prostota obliczeń, brak efektu postarzania informacji
wady: możliwa jest budowa jedynie prognoz krótkoterminowych, nie stosuje się jej w przypadku gdy zmienna wykazuje wahania sezonowe
metoda naiwna: Yt* = Yt-1
współczynnik zmienności:
S - odchylenie standardowe zmiennej prognozowanej
- średnia arytmetyczna zmiennej prognozowanej
ocena trafności prognozy (błąd ex post)
(prognoza trafna jeżeli błąd ex post nie będzie większy od 5 % )
średnia ruchoma
zastosowanie: w przypadku, gdy zmienna prognozowana wykazuje trend i wahania przypadkowe
zalety: prostota obliczenia; umożliwia wygładzenie szeregu czasowego; stanowi wstępną metodę obróbki szeregu czasowego, brak efektu postarzania informacji
wady: możliwa jest budowa jedynie prognoz krótkoterminowych, średniej ruchomej nie stosuje się w przypadku gdy zmienna prognozowana wykazuje wahania sezonowe
\
średnia ruchoma:
k - okres średniej ruchomej
Im wyższy okres k średniej ruchomej, tym gładszy, ale zarazem krótszy szereg teoretyczny,
im niższy okres k średniej ruchomej, tym słabiej wygładzony szereg czasowy ale jednocześnie odpowiednio długi, okres k średniej ruchomej wybierany jest w oparciu o kryterium minimalizacji dowolnego błędu ex post prognoz wygasłych.
Błędy prognoz ex post
cechy błędów: wartość błędu nie ulega zmianie wraz ze wzrostem horyzontu prognozy, liczone są zawsze na podstawie prognoz wygasłych, istnieją modele dla których nie można obliczyć niektórych błędów z uwagi na założenia teoretyczne modelu
bezwzględny błąd prognozy liczony na moment t:
względny błąd prognozy (procentowy)
ME - średni błąd ex post:
MAE - średni absolutny błąd bez postarzania
MSE - średni kwadratowy błąd ex post
RMSE - pierwiastek błędu średnio kwadratowego ex post
MPE - średni błąd procentowy ex post
MAPE - średni absolutny błąd procentowy prognoz ex post
Prognozy na podstawie modelu ekonometrycznego:
Zgromadzono następujące dane :
Yt - zgony niemowląt na 1000 urodzeń żywych
X1t - spożycie wódki czystej i gatunkowej w przeliczeniu na alkohol 100% w litrach na osobę w ciągu roku
X2t - PKB na jednego mieszkańca w $
na podstawie danych oszacowano dla X1t:
Yt = -0,24t + 4,19 + ut
w latach 92' - 2000 spożycie alkoholu spadało średnio rzecz biorąc o 0,24 jednostki
w roku 91 przeciętne spożycie alkoholu wynosiło 4,19 jednostki
prognoza dla t=10: Yt = 1,79
prognozy dla X1t i X2t podstawiamy do wyznaczonego modelu, obliczamy błędy predykcji.
Modelowanie zmiennych jakościowych
Wybrane zagadnienia przy modelowaniu których stosowane są zmienne jakościowe:
determinanty zatrudnienia bezrobotnych,
modelowanie wyboru zawodu,
czynniki determinujące decyzje konsumentów dotyczące zakupu określonego dobra,
kondycja finansowa przedsiębiorstwa,
identyfikacja zmiany trendu określonej zmiennej.
Zmienne jakościowe w modelu mogą pełnić rolę zmiennych endogenicznych oraz zmiennych objaśniających.
W modelowaniu ekonometrycznym zmiennych jakościowych można wyróżnić podejścia:
metody polegające na wyznaczeniu prawdopodobieństwa wystąpienia danej kategorii zmiennej jakościowej w zależności od określonych czynników
metody polegające na określeniu reguł postępowania mającego na celu przyporządkowanie obiektów do populacji odpowiadającej danej kategorii cechy/zmiennej
Jakościowa zmienna endogeniczna reprezentowana jest przez sztuczną zmienną, która może:
przyjmować różne przypisane jej wartości (zgodnie z przyjętą skalą pomiaru)
stanowić zmienną o charakterze dychotomicznym, czyli tzw zmienną zero-jedynkową
Do podstawowych modeli regresji, które wykorzystują zmienne zero-jedynkowe w roli zmiennych endogenicznych zalicza się: liniowy model prawdopodobieństwa, mający ścisły związek z funkcją dyskryminacyjną
W przypadku, gdy zmienna endogeniczna modelu ekonometrycznego jest zmienną tzw ukrytą - zmienna, której wartości nie można bezpośrednio obserwować; to stanowi to podstawę do formowania:
modele logitowe
modele probitowe
Modele z dychotomiczną zmienną endogeniczną:
Przyjmijmy, zę Y oznacza zero-jedynkową zmienną losową
p = F(0 + 1X1 + … + kXk + )
p* = F(b0 + b1X1t + … + bkXik)
Szacowanie parametrów modelu z wykorzystaniem MNK:
yi = 0 + x+ ui
obliczanie wagi:
Wady modelu:
wagi mogą okazać się ujemne
składniki losowe nie mają rozkładu normalnego, pojawia się problem ze stosowaniem testów klasycznych istotności parametrów
w wielu przypadkach wartość warunkowa E(yi|xi) = 0 + xi może leżeć poza przedziałem <0,1>
Model probitowy
W modelu probitowym funkcja F jest dystrybuantą standardowego rozkładu normalnego N(0,1)
Model dany jest jako:
p = F(0 + 1X1+...+kXk + )
Probitem nazywać będziemy wielkość daną jako:
Pr = -1 (p) +5 = -1(P(Y=1)) +5
Szacowanie parametrów modelu probitowego:
UMNK
metoda największej wiarygodności
Model logitowy
p =
Logitem, czyli funkcją odwrotną do funkcji F nazywamy wyrażenie postaci:
L =
Przekształcenie L sprowadza zależność prawdopodobieństwa p (zmiennej endogenicznej) od zmiennych objaśniających do postaci liniowej
L = 0 + 1X1 + … + kXk +
Szacowanie parametrów modelu:
UMNK
metoda największej wiarygodności
UMNK modelu probitowego
Wektor ocen parametrów strukturalnych dla modelu probitowego uzyskany UMNK dany jest jako:
b = (X'V-1X)-1X'V-1Pr gdzie b - wektor ocen parametrów strukturalnych
Przykład modelu probitowego - odległość metodą Warda
Miary dopasowania modeli:
R2
R2 = 1 -
R2 McFaddena
Uwaga: wymagane jest aby w liczniku znalazła się większą wartość estymatora wariancji składnika losowego
Można je policzyć
po wygaśnięciu
prognozy