EKONOMETRYCZNE METODY PRZETWARZANIA INFORMACJI
Wprowadzenie.
Ekonometria jest nauką o metodach badania ilościowych zależności występujących miedzy zjawiskami ekonomicznymi. Metody badawcze ekonometrii to metody statystyczne i matematyczne przystosowane do badań ekonomicznych. Podstawowym narzędziem analizy ekonometrycznej jest opisowy model ekonometryczny.
Model ekonometryczny - jak każda konstrukcja formalna - stanowi uproszczone odwzorowanie pewnego fragmentu rzeczywistości. Oznacza to, ze model ekonometryczny przedstawia związki zachodzące w procesach gospodarczych, bądź tez zjawiskach występujących w pewnych sferach działalności człowieka - uwzględniając przy tym jedynie najbardziej istotne czynniki główne, czyli określające zmienność opisywanego zjawiska a pomijając czynniki mniej ważne - tzw. czynniki uboczne. Zazwyczaj przedmiotem badań staje się sfera zjawisk ekonomiczno - społecznych o bardzo skomplikowanej strukturze - działania czynników głównych splatają się z wpływami czynników ubocznych oraz czysto losowych.
Model ekonometryczny jest, zatem równaniem lub układem równań, który w sposób przybliżony przedstawia zasadnicze powiązania ilościowe występujące miedzy rozpatrywanymi zjawiskami ekonomicznymi.
Zależności występujące miedzy zjawiskami ekonomicznymi są zazwyczaj bardzo złożone, a często i wielokierunkowe. Zwykle na wydzielone zjawisko oddziałuje wiele innych zjawisk o charakterze ekonomicznym oraz pozaekonomicznym. Oddziaływanie różnych czynników na badane zjawisko ekonomiczne jest zazwyczaj zróżnicowane: siła wpływu jednych wielkości jest duża, a innych niewielka i przypadkowa. Model ekonometryczny jest sformalizowanym opisem badanego fragmentu rzeczywistości ekonomicznej uwzględniającym tylko istotne jej elementy i pomijającym mniej istotne.
Badanie za pomocą modelu ekonometrycznego zależności miedzy zjawiskami ekonomicznymi jest procesem wieloetapowym. Wstępnym etapem jest określenie, jakie zjawisko będzie badane, co jest równoznaczne z określeniem zjawiska wyjaśnianego przez model. W pierwszym etapie należy dokonać wyboru zmiennych objaśniających spośród wielu czynników wpływających na zmienna objaśniana. Drugi etap, to wybór postaci analitycznej modelu, a wiec określonej postaci matematycznej funkcji opisującej zależność zmiennej objaśnianej od zmiennych objaśniających. Trzecim etapem jest szacowanie parametrów (estymacji parametrów) modelu, które sprowadza się do wyznaczenia wartości ocen poszczególnych parametrów. W czwartym etapie należy przeprowadzić weryfikacje modelu, której celem jest sprawdzenie, czy zbudowany model dostatecznie dobrze opisuje badana rzeczywistość ekonomiczna. Ostatnim etapem, piątym, jest wnioskowanie na podstawie modelu, a wiec jego praktyczne wykorzystanie. Wnioskowanie to może być zasadniczo dwojakiego rodzaju: analiza ekonomiczna i prognozowanie.
Dobór materiału liczbowego.
Jak wspominano wyżej, model ekonometryczny jest sformalizowanym opisem badanego fragmentu rzeczywistości ekonomicznej uwzględniającym tylko istotne jej elementy i pomijającym mniej istotne. Zewnętrznym wyrazem tego opisu jest równanie modelu. Pod względem roli, jaka odgrywają zjawiska ekonomiczne w opisywanym modelu ekonometrycznym, można je podzielić na dwa rodzaje: zjawisko ekonomiczne wyjaśniane przez model, czyli zmienna objaśniana, oraz zjawiska ekonomiczne, które oddziałują na zmienna objaśniana, czyli zmienne objaśniające. Zmienna objaśniana oznaczamy przez
, a zmienne objaśniające przez
. Opisowy model ekonometryczny przedstawiający zależność zmiennej
od zmiennych losowych
można zapisać w ogólnej postaci następująco:
|
(1) |
W zapisie tym symbol f oznacza analityczna postać funkcji zmiennych objaśniających, która jest określana w trakcie budowy modelu. Symbol
oznacza tzw. odchylenia losowe modelu ekonometrycznego.
Do zmiennych objaśniających zalicza się czynniki najważniejsze. Oznacza to, ze zbiór zmiennych objaśniających nigdy nie wyjaśnia dokładnie kształtowania się zmiennej objaśnianej. Konsekwencja tego jest, ze zaobserwowane wartości zmiennej objaśnianej nie są dokładnie równe jej wartościom wyznaczonym z równania modelu, lecz wahają się wokół nich. Te odchylenia rzeczywistych wartości zmiennej objaśnianej od jej wartości wyznaczonych z modelu są przejawem działania czynników losowych. Im lepiej model odzwierciedla badana rzeczywistość, tym odchylenia losowe są mniejsze.
Dobór materiału liczbowego do modelu ekonometrycznego ściśle wynika z założonego celu badań. Dla potrzeb przeprowadzenia ekonometrycznej analizy dynamiki sprzedaży usług w zakresie szkoleń komputerowych wykorzystany zostanie trójrównaniowy model ekonometryczny pozwalający opisać kształtowanie się i współzależność wartości 3 zmiennych charakteryzujących działalność Szkoły Komputerowej Impuls, czyli: przychodu ze szkoleń komputerowych organizowanych przez Szkołę, średniej ceny szkolenia oraz popytu na te szkolenia. Zmiany wartości zmiennych endogenicznych (objaśnianych) są efektem zmian wartości zmiennych egzogenicznych (objaśniających), tj. obserwowanych czynników zewnętrznych stale oddziaływujących na badany system oraz ewentualnych zakłóceń losowych uwzględnianych zawsze w modelowaniu ekonometrycznym. Zmienne egzogeniczne zostaną dobrane do modelu na podstawie uważnych studiów i analiz.
Dobór zmiennych objaśniających do modelu.
Zmienne objaśniające w liniowym modelu ekonometrycznym z formalnego punktu widzenia powinny się odznaczać następującymi własnościami:
mieć odpowiednio wysoka zmienność,
być silnie skorelowane ze zmienna objaśnianą,
być słabo skorelowane miedzy sobą,
być silnie skorelowane z innymi zmiennymi nie pełniącymi roli zmiennych objaśniających, które zmienne objaśniające reprezentują zmiennych
Wybór zmiennych objaśniających odbywa się za pomocą metod statystycznych. Procedura doboru zmiennych jest następująca:
na podstawie wiedzy merytorycznej sporządza się zestaw tzw. potencjalnych zmiennych objaśniających, którymi są wszystkie najważniejsze wielkości oddziałujace na zmienna objaśnianą; zmienne te będą oznaczane przez
zbiera się dane statystyczne będące realizacjami zmiennej objaśnianej i potencjalnych zmiennych objaśniających; otrzymuje się wektor
obserwacji zmiennej
oraz macierz
obserwacji zmiennych
o postaci:
|
(2) |
eliminuje się potencjalne zmienne objaśniające odznaczające się zbyt niskim poziomem zmienności
oblicza się współczynniki korelacji miedzy wszystkimi rozpatrywanymi zmiennymi
przeprowadza się redukcje zbioru potencjalnych zmiennych objaśniających za pomocą wybranej procedury statystycznej.
Eliminowanie zmiennych quasi - stałych.
Warunkiem wstępnym uznania różnych wielkości za zmienne objaśniające modelu jest dostatecznie wysoka zmienność. Miara poziomu zmienności jest współczynnik zmienności:
|
(3) |
gdzie
- średnia arytmetyczna zmiennej
|
(4) |
natomiast
- odchylenie standardowe zmiennej
|
(5) |
Obiera się krytyczna wartość współczynnika zmienności
np.
Zmienne spełniajace nierówność:
|
(6) |
uznaje się za quasi - stałe i eliminuje ze zbioru potencjalnych zmiennych objaśniających. Zmienne te nie wnoszą istotnych informacji.
Analiza macierzy współczynników korelacji.
Aby obliczyć się liniowej zależności zmiennej objaśnianej
i potencjalnych zmiennych objaśniających
, oblicza się współczynnik korelacji:
|
(7) |
Współczynniki te są przedstawione w postaci wektora korelacji:
|
(8) |
Współczynniki korelacji pomiędzy potencjalnymi zmiennymi objaśniającymi są obliczane wg
wzoru:
|
(9) |
Współczynniki te tworzą macierz korelacji:
|
(10) |
Macierz R jest symetryczna, tzn.
Do analizy ekonometrycznej dobiera się takie zmienne objaśniające, które są silnie skorelowane ze zmienna objaśnianą i jednocześnie słabo skorelowane miedzy sobą. Punktem wyjścia jest wektor
oraz macierz
Dla zadanego poziomu istotności
oraz dla
stopni swobody wyznacza się tzw. krytyczna wartość współczynnika korelacji:
|
(11) |
gdzie:
jest wartością statystyki odczytanej z tablic testu t Studenta dla danego
oraz dla
stopni swobody.
Krytyczna wartość współczynnika korelacji
może tez być zadawana z góry przez badacza.
Procedura doboru zmiennych objaśniających jest następująca:
ze zbioru potencjalnych zmiennych objaśniających eliminuje się te wszystkie zmienne, dla których zachodzi nierówność:
|
(12) |
są to, bowiem zmienne nieistotnie skorelowane ze zmienna objaśnianą,
spośród pozostałych zmiennych jako zmienna objaśniająca powoduje się taka zmienna
, dla której:
|
(13) |
zmienna
jest nośnikiem największego zasobu informacji o zmiennej objaśnianej,
ze zbioru potencjalnych zmiennych objaśniających eliminuje się te wszystkie zmienne, dla których:
|
(14) |
są to zmienne zbyt silnie skorelowane ze zmienna objaśniająca
, a wiec powielające dostarczane przez nią informacje.
Metoda wskaźników pojemności informacyjnej.
Idea metody wskaźników pojemności informacyjnej sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienna objaśnianą, a jednocześnie słabo skorelowane miedzy sobą. Punktem wyjścia tej metody jest również wektor
oraz macierz
Rozpatruje się wszystkie kombinacje potencjalnych zmiennych objaśniających, których ogólna liczba wynosi:
|
(15) |
Dla każdej kombinacji potencjalnych zmiennych objaśniających oblicza się wskaźniki pojemności informacyjnej: indywidualne i integralne. Indywidualne wskaźniki pojemności informacyjnej zmiennych w ramach rozpatrywanej kombinacji są zdefiniowane następująco:
|
(16) |
We wzorze tym
oznacza numer kombinacji,
oznacza numer zmiennej w kombinacji, natomiast
oznacza liczbę zmiennych w rozpatrywanej kombinacji.
Integralne wskaźniki pojemności informacyjnej kombinacji potencjalnych zmiennych objaśniających oblicza się według wzoru:
|
(17) |
Indywidualne oraz integralne wskaźniki pojemności informacyjnej są unormowane w przedziale [0; 1]. Przyjmują one tym większe wartości, im zmienne objaśniające są silniej skorelowane ze zmienna objaśnianą oraz im słabiej są skorelowane miedzy sobą. Jako zmienne objaśniające wybiera się taka kombinacje zmiennych, której odpowiada maksymalna wartość wskaźnika integralnej pojemności informacyjnej.
Konstrukcja modelu ekonometrycznego.
Ogólna postać modelu wielorównaniowego jest następująca:
|
(18) |
gdzie:
- zmienne objaśniane, które mogą występować również w roli zmiennych objaśniających,
- zmienne objaśniające.
Każde równanie wchodzące w skład modelu wielorównaniowego stanowi jedna z relacji służacych do wyjaśnienia zachodzących prawidłowości i wyjaśnia kształtowanie się jednego zjawiska y.
Nie każdy taki układ równań można rozwiązać metodami ekonometrycznymi. Dlatego należy wcześniej sprowadzić model do postaci macierzowej. Niech:
- macierz współczynników przy zmiennych objaśnianych
,
- macierz współczynników przy zmiennych objaśniających. Można zapisać postać ogólna modelu macierzowo w postaci:
|
(19) |
Jeżeli macierz
jest odwracalna, to model można sprowadzić do postaci zredukowanej. Polega to na wyliczeniu
z równania macierzowego . Postać zredukowana modelu przyjmie wówczas postać:
|
(20) |
Jeżeli model można sprowadzić do postaci zredukowanej, to można zastosować Pośrednia Metodę Najmniejszych Kwadratów. Podwójna Metodę Najmniejszych Kwadratów można natomiast stosować zawsze.
Modele ekonometryczne można sklasyfikować ze względu na charakter powiązań miedzy zmiennymi
na:
modele proste - w modelu tym macierz
jest jednostkowa, lub diagonalna, a żadna ze zmiennych objaśnianych nie występuje w roli zmiennych objaśniających
modele rekurencyjne - w modelu tym macierz
jest trójkątna lub quasi-trójkatna
modele o równaniach współzależnych - w modelu tym macierz
jest każda inna macierzą niż w wymienione powyżej.
W zależności od typu równania inna metodę estymacji należy stosować. W modelu prostym każde równanie z osobna szacuje się Klasyczna Metoda Najmniejszych Kwadratów. Każdy model prosty jest identyfikowalny. Model rekurencyjny jest również zawsze identyfikowalny i do jego estymacji również można stosować Pośrednia Metodę Najmniejszych Kwadratów. W przypadku modeli o równaniach współzaleznych, analizę estymacji rozpoczyna się od zbadania identyfikowalności równania. Identyfikowalnośc bada się dla każdego z równań osobno. Identyfikacja modelu obejmuje szacowanie jego parametrów strukturalnych oraz parametrów strukturalnych stochastycznych.
Warunkiem koniecznym i wystarczającym na to, by i-te równanie modelu wchodzące w skład modelu m-równaniowego było identyfikowalne jest, by macierz
parametrów znajdujących się przy zmiennych objaśnianych będących w modelu, a nie występujących w i-tym równaniu była rzędu
Pierwsze twierdzenie Theil'a.
Warunkiem koniecznym, aby i-te równanie wchodzące w skład modelu m-równaniowego było identyfikowalne jest by liczba zmiennych, które są w modelu, a nie występują w równaniu była większa lub równa od
Drugie twierdzenie Theil'a .
Model wielorównaniowy jest identyfikowalny, jeśli identyfikowalne są wszystkie równania, które na ten model się składają.
Estymacja parametrów modelu.
Szacowanie parametrów modelu ekonometrycznego sprowadza się do przypisywania nieokreślonym liczbowo parametrom konkretnych wartości liczbowych. Szacowanie to powinno być przeprowadzone w taki sposób, aby zapewniło najlepsze dopasowanie modelu do danych empirycznych. Powszechnie wykorzystywana metoda szacowania parametrów liniowych modeli ekonometrycznych:
|
(21) |
jest Metoda Najmniejszych Kwadratów. Idea tej metody jest takie wyznaczenie wartości ocen
parametrów strukturalnych
aby suma kwadratów odchyleń zaobserwowanych wartości zmiennej objaśnianej od jej wartości teoretycznych obliczonych z modelu była najmniejsza. Warunek ten zapisuje się następująco:
|
(22) |
gdzie:
- odchylenie empirycznych wartości zmiennej objaśniajacej od jej wartości teoretycznych nazywane resztami modelu:
|
(23) |
przy czym:
|
(24) |
W celu przedstawienia klasycznej metody najmniejszych kwadratów w zastosowaniu do modelu liniowego z wieloma zmiennymi objaśniającymi:
|
(25) |
wprowadza się symbolikę macierzowa:
|
(26) |
|
(27) |
|
(28) |
|
(29) |
Kryterium najmniejszych kwadratów można w tym wypadku zapisać w następujaący sposób:
|
(30) |
gdzie:
|
(31) |
Wzór na wektor
ocen parametrów strukturalnych modelu jest następujący:
|
(32) |
Wariancje odchyleń losowych szacuje się na podstawie wzoru:
|
(33) |
Macierz wariancji i kowariancji ocen parametrów strukturalnych szacuje się na podstawie wzoru:
|
(34) |
W macierzy tej elementy na głównej przekątnej są wariancjami
ocen parametrów strukturalnych. Wielkości:
|
(35) |
są standardowymi błędami szacunku parametrów strukturalnych.
W przypadku niejednoznacznej identyfikowalności równań modelu do estymacji parametrów modelu stosuje się Podwójna Metodę Najmniejszych Kwadratów. W metodzie tej równania modelu sprowadza się do postaci zredukowanej i na ich podstawie wyznacza się wektor ocen parametrów strukturalnych:
|
(36) |
gdzie:
|
(37) |
- kolumna wartości zmiennej objaśnianej w szacowanym modelu,
- macierz kolumn zmiennych objaśnianych przez inne modele, a które w szacowanym modelu występują w roli zmiennych objaśniających,
- zbiór wszystkich zmiennych, które w modelu występują jako wyłącznie zmienne z góry ustalone,
- zbiór zmiennych objaśniających wykorzystanych w szacowanym równani,
|
(38) |
|
Weryfikacja modelu ekonometrycznego.
Weryfikacja modelu ma na celu sprawdzenie, czy model ekonometryczny jest dopuszczalny do jego wykorzystania i dokonuje się jej w następujących kierunkach:
ocena błędu, jakim obarczone jest oszacowane równanie,
ocena błędów oszacowań parametrów strukturalnych,
ocena poziomu dopasowania modelu do danych empirycznych,
badanie własności odchyleń losowych.
Ocena błędów, jakimi obarczone są szacowane równania.
Punktem wyjściowym jest oszacowanie wariancji resztowej
; do tego potrzebny jest ciąg reszt modelu. Ciąg reszt zawiera n - elementów tyle, ile wynosi liczba obserwacji, ponieważ resztę
wyznacza się dla każdego badanego obiektu.
Wzór na wariancje resztową jest następujący:
|
(40) |
gdzie:
- liczba obserwacji,
- liczba szacowanych parametrów modelu.
Standardowe odchylenie reszt, czyli przeciętny błąd bezwzględny, jaki będziemy popełniali posługując się tym równaniem wylicza się ze wzoru:
|
(41) |
Standardowe odchylenie reszt wyraża się w jednostkach zmiennej objaśnianej.
Współczynnik zmienności resztowej modelu, czyli błąd względny jaki będziemy popełniali posługując się tym równaniem wylicza się ze wzoru:
|
(42) |
Model jest dopuszczalny, gdy
przyjmuje wartości nie wysokie, np.:
Ocena błędów oszacowani parametrów strukturalnych.
Na tym etapie przeprowadza się badania dotyczące słusznosci wprowadzenia zmiennych objaśniających
do modelu. W tym celu bada się, czy oszacowane parametry strukturalne modelu istotnie różnią się od zera. Badanie to przeprowadza się wyliczając współczynnik determinacji
i współczynnik korelacji wielorakiej
:
|
(43) |
|
(44) |
Współczynnik korelacji wielorakiej informuje o średnim poziomie kształtowania
przez zmienna
.
Współczynnik determinacji można wyrazić procentowo za pomocą wzoru:
|
(45) |
i wówczas mówi się, ze model wyjaśnia kształtowanie zmiennej
w
zakresu zmienności
.
Natomiast współczynnik indeterminacji:
|
(46) |
określa zakres zmienności
, w którym brak wyjaśnienia kształtowania
przez model.
Aby stwierdzić, czy błędy oszacowań parametrów strukturalnych są niewielkie, można zweryfikować hipotezę o istotności współczynnika korelacji wielorakiej, tj. hipotezę zerowa postaci:
wobec hipotezy alternatywnej
Sprawdzianem tej hipotezy jest statystyka:
|
(47) |
Statystyka ta ma rozkład Fishera - Snedecora o
oraz
stopniach swobody. Z tablic testu
dla zadanego poziomu istotności
oraz dla
i
stopni swobody odczytuje się wartość krytyczna
. Jeśli
, to nie ma podstaw do odrzucenia hipotezy
. Oznacza to, ze współczynnik korelacji wielorakiej jest nie istotnie różny od zera, a dopasowanie modelu do danych jest zbyt słabe. Natomiast, jeśli
, to hipotezę
należy odrzucić na rzecz hipotezy
. Współczynnik korelacji wielorakiej jest istotny, a stopień dopasowania modelu jest dostatecznie wysoki.
Dla każdego parametru strukturalnego
bada się następnie, czy różni się istotnie od zera. Dokonuje się weryfikacji hipotezy zerowej postaci:
wobec hipotezy alternatywnej
. Sprawdzianem tej hipotezy jest statystyka:
|
(48) |
gdzie:
- ocena parametru strukturalnego,
- standardowy błbłąd, jakimbarczone jest oszacowanie parametru
.
Z tablic testu t Studenta dla przyjętego poziomu istotności
oraz dla
stopni swobody odczytuje się wartość krytyczna
. Jeżeli
, nie ma podstaw do odrzucenia hipotezy
. Parametr strukturalny
różni się istotnie od zera, a zmienna objaśniająca
nie wpływa w istotny sposób na zmienna objaśnianą
. Natomiast, jeżeli
, hipotezę
należy odrzucić na rzecz hipotezy
. W tym przypadku parametr
różnie się w istotny sposób od zera i zmienna objaśniająca
oddziałuje w sposób istotny na zmienna objaśnianą
.
Ocena poziomu dopasowania modelu do danych empirycznych.
Ocena dopasowania modelu do danych empirycznych ma na celu sprawdzenie, czy model ten w wystarczająco wysokim stopniu wyjaśnia kształtowanie się zmiennej objaśnianej. Do tego celu służą różne miary zgodności modelu z danymi empirycznymi. Podstawowymi miarami tego typu są: odchylenie standardowe reszt, współczynnik zmienności losowej, współczynnik zbieżności i współczynnik determinacji.
Współczynnik zmienności losowej jest zdefiniowany następująco:
|
(49) |
Współczynnik ten informuje, jaki procent średniej arytmetycznej zmiennej objaśnianej modelu stanowi odchylenie standardowe reszt. Mniejsze wartości współczynnika zmienności losowej
wskazują na lepsze dopasowanie modelu do danych empirycznych. Jeżeli dla założonej z góry krytycznej wartości współczynnika zmienności losowej
zachodzi nierówność:
|
(50) |
to model uznaje się za dostatecznie dobrze dopasowany do danych empirycznych. Przy przeciwnym kierunku nierówności dopasowanie uznaje się za zbyt słabe.
Współczynnik zbieżności wyraża się wzorem:
|
(51) |
Współczynnik zbieżności przyjmuje wartości z przedziału [0; 1]. Informuje on, jaka część całkowitej zmienności zmiennej objaśnianej nie jest wyjaśniana przez model. Dopasowanie modelu do danych jest tym lepsze, im współczynnik zbieżności jest bliższy zeru.
Współczynnik determinacji ma postać:
|
(52) |
Współczynnik determinacji przyjmuje wartości z przedziału [0; 1]. Informuje on, jaka część całkowitej zmienności zmiennej objaśnianej stanowi zmienność wartości teoretycznych tej zmiennej, tj. część zdeterminowana przez zmienne objaśniające. Dopasowanie modelu jest tym lepsze, im współczynnik determinacji jest bliższy jedności.
Miedzy współczynnikami zbieżności i determinacji zachodzi relacja:
|
(53) |
Aby stwierdzić, czy dopasowanie modelu do danych empirycznych jest dostatecznie duże, można zweryfikować hipotezę o istotności współczynnika korelacji wielorakiej, tj. hipotezę zerowa postaci:
wobec hipotezy alternatywnej
. Sprawdzianem tej hipotezy jest statystyka o rozkładzie Fishera - Snedecora
Badanie własności odchyleń losowych.
Badanie własności odchyleń losowych obejmuje:
zbadanie, czy ciąg reszt jest losowy,
zbadanie, czy ciąg reszt modelu ma rozkład symetryczny,
zbadanie stacjonarności reszt,
zbadanie nieobciażoności reszt,
zbadanie, czy reszty modelu podlegają rozkładowi normalnemu,
zbadanie autokorelacji reszt.
Badanie losowości zmiennej losowej reszt sprowadza się do przeprowadzenia Testu Serii, przy
, weryfikującego hipotezę o losowosci ciągu reszt, tj. hipotezę zerowa postaci:
wobec hipotezy alternatywnej
.
Z tablic rozkładu dla Testu Serii, dla zadanego poziomu istotności
oraz
i
reszt dodatnich i ujemnych odczytuje się wartości krytyczne
oraz
. Jeśli
, gdzie
- ilość serii w ciągu reszt, to nie ma podstaw do odrzucenia hipotezy
. Oznacza to, ze ciąg reszt jest losowy. Natomiast, jeśli
, to hipotezę
należy odrzucić na rzecz hipotezy
. Ciąg reszt nie jest losowy, co oznacza, ze należy szukać modelu ekonometrycznego w innej postaci, niż oszacowana.
Badanie symetrii rozkładu reszt dla próby:
polega na weryfikacji hipotezy, ze ilość reszt dodatnich nie różni się istotnie od ilości reszt ujemnych, tj. hipotezy zerowej postaci:
wobec hipotezy alternatywnej
. Sprawdzianem tej hipotezy jest statystyka:
|
(54) |
gdzie:
- ilość wszystkich reszt,
- ilość reszt jednego znaku.
Z tablic testu t Studenta dla przyjętego poziomu istotności
oraz dla
stopni swobody odczytuje się wartość krytyczna
. Jeżeli
, nie ma podstaw do odrzucenia hipotezy
i rozkład reszt modelu jest symetryczny. Natomiast, jeżeli
, hipotezę
należy odrzucić na rzecz hipotezy
, co oznacza brak symetrii rozkładu reszt modelu.
Badanie stacjonarności reszt sprowadza się do wyznaczania współczynnika korelacji miedzy resztami, a upływem czasu. Następnie należy zweryfikować istotność współczynnika otrzymanej korelacji, tj. hipotezy zerowej:
(otrzymany współczynnik nie różni się istotnie od zera) wobec hipotezy alternatywnej
. Weryfikacji istotności współczynnika otrzymanej korelacji dokonuje się z wykorzystaniem testu t Studenta (dla próby:
). Z tablic testu t Studenta dla przyjętego poziomu istotności
oraz dla
stopni swobody odczytuje się wartość krytyczna
. Jeżeli
, nie ma podstaw do odrzucenia hipotezy
co oznacza, ze oszacowany współczynnik korelacji nie wykazuje istotnej różnicy od zera, zatem model spełnia warunek stałości wariancji. Natomiast, jeżeli
, hipotezę
należy odrzucić na rzecz hipotezy
. Dla prób
można tez stosować test Goldfelda - Quandta.
Badanie normalności rozkładu dla próby
dokonuje się z wykorzystaniem testu Hellwiga. Dokonuje się weryfikacji hipotezy o pokrywaniu się dystrybuanty rozkładu reszt z dystrybuanta rozkładu normalnego, tj. hipotezy zerowej postaci:
wobec hipotezy alternatywnej
. Z tablic rozkładu Hellwiga dla przyjętego poziomu ufności
oraz dla
prób odczytuje się wartości krytyczne dla
:
, gdzie
- liczba pustych klas. Jeżeli
, nie ma podstaw do odrzucenia hipotezy
co oznacza, ze rozkład reszt jest normalny. Natomiast, jeżeli
, hipotezę
należy odrzucić na rzecz hipotezy
.
Badanie autokorelacji składnika resztowego modelu dokonuje się z wykorzystaniem testu Durbina-Watsona, weryfikującego hipotezę o zerowaniu się współczynnika korelacji dowolnych reszt, tj. hipotezę zerowa postaci:
wobec hipotezy alternatywnej
.
Korzystając ze statystyki testowej postaci:
|
(55) |
dla zadanego poziomu istotności
,
zmiennych objaśniających w modelu, oraz
obserwacji, odczytuje się wartości krytyczne
oraz
. Wiedząc, ze
przyjmuje się:
hipotezę
, jeżeli:
hipotezę
, jeżeli:
brak rozstrzygnięcia, jeżeli:
Ponadto przyjmuje się w zależności od znaku współczynnika autokorelacji:
,
Prognoza modelu.
Prognoza ekonometryczna wg Z. Hellwiga, to ``taki sad, którego prawdziwość jest zdarzeniem losowym, przy czym prawdopodobieństwo zdarzenia jest nie mniejsze od ustalonej z góry bliskiej jedności liczby zwanej wiarygodnością prognozy.'' Podkreśla przy tym, ze każda prognoza przyszłości jest określoną funkcja przeszłości. Z. Hellwig, używając pojęcia prawdopodobieństwa, ogranicza zarazem definicje prognozy tylko do przewidywań zmiennych losowych.
Zadaniem prognozy jest dostarczenie informacji o kierunku rozwoju zjawiska lub o poziomie jego natężenia. W procedurze postępowania prognostycznego wyróżnia się następujące etapy:
przyjęcie reguły prognostycznej,
sformułowanie zadania prognostycznego (obiekty, zjawiska, zmienne),
cel prognozy i ustalenie metod badawczych i analitycznych,
ustalenie horyzontu prognozy (pola predykcji).
Ustala się n-okresów stanowiących zakres badania:
.Z każdego okresu dysponuje się wartością badanego zjawiska:
. Kolejne m-okresów, to horyzont prognozy (pole predykcji):
. Na koniec określa się przedział czasowy, dla którego należy oszacować prognozę:
.
Założenia w procedurze prognozowania:
prognoza wymaga znajomości modelu zmiennej prognozowanej
,
stabilności parametrów strukturalnych modelu i jego postaci analitycznej,
stabilności rozkładu odchyleń losowych,
znajomości wartości zmiennych objaśniających modelu w okresie objętym horyzontem prognozowania,
dopuszczenia ekstrapolacji modelu.
Wśród metod prognozowania wyróżnia się zasadniczo dwie grupy:
metody ekonometryczne,
metody nieekonometryczne.
Do metod ściśle ekonometrycznych zalicza się procedury oparte przede wszystkim na ekstrapolacji ekonomicznych szeregów czasowych lub wykorzystujące modele ekonometryczne przy zastosowaniu stale doskonalonej techniki obliczeniowej posługującej się dobrze oprogramowanymi komputerami.
Szczególna rola prognoz typu ekonometrycznego wynika z dwóch zasadniczych okoliczności: po pierwsze, prognozy budowane na podstawie metod ekonometrycznych maja charakter najbardziej ścisły, wynikają, bowiem z zastosowania racjonalnego procesu rozumowania o jednoznacznie określonych regułach wnioskowania; po drugie, metody te pozwalają już w chwili budowy prognozy ocenić rząd jej dokładności, co ma istotne znaczenie praktyczne. Obiektywność prognoz ekonometrycznych polega wiec na tym, ze z chwila, gdy model został już zbudowany i szacowany oraz została wybrana zasada i metoda predykcji, nie można skonstruowanej prognozy dowolnie interpretować.
Budowa prognoz na podstawie modeli wielorównaniowych będzie różna w zależności od typu modelu. Wnioskowanie w przyszłość na podstawie modelu prostego lub rekurencyjnego opierające się na zasadzie predykcji nieobciążonej jest sprawa łatwa, postępowanie jest, bowiem podobne jak przy modelach jednorównaniowych. Modele proste i rekurencyjne maja tę własność, ze składają się z określonej liczby powiązanych ze sobą więzią jednostronna modeli jednorównaniowych, dlatego tez przy budowie prognozy w modelu rekurencyjnym ma znaczenie kolejność równań. W związku z tym można budować prognozy dla każdej ze zmiennych endogenicznych modelu z osobna. Gdy model jest modelem o równaniach współzależnych, predykcja na jego podstawie jest bardziej skomplikowana zarówno od strony teoretycznej, jak i od strony numerycznej, co wynika z bardziej złożonej budowy tej klasy modeli. Wybór techniki budowy prognozy na podstawie modelu wielorównaniowego jest, zatem silnie powiązany z typem modelu i zasadnym jest opis jej po uprzedniej konstrukcji modelu.
W szeregu czasowym wartości badanej zmiennej są kształtowane zarówno przez przyczyny główne, jak i uboczne. Efektem kształtowania zjawiska przez przyczyny główne jest trend. Trend stanowi składowa systematyczna modelu ekonometrycznego. Aby sprawdzić, czy w badanym zjawisku występuje trend, należy skorzystać z testu weryfikującego hipotezę o wykazywaniu przez zjawisko trendu tj. hipotezę zerowa:
wobec hipotezy alternatywnej, czyli:
Empiryczna wartość statystyki testowej przyjmuje tu postać:
|
(56) |
Oczekiwana wartość statystyki testowej przyjmuje postać:
|
(57) |
a wariancja statystyki testowej wynosi:
|
(58) |
gdzie:
- długość szeregu czasowego.
Empiryczna wartość statystyki testowej standaryzuje się, a hipotezę weryfikuje się w oparciu o poziom istotności
Jeżeli
wówczas przyjmujemy za prawdziwa hipotezę
Dla
prawdziwa jest hipotez
Drugiego typu składowa systematyczna w modelu ekonometrycznym szeregu czasowego są wahania cykliczne. Są to odchylenia od trendu pojawiające się rytmicznie, określony jest ich kierunek i zachowana proporcjonalność dla jednoimiennych podokresów cykli. Jeżeli cykl pokrywa się z okresem roku, to wahania cykliczne noszą nazwę wahań sezonowych. Aby sprawdzić, czy w badanym zjawisku występują wahania sezonowe, należy skorzystać z testu weryfikującego hipotezę o podleganiu szeregu wahaniom sezonowym, tj. hipotezę
wobec hipotezy alternatywnej
- szereg nie podlega wahaniom sezonowym. Empiryczna wartość statystyki testowej przyjmuje tu postać:
|
(59) |
gdzie:
- liczba punktów zwrotnych w rozpatrywanym trendzie oraz:
|
(60) |
Wartość oczekiwana liczby punktów zwrotnych wyraża się wzorem:
|
(61) |
Wariancja liczby punktów zwrotnych przyjmuje postać:
|
(62) |
Zmienna:
jest długość szeregu czasowego. Po dokonaniu standaryzacji
empirycznej wartości statystyki testowej hipotezę
przyjmuje się dla
natomiast hipotezę
w sytuacji przeciwnej
16