Instrukcja wykonania zadania na zaliczenie koła z Prognozowania Gospodarczego
Utworzony przez mackingus
Strona 1
1. Dodać zmienne czasowe t, t2, t3.
2. Skrócić próbę do 2006!!!
3. Zbadaj wewnętrzną strukturę Yt i Xt (tabela r i Ar(q)).
a. Badanie struktury Xt (produk) (nowa karta w Excelu):
Badanie stopnia trendu [r] (Test F)
KMNK: zależna produk; niezależna time; jeżeli parametr przy time jest nieistotny, to
nie ma trendu i autokorelację bada się bezpośrednio dla zmiennej, jeżeli parametr przy
time jest istotny, to:
KMNK: zależna produk; niezależna time, time2; parametr przy time jest nieistotny, ale
przy t2 jest istotny więc możemy robić Test F; jeżeli parametr przy t2 jest nieistotny to
nie robimy Testu F i trend jest liniowy.
Test F, czy nastąpił istotny spadek wariancji resztowej, przy przejściu od modelu
trendu liniowego do modelu trendu kwadratowego. Jeżeli NIE nastąpił, to trend
liniowy (r=1), jeżeli natomiast nastąpił, to…
KMNK: zależna produk; niezależna time, time2, time3; jeżeli parametr przy t3 jest
nieistotny to nie robimy Testu F i trend jest kwadratowy;
Test F, czy nastąpił istotny spadek wariancji resztowej, przy przejściu od modelu
trendu kwadratowego do modelu trendu sześciennego (trzeciego stopnia?). Jeżeli NIE
nastąpił, to trend kwadratowy (r=2), jeżeli natomiast nastąpił, to…
KMNK: zależna produk; niezależna time, time2, time3, time4; jeżeli parametr przy t4
jest nieistotny to nie robimy Testu F i trend jest stopnia trzeciego;
Test F, czy nastąpił istotny spadek wariancji resztowej, przy przejściu od modelu
trendu sześciennego (stopnia trzeciego?) do modelu trendu stopnia czwartego (?).
Jeżeli NIE nastąpił, to trend sześcienny (stopnia trzeciego?) (r=3), jeżeli natomiast
nastąpił, to…
itd. Chociaż wg prof. Piłatowskiej time4 występuje baaaaardzo rzadko.
Badanie rzędu autokorelacji [Ar(q)] [34:30]:
Jeżeli r=0, to prawym przyciskiem myszy na zmienną zależną (dla Xt – produkt; dla Yt
–zysk) i korelogram.
Jeżeli r>0, to w oknie z wydrukiem modelu KMNK Wykresy Korelogram
procesu resztowego.
Maksymalne opóźnienie = 10-20% N, czyli tutaj 4-7 (Piłatowska powiedziała, żeby
brać 4 lub 5, żeby nie wystąpiła autokorelacja rzędu 7, czy 6).
Rząd autokorelacji ustalamy metodą „od góry do dołu”, czyli patrzymy od najwyższego
stopnia opóźnienia, do najniższego, który jest istotny.
Instrukcja wykonania zadania na zaliczenie koła z Prognozowania Gospodarczego
Utworzony przez mackingus
Strona 2
N (potrzebne do wyliczenia wartości krytycznej ze wzoru 1,96/N^(1/2)) jest równe tyle
ile jest napisane w oknie z KMNK modelu zgodnego.
Przykładowe interpretacje:
o
„Współczynniki autokorelacji cząstkowej rzędów od 5 do 1 są mniejsze niż
wartość graniczna, więc nie ma podstaw do odrzucenia Ho, że współczynniki są
nieistotne statystycznie. Wynika z tego, że proces resztowy jest
niezautokorelowany, jest białym szumem.” (?) Czyli Ar(q)=0
o
„Współczynniki autokorelacji cząstkowej rzędów od 5 do 3 są mniejsze niż
wartość graniczna, więc nie ma podstaw do odrzucenia Ho, że współczynniki są
nieistotne statystycznie. Dopiero współczynnik autokorelacji cząstkowej reszt
(PACF) rzędu 2 jest większy od wartości granicznej = 0,317954 i dlatego
odrzucamy Ho i możemy sądzić, że współczynnik autokorelacji rzędu 2 jest
istotny statystycznie. Wniosek - q dla X = 2.” Czyli Ar(q)=2
b. Badanie struktury Yt (zysk) (nowa karta w Excelu):
Tak samo jak dla Xt.
4. Budowa modelu trendowo-autoregresyjnego dla Xt i jego prognoza dynamiczna (nowa karta w
Excelu):
a. Model KMNK:
Zmienna zależna – produk;
Zmienne niezależne (objaśniane):
zmienne czasowe do stopnia r (jeżeli r=0, to bez czasowych);
opóźnienia zmiennej zależnej produk (tyle opóźnień, jaki rząd autokorelacji – Ar(q),
jeżeli Ar(q)=0, to bez opóźnień).
b. Prognoza:
W oknie z modelem klikamy Analiza Prognoza… :
mamy zrobić dynamiczną, czyli zostawiamy zaznaczoną opcję 1 – prognoza
automatyczna (jeżeli nie ma opóźnień, to się nie da i PODOBNO robi się wtedy
statyczną);
prognozę wklejamy do Excela; tam obserwacje, prognozy i resztę trzeba podzielić na
kolumny, więc: Dane Tekst jako kolumny;
kopiujemy dane dla lat 2007-2010 (obserwacje, prognozy i błędy ex-ante) i wklejamy
obok; opisujemy jako:
o
obserwacje – yT;
o
prognozy – yTP;
Instrukcja wykonania zadania na zaliczenie koła z Prognozowania Gospodarczego
Utworzony przez mackingus
Strona 3
o
błędy ex-ante – VT;
dodajemy też do tabeli:
o
VT* = VT / yTP – jest to względny błąd predykcji, czyli dopuszczalność
prognozy (sformatować na dane procentowe);
ustalamy błąd graniczny (np. 10%) i jeżeli błąd względny predykcji (VT*)
jest mniejszy od tego błędu granicznego, to dana prognoza jest
dopuszczalna, w przeciwnym razie niedopuszczalna.
o
dT = yT – yTP – jest to bezwzględny błąd prognozy;
o
dT* = dT / yT – jest to względny błąd prognozy, czyli trafność prognozy
(sformatować na dane procentowe).
jeżeli dT* > 0 (wynik dodatni) – prognoza niedoszacowana;
jeżeli dT* < 0 (wynik ujemny) – prognoza przeszacowana;
ustalamy wartość graniczną (np. 10%) i jeżeli |dT*| (wartość bezwzględna
względnego błędu prognozy) jest mniejsza od tej wartości granicznej, to
dana prognoza jest trafna, w przeciwnym razie jest nietrafna.
Trzeba znać na pamięć interpretacje do każdego :D
Mamy taką tabelę (przykład):
Musimy też znać interpretacje:
o
RMSE – pierwiastek błędu średniokwadratowego:
„Rzeczywiste wartości zmiennej prognozowanej w okresie prognozowanym
różniły się od wyznaczonych prognoz ŚREDNIO o RMSE jednostki (trzeba
podać jakiej – dla zysku to mln zł; dla produkcji to tys. ton).”
o
MAPE – średni absolutny procentowy (względny) błąd prognoz:
„Prognozując zmienną (tu mówimy zysk lub produkcję) z danego modelu
mylimy się ŚREDNIO o MAPE% rocznie.”
o
I – współczynnik Theila:
„W okresie prognozowanym PRZECIĘTNY względny błąd predykcji
wyniósł I.”
5. Model zgodny (nowa karta w Excelu).
Instrukcja wykonania zadania na zaliczenie koła z Prognozowania Gospodarczego
Utworzony przez mackingus
Strona 4
a. Przywróć pełen zakres próby.
b. Prawym na produkcję Edycja wartości:
dla lat 2007-2010 wpisz prognozy z Xt (te z poprzedniego polecenia):
dla lat 2007-2008 – zamieniasz istniejące dane na prognozy;
dla lat 2009-2010 – wpisujesz prognozy;
oczywiście dla roku 2007 wpisujesz prognozę z roku 2007, dla 2008 z 2008, itd.
c. Z powrotem zmniejsz zakres próby do 2006.
d. Zbuduj model zgodny:
zmienna zależna – zysk;
zmienne niezależne (objaśniające):
zmienne czasowe (do stopnia, jaki największy występuje w Xt i Yt; jeżeli w Xt jest r=2,
a w Yt r=1, to w zgodnym r=2, czyli dajemy time i time2; itp.);
produkcję (zawsze) i jej opóźnienia (tyle ile wyszło w Badaniu struktury Xt);
opóźnienia zysku (tyle ile wyszło w Badaniu struktury Yt);
zapisz zbudowany model w Excelu (jako model startowy) i do niego wartość krytyczną
statystyki t-Studenta.
e. Przeprowadź autokorelację cząstkową dla tego modelu:
Robi się ją jak wyżej;
Jeżeli brak autokorelacji (występuje biały szym), to interpretacja:
„Współczynniki autokorelacji cząstkowej rzędów 5 do 1 są mniejsze niż wartość
graniczna, więc nie ma podstaw do odrzucenia Ho, że współczynniki są nieistotne. Z
tego wynika, że proces resztowy jest niezautokorelowany (jest białym szumem), a to
oznacza, że warunek zgodności modelu został spełniony.”
Jeżeli występuje autokorelacja, to:
Do modelu dodajemy dodatkowe opóźnienia Y, po jednym, do momentu, gdy nie
będzie autokorelacji i wtedy interpretacja jak wyżej.
Jeżeli dodawanie dodatkowych opóźnień Y nie pomaga (wciąż występuje
autokorelacja), to interpretacja:
o
„Prawdopodobnie jest to przypadek tzw. nieusuwalnej autokorelacji w ramach
modelu liniowego”
o
Można też do tego dodać:
„Współczynniki autokorelacji cząstkowej rzędów 5 do 3 są mniejsze niż
wartość graniczna, więc nie ma podstaw do odrzucenia Ho, że
współczynniki są nieistotne. Współczynnik autokorelacji cząstkowej rzędu 2
Instrukcja wykonania zadania na zaliczenie koła z Prognozowania Gospodarczego
Utworzony przez mackingus
Strona 5
jest większy niż wartość graniczna, więc odrzucamy Ho, że współczynniki
są nieistotne. Z tego wynika, że proces resztowy posiada autokorelację
cząstkową rzędu 2, a to oznacza, że warunek zgodności modelu NIE został
spełniony.”
o
Pomimo to kontynuujemy proces, tak jakby występował biały szum.
f. Redukujesz zmienne nieistotne a posteriori (czyli po jednej, zawsze tą najmniej istotną – która ma
największą wartość p).
Zapisujesz kolejno usuwane zmienne oraz model zredukowany (w którym wszystkie zmienne
są istotne). Przy zredukowanym proponuję wstawić z tablic wartość krytyczną t-Studenta, bo
to ważne przy odpowiedzi;
Przy odpowiedzi usunięcie zmiennej trzeba będzie motywować statystyką t-Studenta!;
Parametry nieistotne, to takie, dla których wartość statystyki t-Studenta jest MNIEJSZA niż
wartość z tablic statystycznych:
Tablice statystyczne t-Studenta są tu: główne okno Gretla Tablice statystyczne
zakładka „t”.
Statystykę t-Studenta zapisz przy startowym i końcowym (zredukowanym) modelu zgodnym.
W pozostałych przypadkach szybciej jest patrzeć na gwiazdki stojące przy poszczególnych
parametrach, i tak:
* - parametr istotny przy poziomie istotności (alfa) ≤ 10%;
** - parametr istotny przy poziomie istotności (alfa) ≤ 5%;
*** - parametr istotny przy poziomie istotności (alfa) ≤ 1%.
Z tego wynika, że jeżeli przy parametrze stoją dwie lub trzy gwiazdki, to dla poziomu
istotności = 0,05 ten parametr jest istotny;
ale NIE można tego tak tłumaczyć na kole – trzeba t-Studentem.
g. Przeprowadzasz weryfikację modelu końcowego:
Dopasowanie:
R² (podane w oknie z KMNK):
o
Przyjmujemy wartość graniczną 80% (lub 75% jeżeli R² dla naszego modelu jest
w okolicach 75% właśnie);
o
Jeżeli R² > 80%, to „Dopasowanie modelu do danych empirycznych jest dobre,
ponieważ wartość R² przekracza wartość graniczną równą 80%”
o
Jeżeli R² jest w okolicach 70-75%, to „Dopasowanie modelu do danych
empirycznych jest umiarkowanie dobre (?)”.
Vu:
Instrukcja wykonania zadania na zaliczenie koła z Prognozowania Gospodarczego
Utworzony przez mackingus
Strona 6
o
Wyliczamy ze wzoru Vu = Su / y średnie (obydwie te wartości są podane w oknie
z KMNK);
o
Przyjmujemy wartość graniczną maksymalnie = 15%;
o
Współczynnik ten informuje, jaki procent średniej arytmetycznej zmiennej
objaśnianej stanowi odchylenie standardowe reszt.
Jeżeli współczynnik zmienności nie przekracza założonej z góry wartości
granicznej, Vu ≤ V*, przy czym V* ustala się maksymalnie na poziomie 15%, to
odchylenie wartości empirycznych zmiennej objaśnianej od jej wartości
teoretycznych można uznać za niewielkie. Świadczy to również o dobrym
dopasowaniu modelu do danych empirycznych.
Jeżeli R^2 mówi, że dobre dopasowanie, a Vu inaczej, to wg słów prof. Piłatowskiej
przy określeniu ogólnego dopasowania należy „pokombinować” :D
Parametry:
Istotność (Test t-Studenta dla wersji końcowej modelu zgodnego);
o
Zapisać Ho dla t-Studenta: |t| < t kryt. – parametr nieistotny;
o
Skopiować z tablic z Gretla wartość krytyczną;
o
Przykładowe interpretacje:
„Odrzucamy Ho, dla poziomu istotności 0,05, że parametr [tu jaki parametr]
jest nieistotny statystycznie i możemy sądzić, że parametr jest istotny
statystycznie.”
„Brak podstaw do odrzucenia Ho, przy poziomie istotności 0,05, że
parametr [tu jaki] jest nieistotny statystycznie. Parametr jest nieistotny
statystycznie.”
Stabilność (test Chowa):
o
W głównym oknie Gretla prawym na zysk (trzeba najpierw zaznaczyć lewym
przyciskiem), z menu wybierasz Wykres szeregu czasowego i patrzysz w którym
momencie następuje zmiana trendu na wykresie;
o
W Gretlu w oknie z modelem zgodnym klikasz: Testy Test zmian
strukturalnych Chowa;
o
Wpisujesz, aby Gretl podzielił próbę w roku, w którym na wykresie widać zmianę
tendencji (pamiętaj, aby pozostawić mu co najmniej ok. 10 obserwacji do 2006r.);
o
Gretl dokleja wynik w oknie KMNK z modelem zgodnym (musi pozostawać cały
czas otwarte!);
o
Interpretacje:
Instrukcja wykonania zadania na zaliczenie koła z Prognozowania Gospodarczego
Utworzony przez mackingus
Strona 7
p ≥ α (czyli poziom istotności = 0,05) – Brak podstaw do odrzucenia Ho, że
parametry są stabilne. Parametry są stabilne. Nie nastąpiła zmiana
strukturalna.
p < α (czyli poziom istotności = 0,05) – Odrzucamy Ho, że parametry są
stabilne. Parametry NIE są stabilne. Nastąpiła zmiana strukturalna.
Suma współczynników przy parametrach produkcji zredukowanego modelu zgodnego
(czyli przy produkcji i jej opóźnieniach; oczywiście tych, które pozostały w
zredukowanym modelu zgodnym):
o
Sumujesz te współczynniki; powiedzmy, że suma jest równa X;
o
Przykładowa interpretacja:
„Wzrost produkcji o jeden tys. sztuk (jednostkę) spowoduje wzrost zysku
średnio o X mln zł, przy założeniu ceteris paribus.”
Składnik resztowy:
Badanie autokorelacji cząstkowej:
o
Przeprowadzamy tak samo jak przy budowie struktury (z tym, że dla modelu
zgodnego);
o
N (potrzebne do wyliczenia wartości krytycznej ze wzoru 1,96/N^(1/2)) jest
równe tyle ile jest napisane w oknie z KMNK modelu zgodnego;
o
Przykładowe interpretacje:
„Współczynniki autokorelacji rzędów 5 do 1 są mniejsze niż wartość
graniczna, więc nie ma podstaw do odrzucenia Ho, że współczynniki są
nieistotne. Z tego wynika, że proces resztowy jest niezautokorelowany (jest
białym szumem), a to oznacza, że warunek zgodności modelu został
spełniony.”
W przypadku wystąpienia autokorelacji, nie jestem pewien interpretacji, ale
prawdopodobnie taka jak w autokorelacji wyżej (ta dłuższa, bo tutaj już się
nie dodaje opóźnień do modelu – w końcu już go zredukowaliśmy)
Wystąpienie autokorelacji w podsumowaniu należy uznać za
NIEKORZYSTNE dla modelu.
Badanie normalności rozkładu składnika resztowego (Test na normalność rozkładu
reszt):
o
Z okna z KMNK zredukowanego modelu zgodnego robimy Test na normalność
rozkładu reszt;
o
Wynik pojawia się na dole okna z KMNK, kopiujemy go do Excela;
o
Interpretacje:
Instrukcja wykonania zadania na zaliczenie koła z Prognozowania Gospodarczego
Utworzony przez mackingus
Strona 8
p ≥ α (czyli poziom istotności = 0,05) – „Brak podstaw do odrzucenia Ho,
że rozkład jest normalny, ponieważ wartość p jest większa niż poziom
istotności = 0,05. Czyli rozkład składnika resztowego jest normalny.”
p < α (czyli poziom istotności = 0,05) – „Odrzucamy Ho, że rozkład jest
normalny, ponieważ wartość p jest mniejsza niż poziom istotności = 0,05 i
możemy sądzić, że rozkład składnika resztowego NIE jest normalny.”
Badanie homoscedastyczności wariancji resztowej (Test White’a (tylko kwadraty)).
o
Z okna z KMNK zredukowanego modelu zgodnego robimy Test White’a (tylko
kwadraty);
o
Wynik pojawia się na dole okna z KMNK, kopiujemy go do Excela;
o
Interpretacje:
p ≥ α (czyli poziom istotności = 0,05) – „Brak podstaw do odrzucenia Ho,
że wariancja resztowa jest homoscedastyczna, ponieważ wartość p jest
większa niż poziom istotności = 0,05. Czyli wariancja resztowa jest
homoscedastyczna.”
p < α (czyli poziom istotności = 0,05) – „Odrzucamy Ho, że wariancja
resztowa jest homoscedastyczna, ponieważ wartość p jest mniejsza niż
poziom istotności = 0,05 i możemy sądzić, że wariancja resztowa jest
heteroscedastyczna.”
Liniowość:
Test nieliniowości (logarytmy).
o
Z okna z KMNK zredukowanego modelu zgodnego robimy Test nieliniowości
(tylko logarytmy);
o
Wynik pojawia się na dole okna z KMNK, kopiujemy go do Excela;
o
Interpretacje:
p ≥ α (czyli poziom istotności = 0,05) – „Brak podstaw do odrzucenia Ho,
że zależność zmiennej objaśnianej (Yt) względem zmiennych
objaśniających jest liniowa., ponieważ wartość p jest większa niż poziom
istotności = 0,05. Czyli zależność zmiennej objaśnianej (Yt) względem
zmiennych objaśniających jest liniowa.”
p < α (czyli poziom istotności = 0,05) – „Odrzucamy Ho, że zależność
zmiennej objaśnianej (Yt) względem zmiennych objaśniających jest liniowa,
ponieważ wartość p jest mniejsza niż poziom istotności = 0,05 i możemy
sądzić, że zależność zmiennej objaśnianej (Yt) względem zmiennych
objaśniających jest liniowa.”
Instrukcja wykonania zadania na zaliczenie koła z Prognozowania Gospodarczego
Utworzony przez mackingus
Strona 9
Podsumowanie:
Na korzyść modelu przemawiają (i wymienić które):
o
Dobre dopasowanie modelu do danych empirycznych;
o
Istotność parametrów;
o
Stabilność parametrów;
o
Brak autokorelacji;
o
Normalny rozkład składnika resztowego;
o
Homoscedastyczność wariancji resztowej;
o
Liniowa zależność zmiennej zależnej od zmiennych objaśniających.
Na niekorzyść modelu przemawiają (i wymienić które):
o
Wszystkie odwrotnie.
Wniosek – czy model nadaje się do prognozowania:
o
Tak lub nie i dlaczego.
6. Zrób prognozę zredukowanego modelu zgodnego (nowa karta w Excelu):
a. Tak jak prognozę produkcji (Xt).