PROGNOZOWANIE GOSPODARCZE – KOLOKWIUM mgr M. Żurek
BUDOWA MODELU ZGODNEGO
1) Zaczytujemy dane do GRETLA:
od 1 wiersza i 2 kolumny (ARKUSZ 1)
dane jako szeregi czasowe
dane roczne od podanego roku
2) Gdy dane są już wczytane do GRETLA:
-> DODAWANIE ZMIENNYCH -> ‘time – dodawanie zmiennej czasowej’
zaznaczamy dodaną zmienną ‘time’ i DODAWANIE ZMIENNYCH -> ‘kwadraty dla wybranych zmiennych’
jeśli jest potrzeba zdefiniowania ‘time^3’ itd. to: DODAWANIE ZMIENNYCH -> ‘Definiowanie nowej zmiennej’ i tam w oknie wpisujemy ‘time_3=time^3’
UWAGA – OGRANICZAMY PRÓBĘ O 2 OBSERWACJE – PRÓBA -> ‘Zakres próby’
3) Gdy zdefiniowane są już wszystkie zmienne tworzymy za pomocą KMNK model trendu dla pierwszej zmiennej (w przypadku tych zadań: ZYSK)
MODEL -> ‘Klasyczna Metoda Najmniejszych Kwadratów’ -> ZMIENNA ZALEŻNA – czyli w tym wypadku ‘ZYSK’,
ZMIENNE NIEZALEŻNE – ‘const.’ i ‘time’ – po przejściu dalej mamy model trendu liniowego –
sprawdzamy wartość p dla zmiennej ‘time’ – jeśli jest mniejsza niż 0,05 (wartość poziomu istotności) to oznacza, że parametr zmiennej ‘time’ jest istotny statystycznie!
ten sam krok podejmujemy w sprawdzaniu trendu kwadratowego ZYSKU (tutaj ZMIENNE
NIEZALEŻNE to: ‘const.’, ‘time’ i ‘sq_time’ -> UWAGA-> Tutaj sprawdzamy istotność parametru dla
‘sq_time’) i wyższych stopni (na tej samej zasadzie co wcześniej – dla wielomianu stopnia 3
sprawdzamy istotność ‘time^3’ itd…)
Wielomian stopnia trendu sprawdzamy tak długo aż nie wyjdzie nam że któryś stopień jest nieistotny (czyli wartość p dla parametru przy ‘time_a’ (a to stopień wielomianu, 1, 2, 3 itd…) będzie większa niż poziom istotności = 0,05)
W przypadku kiedy np. mamy istotny parametr dla trendu liniowego (‘time’) i istotny parametr dla trendu kwadratowego (‘sq_time’) sprawdzamy, który wybrać za pomocą statystyki F ( test Fishera):
ZASTOSOWANIE STATYSTYKI F:
ogólne zastosowanie wzoru: w Excelu tworzymy taką formułę:
F= (błąd standardowy reszt modelu trendu liniowego)^2 / (błąd standardowy reszt modelu trendu kwadratowego)^2
wynik tego jest to nasza wartość statystyki F, którą porównujemy z wartością graniczną statystyki F czyli F* (F* znajdziemy GRETLU: NARZĘDZIA-> Tablice statystyczne -> ‘F’)
W otwartych tablicach wpisujemy odpowiednio:
o L. stopni swobody licznika= (liczba obserwacji – 1 – 1) <- dla tr. liniowego o L. stopni swobody mianownika=(liczba obserwacji – 1 - 2 ) <- dla tr. kwadr.
Wzięło się to z wzoru: (n-k-1) gdzie n- liczba obserwacji, k- liczba zmiennych niezależnych, o poziom istotności – jak (prawie) zawsze 0,05
wartość naszej statystyki F porównujemy z wartością F* i zgodnie z tym: F<F* - brak podstaw do odrzucenia Ho mówiącej o równości wariancji obu modeli (mówiąc prościej wybieramy model niższego stopnia (czyli ten, którego dane są w liczniku!!!))
1
PG 2010 Utworzony przez: Kala
PROGNOZOWANIE GOSPODARCZE – KOLOKWIUM mgr M. Żurek
BUDOWA MODELU ZGODNEGO
F>F* - odrzucamy Ho na rzecz H alternatywnej, nastąpił istotny spadek wariancji resztowej przy przejściu z modelu stopnia niższego do wyższego (czyli należy stosować dalej statystykę F aż do pierwszego nieodrzucenia Ho)
PRZYKŁAD: stosowaliśmy statystkę F w takiej postaci:
F=(błąd stand. reszt tr. liniowego)^2/ (błąd stand. reszt tr. kwadratowego)^2 i wyszło nam, że F>F*
to dalej robimy F=(błąd stand. reszt tr. kwadratowego)^2/ (błąd stand. reszt tr. trzeciego stopnia)^2
itd. itd… Aż pierwszy raz nie odrzucimy Ho
UWAGA -> jeśli zdarzy się, że wyjdzie nam nieistotny parametr dla trendu liniowego – to dalszą opisaną procedurę stosujemy dla modelu ZYSKU z tylko jedną zmienna niezależną, którą jest zmienna ‘const.’
4) Gdy już mamy wybrany stopień wielomianu trendu sprawdzamy funkcję autokorelacji procesu resztowego.
Otwieramy okno z modelem, który nam wyszedł i w zakładce WYKRESY -> ‘Korelogram procesu resztowego’
Na tej podstawie oceniamy rząd opóźnień – patrzymy tutaj na wartości FUNKCJI PACF i patrząc ‘od dołu’ wybieramy pierwszą wartość, która jest WIĘKSZA niż poziom krytyczny testu Queneuille’a czyli wart. kryt. testu Q = 2/pierwiastek (n), gdzie n – liczba obserwacji 5) Gdy ta procedura jest już zakończona – od początku robimy to samo dla innej zmiennej (w przypadku tych zadań jest to PRODUKCJA)
NASTĘPNIE NALEŻY ZAPISAĆ HIPOTEZĘ MODELOWĄ
BUDOWA MODELU ZGODNEGO
1) Budowa modelu zgodnego polega na tym, że uwzględniamy wszystkie czynniki wpływające na zmienną zależną - ZYSK opisywany jest także przez PRODUKCJĘ.
DLATEGO – dla PRODUKCJI należy wyznaczyć prognozę – ANALIZA -> ‘Prognoza’ – ostatnie 2 wiersze (dla tych okresów, które w wykluczyliśmy na początku z próby) kopiujemy do Excela i obliczamy błędy.
BŁĘDY PROGNOZ (ex post i ex ante) – na przykładzie prognozy z GRETLa
obserwacje wartość rzeczywista prognoza śr. bł. predykcji 2010:01:00
330736
335772
3050,13
2010:02:00
345144
345291
3633,77
a) Średni błąd predykcji (V *
t ) – pierwiastek z wariancji predykcji
b) Względny błąd predykcji - V *
*
t = (Vt / ytp ) x 100% [ (śr. bł. predykcji / prognoza)x100% ]
c) Błąd prognozy – ( yt - ytp ) [ wartość rzeczywista (realizacja) – prognoza ] – mówi nam o tym, czy prognoza jest przeszacowana czy niedoszacowana
d) Względny błąd prognozy – ((yt - ytp) / yt)x100% [ (błąd prognozy / realizacja)x100% ]
jeżeli jest on mniejszy niż nasz poziom graniczny (zwykle 10%) to prognoza jest TRAFNA jeżeli jest on większy niż nasz poziom graniczny to prognoza jest NIETRAFNA
2) Następnie przywracamy PIERWOTNY ZAKRES PRÓBY – czyli: PRÓBA -> ‘Przywracanie pełnego zakresu’
3) Klikamy na zmienną PRODUKCJA -> ‘Dane’ -> ‘Edycja danych’ i wpisujemy zamiast dwóch ostatnich wartości (wartości rzeczywistych) to co wyszło nam z prognozy dla produkcji. Zatwierdzamy zielonym ‘przyciskiem’.
4) Tworzymy nowy model powiązany z tym co wyliczyliśmy w pierwszej części. Uwzględniając stopnie trendu i rząd opóźnień.
2
PG 2010 Utworzony przez: Kala
PROGNOZOWANIE GOSPODARCZE – KOLOKWIUM mgr M. Żurek
BUDOWA MODELU ZGODNEGO
5) Jeżeli w pierwszej części wyszło nam, że ZYSK – trend liniowy, rząd opóźnień 2
PRODUKCJA – trend liniowy, rząd opóźnień 2
To nasze zmienne do modelu zgodnego ZYSKU opisanego za pomocą PRODUKCJI będą takie: const
time
produk
produkcja
produk_1
produkcja opóźniona o 1 okres
produk_2
produkcja opóźniona o 2 okresy
zysk_1
zysk opóźniony o 1 okres
zysk_2
zysk opóźniony o 2 okresy
6) Po kolei z modelu usuwamy zmienne nieistotne (na podstawie ‘wartości p’ – porównujemy ‘wartość p’ danej zmiennej z poziomem istotności 0,05 – jeśli ‘p’ jest większa to zmienna jest do usunięcia gdyż jest nieistotna) Obliczamy od nowa model zgodny (tj. usuwamy zmienną nieistotną i OK.) – jeśli w modelu jest nadal zmienna nieistotna to znów usuwamy itd…. aż do momentu kiedy WSZYSTKIE ZMIENNE W MODELU BĘDĄ
ISTOTNE STATYSTYCZNIE.
7) Model w którym wszystkie zmienne są ISTOTNE jest naszym MODELEM ZGODNYM ☺
8) Kolejnym krokiem jest interpretacja wartości z modelu i tak np.
Model
10:00 Estymacja
KMNK,
wykorzystane
obserwacje
1971-2006 (N
=
36)
Zmienna
zależna:
zysk
współczynnik
błąd
standardowy
t-Studenta
wartość
p
---------------------------------------------------------------
const
15,5871
3,41533
4,564
7,47E-05 ***
produk
1,69518
0,274044
6,186
7,24E-07 ***
produk_1
-1,56909
0,289505
-5,42
6,44E-06 ***
zysk_1
1,32469
0,0835355
15,86
2,01E-16 ***
zysk_2
-0,701572
0,0804704
-8,718
7,62E-10 ***
Średn.aryt.zm.zależnej
46,98056 Odch.stand.zm.zależnej
20,06224
Suma
kwadratów
reszt
1288,779 Błąd
standardowy
reszt
6,447753
Wsp.
determ.
R-kwadrat
0,908515 Skorygowany
R-kwadrat
0,89671
F(4,
31)
76,96298 Wartość
p
dla
testu
F
1,20E-15
Logarytm
wiarygodności
-115,4846 Kryt.
inform.
Akaike'a
240,9691
Kryt.
bayes.
Schwarza
248,8867 Kryt.
Hannana-Quinna
243,7326
Autokorel.reszt
-
rho1
-0,051838 Statystyka
Durbina
h
-0,35277
Przykładowe interpretacje (to czego dotyczą zaznaczone KOLOREM):
Współczynnik determinacji (R2) – 90,85 % zmienności zysku (zmiennej zależnej) zostało wyjaśnione za pomocą modelu.
Błąd standardowy reszt – wartości empiryczne zmiennej prognozowanej (zysku) różnią się od wartości teoretycznych zmiennej o przeciętnie 6,4477…
PRODUKCJA – jeżeli produkcja (zmienna niezależna) w danym okresie wzrośnie o jednostkę, to zysk (zmienna zależna) wzrośnie średnio (lub spadnie ale tu jest dodatnie więc wzrost!) o 1,69518 jednostki.
UWAGA!!!! -> przy zmiennej PRODUKCJA_1 mamy wartość ujemną więc jeżeli wartość produkcji w roku poprzednim była o jednostkę większa to ZYSK w roku bieżącym będzie mniejszy o 1,56909
jednostki przy założeniu Ceteris Paribus.
ZYSK_1 – szacując parametr dla zmiennej ZYSK_1 mylimy się średnio o 0,0836… %.
9) Następnie przeprowadzamy testowanie modelu zgodnego – testami z pliku od mgr Żurek 10) Wyliczamy prognozy i ich błędy w oparciu o model zgodny (tak jak to robiliśmy wcześniej) Życzę powodzenia ☺
3
PG 2010 Utworzony przez: Kala