Prognozowanie gospodarcze
SPIS TREŚCI
1. Wstęp
2. Specyfikacja zmiennych do modelu
3. Prezentacja zmiennych
4. Tabelaryczne zestawienie zmiennych
5. Dobór zmiennych objaśniających
5.1. Eliminacja zmiennych o zbyt niskim poziomie zmienności
5.2. Redukcja zbioru zmiennych objaśniających metodą analizy
macierzy współczynników korelacji
5.3. Metoda Hellwiga
6. Postać analityczna modelu ekonometrycznego
7. Weryfikacja modelu
7.1. Współczynnik determinacji R2
7.2. Współczynnik korelacji wielorakiej R
7.3. Skorygowany współczynnik determinacji
7.4. Współczynnik zbieżności Φ2
7.5. Współczynnik zmienności losowej
7.6. Błędy standardowe oszacowań współczynników
7.7. Błędy procentowe oszacowania współczynników modelu
7.8. Test dla współczynnika korelacji liniowej
7.9. Test Walda
7.10. Test Durbina - Watsona
7.11. Test istotności parametrów modelu
8. Prognozowanie
9. Podsumowanie
10. Literatura
11. Załączniki
1. Wstęp
Nasza praca ma na celu wybór i oszacowanie modelu ekonometrycznego badanego zjawiska. Głównym celem konstrukcji naszego modelu ekonometrycznego jest jego wykorzystanie do prognozowania wartości endogenicznej w okresie poza próbą statystyczną, na podstawie której będzie ona objaśniana, poprzez zbudowany w tym celu odpowiedni model.
Ogólną konstrukcję naszego modelu ekonometrycznego przedstawia równanie:
Y = ƒ (X, ξ)
gdzie:
y - wektor zmiennej objaśniającej (endogenicznej)
X - macierz zmiennych objaśniających (egzogenicznych)
ξ - wektor składników losowych
Zmienna objaśniana, stanowi zjawisko, które chcemy poznać. Zmienne objaśniające wyrażają zjawiska, które wpływają na kształtowanie się zjawiska podlegającego badaniu. Przy budowie modeli ekonometrycznych istotne znaczenie ma dostępność zmiennych objaśniających zarówno dla okresu przeszłego jak i ich prognoz na przyszłość.
Za cel stawiamy sobie osiągnięcie modelu, który będzie w jak najlepszym stopniu odwzorowywał rzeczywistość (jak najwyższe R2). W jego szacowaniu posłużymy się metodą najmniejszych kwadratów. Obliczenia zostaną wykonane za pomocą pakietu SPSS. Badanie wybranego zjawiska zostało oparte na danych rzeczywistych uzyskanych z roczników statystycznych GUS.
2. Specyfikacja zmiennych do modelu
Problem specyfikacji zmiennych dla naszego modelu polegał na określeniu listy zmiennych, które powinny znaleźć się w modelu. Jako temat naszego opracowania wybieramy zagadnienie związane z przyrostem naturalnym, a dokładniej z ilością porodów. W ostatnich latach w Polsce obserwowany jest ujemny przyrost naturalny. Zbyt mała liczba przyszłych pracowników, a co za tym idzie mniejsze składki odprowadzane na ubezpieczenia społeczne mogą nie wystarczyć na zapewnienie godziwego życia przyszłym emerytom (mamy tu na myśli tzw. „solidarność pokoleniową”). Zbadamy jakie zjawiska mają głównie wpływ na liczbę dzieci.
Poniżej przedstawiamy listę zmiennych, które naszym zdaniem powinny być uwzględnione przy konstrukcji modelu ekonometrycznego.
Zmienna objaśniana
y - liczba porodów
Zmienne objaśniające
x1 - stopa bezrobocia rejestrowanego
x2 - liczba oddanych do użytku mieszkań
x3 - średnia miesięczna płaca nominalna
x4 - liczba małżeństw zawartych w danym roku
x5 - liczba małżeństw zawartych w roku poprzednim
x6 - liczba małżeństw zawartych przed dwoma laty
x7 - liczba małżeństw zawartych przed trzema laty
x8 - wielkość sprzedanych środków antykoncepcyjnych w badanym roku
Zbiór zmiennych został przez nas dobrany poprzez merytoryczną analizę badanego zjawiska. Wybrane zmienne objaśniające, naszym zdaniem powinny wyjaśniać kształtowanie się badanego zjawiska. Wśród wyżej wymienionych zmiennych objaśniających wyodrębnimy zmienne objaśniające silnie skorelowane ze zmienną objaśnianą, a zarazem stosunkowo słabo skorelowane między sobą. Do realizacji tego zamierzenia jak również badania zjawiska posłużymy się SPSS.
SPSS - wielomodułowy pakiet programowy do analizy danych. Jest to rozbudowany system analizy danych zdolny do współpracy z wieloma rodzajami danych i potrafiący korzystać z różnych formatów plików arkuszy kalkulacyjnych i baz danych. Zawiera procedury generujące zarówno proste statystyki opisowe jak i analizy statystyczne. Jego zaletą są bogate i urozmaicone możliwości prezentacji danych (tabele, raporty, wykresy).
3. Prezentacja zmiennych
Prezentowany przez nas model opisuje zależność w okresie 1990 - 2001 pomiędzy y - liczbą porodów w badanym okresie w tysiącach od pewnych wielkości występujących w tymże okresie. Tymi różnymi wielkościami mogącymi mieć, naszym zdaniem wpływ na wielkość zmiennej objaśnianej są:
x1 - stopa bezrobocia rejestrowanego (średnia w roku) (w procentach),
Jest to stosunek liczby bezrobotnych zarejestrowanych do liczby cywilnej ludności aktywnej zawodowo, tj. bez osób odbywających czynną służbę zawodową oraz pracowników jednostek budżetowych prowadzących działalność w zakresie obrony narodowej i bezpieczeństwa publicznego.
x2 - liczba oddanych do użytku mieszkań (w tysiącach),
Dane rzeczywiste zawarte w tabeli zawierają wszystkie nowo oddane do użytku lokale składające się z jednej lub kilku izb łącznie z pomieszczeniami pomocniczymi wybudowane lub przebudowane dla celów mieszkalnych (np. hotele robotnicze, internaty) dla jednej rodziny, konstrukcyjnie wydzielone trwałymi ścianami (również przebudowy pomieszczeń niemieszkalnych) w obrębie budynku, do którego to lokalu prowadzi niezależne wejście z klatki schodowej, ogólnego korytarza bądź bezpośrednio z ulicy, podwórza lub ogrodu. Informacje za poszczególne lata dotyczą między innymi budownictwa spółdzielczego, komunalnego (gminnego), zakładowego i budownictwa indywidualnego.
x3 - średnia miesięczna płaca nominalna (w złotych) (przeciętne miesięczne wynagrodzenie),
Dane statystyczne średniej płacy nominalnej obejmują wypłaty pieniężne oraz wartość świadczeń w naturze bądź ich ekwiwalenty należne pracownikom z tytułu pracy. Składnikami średniej płacy są: wynagrodzenia osobowe, wypłaty z tytułu udziału w zysku, dodatkowe wynagrodzenie roczne, wynagrodzenie bezosobowe, honoraria (np. wypłacone dziennikarzom, realizatorom filmów, programów radiowych i telewizyjnych). Do obliczenia wynagrodzenia przyjęto sumę wypłat za cały miesiąc z uwzględnieniem wypłat dokonanych za okresy dłuższe niż miesiąc w przeliczeniu na jeden miesiąc. Dane o wynagrodzeniach podane są w ujęciu brutto, tj. łącznie z zaliczkami na poczet podatku dochodowego od osób fizycznych. Dla danych GUS z lat 1990 i 1991 (podane są wartości netto) zastosowaliśmy wskaźnik przeliczeniowy o wartości 1,20. W danych za okres 1990 - 1994 została uwzględniona denominacja. Wiedząc, że dane z lat 1999 - 2001 opublikowane przez GUS zawierają średnie płace już ubruttowione, aby urealnić obserwacji, uwzględniliśmy współczynnik o wartości 0,82, dzięki któremu dokonano korekty danych średniej płacy. W zestawieniu tabelarycznym zawarte są dane statystyczne z uwzględnieniem wyżej wymienionych współczynników:
x4 - liczba małżeństw zawartych w danym roku (w tysiącach),
x5 - liczba małżeństw zawartych w roku poprzednim (w tysiącach),
x6 - liczba małżeństw zawartych dwa lata wcześniej (w tysiącach),
x7 - liczba małżeństw zawartych trzy lata wcześniej (w tysiącach).
Ponieważ poród jest wynikiem podjętej wcześniej decyzji o prokreacji, a zatem na decyzję tę mają wpływ dane o zawartych małżeństwach z bieżącego roku, jak i z lat poprzednich. Uznaliśmy, że przyjęcie do badań danych o liczbie zawartych małżeństw w roku badanym jak i z lat poprzednich będzie sensowne.
x8 - wielkość sprzedanych środków antykoncepcyjnych,
Ze względu na niemożliwe uzyskanie danych statystycznych w tym zakresie, tą zmienną objaśniającą odrzucamy już na wstępie.
4. Tabelaryczne zestawienie zmiennych
TU WSTAWIMY TABELĘ
5. Dobór zmiennych objaśniających
Dobór zmiennych objaśniający polega na określeniu listy zmiennych, które powinny znaleźć się w modelu. Pożądane własności zmiennych objaśniających to:
odpowiednio wysoka zmienność,
silna korelacja ze zmienną objaśnianą,
słaba korelacja z innymi zmiennymi objaśniającymi.
Mając zestaw potencjalnych zmiennych objaśniających x1, x2, x3, x4, x5, x6, x7, oraz zestawienie danych statystycznych będących realizacjami zmiennych objaśniających xi i objaśnianej y, do wyboru zmiennych objaśniających możemy zastosować jedną z wielu metod matematyczno-statystycznych doboru zmiennych objaśniających.
5.1. Eliminacja zmiennych o zbyt niskim poziomie zmienności
Warunkiem uznania pewnych cech (charakterystyk) za zmienne objaśniające jest ich dostateczna zmienność. Miarą zmienności jest stosunek odchylenia standardowego zmiennej xi i jej wartości średniej. Wartości te wyznaczymy według wzoru:
gdzie:
Si - odchylenie standardowe zmiennej xi
Zasada stosowania tej metody polega na wyznaczeniu krytycznej wartości współczynnika zmienności V*, a zmienne spełniające nierówność:
Vi ≤ V*
uznaje się za quasi - stałe i eliminuje z określonego na wstępie zbioru zmiennych, albowiem wnoszą one zbyt małą informację.
Zakładamy wartość graniczną:
V* = 0,2
Za pomocą pakietu SPSS wyznaczamy wartości statystyki opisowej naszych zmiennych, tj. wartości średnie i odchylenia standardowe, załącznik nr ......, następnie obliczamy współczynniki zmienności poszczególnych zmiennych xi
Wniosek: eliminujemy V4, V5, V6, V7.
Zmienne x4, x5, x6, x7 wnoszą zbyt małą informację.
Nasz model ma postać:
y = a + b1x1 + b2x2 + b3x3 + ξ
5.2. Redukcja zbioru zmiennych objaśniających metodą analizy macierzy współczynników korelacji
Metoda ta zakłada, że dysponujemy macierzą
R = [rij] (1+ M) * (1 + M)
współczynników korelacji pomiędzy zmienną objaśnianą oraz potencjalnymi zmiennymi objaśniającymi (pierwszy wiersz macierzy), jak i pomiędzy poszczególnymi parami zmiennych objaśniających, tzn.
R =
gdzie:
rij - współczynnik korelacji pomiędzy i - tą i j - tą zmienną (przy czym indeksem 0 oznaczana jest zmienna objaśniana),
i = 0,1, ..., M ; j = 0,1, ..., M
M - liczba potencjalnych zmiennych objaśniających
Idea metody analizy macierzy współczynników korelacji sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą i jednocześnie słabo skorelowane między sobą.
Zakładamy poziom istotności α oraz N - 2stopni swobody. Wyznaczymy tzw. krytyczną wartość współczynnika korelacji według wzoru:
gdzie:
I* - wartość statystyki odczytana z tablic testu T - Studenta dla α oraz N - 2 stopni swobody.
W naszym zadaniu zakładamy poziom istotności α = 0,05, zaś liczba stopni swobody przy N = 12 wynosi 12 - 2 = 10. Za pomocą tablic T - Studenta odczytujemy wartość statystyki I* = 2,228. Wyznaczamy krytyczną wartość współczynnika korelacji:
Ze zbioru zmiennych objaśniających eliminujemy te wszystkie zmienne, dla których zachodzi nierówność:
(są to zmienne nieistotnie skorelowane ze zmienną y) i tworzymy macierz R', gdzie elementami tej macierzy są następujące liczby:
Ze zbioru pozostałych zmiennych objaśniających jako zmienną objaśniającą powołuje się taką zmienną xn dla której:
taka xn jest nośnikiem największego zasobu informacji o zmiennej y. W naszym zadaniu taką zmienną jest zmienna x3.
Z pozostałego zbioru potencjalnych zmiennych objaśniających eliminuje się te wszystkie zmienne dla których:
Są to zmienne zbyt mocno skorelowane ze zmienną x3, czyli są zmiennymi, które powielają informację x3.
Wniosek: dokonaliśmy wyboru zmiennych x1 i x3 jako zmienne objaśniające. Nasz model ekonometryczny po procedurze doboru zmiennych objaśniających ma postać:
Y = a + b1x1 + b3x3 + ξ
5.3. Metoda Hellwiga
Metoda Hellwiga polega na tym, że spośród zmiennych objaśniających tworzy się wszystkie możliwe kombinacje tych zmiennych, a następnie bada się tzw. integralną pojemność informacji jaką niesie za sobą zastosowanie każdej z możliwych kombinacji tych zmiennych.
M oznacza w naszym zadaniu liczbę potencjalnych zmiennych objaśniających. Proces wyboru zmiennych objaśniających do modelu jest następujący:
1. Tworzymy wszystkie możliwe kombinacje potencjalnych zmiennych objaśniających, które można utworzyć z M zmiennych. Ich liczba jest równa liczbie wszystkich możliwych podzbiorów zbioru M - elementowego, czyli N = 2M - 1. W naszym przypadku gdybyśmy chcieli zastosować tę metodę na początku otrzymamy 27 - 1 = 127 kombinacji. Jest to bardzo duża liczba podzbiorów. Ale można tę metodę zastosować po dokonaniu eliminacji zmiennych o zbyt niskim poziomie zmienności i wówczas mając M' = 3 zmienne objaśniające, to można utworzyć 23 - 1 = 7 kombinacji zmiennych:
K1 = {x1} K2 = {x2} K3 = {x3} K4 = {x1, x2}
Kk5 = {x1, x3} K6 = {x2, x3} K7 = {x1, x2, x3}
gdzie:
Kn - n-ta kombinacja zmiennych dla n = 1, 2, ..., 7
xi - i-ta potencjalna zmienna objaśniająca dla i = 1, 2, 3
2. Dla każdej j-tej potencjalnej zmiennej objaśniającej, w każdej kombinacji w. n-tej oblicza się tzw. indywidualną pojemność informacji bnj bez zmiennej w tej kombinacji według wzoru:
gdzie:
- zbiór indeksów zmiennych wchodzących w skład n-tej kombinacji, tj. kombinacji Kn
bnj - indywidualna pojemność j-tej zmiennej w n-tejkombinacji
roj - współczynnik korelacji j-tej potencjalnej zmiennej objaśniającej ze zmienną endogeniczną (objaśnianą)
- suma bezwzględnych wartości współczynników korelacji j-tej potencjalnej zmiennej objaśniającej z pozostałymi występującymi w danej kombinacji, tzn. w kombinacji Kn
W naszym zadaniu mając następujące dane:
r01 = -0,467 r11 = 1 r12 = r21 = -0,550
r02 = 0,669 r22 = 1 r13 = r31 = 0,386
r03 = -0,368 r33 = 1 r23 = r32 = -0,494
Obliczamy indywidualną pojemność informacji
3. Kolejnym etapem jest obliczenie integralnej pojemności potencjalnych zmiennych objaśniających Hn jako sumy pojemności indywidualnych w ramach każdej kombinacji, według wzoru:
Wracając do naszych danych otrzymujemy:
H1 = b11 = 0,218
H2 = b22 = 0,4476
H3 = b33 = 0,937
H4 = b41 + b42 = 0,4294
H5 = b51 + b53 = 0,8333
H6 = b62 + b63 = 0,9268
H7 = b71 + b73 = 0,83
Jako zmienne objaśniające wybrać należy zmienne należące do tej kombinacji n*, której odpowiada największa wartość Hn, tzn. reguła decyzyjna jest następująca:
Kopt Hopt = max {Hn : n = 1, 2, ..., 23 - 1}
Wniosek: należy wybrać kombinację K3 = {x3} jako zmienne objaśniające do naszego modelu ekonometrycznego.
Nasz model ekonometryczny miałby wówczas postać:
y = a + b3x3 + ξ
6. Postać analityczna modelu ekonometrycznego
Po procesie doboru zmiennych objaśniających ogólna postać naszego modelu liniowego z dwoma zmiennymi objaśniającymi jest następująca:
y = β0 + β1x1 + β3x3 + ξ
gdzie:
y - zmienna objaśniana (liczba porodów)
x1 - zmienna objaśniająca (stopa bezrobocia)
x3 - zmienna objaśniająca (średnia płaca)
βi - parametry strukturalne i = 0, 1, 3
ξ - składnik losowy
Założenia
Niech:
n = 12 - liczba obserwacji
t = 1, 2, ..., 12 - numery obserwacji
yt, ξt, xt1, xt3 - zaobserwowane wartości zmiennej objaśniającej, składnika losowego i zmiennych objaśniających t = 1, 2, ..., 12
Założenie 1
yt = β0 + β1xt1 + β3xt3 + ξt
dla t = 1, 2, ..., 12
Model w powyższej postaci jest niezmienniczy, ze względu na obserwacje tzn. postać modelu i wzajemne oddziaływania zmiennych są stałe aż do momentu prognozowania włącznie. Model regresji jest liniowy względem parametrów.
Założenie 2
xt1, xt3 - zmienne objaśniające są nielosowe, a ich wartości to ustalone liczby rzeczywiste i liniowo niezależne.
Rozkład zmiennej objaśnianej yt nie jest warunkowy względem xti.
Założenie 3
ξt - składnik losowy, jest niezależną zmienną losową i ma rozkład normalny N(0, 8)
Oznacza to, że
E(ξt) = 0
Cov (ξt, ξţ) = 0 t = ţ
D2 (ξt) = σ2
Wynika to z założeń:
wraz ze wzrostem rozmiarów próby rozkłady statystyczne są zbieżne do rozkładu normalnego,
odchylenie zmiennej losowej od jej wartości średniej uważa się za błąd podlegający „prawu błędów” (opisywany przez rozkład normalny). Występujące zakłócenia, które reprezentuje składnik losowy ξt mają tendencję do wzajemnej redukcji,
brak autokorelacji składnika losowego,
niezmienność w czasie wariancji składnika losowego.
Założenie 4
Informacje zawarte w próbie są jedynymi na podstawie których dokonuje się estymacji parametrów modelu.
Wyżej wymienione założenia definiują model liniowej regresji.
Zapis naszego modelu ekonometrycznego w postaci macierzowej
Zatem powyższy model można zapisać w postaci:
Y = βX
Parametry strukturalne modelu: β, σ2
Stosując metodę najmniejszych kwadratów przy pomocy pakietu SPSS otrzymujemy wektor estymatorów parametrów strukturalnych b ≈ β.
Estymacja parametrów strukturalnych metodą najmniejszych kwadratów polega na minimalizacji następującej funkcji kryterium:
→ min
gdzie:
et - reszta modelu określana jako różnica między wartością rzeczywistą, a wynikającą z modelu wartością teoretyczną zmiennej Y w chwili t, tzn.
gdzie:
yt - wartość rzeczywista zmiennej y
- wartość teoretyczna zmiennej y wynikająca z modelu
Estymatory parametrów strukturalnych wyznaczone za pomocą SPSS:
punktowe
b0 = 567,037
b1 = -1,962
b3 = -0,111
przedziałowe dla poziomu istotności 0,05
b0 = <527,236 ; 606,838>
b1 = <-5,273 ; 1,353>
b3 = <-0,134 ; -0,089>
Oszacowany model przybiera następującą postać:
7. Weryfikacja modelu
7.1. Współczynnik determinacji R2
Współczynnik determinacji R2 wyznaczony został za pomocą pakietu SPSS.
R2 = 0,948
Współczynnik R2 jest bliski 1, oznacza to bardzo dobre dopasowanie modelu regresji do wartości empirycznych. Model ekonometryczny wyjaśnia (opisuje) w 94,8% badane zjawisko, czyli inaczej mówiąc zawiera 94,8% rzeczywistych obserwacji.
7.2. Współczynnik korelacji wielorakiej R
Jest to współczynnik pomiędzy zmienną endogeniczną i zmiennymi ......................, im bliższy jest jedności tym model jest lepiej dopasowany.
7.3. Skorygowany współczynnik determinacji
Zwiększenie liczby zmiennych objaśniających oraz mniej liczna próba obserwacji, zmniejsza wartość R2 (współczynnik determinacji) co utrudnia porównywanie modeli. Z tego powodu stosuje się, wolny od tej wady skorygowany współczynnik determinacji. Zdefiniowany jest on następująco:
Wartość skorygowanego współczynnika determinacji oznacza, że nasz model ekonometryczny jest bardzo dobrze dopasowany do wartości empirycznych.
7.4. Współczynnik zbieżności φ2
Φ2 = 1 - R2
Φ2 = 1 - 0,948 = 0,052
Jest to część zaobserwowanej zmienności y nie wyjaśnionej przez model. Im Φ2 bliższy zeru tym model jest lepiej dopasowany. Φ2 zawiera się w przedziale <0, 1>.
7.5. Współczynnik zmienności losowej
Wartość współczynnika zmienności losowej mówi o tym, że średnia różnica między wartością z modelu a wartością empiryczną wynosi 3,35%, możemy przyjąć, że zmienność tych różnic jest mała.
7.6. Błędy standardowe oszacowań współczynników
Błędy standardowe oszacowań współczynników modelu regresji wynoszą:
dla b0 : S0 = 17,594
dla b1 : S1 = 1,464
dla b3 : S3 = 0,010
7.7. Błędy procentowe oszacowania współczynników modelu
Odpowiednie błędy procentowe wyznaczymy ze wzoru:
dla b0
dla b1
dla b3
Przyjmuje się, że jeżeli dowolne Sbi przekracza 50%, to model nie powinien być zweryfikowany pozytywnie. W naszym przypadku wartość ta przekracza tylko Sbi, nie mniej jednak biorąc pod uwagę pozostałe miary dopasowania przyjmujemy tak skonstruowany model ekonometryczny.
7.8. Test dla współczynnika korelacji liniowej
(nieznanego dla populacji generalnej)
Sprawdzeniu podlega hipoteza H0 (p = 0) (brak korelacji pomiędzy zmiennymi)
H1 (p ≠ 0)
Wartość statystyki wyznaczamy według wzoru:
Zbiór krytyczny:
K = (- ∞; -2,262> u <2,262 : +∞)
Decyzja: H0 odrzucamy gdyż wartość statystyki testowej jest większa od wartości odczytanej z tablic rozkładu T-Studenta.
Wniosek: istnieją liniowe zależności (korelacje) między zmiennymi.
7.9. Test Walda
Dla poziomu istotności 0,05 rozpatrzymy uogólniony test Walda.
Wysuwamy dwie hipotezy:
H0 (β1 = β3 = 0)
H1 (co najmniej jedno β1 ≠ 0 i = 1,3)
Dla weryfikacji hipotezy zerowej stosujemy statystykę testową o postaci:
Rozpatrujemy zbiór krytyczny K = <k : +∞) gdzie k odczytujemy dla poziomu istotności 0,05 z tablicy rozkładu F - Snedecora dla (k, n - (k + 1)) stopni swobody H0 odrzucamy, jeżeli wartość F jest większa od wartości odczytanej z tablic rozkładu F - Snedecora, czyli gdy F∈ K.
Jeżeli F ∉ K, to nie ma podstaw do odrzucenia H0.
W naszym przypadku:
Z Tablicy F - Snedecora odczytujemy wartość k(2 ; 9)
Dla poziomu istotności 0,05:
K = 4,26
Decyzja: ponieważ k < F to hipotezę H0 odrzucamy.
Decyzja: ponieważ k < F, więc F ∈ K, to hipotezę H0 odrzucamy.
Wniosek: Współczynniki są istotne dla naszego modelu ekonometrycznego.
7.10. Test Durbina - Watsona
Test Durbina - Watsona polega na badaniu autokorelacji reszt. Rozpatrujemy hipotezę: H0 (reszty nie są skorelowane) tzn. H0 (p = 0).
Obliczamy wartość statystyki według wzoru:
w naszym zadaniu:
Un = 0,969
Wartość statystyki Un ∈ <0 ; 4>
Dla reszt nieskorelowanych Un ≈ 2
Z tablic rozkładu D - W dla α = 0,05 odczytujemy wartości dla n = 12 i k = 2
kL = 0,812 ku = 1,579
Jeżeli Un < 2, to rozpatrujemy hipotezę alternatywną:
H1 (reszty są skorelowane dodatnio), tzn. H1 (p>0)
Przyjmuje się następującą regułę decyzyjną:
jeśli Un < kL to H0 odrzucamy
jeśli Un > ku to nie ma podstaw do odrzucenia H0
jeśli kL ≤ Un ≤ ku to nie podejmujemy decyzji
W naszym przypadku
Un = 0,969
więc:
0,812 < 0,969 < 1,579
Wniosek: badanie autokorelacji reszt poprzez test Durbina - Watsona nie pozwala nam na podjęcie decyzji, że reszty nie są skorelowane.
7.11. Test istotności parametrów modelu
Dla poziomu istotności 0,05 rozpatrujemy test istotności dla poszczególnych parametrów. Przy badaniu istotności parametrów przyjmujemy:
Βi = 0 , i = 1, 3
tzn. rozpatrujemy dwie hipotezy:
H0 (βi = 0) ; H1 (βi ≠ 0)
Rozpatrujemy statystykę:
mamy dla:
Zbiór krytyczny K = (-∞ ; -k> u <k ; +∞)
Odczytujemy z tablic rozkładu T - Studenta wartość k, czyli k = 2,262
Tak więc zbiór krytyczny K = (-∞ ; -2,62> u <2,62 ; +∞)
U1 ∉ K ; U2 ∈ K
jeśli Ui ∈ K to hipotezę H0 odrzucamy
jeśli Ui ∉ K to nie ma podstaw do odrzucenia hipotezy H0
Pożądane jest odrzucenie hipotezy H0 albowiem w przeciwnym przypadku mielibyśmy do czynienia z sytuacją gdy określona zmienna x nie ma wpływu na zmienną y.
Decyzja: w przypadku zmiennej x1 nie ma podstaw do odrzucenia hipotezy H0, zaś w przypadku zmiennej x3 hipotezę H0 odrzucamy.
Wniosek: Zmienna x1 nie ma istotnego wpływu na zmienną y, czyli stopa bezrobocia nie ma istotnego wpływu na zmienną y, czyli średnia płaca nominalna ma wpływ na liczbę porodów.
8. Prognozowanie
Przy założeniu, że skorzystamy z naszego modelu ekonometrycznego:
y = 567,037 - 1,962x1 - 0,111x3
dokonaliśmy prognoz przy z góry określonej stopie bezrobocia i średniej płacy nominalnej.
Prognoza 1
Zakładamy, że stopa bezrobocia wyniesie 17%, a średnia miesięczna płaca nominalna 1700,00 zł (czyli x1 - 17,00 ; x3 = 1700,00). Należy spodziewać się, że liczba porodów będzie wynosiła 344,983.
Prognoza 2
Gdy stopa bezrobocia będzie wynosiła 17,5%, a średnia płaca 1700,00, to prognozowana jest liczba porodów o wielkości 344,002.
Prognoza 3
Gdy stopa bezrobocia będzie wyrażała się wielkością 16%, a średnia płaca 1700,00 zł, to spodziewane jest 346,945 porodów.
Prognoza 4
Gdy stopa bezrobocia będzie w granicach 15%, a płace średnie 1700,00 zł, to liczba porodów wyniesie 348,907.
Prognoza 5
Gdy stopa bezrobocia spadnie do 14%, a średnia płaca pozostanie na niezmienionym poziomie, tj. 1700,00 zł, to spodziewane jest 350,869 porodów.
Prognoza 6
Gdy stopa bezrobocia wyniesie 14%, a średnia płaca 1690,00 zł (czyli zostanie obniżona w stosunku do prognozy 5), to liczba porodów wzrośnie do 351,979, czyli o 1110.
Prognoza 7
Gdy stopa bezrobocia będzie na poziomie 13,5%, a średnie płace na poziomie 1700,00zł, to prognozowane jest 351,850 porodów.
9. Podsumowanie
Nasz model ekonometryczny ma analityczną postać liniową. Przy testowaniu hipotez przyjęliśmy poziom istotności 0,05 co oznacza, że przeciętnie tylko w pięciu próbach na sto otrzymane przedziały ufności nie będą zawierały rzeczywistej wartości parametrów. Poziom istotności nie może być zbyt wysoki. Jeśli zmniejszymy wartość poziomu istotności, to wzrośnie nam długość przedziału ufności i spadnie jakość oszacowania parametrów strukturalnych. Aby poprawić jakość oszacowania parametrów przedziałem ufności, należałoby zwiększyć liczebność próby.
Współczynnik determinacji jest bliski jedności, co oznacza, że przyjęty przez nas model ekonometryczny w 94,8% wyjaśnia (opisuje) badane zjawisko. Ze względu na małą ilość obserwacji (N = 12) badanego zjawiska posłużyliśmy się również skorygowanym współczynnikiem determinacji. Współczynnik ten w dokładniejszym stopniu określa nam dopasowanie modelu ekonometrycznego. Wartość tego współczynnika mówi nam, że model przyjęty przez nas w 93,7% zawiera rzeczywiste obserwacje badanego zjawiska.
Współczynnik zbieżności jest bliski zeru, to też świadczy o bardzo dobrym dopasowaniu. Wskazuje on, że zmienność w badanym okresie nie została wyjaśniona w 5,2% badanego zjawiska.
Współczynnik zmienności losowej informuje nas, że 3,35% średniej wartości badanego zjawiska stanowi odchylenie standardowe reszt. Współczynnik ten wyjaśnia nam, że przypadkowe odchylenia (nie wyjaśnione przez model) od średniego poziomu zmienności danych zmiennych w latach 1990 - 2001 stanowią zaledwie 3,35%. Świadczy to o małej zmienności danych losowych nie uwzględnionych w naszym modelu ekonometrycznym.
Wyżej wymienione miary dopasowania wskazują na bardzo dobre dopasowanie modelu do rzeczywistych obserwacji badanego zjawiska. Niemniej nasuwają się nam pewne wątpliwości co do jakości naszego modelu ekonometrycznego. Przyczyną tego jest brak jednoznacznej odpowiedzi co do autokorelacji reszt. Nie możemy jednoznacznie stwierdzić, że reszty nie są skorelowane.
Estymacja przedziałowa parametru b1 pokazuje nam, że ten parametr może przyjąć również wartość zero. Potwierdzeniem tego faktu jest test istotności parametrów strukturalnych w przyjętym przez nas modelu ekonometrycznym. Test ten wskazuje na brak istotnego wpływu stopy bezrobocia na liczbę porodów, co w pewnym sensie podważa jakość naszego modelu. Zatem należało dokonać doboru zmiennych objaśniających metodą Hellwiga i przyjąć model o kombinacji zmiennych, który zawiera największą tzw. integralną pojemność informacji, czyli kombinację K3 = {x3}. Wówczas nasz model miałby postać y = b0 + b3x3, czyli zawierałby tylko jedną zmienną objaśniającą badane przez nas zjawisko. Jednak w tak skonstruowanym modelu ekonometrycznym test Durbina - Watsona wskazuje na odrzucenie hipotezy H0 (reszty nie są skorelowane) co znaczy, że reszty są skorelowane dodatnio.
Przyjęty przez nas model liniowy należałoby odrzucić. Do konstrukcji nowego modelu ekonometrycznego należy wybrać inny zbiór zmiennych objaśniających, np. zamiast średniej płacy nominalnej, jako zmienną objaśniającą przyjąć średnią płacę realną lub też z początkowego zbioru zmiennych objaśniających odrzucić zmienną - średnia płaca nominalna.
10. Literatura
Cieślak Maria, Prognozowanie gospodarcze. Metody i zastosowania, Wydawnictwo Naukowe PWN, Warszawa 2002.
Gruszczyński Marek, Podgórska Maria, Ekonometria, Szkoła Główna Handlowa, Warszawa 2000.
Kowalski Lucjan, Wydział Cybernetyki WAT, Warszawa 2001.
Manikowski Arkadiusz, Tarapata Zbigniew, Prognozowanie i symulacja rozwoju przedsiębiorstw, Wyższa Szkoła Ekonomiczna, Warszawa 2002.
Pierzchała Dariusz, Wykłady z Prognozowania i symulacji, Wydział Cybernetyki WAT, Warszawa 2003.