Wykłady z ekonometrii ( 15 godz )
Wykład pierwszy
Temat wykładu : Wprowadzenie do ekonometrii
Ekonometria
jest nauką , która zajmuje się badaniem ilościowych zależności zachodzących między zjawiskami i procesami ekonomicznymi za pomocą wyspecjalizowanego języka matematyczno - statystycznego.
Ekonometria ( składa się z dwóch wyrazów ekono i metria ) czyli mierzenie zjawisk ekonomicznych
Ekonometria jest traktowana jako przyczynek do wszystkich nauk ekonomicznych. Jest ona ściśle związana z matematyką , statystyką , informatyką , makro i mikro ekonomią .
Ekonometria posiada już swoją historię. Pierwsze badania ekonometryczne pojawiły się w USA .Ośrodkiem badań był uniwersytet Harward .Problematyka tych badań dotyczyła przebiegu cykli koniunkturalnych .
Ważny wkład w rozwój ekonometrii miały prace ekonometryka holenderskiego J. Tinbergena Wprowadził on w ekonometrii opis współzależności różnych zjawisk ekonomicznych za pomocą układu równań .
Po raz pierwszy termin ekonometria pojawił się w 1910 roku w tytule pracy Pawła Ciompy „ Przegląd ekonometrii i rzeczywistej teorii buchalterii „ wydanej we Lwowie.
W dzisiejszym znaczeniu termin ten został wprowadzony do słownika nauk ekonomicznych przez norweskiego ekonomistę Ragnara Frischa w 1926 roku .
Cele jakie realizuje ekonometria to :
1.Cel poznawczy - opis mechanizmu kształtowania się zjawisk
2.Cel predyktywny - przewidywanie dalszego przebiegu zjawisk
3.Cel decyzyjny ( optymalizacyjny ) - sterowanie przebiegiem zjawisk ekonomicznych.
Przedmiotem badań ekonometrycznych jest model ekonometryczny .
Model ekonometryczny jest to formalny opis stochastycznej zależności wyróżnionego zjawiska ekonomicznego ( wyróżnionych zjawisk ) od czynników które go kształtują , a wyrażony jest w formie pojedynczego równania bądź układu równań. Model ekonometryczny jest to konstrukcja formalna , która za pomocą równania i układu równań przedstawia zasadnicze powiązania jakie zachodzą między zjawiskami ekonomicznymi.
Strukturę każdego równania określają :
• zmienna objaśniana , zmienne objaśniające ( nielosowe albo losowe ) mające ustaloną treść ekonomiczną ,
• parametry strukturalne ,
• zmienne losowe ( składnik losowy)
• oraz typ związku funkcyjnego między zmienną objaśnianą a zmiennymi objaśniającymi i składnikiem losowym.
Przykład 1.
Dany jest model o następującej postaci :
gdzie :
Y - oznacza np. wielkość produkcji w pewnej firmie ( w tys , szt ) ,
X - wielkość zatrudnienia ( w tys. osób ) w pewnej firmie
Zmienną Y nazywamy zmienną objaśnianą , zmienną X - objaśniającą ,
są nieznanymi parametrami strukturalnymi modelu. Składnik losowy
określany jest jako błąd w równaniu , informuje o łącznym oddziaływaniu wszystkich czynników nie uwzględnionych w modelu. Wiadomo , że na wielkość produkcji w firmie oprócz zatrudnienia wpływa jeszcze szereg innych czynników . Zależność ta ma charakter liniowy.
W modelu można wyróżnić następujące zmienne :
• Zmienne endogeniczne ; bieżące i opóźnione ( wyjaśniane przez model )
• Zmienne egzogeniczne : bieżące i opóźnione ( nie wyjaśniane przez model )
Ze względu na rolę pełnioną przez poszczególne zmienne w modelu możemy wyróżnić
• Zmienne objaśniane
•Zmienne objaśniające
Klasyfikacja modeli może być dokonana z punktu widzenia różnych kryteriów .
Ze względu na liczbę równań w modelu można wyróżnić:
• modele jednorównaniowe
• modele wielorównaniowe
Ze względu na postać analityczną równań modeli , można wyróżnić modele liniowe i nieliniowe .
Ze względu na rolę czynnika czasu w równaniach modelu wyróżnia się modele
• Statyczne (nie posiadające czynnika czasu )
• Dynamiczne ( w których występuje czynnik czasu - najlepszym przykładem jest model trendu )
Innym przykładem modelu dynamicznego jest model autoregresyjny , w którym wśród zmiennych objaśniających występuje opóźniona w czasie zmienna objaśniana.
Ze względu na walory poznawcze wyróżnia się następujące rodzaje modeli :
• Przyczynowo - opisowe wyrażające związki przyczynowo - skutkowe między zmiennymi objaśniającymi i objaśnianymi .
• Modele symptomatyczne , w których rolę zmiennych objaśniających pełnią zmienne skorelowane z odpowiednimi zmiennymi objaśnianymi , a nie wyrażające źródeł zmienności zmiennych objaśnianych.
Modele wielorównaniowe ze względu na budowę ( czyli charakter powiązań między zmiennymi endogenicznymi w modelu wielorównaniowym ) dzielimy na
Proste
Rekurencyjne
O równaniach współzależnych
Modelowanie ekonometryczne jest procesem wieloetapowym.
W każdym z etapów modelowania ekonometrycznego korzysta się z metod i narzędzi stosowanych w innych dyscyplinach naukowych. Ekonometria ma charakter interdyscyplinarny .
Proces budowy modelu ekonometrycznego obejmuje :
• Merytoryczną analizę zjawiska i konstrukcję modelu ( w etapie tym dokonujemy doboru zmiennych objaśniających kierując się znajomością dotychczasowej wiedzy ekonomicznej oraz korzystając z odpowiednich procedur np. teoria grafów lub metoda Z. Hellwiga )
• Typ związku ustalamy korzystając z tzw. wiedzy apriorycznej o modelowanym zjawisku lub innych procedur np. oceny wzrokowej itp. )
• Estymacja parametrów za pomocy KMNK lub innych metod np. największej wiarygodności, różniczki zupełnej
• Weryfikacja modelu ( weryfikacja merytoryczna i statystyczna za pomocą odpowiednich miar )
• Zastosowanie modelu ( do symulacji lub prognozowania )
Źródła danych wykorzystywanych do budowy modeli to
• Dane pierwotne
• Dane wtórne
Dane statystyczne mogą mieć
• Charakter szeregu czasowego , gdy badane zjawisko przedstawione jest kolejnych jednostkach czasu
• Danych przekrojowych , gdy dane wyrażają stan zjawiska w ustalonym czasie w odniesieniu do różnych obiektów np. firm , banków .
Wybrane pozycje literaturowe
.Aczel D.A Statystyka w zarządzaniu, PWN, Warszawa 2000
C. Chow, Ekonometria, PWN, Warszawa 1995.
S. Bartosiewicz, Ekonometria - technologia ekonomicznego przetwarzania informacji, PWE, Warszawa 1976.
Ekonometria . Metody - Zastosowania - Zadania . Pod redakcją W. Tomaszewskiego ( współautor M. Wierzbińska ) . UMCS Lublin 1983.
K. Kukuła (red.), Wprowadzenie do ekonometrii w przykładach i zadaniach, PWN, Warszawa 1996.
R.L.Klein, Wykłady z ekonometrii., PWE, Warszawa 1982.
E. Nowak, Zarys metod ekonometrii - zbiór zadań, PWN, Warszawa 1998.
Pawłowski Z. : Ekonometria .PWN. Warszawa 1969. Wydanie III.
W. Welfe, A. Welfe, Ekonometria stosowana, PWN, Warszawa 1996.
W. Welfe, Gospodarka polski w okresie transformacji - zasady modelowania ekonometrycznego, PWE Warszawa 2000.
Welfe A i inni, Ekonometria - zbiór zadań, PWE Warszawa 1997
Welfe : Ekonometria ,PWE. 1998
Wykłady i ćwiczenia z ekonometrii. Materiały dydaktyczne pod redakcją M.Woźniaka ( współautor M.Wierzbińska), UMCS Filia w Rzeszowie, Rzeszów 1999.
Ekonometria . Metody i analiza problemów ekonomicznych. Pod redakcją Krzysztofa Jajugi . Wydawnictwa Akademii Ekonomicznej im. Oskara Lanego we Wrocławiu, Wrocław 1998.
Dorosiewicz S.., Kołatkowski D. ,Kuszewski T., Podgórska M., Syczewska E.: Ekonometria . SGH, Warszawa .
Wykład drugi
Temat wykładu : Proces budowy jednorównaniowego modelu ekonometrycznego.
1. Założenia dotyczące klasycznego modelu ekonometrycznego
2. Przykład numeryczny
Zakładając, że związek między zmienną objaśnianą Y, a zmienną objaśniającą X jest liniowy zakłócony przez addytywny składnik losowy, to jednorównaniowy liniowy model ekonometryczny można sformułować w postaci następujących założeń.
Założenie 1.
Z zapisu wynika, że każda zaobserwowana wartość yt jest liniową funkcją obserwacji na zmiennej objaśniającej xt z dokładnością do składnika losowego ξt .
Założenie 2.
Obserwacje na zmiennej objaśniającej są ustalonymi ( tj. nielosowymi ) wartościami, takimi samymi w powtarzalnych próbach.
Założenie 3.
Składniki losowe ξt dla t= 1,2,3,..,n są niezależnymi zmiennymi losowymi o jednakowych rozkładach prawdopodobieństwa z wartością oczekiwaną równą zero, czyli
i stałą wariancją
Założenie 3 określa strukturę stochastyczną modelu. Nie precyzuje typu rozkładu prawdopodobieństwa składnika losowego ξt tylko określa główne parametry tego rozkładu czyli, tzw. parametry struktury stochastycznej modelu. Sformułowanie mówiące, że „ są niezależnymi zmiennymi losowymi „ implikuje, że dla każdej pary zmiennych losowych ( ξi , ξj ) ich kowariancja jest równa zero, czyli można zapisać:
i ≠ j
Założenie o niezależności i jednorodności wariancji składników losowych wraz z założeniem o zerowej wartości oczekiwanej tworzą tzw. klasyczny zestaw założeń o składniku losowym.
Z założenia o nielosowym charakterze zmiennej objaśniającej oraz z założenia o wartości oczekiwanej składnika losowego wynika, że zmienne objaśniająca i składnik losowy są niezależne. Tak więc możemy zapisać:
dla t = 1,2,..., n
Ważne konsekwencje ma założenie o wartości oczekiwanej składnika losowego.
Uwzględniając to założenia model możemy zapisać następująco :
dla t= 1,2,...,n
Zapis powyższy oznacza liniową funkcję regresji Y względem X , to jest funkcję przyporządkowującą wartością xt warunkowe wartości oczekiwane zmiennej objaśnianej yt .
Parametry strukturalne modelu α0 ,α1 są więc parametrami regresji, co umożliwia zastosowanie do ich szacowania odpowiednich metod estymacji parametrów funkcji regresji.
Składnikowi losowemu można nadać interpretację odchylenia od nieznanej funkcji regresji, czyli
dla t= 1,2,...,n
Klasyczny jednorównaniowy liniowy model ekonometryczny to model sformułowany dzięki założeniom.
Twierdzenie Gaussa - Markowa
W klasycznym modelu regresji liniowej najlepszym nieobciążonym estymatorem liniowym parametrów αo , α1 jest estymator, otrzymany metodą najmniejszych kwadratów .
METODA NAJMNIEJSZYCH KWADRATÓW
MNK - polega na wyznaczeniu takich ocen ao, a1 parametrów αo,α1 aby dla danych n obserwacji dokonanych na zmiennych (yt, xt) suma kwadratów odchyleń zaobserwowanych wartości zmiennej objaśnianej (Yt) od jej wartości teoretycznych wyznaczonych przez funkcję regresji, tj. funkcję:
osiągnęła minimum.
Poprzez przyrównanie do zera pierwszych pochodnych cząstkowych funkcji S względem αo , α1 otrzymujemy tzw. układ równań normalnych
Rozwiązując powyższy układ równań otrzymujemy następujące wzory na estymatory parametrów
Można również udowodnić, że standardowe błędy ocen parametrów ( określane inaczej jako średnie błędy szacunku parametrów ) można wyrazić następującymi wzorami
Przykład numeryczny
Załóżmy , że interesuje nas badanie zależności spożycia od dochodu narodowego. Dane potrzebne do badań zostały zmieszczone w poniższej tablicy
Tab.1 Spożycie i dochód narodowy
t |
Spożycie |
DN |
1 |
3,1 |
4,3 |
2 |
3,3 |
4,7 |
3 |
3,6 |
5,2 |
4 |
3,9 |
5,7 |
5 |
4,2 |
6,3 |
6 |
4,7 |
6,9 |
7 |
5,1 |
7,4 |
8 |
5,4 |
7,7 |
9 |
5,5 |
8 |
10 |
5,7 |
7,8 |
Źródło : Gajda M. : Ekonometria praktyczna. Wyd. Absolwent 1989 .
Należy oszacować model i przeprowadzić interpretację uzyskanych wyników .
Do badań zostanie wykorzystany liniowy model ekonometryczny o następującej postaci :
gdzie : Yt - jest to zmienna objaśniana w modelu ( spożycie )
Xt1 - zmienna objaśniająca ( dochód narodowy )
αo , α1 - parametry modelu , które należy oszacować
ξt - składnik losowy
Oceny parametrów modelu znajdziemy dzięki wykorzystaniu MNK , czyli wykorzystując odpowiednie wzory . Obliczenia są wykonane w arkuszu Excel , można również wykonać w programie Statistica PL w module Regresja wielokrotna
Tab.2Tablica pomocnicza do wyznaczenia ocen parametrów modelu
t |
Spożycie |
DN |
( |
|
( |
|
|
|
X2 |
1 |
3,1 |
4,3 |
-1,35 |
-2,1 |
2,835 |
4,41 |
2,9842 |
0,0134 |
18,49 |
2 |
3,3 |
4,7 |
-1,15 |
-1,7 |
1,955 |
2,89 |
3,2643 |
0,0013 |
22,09 |
3 |
3,6 |
5,2 |
-0,85 |
-1,2 |
1,02 |
1,44 |
3,6124 |
0,0002 |
27,04 |
4 |
3,9 |
5,7 |
-0,55 |
-0,7 |
0,385 |
0,49 |
3,9614 |
0,0038 |
32,49 |
5 |
4,2 |
6,3 |
-0,25 |
-0,1 |
0,025 |
0,01 |
4,3802 |
0,0324 |
39,69 |
6 |
4,7 |
6,9 |
0,25 |
0,5 |
0,125 |
0,25 |
4,799 |
0,0098 |
47,61 |
7 |
5,1 |
7,4 |
0,65 |
1 |
0,65 |
1 |
5,148 |
0,0023 |
54,76 |
8 |
5,4 |
7,7 |
0,95 |
1,3 |
1,235 |
1,69 |
5,3574 |
0,0018 |
59,29 |
9 |
5,5 |
8 |
1,05 |
1,6 |
1,68 |
2,56 |
5,5668 |
0,0045 |
64,00 |
10 |
5,7 |
7,8 |
1,25 |
1,4 |
1,75 |
1,96 |
5,4272 |
0,0744 |
60,84 |
|
4,45 |
6,4 |
|
|
11,66 |
16,7 |
|
0,1439 |
426,3 |
Źródło : Opracowanie własne .
Wykorzystując wzory na oceny parametrów otrzymujemy :
,
Oszacowany model ma postać następującą :
Ocena parametru *0 wynosi - 0,0172 , co oznacza , że gdyby zmienne objaśniające naszego modelu ( w tym przykładzie jedna zmienna tj. dochód narodowy ) przybrały wartość zerową, to należałoby oczekiwać, że spożycie wynosiłoby -0,0172. Formalnie rzecz biorąc wszystko jest w porządku , wyraz wolny istotnie informuje o tym , jaki byłby poziom opisywanego zjawiska , gdyby wszystkie zmienne objaśniające modelu przybrały wartości zerowe. Trudno jednak sobie wyobrazić ujemną konsumpcję . Mamy do czynienia z przypadkiem , w którym wyraz wolny równania nie ma sensownej interpretacji ekonomicznej .
Ocena parametru *1 wynosi 0,698 , oznacza to , że jeśli wartość zmiennej DN wzrośnie o jedną jednostkę , to oczekujemy , że spożycie wzrośnie o 0,698.
Następnie wyznaczamy średnie błędy szacunku . Najpierw należy wyznaczyć wariancję resztową .
Odchylenie standardowe reszt czyli pierwiastek z wariancji reszt, który wynosi s=0,134 , oznacza , że przewidywane przez oszacowane równanie wartości zmiennej objaśnianej czyli spożycie , średnio różnią się od empirycznych wartości tej zmiennej o 0, 134 .
Standardowe błędy szacunku równania informują nas z jaką dokładnością oszacowane równanie prognozuje w obrębie próby wartości zmiennej objaśnianej. Możemy powiedzieć , że szacując parametr *o ( wyraz wolny ) mylimy się średnio o 0,214 , a szacując parametr *1 ( stojący przy zmiennej objaśniającej - dochód narodowy ) pomyliliśmy się o 0,328.
Ważnym problemem jest sformułowanie przedziałów ufności dla otrzymanych ocen parametrów. Znając standardowe błędy ocen parametrów, oraz zakładając że składnik losowy ma rozkład normalny wówczas możemy zbudować przedziały ufności dla otrzymanych ocen parametrów w sposób następujący
Przyjmując poziom istotności
=0,1 z tablic odczytujemy
i możemy zapisać 90 procentowe [ tj. ( 1- α )* 100 ] przedziały ufności dla oszacowanych parametrów modelu, są one następujące :
[ - 0,185 - 1,8946*0,214 < α0 < - 0,185 + 1,8946*0,214 ]
[ - 0,5904 < α0 < 0,2204 ] Przedział ten z prawdopodobieństwem 0,9 nakryje parametr α0 .
Przedział ufności dla parametru α1 jest następujący :
[ 0,698 - 0,0328 * 1,894 < α1, 0,698 + 0,0328 * 1,8946 ]
[ 0,63587 < α1 < 0,76014 ]
Wykład 3
Temat wykładu . Modele trendu.
1.Pojęcie trendu
2.Modele trendu liniowe i nieliniowe
3. Przykłady modeli nieliniowych ( przyczynowo - skutkowych )
Przez trend rozumie pewną krzywą ciągłą wyznaczoną przez wartość oczekiwaną procesu która jest funkcją ciągłą zmiennej czasowej t .Trend to ogólna tendencja rozwojowa , charakteryzująca dany szereg chronologiczny na przestrzeni dłuższego okresu czasu ( kilkunastu lub kilkudziesięciu lat ) .
Trend określany jest jako „ funkcja opisująca najbardziej istotne , trwałe zmiany rozmiarów zjawiska „
Trend definiowany jest jako „ zmiany zachodzące w ogólnym poziomie badanego zjawiska w sposób systematyczny i regularny „ Trendem nazywa się funkcję ( krzywą ) obrazującą proces zmiany badanej wielkości w czasie „
Modele trendu mogą przyjmować postać funkcji nieliniowych względem parametrów. Najczęściej wykorzystuje się funkcje nieliniowe sprowadzalne do postaci liniowej , aby można było dokonać estymacji klasycznymi metodami .
Modele szeregów czasowych, w których występują trend oraz wahania przypadkowe mogą być :
1. yt = f(t) +εt - modele addytywne
2. yt = f(t)*εt - modele multiplikatywne
gdzie :
f(t) - funkcja trendu
εt - zmienna losowa , charakteryzująca efekty oddziaływania wahań przypadkowych na trend szeregu, o wartości oczekiwanej równej zeru dla modelu (1) lub jedności dla modelu (2 ) i skończonej wariancji.
Najczęstszą postacią funkcji trendu jest funkcja liniowa :
Yt = α + βt + εt
. Reprezentuje ona stały kierunek rozwoju danego zjawiska (np. wielkości sprzedaży ) wyznaczony przez współczynnik kierunkowy prostej (β). Parametr ten jest współczynnikiem stałego przyrostu wartości zmiennej objaśnianej ( np. wielkości sprzedaży w jednostce czasu).
W przypadku , gdy wprowadzamy nowy towar na rynek i sprzedaż rośnie nieograniczenie , to można wykorzystać
funkcje wykładnicze
Właściwością tej funkcji jest stopa wzrostu wynosząca: β lub lnβ
Wielomian stopnia drugiego ( parabola)
Zaletą tej funkcji jest duża elastyczność , wynikająca z posiadania trzech parametrów . Dzięki temu funkcja ta może lepiej odzwierciedlać różne nieliniowe tendencje rozwojowe .
Gdy wzrost sprzedaży jest coraz wolniejszy wśród możliwych do zastosowania funkcji można wymienić następujące :
Logarytmiczna
Yt = α +β ln t , β > 0
Potęgowa
Yt= αtβ , 0 < β < 1
O wykładniku większym od zera i mniejszym od jeden.
Gdy wzrost jest coraz wolniejszy i zdąża do pewnego poziomu , to można wykorzystać funkcję
Mającą asymptotę poziomą
Obserwując cykl życia produktu ( wprowadzenie , wzrost, nasycenie , spadek ) można dla tego cyklu wykorzystać bardziej złożoną funkcję typu logistycznego:
Przebiegiem logistycznym charakteryzują się między innymi zjawiska rynkowe dotyczące popytu , zwłaszcza popytu na dobra trwałego użytkowania.
Ustalenie analitycznej postaci trendu sprowadza się do :
• Sporządzenia wykresu na podstawie danych empiryczny ( zaobserwowanych , oryginalnych )
• Analiza wykresu
• Sformułowanie hipotez dotyczących postaci analitycznej funkcji trendu
• Estymacja ( MNK , metoda Hotellinga np. dla funkcji logistycznej )
• Weryfikacja
Przykład
Sprzedaż rowerów górskich ( w tys. sztuk ) w latach 1985 - 1999 kształtowała się następująco : 10,3; 10,5; 10,6; 10,7; 11,0; 11,5; 12,0; 12,2;12,5;12,6; 13,0; 13,9; 14,4; 15,2; 16,0;
Należy oszacować parametry modelu trendu
Do badań wykorzystano trend liniowy. Wyniki uzyskano w module regresja wielokrotna.
Oszacowany model trendu ma postać :
0,235789 0,025933
t 39,54294 14,9559
R2=0,945 s=0,43395
Przykłady modeli nieliniowych ( przyczynowo - skutkowych )
Przykład
Przeciętne roczne spożycie tłuszczów bez masła ( w kg na osobę ) w zależności od miesięcznych dochodów ( w zł na osobę ) kształtuje się następująco
Dochód |
800 |
1000 |
1250 |
1500 |
2000 |
2500 |
Spożycie |
4,5 |
5,5 |
7,0 |
8,5 |
9,5 |
10,0 |
Oszacować parametry modelu :
• Funkcji potęgowej
•Funkcji Törnquista I rodzaju.
Funkcja potęgowa ma postać następującą :
gdzie:
Y- wielkość spożycia
X- wielkość dochodów
α0 ,α1 - parametry strukturalne, które należy wyznaczyć
Funkcję potęgową można sprowadzić do liniowości dzięki prostym przekształceniom tj.
Oszacowany model ma postać następującą:
Ostatecznie oszacowany model można zapisać
Ocena parametru α1 - to elastyczność dochodu względem spożycia. Informuje o tym, że wraz ze wzrostem dochodu o 1 % spożycie wzrasta o 0,7248.
Ogólna postać funkcji Törnquista I rodzaju ma postać:
gdzie:
Y- wielkość spożycia
X- dochód
a ,b - parametry równania
W celu oszacowania parametrów tej funkcji, transformuje się ją do postaci liniowej :
gdzie
Oszacowana funkcja Törnquista I rodzaju ma postać :
Wykład 4
Temat wykładu - Zagadnienie doboru zmiennych objaśniających do modelu ekonometrycznego.
1. Uwagi wstępne
Wstępnym zadaniem przy budowie modelu ekonometrycznego jest określenie zmiennych objaśniających.
Głównym kryterium doboru zmiennych do modelu ekonometrycznego jest merytoryczna znajomość badanego zjawiska. Zadaniem ekonometryka jest wybrać takie czynniki ( zmienne objaśniające) , które mają istotny wpływ na kształtowanie się badanego zjawiska ( zmiennej objaśnianej). Powszechnie wiadomo z teorii ekonomii , że popyt (zakładamy , że jest to zmienna objaśniana) zależy od dochodu (zmienna objaśniająca - X1) i ceny (zmienna objaśniająca X2 ) oraz innych jeszcze czynników .
Warunkiem wstępnym , aby dana zmienna ( np. Xj ) mogła być uznana za zmienną objaśniającą w modelu , jest jej wystarczające zróżnicowania. Zmienną objaśniającą bowiem nie może być zmienna , której poszczególne obserwacje nie różnią się między sobą (lub różnią się w niewielkim stopniu). Nie jest to wtedy już zmienna , lecz stała (lub quasi - stała).
Do mierzenia poziomu zróżnicowania wykorzystuje się klasyczny współczynnik zmienności, dany wzorem :
odchylenie standardowe zmiennej xj
Średnia arytmetyczna zmiennej xj
Zwykle obiera się krytyczną wartość współczynnika zmienności V* ( np. V*= 0,1 ). Zmienne spełniające nierówność Vj < V* uznaje się za mało zróżnicowane i eliminuje ze zbioru potencjalnych zmiennych objaśniających.
2. Metoda Z. Hellwiga
Procedura zaproponowana przez Z. Hellwiga jest wykorzystywana wówczas gdy dotychczasowa wiedza z teorii ekonomii jest niewystarczająca w procesie modelowania ekonometrycznego. Powszechnie wiadomo z teorii ekonomii od czego zależy np. kształtowanie się popytu konsumpcyjnego , co wpływa na wielkość produkcji w firmie itp. Opracowując ekonometryczny model popytu czy ekonometryczny model produkcji kierujemy się przede wszystkim znajomością ekonomii. W przypadku budowy modelu , gdzie nie wiadomo jakie i ile zmiennych należy brać pod uwagę , to korzystamy z gotowych algorytmów. Jednym z takich algorytmów jest metoda Z. Hellwiga.
Idea tej metody sprowadza się do wykonania szeregu czynności :
Określenie zmiennej objaśnianej
Ustalenie potencjalnej listy zmiennych „ kandydujących” do roli zmiennych objaśniających
Wyznaczenie współczynników korelacji między zmienną objaśnianą a potencjalnymi zmiennymi objaśniającymi ( czyli wektora R0 )
Wyznaczenie współczynników korelacji między potencjalnymi zmiennymi objaśniającymi ( wyznaczenie macierzy R )
Ustalenie liczby kombinacji
Obliczenie pojemności indywidualnych nośników informacji
Obliczenie pojemności integralnej
Podjęcie decyzji , która z zaproponowanych zmiennych wejdzie do modelu ekonometrycznego
Formalny opis procedury
Zdefiniowanie wektora zmiennej objaśnianej
Określenie macierzy potencjalnych zmiennych objaśniających
Wyznaczenie wektora współczynników korelacji między zmienną objaśnianą a potencjalnymi zmiennymi objaśniającymi czyli :
Przy czym współczynnik korelacji między zmienną objaśnianą a pierwszą zmienną objaśniającą wyznaczamy w sposób następujący :
Wyznaczenie macierzy współczynników korelacji między potencjalnymi zmiennymi objaśniającymi czyli :
Przy czym współczynnik korelacji między pierwszą a drugą zmienną objaśniającą wyznaczamy następująco :
Ustalenie liczby kombinacji według wzoru K= 2 k -1 , gdzie k to liczba zmiennych objaśniających w modelu
Wyznaczenie pojemności indywidualnych nośników informacji według wzoru :
gdzie
- pojemność indywidualna k - tej kombinacji i j- tej zmiennej
- kwadrat współczynnika korelacji j- tej zmiennej objaśnianej ze zmienną objaśniającą
- współczynnik korelacji między i-tą a j - tą zmienną objaśniającą
7. Wyznaczenie pojemności integralnej według wzoru :
Przykład
Załóżmy , że dla pewnej zmiennej objaśnianej Y wybrano dwuelementowy zbiór „ kandydatek „ na zmienne objaśniające X = { X1 , X2 } . Macierze współczynników korelacji są dane :
Rozwiązanie :
Najpierw ustalamy liczbę kombinacji : K=22-1=3
K1 = {X1}
K2 = {X2}
K3 = { X1 , X2 }
Następnie wyznaczamy indywidualne pojemności informacyjne :
Pojemności integralne wynoszą :
H1=o,49
H2=0,25
H3=0,627
Pojemność integralna trzecia jest największa , co świadczy , że do rozwiązania wejdą dwie zmienne objaśniające tj. X1 i X2 .
3. DOBÓR ZMIENNYCH OBJAŚNIAJĄCYCH ZA POMOCĄ GRAFÓW.
Główne założenia :
1. Zmienne objaśniające wchodzące w skład modelu nie powinny być skorelowane między sobą, tzn. rij =0 dla wszystkich kombinacji wskaźników i , j , gdzie i
j ( i ,j = 2,3,4,...k)
2. Zmienne objaśniające powinny pozostawać w związku korelacyjnym ze zmienną objaśnianą , tzn.
( j=2,3,...k ) ( przy czym k oznacza liczbę zmiennych występujących w modelu , w tym numerem 1 oznaczona jest zmienna objaśniana ) . W praktyce postulat braku korelacji między zmiennymi objaśniającymi jest niemożliwy do spełnienia , zatem stawiamy złagodzone założenie , wymagając, aby
( i,j=2,3,...,k ).
ETAPY DZIAŁAŃ W METODZIE GRAFÓW
Na podstawie danych empirycznych dotyczących n obserwacji dokonanych na k zmiennych budujemy macierz X o wymiarach ( n x k)
Z powyższych danych budujemy symetryczną macierz współczynników korelacji rij, którą oznaczamy jako W ( będzie to macierz o wymiarach ( k x k )
Z macierzy W przez wyłączenie pierwszej kolumny i pierwszego wiersza tworzymy macierz współczynników korelacji zmiennych objaśniających łączonych parami. Oznaczmy ją jako
.Wymiar tej macierzy wynosi ( k-1)x(k-1)
W odniesieniu do występujących współczynników korelacji weryfikujemy hipotezę H0 : rij = 0 , i
j . Sprawdzianem tej hipotezy jest statystyka:
Wykorzystując macierz
, budujemy graf, w którym wierzchołkami są zmienne, a łukami współczynniki korelacji
. W rezultacie takiego postępowania mogą zajść następujące przypadki:
Powstał graf spójny, co oznacza, że wszystkie wybrane zmienne są ze sobą bezpośrednio skorelowane
Powstało kilka grafów spójnych, co oznacza, że występują grupy zmiennych skorelowanych ze sobą bezpośrednio lub pośrednio, podczas gdy inne grupy są ze sobą nie skorelowane
Powstały grafy spójne i wierzchołki izolowane , co oznacza , że obok grup zmiennych skorelowanych występują zmienne nie skorelowane z żadną z pozostałych
Powstały punkty odosobnione, co oznacza, że wszystkie zmienne są ze sobą nie skorelowane.
Następnie określamy stopień każdego węzła grafu k, tzn. liczbę łuków którymi jest on związany z innymi wierzchołkami. Dla wierzchołków izolowanych k=0.
W każdym grafie spójnym wyróżniamy wierzchołek o maksymalnym k. Jeżeli w danym grafie spójnym jest kilka takich wierzchołków, to wybieramy spośród nich wierzchołek charakteryzujący tę zmienną, która jest najmocniej skorelowana ze zmienną objaśnianą ( czyli zmienną ), dla której
jest maksymalny.
Wykład 5.
Temat wykładu - JEDNORÓWNANIOWY MODEL LINIOWY Z WIELOMA ZMIENNYMI OBJAŚNIAJĄCYMI - SFORMUŁOWANIE MODELU I JEGO ESTYMACJA.
Rozważmy model o następującej postaci:
gdzie: Y - zmienna endogeniczna ( zmienna losowa ),
X1,X2,...,Xk - zmienne egzogeniczne ( zmienne nielosowe ),
Zt - zmienna losowa charakteryzująca wpływ czynnika losowego.
- parametry strukturalne modelu ekonometrycznego,
Zmienna nielosowa Xk przyjmuje wartości xtk=1 dla t=1,2,...,n
Aby uprościć dalsze rozważania wprowadzimy następujące oznaczenia:
Uwzględniając wprowadzone oznaczenia , model ekonometryczny zapiszemy w postaci macierzowej, jako:
Założenia dotyczące struktury stochastycznej tego modelu są następujące:
Rozkład wektora losowego Z , a tym samym wektora Y jest rozkładem normalnym,
Nadzieja matematyczna ( średnia wartość oczekiwana ) wektora losowego Z jest wektorem zerowym [ E( Z ) =0 ] ,
Nadzieja matematyczna wektora losowego Y jest równa
=
Macierz kowariancji wektora losowego Z oraz wektora Y jest równa
, gdzie I jest macierzą jednostkową (oznacza to, że składowe wektora losowego Z są zmiennymi losowymi niezależnymi o jednakowej wariancji ).
Między zmiennymi X1,X2,...,Xk nie występuje współliniowość , co oznacza że rząd macierzy X jest równy k ( n > k), co oznacza że istnieje macierz odwrotna (XTX)-1.
Obecnie przystępujemy do szacowania nieznanych wartości parametrów strukturalnych modelu ekonometrycznego na podstawie obserwacji wykorzystując klasyczną metodę najmniejszych kwadratów ( KMNK ). Ogólną postać oceny szacowanego modelu zapiszemy w postaci macierzowej wprowadzając następujące oznaczenia:
Wektora zaobserwowanych wartości zmiennej losowej Y odpowiadające zadanym wartością zmiennych egzogenicznych, a mianowicie
Wektor ocen nielosowej części modelu ekonometrycznego, czyli
Wektor ocen szacowanych parametrów strukturalnych modelu ekonometrycznego jest następujący:
Postać dopasowanego równania do danych empirycznych można wyrazić następująco:
Wektor reszt wyraża się wzorem:
Funkcję kryterium dla dopasowania tego równania do danych empirycznych , zapiszemy w postaci macierzowej, a mianowicie:
lub
względnie
Następnie obliczając pierwszą pochodną i przyrównując ją do zera otrzymujemy :
Ostatecznie układ równań ma postać :
Ponieważ założyliśmy, że rząd macierzy wartości zmiennych objaśniających jest rzędu „k”, więc istnieje macierz odwrotna do macierzy ( XTX ).
Uwzględniając ten fakt mamy :
Jeśli znamy parametr struktury stochastycznej modelu wówczas
macierz wariancji i kowariancji wektora estymatorów parametrów modelu ekonometrycznego ma postać :
Elementy leżące na głównej przekątnej tej macierzy to wariancje estymatorów poszczególnych parametrów modelu ekonometrycznego.
Jeśli nie znamy wartości parametru struktury stochastycznej modelu wówczas znajdujemy jej nieobciążony estymator dany wzorem :
W tym przypadku macierz wariancji i kowariancji przyjmuje postać następującą:
Następnie przystępujemy do budowy przedziałów ufności dla parametrów strukturalnych modelu ekonometrycznego przyjmując współczynnik ufności równy
. Gdy znana jest wartość parametru struktury stochastycznej modelu, wówczas podstawą budowy przedziału ufności jest zmienna zdefiniowana wzorem :
która jest zmienną losową standaryzowaną podlegająca rozkładowi normalnemu N(0,1). Przy tym założeniu przedział ufności dla parametru zapiszemy następująco:
Gdy nie jest znana wartość parametru struktury stochastycznej modelu, wówczas podstawą budowy przedziału ufności dla parametrów strukturalnych modelu jest zmienna losowa zdefiniowana wzorem:
która podlega rozkładowi t- Studenta o ( n - k ) stopniach swobody.
Przy tym założeniu przedział ufności dla parametru zapiszemy w postaci :
Z kolei tak zdefiniowane zmienne, w zależności od posiadanych informacji, dla zadanego poziomu istotności
wykorzystuje się do weryfikacji hipotezy statystycznej
Jeśli korzystamy ze zmiennej losowej U, wówczas obszar krytyczny tej zmiennej losowej , przy tak sformułowanej hipotezie alternatywnej ma postać :
Jeśli obliczona na podstawie wyników obserwacji wartość sprawdzianu przy założeniu prawdziwości hipotezy zerowej
należy do obszaru krytycznego, wówczas na przyjętym poziomie
istotności
hipotezę Ho odrzucamy .
Oznacza to , że i-ta zmienna objaśniająca wpływa w sposób istotny na kształtowanie się średniej wartości zmiennej objaśnianej. Przyjmijmy , że k - ta zmienna objaśniająca spełnia warunek X=1 . W tym przypadku parametr
traktujemy jako wyraz wolny w
analitycznej postaci naszego liniowego modelu ekonometrycznego.
Jeśli więc hipotezę H0 odrzucamy , to oznacza , że wyraz wolny w
modelu jest różny od zera.
W pewnych przypadkach istotne znaczenie ma weryfikacja hipotezy zerowej sformułowanej następująco:
przy hipotezie alternatywnej H1, że przynajmniej jedna składowa powyższego wektora jest różna od zera.
Sprawdzianem tak sformułowanej hipotezy jest zmienna losowa definiowana wzorem :
Przykład budowy modelu regresji liniowej
Model regresji liniowej zmiennej zależnej y względem zbioru k zmiennych objaśniających
jest określony równaniem :
gdzie:
jest punktem przecięcia powierzchni regresji z osią rzędnych ( wyrazem wolnym ), a każde
dla i = 1,2,...,k jest nachyleniem powierzchni regresji względem osi odpowiadającej zmiennej
Przykład
Firma produkująca chemikalia nasiliła kampanię promocji swoich produktów. Oprócz reklam radiowych i telewizyjnych zorganizowała pokazy działania swoich produktów w sklepach. W ciągu 10 tygodni firma śledziła swoje wydatki na reklamę radiową i telewizyjną (zmienna
) oraz wydatki na pokazy w sklepach (zmienna
). Wielkość tygodniowej sprzedaży produktów firmy w badanym okresie potraktowano jako zmienną zależną ( objaśnianą ). Analityk zatrudniony w tej firmie podjął próbę opracowania hipotetycznego modelu liniowej regresji o postaci
, korzystając z danych zebranych w trakcie badania. Badanie zostało przeprowadzone w ciągu 10 tygodni. Zebrane dane zostały zamieszczone w poniższej tablicy.
Zebrane informacje oraz niezbędne dane potrzebne do rozwiązania układu równań normalnych.
|
|
|
|
|
|
|
|
72 |
12 |
5 |
60 |
144 |
25 |
864 |
360 |
76 |
11 |
8 |
88 |
121 |
64 |
836 |
608 |
78 |
15 |
6 |
90 |
225 |
36 |
1170 |
468 |
70 |
10 |
5 |
50 |
100 |
25 |
700 |
350 |
68 |
11 |
3 |
33 |
121 |
9 |
748 |
204 |
80 |
16 |
9 |
144 |
256 |
81 |
1280 |
720 |
82 |
14 |
12 |
168 |
196 |
144 |
1148 |
984 |
65 |
8 |
4 |
32 |
64 |
16 |
520 |
260 |
62 |
8 |
3 |
24 |
64 |
9 |
496 |
186 |
90 |
18 |
10 |
180 |
324 |
100 |
1620 |
900 |
743 |
123 |
65 |
869 |
1615 |
509 |
9382 |
5040 |
źródło : Aczel A., Statystyka w zarządzaniu. PWN, Warszawa 2000.
Parametry równania regresji szacujemy metodą najmniejszych kwadratów (MNK). Przy dwóch zmiennych objaśniających, gdy modelem populacji jest równanie
, szacujemy równanie płaszczyzny, dla której suma kwadratów reszt, czyli odchyleń (
) dla wszystkich danych punktów ( wyników obserwacji ) jest najmniejsza.
Równanie normalne o następującej postaci :
otrzymano stosując rachunek różniczkowy, tj. obliczając pochodne cząstkowe z próby i przyrównując je do zera.
Wykorzystując dane z tablicy otrzymujemy:
Rozwiązanie tego układu równań dowolną metodą daje następujące wyniki:
,
,
Dzięki wykorzystaniu programu Statistica Pl 5.0 otrzymano następujące wyniki
( 2,4704) ( 0,280263) ( 0, 305249 )
t 19, 09191 5,69128 3,76332
- wyraz wolny określany jako punkt przecięcia z osią rzędnych oznacza, że gdyby zmienne
i
przybrały wartości zero, to należałoby oczekiwać, że średnia wartość sprzedaży wynosi 47,1649
( i =1,2) - to współczynniki kierunkowe (współczynniki nachylenia względem osi x )
Ocena współczynników regresji
wskazuje na przyrost lub spadek ( gdy współczynnik jest ujemny) wartości oczekiwanej E(y) na jednostkę przyrostu
jeśli pozostałe zmienne nie zmienią się.
Ocena parametru
wynosząca 1,599 oznacza, że jeśli wydatki na reklamę radiową i telewizyjną wzrosną o jednostkę ( przy założeniu , że wydatki na pokazy w sklepach nie zmienią się ), to wówczas wartość oczekiwana wartości sprzedaży wzrośnie o 1,599.
Ocena parametru
wynosząca 1,14875 oznacza, że gdy zmienna
czyli wydatki na pokazy w sklepach wzrosną o jednostkę ( przy założeniu ,że wydatki na reklamę radiową i telewizyjną są na stałym poziomie ) to oczekiwana wartość sprzedaży wzrośnie o 1,14875.
Do oceny modelu regresji wielorakiej służy test F, który odpowiada na pytanie: czy zachodzi liniowy związek regresyjny między zmienną objaśnianą (zależną ) y i którąkolwiek zmienną objaśniającą
( i=1,2)
Test F służy do weryfikacji hipotezy statystycznej o zachodzeniu liniowego związku między zmienną y a którąkolwiek ze zmiennych
.
Formułujemy hipotezę zerową wobec hipotezy alternatywnej w sposób następujący:
nie wszystkie
( i=1,2) są równe zeru
Jeśli hipoteza zerowa jest prawdziwa to liniowy związek między zmienną y i którąkolwiek ze zmiennych objaśniających występujących w hipotetycznym równaniu regresji nie zachodzi. Analiza regresji kończy się.
Odrzucenie hipotezy zerowej oznacza, że są statystyczne podstawy do przyjęcia iż zachodzi związek liniowy między zmienną y a co najmniej jedną zmienną objaśniającą
występującą w hipotetycznym równaniu.
Wartość statystyki F wynosi 86,34. Ponieważ wartość p jest mała prawie równa zeru to odrzucamy hipotezę , że oba współczynniki kierunkowe
i
są zerowe na korzyść hipotezy alternatywnej, że nie oba są zerowe i wnioskujemy , że są podstawy przyjęcia, iż zachodzi liniowy związek regresyjny między sprzedażą i co najmniej jedną ze zmiennych.
Test F potwierdza tylko lub odrzuca hipotezę o zachodzeniu związku między zmienną zależną ( objaśnianą ) a co najmniej jedną ze zmiennych objaśniających wprowadzonych do równania regresji. Gdy przyjmiemy, że taki związek zachodzi, musimy przeprowadzić dodatkowe testy w celu, podjęcia decyzji, które współczynniki kierunkowe
,
są różne od zera, za pomocą test t.
W przykładzie
wynosi 5,69128 a
. poziom p jest bardzo mały, wobec tego możemy wnioskować, że obie zmienne są istotne.
co oznacza, że kombinacja dwóch zmiennych objaśniających - reklama radiowa i telewizyjna oraz pokazy w sklepach - wyjaśnia zmienność sprzedaży w 96,1%.Zauważmy, że
wynosi 0,95 co jest wartością bliską nieskrępowanej wartości
.
Wnioskujemy, że model regresji bardzo dobrze pasuje do wyników obserwacji, ponieważ poważna część zmienności y została wyjaśniona przez
i
.
Zweryfikowany model można wykorzystać do prognozowania.
WYKŁAD 6.
Temat wykładu : Weryfikacja modeli ekonometrycznych
Weryfikacja modelu ma na celu stwierdzenie , czy oszacowany model dobrze opisuje badane zjawisko. Postuluje się , aby :
model ekonometryczny nie budził zastrzeżeń merytorycznych
model był bardzo dobrze dopasowany do danych empirycznych
wszystkie zmienne objaśniające modelu były istotne
reszty modelu posiadały odpowiednie własności
Weryfikacja obejmuje :
weryfikację merytoryczną
weryfikację statystyczną
Weryfikacja merytoryczna polega na sprawdzeniu , czy model ekonometryczny jest zgodny z wiedzą ekonomiczną na temat badanego zjawiska , teorią ekonomii, wreszcie ze zdrowym rozsądkiem.
Podczas weryfikacji merytorycznej badamy , na przykład :
Czy sensowne są znaki parametrów modelu ?
Czy skala parametrów jest do przyjęcia ?
Czy na podstawie oszacowanego modelu można prognozować ?
Weryfikacja merytoryczna oszacowanego modelu obejmuje interpretację ekonomiczną uzyskanych ocen parametrów. Wiadomo , że ocena aj parametru strukturalnego αj , dla j=1,2,3,..., k występującego przy zmiennej Xj , oznacza o ile przeciętnie wzrasta ( gdy aj>0), albo zmniejsza się ( gdy aj<0) wartość zmiennej objaśnianej Y, gdy przy niezmienionych wartościach innych zmiennych objaśniających wartość zmiennej Xj wzrasta o jednostkę .
Przykłady niepoprawnych modeli
Przykład
Załóżmy , że został oszacowany model o następującej postaci :
gdzie :
Pt - produkcja
Mt - majątek
Zt - zatrudnienie
Ujemny znak parametru przy zatrudnieniu , nie jest sensowny , gdyż sugeruje , że produkcja wraz ze wzrostem zatrudnienia maleje , a spadkiem zatrudnienia wzrasta.
Przykład 2.
Załóżmy , że oszacowano model o następującej postaci :
Wydatki = 1,4 Dochód - 0,15 Cena
W tym modelu znaki parametrów są sensowne . Problem dotyczy skali parametrów , głównie przy dochodzie. Parametr ten jest większy od jedności , co sugeruje , że jeśli dochód wzrośnie o 1 zł , a ceny nie zmienią się , to przyrost wydatku wyniesie 1,4 , a więc więcej niż wynosi przyrost dochodu.
Weryfikacja statystyczna polega na badaniu :
Dopasowania modelu za pomocą współczynnika determinacji
Dopuszczalności modelu ze względu na współczynnik zbieżności
Wyrazistości modelu ze względu na współczynnik zmienności losowej
Istotności zmiennych objaśniających
Własności składnika losowego
Badanie dopasowania modelu za pomocą współczynnika determinacji , polega na wyznaczeniu tego współczynnika , według wzoru :
gdzie :
- wartość teoretyczna ( wyznaczona na podstawie oszacowanego modelu ) zmiennej objaśnianej dla t= 1,2,...,n
- wartość empiryczna ( zaobserwowana ) zmiennej objaśnianej w okresie t=1,...,n
- średnia arytmetyczna wartości empirycznej zmiennej objaśnianej
Współczynnik determinacji jest miarą dokładności dopasowania modelu do danych empirycznych. Współczynnik ten określa , jaka część zmienności zmiennej objaśnianej jest wyjaśniana przez model. Dla jednorównaniowego modelu ekonometrycznego z wyrazem wolnym wartość współczynnika determinacji jest wartością unormowaną z przedziału [ 0,1 ].
Skorygowany współczynnik determinacji - wykorzystuje się do oceny dopasowania modelu w przypadku , gdy n jest niewiele większe od k szacowanych parametrów. Poprawiony
jest zawsze mniejsze od R2.
Skorygowany współczynnik determinacji wyraża się wzorem :
przy czym
gdzie : R2 - współczynnik determinacji
k- liczba zmiennych objaśniających
n- liczba obserwacji
Badanie dopuszczalności modelu za pomocą współczynnika zbieżności :
Współczynnik zbieżności ( zgodności ) jest to stosunek wariancji resztowej
do wariancji zmiennej y , czyli
. Współczynnik zbieżności można zapisać za pomocą następującej formuły :
Miara ta mówi o udziale wariancji odchyleń od modelu ( reszt ) w ogólnej wariancji zmiennej objaśnianej . Im mniejsza wartość współczynnika zbieżności tym lepsze przyleganie modelu do opisywanego fragmentu rzeczywistości ekonomicznej.
Współczynnik ten jest miarą unormowaną i zawiera się w przedziale [0,1 ]. Im wartość współczynnika zbieżności jest bliższa zera, tym model lepiej opisuje badane zjawisko.
Między współczynnikiem zbieżności a współczynnikiem determinacji zachodzi relacja :
Wyrazistość modelu - możemy charakteryzować za pomocą współczynnika zmienności losowej danej wzorem :
gdzie :
- odchylenie standardowe reszt modelu
- średnia arytmetyczna zmiennej objaśnianej
Procedura weryfikacyjna polega na wyznaczeniu współczynnika zmienności losowej i porównaniu go z przyjętą z góry wartością krytyczną .
W przypadku gdy W > W* , to model można uznać za wyrazisty. W przypadku , gdy
, to model budzi zastrzeżenia i powinien być poddany ponownej obróbce.
Weryfikacja składnika losowego
W procesie estymacji parametrów modelu ekonometrycznego formułuje się szereg założeń dotyczących składnika losowego. W etapie weryfikacji należy ustalić , czy przyjęte założenia są słuszne. Do badania własności odchyleń losowych wykorzystuje się odpowiednie testy statystyczne. Przeprowadzając analizę własności odchyleń losowych możemy ocenić , czy dobór zmiennych objaśniających jest właściwy oraz czy postać analityczna modelu jest odpowiednia.
Badanie losowości
Do weryfikacji losowości składników losowych służy test liczby serii.
Punktem wyjścia jest ciąg reszt uporządkowanych według kolejności czasu, w przypadku , gdy model jest budowany na podstawie danych dynamicznych.
W przypadku , gdy model jest budowany na podstawie danych przekrojowych , reszty porządkuje się według rosnących wartości zmiennej objaśniającej ( jeśli w modelu jest jedna zmienna objaśniająca ) lub według rosnących wartości wybranej zmiennej objaśniającej ( jeśli w modelu jest wiele zmiennych objaśniających ).
Dla uporządkowanego ciągu oblicza się liczbę serii S reszt modelu . Serią jest każdy podciąg reszt złożonych wyłącznie z elementów dodatnich i ujemnych.
Z tablic testu liczby serii dla danej liczby reszt dodatnich n1 i liczby reszt ujemnych n2 oraz przyjętego poziomu istotności α ( tj. dla α/2 i 1- α/2 ) odczytujemy dwie krytyczne liczby serii :
i
.
Jeśli
, to nie ma podstaw do odrzucenia hipotezy Ho Oznacza to , że rozkład odchyleń losowych jest losowy, a postać analityczna została dobrana trafnie. Jeśli
lub
to hipotezę Ho należy odrzucić i przyjąć hipotezę H1 .
W przypadku , gdy
czyli w naszym przykładzie 3 < 6 < 9 , wobec tego nie ma podstaw do odrzucenia hipotezy Ho , co oznacza , że rozkład odchyleń jest losowy , a postać analityczna modelu została trafnie dobrana.
Badanie losowości składnika losowego - przykład
Mając dany wektor reszt
1.Formułujemy odpowiednie hipotezy statystyczne
H0 : składnik losowy ma rozkład losowy
H1 : składnik losowy nie ma rozkładu losowego
2. Przyporządkowanie resztom odpowiednich symboli
Jeżeli ei > 0 - to symbol A
Jeżeli ei < 0 - to symbol B
Uwaga ! Reszty równe zero w badaniach pomijamy.
W naszym przykładzie otrzymujemy następujący ciąg symboli
BBBAAAAABBBABBA
3. Ustalamy liczbę serii S
S=6
4. Ustalamy liczbę reszt dodatnich n1 i ujemnych n2
n1 = 7 , n2 = 8
5. Z tablic odczytujemy statystykę teoretyczną S1, dla ustalonych wartości n1, n2 i α=0,05 ( test lewostronny )
S1= 4
Z tablic odczytujemy statystykę teoretyczną S2, dla ustalonych wartości n1, n2 i α=0,05 ( test prawostronny )
S2= 12
6. Porównujemy wartości statystyk teoretycznych S1, S2 z wartościami empirycznymi S , w naszym przypadku zachodzi relacja
S1 < S < S2
to nie ma podstaw do odrzucenia hipotezy H0. Oznacza to , że rozkład reszt jest losowy.
Badanie normalności rozkładu składnika losowego - sprowadza się do weryfikacji hipotezy , że dystrybuanta odchyleń F(e ) jest równa dystrybuancie rozkładu normalnego FN ( e ).Do weryfikacji hipotezy o normalności rozkładu składnika losowego służy między innymi test zgodności Hellwiga .
Procedura testu Hellwiga jest następująca :
Przeprowadza się standaryzację reszt modelu według wzoru :
( t= 1,2,...,n )
gdzie :
- średnia arytmetyczna reszt et ( t= 1,2,...,n )
- odchylenie standardowe reszt oblicza się według wzoru :
, przy czym w przypadku szacowania modelu KMNK
Zestandaryzowane reszty porządkuje się według wartości niemalejących, w następujący sposób :
Z tablic dystrybuanty rozkładu normalnego odczytuje się wartość dystrybuanty
Wyznacza się tzw. cele It( t= 1,2,...,n ) , którymi są przedziały liczbowe o rozpiętości 1/n powstałe po podzieleniu odcinka [ 0,1 ] na n równych części.
Wartość dystrybuanty
przyporządkowuje się odpowiednim celom i określa się liczbę cel pustych K, tj. takich , do których nie trafiła żadna wartość
.
Z tablic testu zgodności Hellwiga dla danej liczby obserwacji n oraz dla przyjętego poziomu istotności α odczytuje się krytyczną liczbę cel pustych K* tak , że
.
Przykład
1. Należy uporządkować reszty i zestandaryzować
2. Należy odczytać z tablic dystrybuanty rozkładu normalnego wartości F ( u i )
3. Należy utworzyć przedziały Ii „ cele „
0, 00000 - 0,06667 ++
0,06667 - 0,13333 +
0,13333 - 0, 2000 -
0,20000 - 0,26667 ++
0,26667 - 0,33333 -
0,33333 - 0,40000 +
0,40000 - 0,46667 ++
0,0,46667 - 0,53333 -
0,53333 - 0,60000 -
0,60000 - 066667 +
0,66667 - 0,73333 -
0,73333 - 0,80000 ++
0,80000 - 0,86667 +++
0,86667 - 0,93333 -
0,93333 - 1,0000 +
4. Ustalamy liczbę cel pustych K emp. = 6
5. Odczytujemy z tablic zgodności Hellwiga dla n=15 i α=0,05 wartości statystyk teoretycznych K1 i K2
K1 = 2
K2 = 7
W rozpatrywanym przypadku zachodzi nierówność
K1< Kemp < K2 .
Oznacza to , że nie ma podstaw do odrzucenia HO , rozkład reszt jest zbliżony do rozkładu normalnego
Badanie autokorelacji odchyleń losowych
Celem badania jest sprawdzenie jednego z założeń KMNK , który brzmi :„ autokorelacja odchyleń losowych nie występuje (ciąg reszt jest ciągiem niezależnych zmiennych losowych)
Autokorelacja oznacza liniową zależność odchyleń losowych pochodzących z różnych okresów badania.
Badanie przeprowadzamy dla modeli zbudowanych w oparciu o czasowe szeregi danych.
Jeżeli autokorelacja występuje , oznacza to , że nie zostało spełnione jedno z założeń KMNK. Należy wrócić do etapu III procedury badań ekonometrycznych i dokonać ponownej estymacji parametrów metodą różniczki zupełnej.
Przyczyny autokorelacji
1.Własności pewnych zjawisk ekonomicznych
2.Błędy w sztuce ekonometrycznej
W większości przypadków , jeśli autokorelacja ma miejsce, to jest to autokorelacja pierwszego rzędu. Zdarzają się jednak sytuacje , gdy zachodzi autokorelacja wyższych rzędów , mimo , że nie występuje autokorelacja pierwszego rzędu.
Test Durbina - Watsona służy do badania autokorelacji pierwszego rzędu. Aby możliwe było zastosowanie tego testu , rozpatrywany model musi zawierać wyraz wolny. Składnik losowy powinien mieć rozkład normalny i w roli zmiennej objaśniającej nie może występować zmienna endogeniczna opóźniona w czasie .
Badanie autokorelacji odchyleń losowych
1.Etap 1
Sformułowanie hipotez statystycznych
Współczynnik korelacji reszt dotyczących okresów t z resztami z okresu poprzedniego t-1 nieistotnie różni się od zera - autokorelacja nie występuje
Współczynnik korelacji reszt dotyczących okresu t z resztami z okresu poprzedniego t-1 istotnie różni się od zera- autokorelacja występuje.
Etap 2.
Obliczenie współczynnika korelacji reszt z okresu t z resztami opóźnionymi o 1 okres ( współczynnik autokorelacji ) według wzoru
Gdzie
et - reszty z okresu bieżącego
et-1 - reszty opóźnione o jeden okres
Etap 3
Obliczenie statystyki empirycznej d według wzoru :
Etap 4
Odczytanie z tablic do testu Durbina - Watsona wartości statystyk teoretycznych dL i dU dla przyjętego poziomu istotności α, n obserwacji oraz k zmiennych objaśniających.
Etap 5
Jeżeli
To występuje autokorelacja dodatnia .
1.Gdy d > du - to nie ma podstaw do odrzucenia H0, współczynnik autokorelacji jest nieistotny , autokorelacja nie występuje
2.Gdy d < d L - to H0 należy odrzucić na rzecz H1, współczynnik autokorelacji istotnie różni się od zera , występuje autokorelacja pierwszego rzędu
3.Gdy
To przy użyciu testu Darbina - Watsona nie można podjąć żądnej decyzji . Należy zastosować inny test.
Jeżeli
To występuje autokorelacja ujemna . Należy obliczyć wartość statystyki d` , czyli d` = 4 - d
1. Gdy d` < dL - H0 należy odrzucić na rzecz H1, współczynnik autokorelacji istotnie różni się od zera , występuje autokorelacja pierwszego rzędu
2.Gdy d` > du - nie ma podstaw do odrzucenia H0 współczynnik autokorelacji jest nieistotny , autokorelacja nie występuje
3. Gdy
Nie można podjąć żadnej decyzji , należy zastosować inny test.
Test t - Studenta służy do badania autokorelacji pierwszego i wyższych rzędów
Etap I Sformułowanie hipotez statystycznych
Współczynnik korelacji reszt dotyczących okresu t z resztami z okresu t - r (gdzie r = 1,2,...,n ) nieistotnie różni się od zera - autokorelacja nie występuje .
Współczynnik korelacji reszt dotyczących okresu t z resztami z okresu t - r ( gdzie r = 1,2,...,n ) istotnie różni się od zera - występuje autokorelacja.
Etap II Obliczenie współczynnika korelacji reszt z okresu t z resztami opóźnionymi o r ( współczynnik autokorelacji ) według wzoru
Etap III Obliczenie statystyki empirycznej te według wzoru
Etap IV
Odczytanie z tablic do testu t- Studenta wartości statystyki teoretycznej tt dla zadanego poziomu istotności α i n-2-r stopni swobody
Etap V
Sprawdzenie poniższych zależności
Gdy
To nie ma podstaw do odrzucenia H0 , współczynnik autokorelacji nieistotnie różni się od zera - autokorelacja nie występuje.
Jeżeli te > tt to należy odrzucić hipotezę zerową ,na rzecz hipotezy alternatywnej - współczynnik autokorelacji istotnie różni się od zera - autokorelacja występuje.
Przykład
Badanie autokorelacji pierwszego rzędu z wykorzystaniem testu Durbina - Watsona
Wyniki obliczeń - współczynnika autokorelacji i statystyki Durbina - Watsona
wynoszą odpowiednio :
d= 1,2840855
n=15
k=2
dL =095
dU = 1,54
Gdy zachodzi następująca zależność :
dL < d < dU
To na podstawie testu Durbina - Watsona nie można podjąć decyzji o braku autokorelacji pierwszego rzędu.
Do zweryfikowania hipotez statystycznych należy zatem wykorzystać test t - Studenta .
Badanie autokorelacji pierwszego rzędu z wykorzystaniem testu t - Studenta
Krok 1. Formułujemy hipotezy statystyczne
Krok 2 . Obliczamy współczynnik autokorelacji , który wynosi
Krok 3. Obliczamy statystykę empiryczną t , która wynosi te = 1,1982099
Krok 4 . Odczytujemy z tablic rozkładu t- Studenta , dla poziomu istotności α = 0,05
i n-2-1 =12 stopni swobody , statystykę teoretyczną tt = 2,179
Krok 5 . Sprawdzamy relacje , gdy zachodzi nierówność te < tt to nie ma podstaw do odrzucenia H0 i można przyjąć , że nie występuje autokorelacja odchyleń losowych pierwszego rzędu.
Badanie autokorelacji drugiego rzędu z wykorzystaniem testu t- Studenta
1.Formułujemy hipotezy statystyczne
2.Obliczamy wartość współczynnika korelacji , który wynosi :
Uwaga ! Przy obliczaniu współczynnika korelacji nie uwzględnia się dwóch pierwszych elementów wektora reszt z okresu t i dwóch ostatnich elementów wektora reszt z okresu t-2
3. Obliczamy wartość statystyki empirycznej te, która w naszym przykładzie wynosi te = 0,073159082
4. Odczytujemy z tablic rozkładu t- Studenta , dla przyjętego poziomu istotności α=0,05 i n - 2 - 2 = 11 stopni swobody , statystyka tt = 2,201
5. Sprawdzamy relację , w naszym przypadku te < tt. Nie ma podstaw do odrzucenia H0 , można przyjąć , że nie występuje autokorelacja odchyleń losowych drugiego rzędu.
Badanie symetrii i stałości wariancji składnika losowego
Celem badania symetrii rozkładu składnika losowego jest sprawdzenie poprawności doboru postaci analitycznej modelu.
Jeżeli rozkład elementu losowego okaże się niesymetryczny , to należy wrócić do etapu II i dokonać ponownego wyboru postaci analitycznej modelu.
Sprawdzanie symetrii rozkładu elementu losowego.
Etap 1. Sformułowanie hipotez statystycznych
Element losowy ma rozkład symetryczny
Element losowy nie ma rozkładu symetrycznego
Gdzie : m - to liczba reszt dodatnich lub ujemnych
Etap 2 . Ustalenie wektora reszt e
Etap 3. Ustalenie liczby reszt dodatnich lub ujemnych
Uwaga ! Reszty równe zero w badaniach pomijamy
Etap 4. Zweryfikowanie na podstawie testów hipotez postawionych w etapie 1
Badanie symetrii za pomocą testu t- Studenta ( tylko dla małej próby )
Wyznaczenie statystyki według wzoru :
Statystykę teoretyczną tt odczytujemy z tablic rozkładu t- Studenta , dla zadanego poziomu istotności α i n-1 stopni swobody .
Jeżeli
To nie ma podstaw do odrzucenia H0, czyli rozkład jest symetryczny. Jeżeli spełniona jest nierówność
te > tt
To należy odrzucić H0 na rzecz H1 , rozkład reszt nie jest symetryczny.
Przykład
1.Formułujemy odpowiednie hipotezy statystyczne
2.Ustalamy wektor reszt e ( Zakładamy , że wektor reszt wynosi odpowiednio jak w poprzednich przykładach )
3. Określamy liczbę reszt dodatnich m+ oraz liczbę obserwacji n m+ = 7 , n= 15
4. Obliczamy wartość statystyki empirycznej te
5.Z Tablic t- Studenta odczytujemy wartość tt , dla n=15 i α=0,05 , tt = 2,145
6. Zachodzi nierówność te < tt .
Wobec tego rozkład jest symetryczny.
Badanie stacjonarności odchyleń losowych
Celem jest sprawdzenie stałości wariancji odchyleń losowych .
Jeżeli moduły reszt są skorelowane z czasem , to rozkład odchyleń losowych nie jest stacjonarny .
Badanie to przeprowadza się dla modeli zbudowanych w oparciu o szeregi czasowe danych.
Weryfikacja stacjonarności odchyleń losowych
Etap 1 . Sformułowanie hipotez statystycznych
Współczynnik korelacji modułów reszt z czasem nieistotnie różni się od zera, możemy przyjąć , że rozkład odchyleń losowych jest stacjonarny
Współczynnik korelacji modułów reszt z czasem istotnie różni się od zera, możemy przyjąć , że rozkład odchyleń losowych nie jest stacjonarny
Etap 2. Obliczenie współczynnika korelacji modułów reszt z czasem według wzoru
Gdzie : t- zmienna czasowa
Etap 3. Obliczenie statystyki empirycznej te według wzoru :
Etap 4. Odczytanie z tablic rozkładu t- Studenta wartości statystyki teoretycznej tt, dla zadanego poziomu istotności α i n-2 stopni swobody
Etap 5. Sprawdzenie poniższych zależności
Jeżeli spełniona jest powyższa relacja to nie ma podstaw do odrzucenia H0 , współczynnik korelacji modułów reszt z czasem nieistotnie różni się od zera ( wariancja odchyleń losowych jest stała )
Jeżeli te > tt
to należy odrzucić H0 , na rzecz H1, współczynnik korelacji modułów reszt z czasem istotnie różni się od zera ( wariancja odchyleń losowych zmienia się w czasie )
Badanie istotności parametrów strukturalnych modelu.
Celem badania jest sprawdzenie istotności wpływu zmiennych objaśniających na zmienną objaśnianą.
Uwaga ! Warunkiem badania istotności parametrów strukturalnych jest spełnienie założenia o normalności rozkładu reszt.
Test F Fishera - Snedecora Jest najbardziej ogólnym testem statystycznym , który sprawdza czy przynajmniej jeden parametr strukturalny w sposób istotny różni się od zera.
Schemat postępowania przy weryfikacji istotności parametrów strukturalnych , z wykorzystaniem testu F Fishera - Snedecora.
Etap 1. Sformułowanie hipotez statystycznych
przy hipotezie alternatywnej H1, że przynajmniej jedna składowa powyższego wektora jest różna od zera .
Etap 2. Wyznaczenie statystyki empirycznej F wyrażonej wzorem
Statystyka ta ma rozkład F o m1 = k ( k liczba zmiennych objaśniających modelu ) oraz m2 = n - ( k+1) stopniach swobody.
Statystykę teoretyczną F* odczytuje się z tablic do testu F dla zadanego poziomu istotności α oraz m1 i m2 stopni swobody.
Etap 3. Sprawdzanie poniższych zależności
Gdy zachodzi taka relacja , to brak podstaw do odrzucenia Ho , co oznacza , że wszystkie parametry strukturalne modelu w sposób nieistotny różnią się od zera, czyli procedurę budowy modelu trzeba rozpocząć od początku , ponieważ należy usunąć wszystkie zmienne objaśniające modelu .
W przypadku , gdy spełniona jest nierówność F > F*
to należy odrzucić H0 na rzecz H1 , co oznacza , że przynajmniej jeden z parametrów strukturalnych modelu w sposób istotny różni się od zera.
Jeżeli w wyniku weryfikacji istotności parametrów strukturalnych z wykorzystaniem test F Fishera - Snedecora okazało się , że przynajmniej jeden parametr strukturalny modelu jest istotnie różny od zera , wówczas należy sprawdzić istotność wszystkich parametrów strukturalnych modelu ( istotności wyrazu wolnego nie bada się ). W tym celu pomocny staje się test t- Studenta.
Test t- Studenta Schemat postępowania przy badaniu istotności parametrów strukturalnych z wykorzystaniem testu t- Studenta.
Etap I . Sformułowanie hipotez statystycznych
Ocena parametru strukturalnego stojącego przy i- tej zmiennej objaśniającej nieistotnie różni się od zera .
Ocena parametru strukturalnego stojącego przy i-tej zmiennej objaśniającej istotnie różni się od zera
Etap II . Wyznaczenie statystyki empirycznej według wzoru
Etap III. Odczytanie statystyki teoretycznej tt z tablic rozkładu t- Studenta dla danego poziomu istotności α i n-( k+1) stopni swobody
Etap IV Porównanie zależności
Jeśli zachodzi relacja
to nie ma podstaw do odrzucenia H0 czyli ocena parametru stojącego przy i-tej zmiennej objaśniającej nieistotnie różni się od zera
Jeśli spełniona jest nierówność
to należy odrzucić H0 na rzecz H1, ocena parametru stojącego przy i - tej zmiennej objaśniającej istotnie różni się od zera.
Wykład 7. Wprowadzenie do prognozowania
Termin „ prognoza „ został wprowadzony do nauki przez Hipokratesa. W medycynie prognoza oznacza rokowanie o rozwoju i skutkach choroby .Greckie słowo gnoza oznacza wiedzę, zaś „ prognoza „ to uprzednia wiedza, przewidywanie. Pojęcie „ prognozy „ było różnie definiowane w literaturze. W definiowaniu prognozy głównym problemem jest czas, powstaje pytanie : czy prognoza powinna dotyczyć tylko przyszłości ?
H. STEINHAUS stoi na stanowisku, że prognoza to zarówno przepowiednia jak i szacowanie, a zatem nie uważał, iż prognoza musi dotyczyć przyszłości.
Takie stanowisko można również znaleźć w pracy Z. Hellwiga .Przez prognozę statystyczną rozumie każdy sąd, którego prawdziwość jest zdarzeniem losowym, przy czym prawdopodobieństwo tego zdarzenia jest znane i wystarczająco duże dla celów praktycznych. Z definicji tej wynika, że prognoza statystyczna i hipoteza statystyczna to pojęcia o zbliżonym znaczeniu.
S. Ostasiewicz rozumuje podobnie, twierdząc, że dopóki prognozowanie rozpatrujemy z logicznego punktu widzenia, to nie ma żadnej różnicy w postępowaniu nazywanym wyjaśnianiem a prognozowaniem, w obu przypadkach na podstawie teorii dedukujemy nowe fakty, a nowe to już istniejące, ale nam nie znane, lub takie, które nie miały miejsca.
W. Sadowski reprezentuje podobny pogląd. W pracy „Diagnoza i prognoza „ , traktując prognozę jako informację X o stanie świata zewnętrznego Z, przy czym informacja X może być bezpośrednią lub też pośrednią informacją o stanie Z.
A.Smoluk definiuje prognozę jako „ wnioskowanie o rzeczach niedostępnych bezpośrednio poznaniu, przeszkodą może być czas, przestrzeń lub jeszcze coś innego „
Definicja prognozy jako sądu o przyszłości posiada wielu zwolenników, wśród nich na uwagę zasługują prace takich autorów jak : Z. Pawłowski, A. Zeliaś, oraz Z. Czerwiński.
W pracach Z. Pawłowskiego można znaleźć rozróżnienie takich pojęć jak : predykcja i prognoza. Przez predykcję rozumie ogół zasad i metod wnioskowania o przyszłości na podstawie odpowiedniego modelu ekonometrycznego, opisującego pewien wycinek życia gospodarczego, natomiast prognoza to konkretny wynik predykcji.
Podobny pogląd reprezentuje A. Zeliaś w pracy: Teoria prognozy. Polskie Wydawnictwo Ekonomiczne. Warszawa 1997.
Prognozowanie według Z. Czerwińskiego, jest działalnością intelektualną , jest zawsze czyjąś prognozą ( osoby, zespołu osób, ogólnie prognostyka . ( Z. Czerwiński : Dylematy ekonomiczne. PWE, Warszawa,1992 )
Zdaniem M. Cieślak , prognozą określa się sąd o następujących właściwościach:
1. sformułowany z wykorzystaniem dorobku nauki
odnoszący się do określonej przyszłości
weryfikowalny empirycznie
niepewny, ale akceptowany.
Prognozy mogą spełniać szereg funkcji, w literaturze wymienia się :
funkcja preparacyjna czyli wspomagająca proces decyzyjny
funkcja aktywizująca prognozy polega na pobudzeniu do podejmowania działań sprzyjających realizacji prognozy, gdy zapowiada ona zdarzenia korzystne, i przeciwstawiających się jej realizacji, gdy przewidywane zdarzenia są oceniane jako niekorzystne
funkcja informacyjna, polegająca na oswajaniu ludzi z nadchodzącymi zmianami i zmniejszaniu lęku przed przyszłością
funkcja ostrzegawcza ma na celu ostrzeżenie przed nadejściem niepożądanych wydarzeń
funkcja badawcza sprowadza się do rozpoznania przyszłości
Podział prognoz ze względu na różne kryteria:
Ze względu na horyzont czasowy wyróżnia się : prognozy długo, średnio- i krótkookresowe,
perspektywiczne, operacyjne i strategiczne.
Ze względu na charakter lub strukturę :prognozy proste i złożone, ilościowe i jakościowe.
Ze względu stopień szczegółowości: prognozy ogólne i szczegółowe
Ze względu na zakres ujęcia :prognozy całościowe i częściowe, globalne i odcinkowe, kompleksowe i fragmentaryczne
Ze względu na zasięg terenowy :prognozy światowe, międzynarodowe, krajowe, regionalne ze względu na metodę opracowania: prognozy indukcyjne, dedukcyjne, minimalne i inne
Ze względu na cel i funkcję: prognozy ostrzegawcze, badawcze, normatywne, aktywne, pasywne i inne.
Procedura prognozowania obejmuje:
sformułowanie zadania prognostycznego ( polega na określeniu obiektu, zjawiska, zmiennych, które mają podlegać prognozowaniu oraz określeniu celu sporządzania prognoz i wymagań co do dopuszczalności i horyzontu prognozy ).
określenie przesłanek prognostycznych ( sprowadza się do sformułowania hipotez o czynnikach kształtujących zjawisko, zebranie zbioru danych potrzebnych do sporządzenia prognoz ).
wybór metody prognozowania (metody matematyczno- statystyczne czy nie matematyczne)
wyznaczenie prognozy ( zgodnie z założeniami przyjętymi w pierwszym etapie )
ocena dopuszczalności prognozy ( za pomocą odpowiednich miar )
weryfikacja prognozy polega na określeniu trafności prognoz za pomocą odpowiednich mierników.
Zasady predykcji
Zasady predykcji określają pewne warunki, jakie powinny być spełnione przy wyznaczaniu prognozy. W literaturze wymienia się dwie zasady :
1.zasada predykcji nieobciążonej polega na tym, że prognozę ustala się na poziomie nadziei matematycznej zmiennej prognozowanej w okresie t, a więc tak aby
. zasada ta ma znaczenie wówczas, gdy proces wnioskowania może być powtarzany wiele razy.
W warunkach jednorazowo przeprowadzanej predykcji zasada nieobciążoności traci na znaczeniu, wówczas należy stosować zasadę największego prawdopodobieństwa.
2.Zasada największego prawdopodobieństwa, polega na tym, że gdy zmienna prognozowana jest skokowa to za prognozę przyjmuje się tę wartość zmiennej, której odpowiada największe prawdopodobieństwo realizacji w czasie t, a przy zmiennej ciągłej prognoza jest równa tej zmiennej, dla której funkcja gęstości prawdopodobieństwa zmiennej y w okresie t posiada maksimum.
Podstawowe założenia predykcji
1.Znajomość ekonometrycznego modelu dla zmiennej prognozowanej
2.Stabilność w czasie relacji strukturalnych
3.Stabilność rozkładu składnika losowego
4.Znajomość wartości zmiennych objaśniających w okresie prognozowanym
5.Dopuszczalność ekstrapolacji poza próbę statystyczną
Prognoza punktowa i przedziałowa
Do prognozowania posługujemy się modelem oszacowanym na podstawie danych z okresów t=1,2,...,n mającym postać :
dla którego znane jest oszacowanie macierzy wariancji kowariancji estymatora a, czyli
Symbolem T oznaczymy okres prognozy, t > n .
Prognoza punktowa
Zakładamy, że wartości zmiennych egzogenicznych w modelu dla okresu t ma postać :
Prognozę wartości zmiennej endogenicznej w okresie prognozowanym ( T) wyznaczamy ze wzoru:
dla prognozy punktowej, średni błąd predykcji ex ante wyraża się wzorem :
Jeśli spełnione jest założenie, mówiące o tym, że składnik losowy w każdym z okresów ma rozkład normalny o wartości oczekiwanej 0 i skończonej i stałej wariancji
(
dla t = 1, 2, ..., n , to na podstawie modelu ekonometrycznego można wyznaczyć prognozy przedziałowe.
Przedział ufności ma postać następującą:
gdzie:
- jest przyjętym poziomem ufności
- odpowiednią wartością krytyczną odczytaną z tablic rozkładu t- Studenta
Otrzymany przedział liczbowy
stanowi prognozę przedziałową zmiennej y na okres T, a prawdopodobieństwo
jest miarą wiarygodności prognozy.
Wykorzystanie modelu regresji liniowej do prognozowania.
Regresja jest terminem, który na trwale zajął miejsce w statystyce i ekonometrii. oznacza on statystyczne metody modelowania związków między zmiennymi. Najpierw zajmiemy się prostą regresją liniową czyli modelowaniem związku między dwiema zmiennymi : zmienną zależną ( objaśnianą , endogeniczną ) oznaczoną jako y i zmienną niezależną (objaśniającą)
oznaczoną jako x.
Wyznaczanie prognozy punktowej i przedziałowej na podstawie modelu regresji.
Przykład Firma American Exspress jest przekonana, że posiadacze jej kart kredytowych podróżują w interesach lub dla przyjemności więcej niż inni ludzie. w ramach obszernych badań prowadzonych przez nowojorską firmę marketingową na zlecenie American Exspress podjęto próbę ustalenia związku między długością trasy podróży a obciążeniem karty kredytowej jej posiadacza.
Firma marketingowa pobrała próbę 25 posiadaczy kart kredytowych American Express zapisanych w rejestrze komputera i odnotowała obciążenia tych kart w pewnym okresie. do posiadaczy kart kredytowych rozesłano kwestionariusze z prośbą o podanie długości tras odbytych przez nich podróży. W tym samym czasie zebrano i przedstawiono w poniższej tablicy dane do badania przeprowadzonego na zlecenie firmy American Ekspress.
obciążenie kart ($)-y |
Długość tras (w milach)-x |
1 802 |
1 211 |
2 405 |
1 345 |
2 005 |
1 422 |
2 511 |
1 687 |
2 332 |
1 849 |
2 305 |
2 026 |
3 016 |
2 133 |
3 385 |
2 253 |
3 090 |
2 400 |
3 694 |
2 468 |
3 371 |
2 699 |
3 998 |
2 806 |
3 555 |
3 082 |
4 692 |
3 209 |
4 244 |
3 466 |
5 298 |
3 643 |
4 801 |
3 852 |
5 147 |
4 033 |
5 738 |
4 267 |
6 420 |
4 498 |
6 059 |
4 533 |
6 426 |
4 804 |
6 321 |
5 090 |
7 026 |
5 233 |
6 964 |
5 439 |
Na podstawie zebranych danych należy sporządzić wykres w którym rozrzut punktów będzie świadczył czy linia prosta będzie dobrze opisywała badaną zależność. Prezentując dane na wykresie można uzyskać odpowiedź na pytanie: czy występuje tendencja do wzrostu obciążenia kart kredytowych w miarę jak wzrasta długość tras podróży.
Wykorzystując program Statistica Pl, otrzymano następujące wyniki:
Oszacowany model ma postać następującą :
( 170,3368) ( 0,0497
t 1,61357 25,24821
- współczynnik determinacji
- współczynnik determinacji poprawiony
- błąd standardowy estymacji, informuje o przeciętnej wielkości odchyleń empirycznych wartości zmiennej zależnej od wyliczonych z modelu ( teoretycznych ). Mówi nam o stopniu dopasowania modelu do danych empirycznych. Im
mniejsze, tym lepiej dopasowany model.
Interpretacja ekonomiczna uzyskanych wyników
Ocena parametru
wynosząca 274,8497 oznacza, że gdyby zmienna x czyli długość tras przybrała wartość zerową, to należałoby oczekiwać, że średnie obciążenie kartami kredytowymi wyniesie 274,8497.
Ocena parametru
wynosi 1,2553 co oznacza, że jeśli długość tras wzrośnie o jednostkę, to należy oczekiwać, że średnie obciążenie kartami kredytowymi wzrośnie o 1,2553.
Błąd standardowy estymacji wynosi 318,16 - co oznacza, że przewidywane przez oszacowane równanie wartości zmiennej objaśnianej - obciążenie kart kredytowych średnio różnią się od empirycznych wartości tej zmiennej o 318,16.
Odchylenia standardowe estymatorów zwane średnimi albo standardowymi błędami szacunku parametrów wynoszą odpowiednio:
,
Możemy powiedzieć, że szacując wyraz wolny
wynoszący 274,8497 mylimy się średnio o 170,3368, a szacując parametr
stojący przy zmiennej x (długość tras ), wynoszący 1,2553 mylimy się średnio o 0,0497 . Powstaje pytanie, czy to dużo czy mało ?
Standardowe błędy szacunku nie są w praktyce wygodne do interpretacji, dużo łatwiej zinterpretować iloraz t zdefiniowany jako stosunek oceny do błędu szacunku parametrów.
Okazuje się, że ocena wyrazu wolnego jest 1,6 razy większa od błędu szacunku , natomiast w przypadku oceny parametru stojącego przy x , aż 25,3 razy większa od błędu szacunku.
Współczynnik determinacji wynoszący 0,9651 wskazuje na dobre dopasowanie równania do danych empirycznych. można powiedzieć, że za pomocą równania ( lub za pomocą zmiennych objaśniających) udało się objaśnić ) 0,9651 zmienności zmiennej objaśnianej, mówiąc prościej, że wahania zmiennej objaśnianej udało się objaśnić w 96,51%.
Przeprowadzona weryfikacja ( ocena ) modelu pod względem merytorycznym i statystycznym pozwala dopuścić oszacowaną funkcję regresji do prognozowania.
Prognozy punktowe na podstawie równania regresji jest bardzo łatwo stawiać. A cały zabieg sprowadza się do podstawienia za x takiej wartości, dla której chcemy przewidzieć wartość y.
Przypuśćmy, że w rozpatrywanym przykładzie z kartami kredytowymi American Exspress, chcemy przewidzieć, jakie będzie obciążenie kart kredytowych wśród tych posiadaczy kart, których trasa podróży osiągnie 4 000 mil w badanym okresie ?
Prognoza punktowa wyniesie:
Prognozy punktowe nie są wolne od wad i mogą być błędne. Błąd może pochodzić zarówno z niepewności szacunków, jak i z losowej zmienności położenia punktów w stosunku do linii regresji.
Prognozy przedziałowe
Jeśli spełnione jest założenie, mówiące o tym, że składnik losowy w każdym z okresów ma rozkład normalny o wartości oczekiwanej 0 i skończonej i stałej wariancji
(
dla t = 1, 2, ..., n ,to na podstawie modelu regresji liniowej można wyznaczyć prognozy przedziałowe.
Przedział predykcji ma postać następującą:
gdzie:
- jest przyjętym poziomem ufności
- wartość prognozy w punkcie
- średni błąd predykcji wyznaczony według wzoru
, n - liczba obserwacji,
- wartość t- Studenta odczytana z tablic rozkładu Studenta
gdy n < 30, przy przyjętym poziomie istotności i wyznaczonych stopniach swobody.
Otrzymany przedział liczbowy
stanowi prognozę przedziałową zmiennej y na okres T, a prawdopodobieństwo
jest miarą wiarygodności prognozy.
W naszym przykładzie przedział predykcji wynosi :
[ 5139,736 ; 5452,634 ]
Opierając się na wynikach badań możemy mieć 95 % zaufania do prognozy, że posiadacz karty, który przebył trasę o długości 4 000 mil w badanym okresie obciąży swoją kartę kredytową sumą od 5 139,736 do 5 452,634.
Wykład 8 Możliwości wykorzystania jednorównaniowych modeli ekonometrycznych w praktyce
Ekonometryczna analiza procesu produkcyjnego
Funkcją produkcji - tradycyjnie nazywa się model zależności pomiędzy wartością lub wielkością produkcji ( firmy , gospodarki ) a nakładami czynników produkcji użytych do wytwarzania tej produkcji (pracy , kapitału , surowców itp. ). Najczęściej rozpatruje się dwuczynnikową funkcje produkcji , uwzględniając kapitał ( K ) i pracę ( L ) jako dwa główne czynniki produkcji - jest to duże uproszczenie i uogólnienie tego zjawiska .
Opis rzeczywistych procesów produkcyjnych może wymagać uwzględnienia bardziej subtelnych podziałów i rozróżnień
Przy oznaczeniu wielkości ( wartości ) produkcji przez Q , wartości kapitału przez K oraz nakładów pracy przez L , funkcję produkcji można zapisać jako:
Q = (K,L)
Przy użyciu funkcji produkcji możemy badać , czy modelowany proces produkcji posiada pewne własności znane z ekonomii. Są one związane z wpływem zmian poszczególnych czynników produkcji na jej poziom, ze współzależnością pomiędzy czynnikami itp.. Gdy interesuje nas , jak zmieni się poziom produkcji pod wpływem zmian nakładu jednego z czynników produkcji , badamy krańcową produktywność danego czynnika
Krańcową produktywność danego czynnika obliczamy jako pochodną cząstkową funkcji produkcji względem danego czynnika , czyli
Krańcowa produktywność danego czynnika oznacza, o ile w przybliżeniu zmieni się wielkość produkcji , jeśli zwiększy się zużycie tego czynnika o jednostkę , przy nie zmienionych nakładach pozostałych czynników.
Często nie wystarcza wiedza o tym , o ile wzrośnie lub zmaleje produkcja w wielkościach absolutnych. Trzeba badać względne przyrosty produkcji pod wpływem zmian czynnika .
Elastyczność produkcji względem danego czynnika oznacza względny przyrost produkcji wywołany względnym wzrostem nakładu tego czynnika , przy pozostałych nakładach nie zmienionych.
Do obliczenia elastyczności produkcji Q względem nakładów czynnika X korzystamy z wzoru
lub w przybliżeniu
Ważnym zagadnieniem jest możliwość zastępowania w procesie produkcyjnym zużycia jednego czynnika przez inny , bez zmiany wielkości produkcji. Może się bowiem zdarzyć , że przy produkcji występują pewne ograniczenia dotyczące wykorzystania jednego z czynników. Jeśli istnieje możliwość substytucji , to tę samą wielkość produkcji można uzyskać przy zastępowaniu różnych kombinacji czynników. Substytucja czynników produkcji polega bowiem na możliwości zastępowania w procesie produkcyjnym zużycia jednego z czynników innymi czynnikami bez zmiany wielkości produkcji.
Następne ważne zagadnienie dotyczy tego , w jakim stopniu wielkość produkcji „ zareaguje „ na zwielokrotnienie zużycia czynników produkcji. Chodzi tu o możliwość zwiększenia poziomu produkcji dzięki zwiększeniu nakładów czynników.
Jeśli zwiększenie w jednakowym stopniu nakładów każdego z czynników produkcji powoduje zwiększenie wielkości produkcji w tym samym stopniu , to mówimy o stałych przychodach (korzyściach) skali. Jeśli powoduje zwiększenie produkcji w mniejszym stopniu - mamy do czynienia z malejącymi przychodami skali , a jeśli stopień zwiększania produkcji przekracza stopień wzrostu nakładów - z rosnącymi przychodami skali.
W celu sprawdzenia , z którym typem funkcji produkcji mamy do czynienia : o rosnących , malejących czy stałych przychodach skali , posługujemy się pojęciem jednorodności funkcji
Funkcja produkcji jednorodna stopnia r =1 charakteryzuje się stałymi korzyściami skali , funkcja jednorodna stopnia r < 1 , malejącymi korzyściami skali , a jednorodna stopnia r > 1 , rosnącymi korzyściami skali.
Funkcja produkcji prawidłowo opisująca rzeczywisty proces produkcji powinna posiadać następujące własności :
• Krańcowa produktywność każdego z czynników produkcji jest dodatnia
• Krańcowa produktywność każdego z czynników maleje wraz ze wzrostem nakładu tego czynnika
• Krańcowa produktywność każdego z czynników rośnie wraz ze wzrostem nakładu innego czynnika
• Krańcowa stopa substytucji czynników maleje wraz ze wzrostem nakładów każdego z czynników
Funkcja produkcji Cobba _ Douglasa jest jedną z funkcji powszechnie stosowanych do opisu procesu produkcji. Postać tej funkcji jest następująca :
Jest to funkcja potęgowa o argumentach oznaczających kolejne czynniki produkcji.
Można również uwzględnić zmiany w czasie , nie związane ze zmianami nakładów czynników produkcji. Są to tak zwane zmiany autonomiczne. Wyraża się je wprowadzając do wzoru określającego tę funkcję czynnik eγ
Funkcja przyjmuje wtedy postać uogólnionej ( dynamicznej ) funkcji Cobba - Dauglasa
W celu zbadania elastyczności tej funkcji względem każdego z czynników obliczamy pochodne cząstkowe Q względem K oraz L.
Elastyczność funkcji Cooba - Dauglasa względem każdego czynnika jest więc stała i równa odpowiedniemu wykładnikowi potęgi.
Przykład
Oszacowano funkcję produkcji dla pewnego przedsiębiorstwa i otrzymano
Wnioski o modelowanym procesie produkcji :
1. Elastyczność produkcji względem kapitału jest równa 0,13 , czyli zwiększenie zużycia kapitału o jeden procent spowoduje wzrost produkcji równy w przybliżeniu o 0,13 procenta
2.Elastyczność produkcji względem pracy jest równa0,75
3.Suma ocen wykładników wynosi 0,88 , jest mniejsza od jedności , zatem badana funkcja produkcji wykazuje malejące korzyści skali.
Ekonometryczny model kosztów
Koszty - encyklopedyczna definicja
1.Wyrażone w pieniądzu zużycie środków produkcji i siły roboczej niezbędne w celu pozyskiwania dobra ( produktu lub usług )
2.Wszystkie zmniejszenia majątku niezbędne , aby produkt doprowadzić do stanu umożliwiającego jego sprzedaż .
Zadaniem ekonometrycznej analizy kosztów jest skonstruowanie modelu zależności kosztów całkowitych lub jednostkowych produkcji od czynników na nie wpływających.
Z. Pawłowski wyróżnia trzy grupy czynników determinujących koszty własne. Są to :
• czynniki obiektywne
• czynniki subiektywne
• czynniki przypadkowe
Do grupy czynników obiektywnych zalicza się wielkość produkcji oraz zmienne związane z realizowaniem procesu produkcyjnego , tj. wyposażenie techniczne, zmiany w technologii produkcji i organizacji pracy.
Grupa czynników subiektywnych obejmuje różnego rodzaju działania związane z zarządzaniem firmą . Działania te mają na celu zmniejszenie kosztów własnych związanych z działalnością firmy.
Trzecią grupę czynników tworzą zjawiska przypadkowe, które oddziałują na zmiany wielkości kosztów własnych w sposób niesystematyczny.
Liniowy model kosztów
Podstawową zmienną objaśniającą w modelu kosztów jest wielkość produkcji. Biorąc pod uwagę to założenie , liniowy model kosztów możemy zapisać następująco
Gdzie :
Y - koszty całkowite produkcji ( zmienna objaśniana )
X - wielkość produkcji ( zmienna objaśniająca )
α1 ,α0 - parametry modelu
Parametr α1 określa przeciętne koszty zmienne i informuje o ile wzrośnie Y gdy X wzrośnie o jednostkę ( np. wydatki na surowce, materiały , płace pracowników itd.. )
Parametr α0 informuje o wielkości przeciętnych kosztów stałych , wielkość ich pozostaje niezmienne, niezależnie od rozmiarów produkcji ( np. wydatki na amortyzację budynku fabrycznego ).
Liniowy model kosztów z wieloma zmiennymi objaśniającymi.
Jeżeli w modelu kosztów uwzględnimy jeszcze wpływ innych czynników ( poza produkcją ) to liniowy model możemy zapisać następująco
Gdzie :
Xi ( i=1,2,...,k) - zmienne objaśniające
αi (i=0, 1,2,...,k ) - parametry modelu
Ogólną postać funkcji potęgowej zapisać można w sposób następujący
Funkcja ta zostanie doprowadzona do postaci liniowej poprzez logarytmowanie obu jej stron , czyli
Log Y= log a + b log X
Gdy przyjmiemy następujące oznaczenia :
Log Y = Z , log X = P b= B log a = A , wówczas otrzymujemy funkcje liniową , którą należy zapisać , jako
Z = A + B P
W literaturze przedmiotu można spotkać następujące modele kosztów :
Ekonometryczna analiza popytu konsumpcyjnego
Popyt konsumpcyjny to preferencje ludności dotyczące nabycia dóbr konsumpcyjnych przy istniejących cenach tych dóbr i mające pokrycie w ich funduszu nabywczym.
Popyt na dane dobro jest zmienną obserwowaną w przypadku gdy nie ma ograniczeń ze strony podaży. Wówczas wielkość sprzedaży (zakupów) możemy utożsamiać z popytem na dane dobro.
Przy niedostatecznej podaży sprzedaż (zakupy ) jest mniejsza od popytu, którego nie można zaobserwować.
Ekonometryczna analiza popytu jest możliwa przy dostatecznej podaży ( przynajmniej w przeważającej części badanego okresu )
Ekonometryczną funkcję popytu konsumpcyjnego możemy zapisać w sposób następujący :
Gdzie :
Yt - wielkość popytu
X1t , X2t , ..., Xkt - czynniki określające popyt
εt - składnik losowy
Czynniki określające popyt , czyli zmienne objaśniające to:
• Cena danego dobra
• Dochody konsumentów ( względnie wydatki ogółem )
• Ceny dóbr substytucyjnych
• Ceny dóbr komplementarnych
• Ogólny poziom cen ( wskaźnik kosztów utrzymania )
• Struktura demograficzna i zawodowa badanej grupy konsumentów
• Wielkość popytu na dane dobro w okresach poprzednich ( zwłaszcza w przypadku dóbr trwałego użytkowania )
W literaturze przedmiotu wyróżnia się :
• Mikroekonomiczne funkcje popytu
• Makroekonomiczne funkcje popytu
Makroekonomiczne funkcje popytu szacuje się dla dużych zbiorowości konsumentów , np. ludności kraju czy regionu , na podstawie zagregowanych danych w postaci szeregów czasowych dotyczących wielkości sprzedaży danego dobra, cen tego dobra, ludności i ewentualnie innych zmiennych .
Mikroekonomiczne funkcje popytu konsumpcyjnego szacowane są na podstawie danych pochodzących z badań budżetów rodzinnych. Są to zwykle dane przekrojowe z jednego okresu czasu ( z jednego roku ) z różnych odpowiednio wylosowanych do badań gospodarstw domowych ( pracowniczych , emerytów i rencistów , chłopskich , czy pracujących na własny rachunek )
Dane przekrojowe z jednego okresu czasu nie pozwalają uchwycić wpływu zmian cen na popyt , stąd w mikroekonomicznych funkcjach popytu konsumpcyjnego podstawą , a często jedyną zmienną objaśniającą jest dochód ( względnie wydatki ogółem ).
W 1857 roku niemiecki statystyk E. Engel na podstawie badań budżetów rodzinnych sformułował szereg prawidłowości , między popytem ( wydatkami ) na dane dobro lub usługę a dochodami konsumentów. Prawidłowości te noszą nazwę krzywych Engla. Kształt tych krzywych jest różny dla różnych artykułów i usług konsumpcyjnych.
Dobra i usługi konsumpcyjne można podzielić na trzy grupy :
1.Dobra i usługi pierwszej potrzeby
2.Dobra i usługi wyższego rzędu
3.Dobra i usługi luksusowe
Wielkość popytu na poszczególne kategorie dóbr i usług zależeć będą głownie od pieniężnej siły nabywczej konsumentów.
Jako aproksymant krzywych Engla w skali mikroekonomicznej najczęściej używa się następujących funkcji :
Gdzie :
Y - popyt na usługę ( lub jednostkę konsumpcyjną )
X - wielkość dochodu w rodzinie na głowę ( lub na jednostkę konsumpcyjną )
Ciekawymi i powszechnie uznawanymi i akceptowanymi funkcjami popytu (odzwierciedlającymi prawa Engla ) są tzw. krzywe Törnquista - szwedzkiego ekonomisty. Funkcje te mają postać zależną od rodzaju dobra i usługi konsumpcyjnej.
Funkcje I typu ( dla dóbr pierwszej potrzeby czyli podstawowych ) mają postać :
Funkcja II typu ( dla dóbr i usług wyższego rzędu )
Funkcja III typu ( dla dóbr i usług luksusowych )
Parametry γ wyznaczają hierarchię pilności potrzeb , a parametry α poziom ich nasycenia.
Kształt krzywych Törnquista jest zgodny z ogólnymi procesami zachowania się konsumentów w zależności od wysokości dochodu ( zgodnie z prawem Engla ).
Prawo Engla mówi o tym :
• udział wydatków na żywność maleje w miarę wzrostu standardu życia ( dochodów ) badanych rodzin
• udział wydatków stałych ( np.. opłaty za mieszkanie , opał , wydatki na odzież ) pozostaje na stałym poziomie
• udział innych wydatków rośnie wraz z dochodem
Metody estymacji funkcji Törnquista
Oceny parametrów tych funkcji można wyznaczyć za pomocą KMNK w następujący sposób :
1.Za pomocą odpowiednich transformacji zmiennej objaśnianej , zmiennej objaśniającej i parametrów strukturalnych przekształcić równanie krzywej Törnqista do postaci liniowej względem nowych parametrów , a następnie zastosować KMNK
2.Przyjąć dwuetapową procedurę estymacji ( idea równań różnicowych )
Włoski ekonomista Vilfredo Pareto ( 1848 - 1923 ) stwierdził , że w większości przypadków , które badał , krzywe obrazujące rozkłady dochodów mają kształt zbliżony do siebie , są hiperbolami których równania można przedstawić za pomocą wzoru :
gdzie :
Y- liczba osób posiadających dochód większy lub równy x
X- wielkość dochodu
X0 - najniższy dochód
a,b - parametry modelu
W praktyce stosuje się uproszczoną postać krzywej Pareta ponieważ brak jest informacji dotyczących liczby osób o małych dochodach , czyli
Zieliński Z. : Metody analizy dynamiki i rytmiczności zjawisk gospodarczych , PWN, Warszawa 1979, s. 96
.( Lange O., Wstęp do ekonometrii, Wyd. 5, PWN, Warszawa 1961)
Hellwig Z., Zarys ekonometrii, Wyd. 2, PWE 1970
Pawłowski Z., Ekonometria . Wyd. 4, PWN, Warszawa 1975).
Czerwiński Z., Matematyka na usługach ekonomii, Wyd. 4 , PWN, Warszawa 1977.
Por. Z. Hellwig , Zarys ekonometrii. PWN, Warszawa 1973, s. 148 .
Sadowski W. , Diagnoza i prognoza .PWE, Warszawa 1977
Smoluk A Matematyka , Nauka, Ekonomia. AE, Wrocław 1993
Prognozowanie gospodarcze. Metody prognozowania. Redakcja naukowa M. Ceślak. Wyd. Naukowe PWN, W-wa 1997
1