Wykłady z ekonometrii

Wykłady z ekonometrii ( 15 godz )

Wykład pierwszy

Temat wykładu : Wprowadzenie do ekonometrii

Ekonometria

jest nauką , która zajmuje się badaniem ilościowych zależności zachodzących między zjawiskami i procesami ekonomicznymi za pomocą wyspecjalizowanego języka matematyczno - statystycznego.

Ekonometria ( składa się z dwóch wyrazów ekono i metria ) czyli mierzenie zjawisk ekonomicznych

Ekonometria jest traktowana jako przyczynek do wszystkich nauk ekonomicznych. Jest ona ściśle związana z matematyką , statystyką , informatyką , makro i mikro ekonomią .

Ekonometria posiada już swoją historię. Pierwsze badania ekonometryczne pojawiły się w USA .Ośrodkiem badań był uniwersytet Harward .Problematyka tych badań dotyczyła przebiegu cykli koniunkturalnych .

Ważny wkład w rozwój ekonometrii miały prace ekonometryka holenderskiego J. Tinbergena Wprowadził on w ekonometrii opis współzależności różnych zjawisk ekonomicznych za pomocą układu równań .

Po raz pierwszy termin ekonometria pojawił się w 1910 roku w tytule pracy Pawła Ciompy „ Przegląd ekonometrii i rzeczywistej teorii buchalterii „ wydanej we Lwowie.

W dzisiejszym znaczeniu termin ten został wprowadzony do słownika nauk ekonomicznych przez norweskiego ekonomistę Ragnara Frischa w 1926 roku .

Cele jakie realizuje ekonometria to :

1.Cel poznawczy - opis mechanizmu kształtowania się zjawisk

2.Cel predyktywny - przewidywanie dalszego przebiegu zjawisk

3.Cel decyzyjny ( optymalizacyjny ) - sterowanie przebiegiem zjawisk ekonomicznych.

Przedmiotem badań ekonometrycznych jest model ekonometryczny .

Model ekonometryczny jest to formalny opis stochastycznej zależności wyróżnionego zjawiska ekonomicznego ( wyróżnionych zjawisk ) od czynników które go kształtują , a wyrażony jest w formie pojedynczego równania bądź układu równań. Model ekonometryczny jest to konstrukcja formalna , która za pomocą równania i układu równań przedstawia zasadnicze powiązania jakie zachodzą między zjawiskami ekonomicznymi.

Strukturę każdego równania określają :

• zmienna objaśniana , zmienne objaśniające ( nielosowe albo losowe ) mające ustaloną treść ekonomiczną ,

• parametry strukturalne ,

• zmienne losowe ( składnik losowy)

• oraz typ związku funkcyjnego między zmienną objaśnianą a zmiennymi objaśniającymi i składnikiem losowym.

Przykład 1.

Dany jest model o następującej postaci :

gdzie :

Y - oznacza np. wielkość produkcji w pewnej firmie ( w tys , szt ) ,

X - wielkość zatrudnienia ( w tys. osób ) w pewnej firmie

Zmienną Y nazywamy zmienną objaśnianą , zmienną X - objaśniającą ,

są nieznanymi parametrami strukturalnymi modelu. Składnik losowy
określany jest jako błąd w równaniu , informuje o łącznym oddziaływaniu wszystkich czynników nie uwzględnionych w modelu. Wiadomo , że na wielkość produkcji w firmie oprócz zatrudnienia wpływa jeszcze szereg innych czynników . Zależność ta ma charakter liniowy.

W modelu można wyróżnić następujące zmienne :

• Zmienne endogeniczne ; bieżące i opóźnione ( wyjaśniane przez model )

• Zmienne egzogeniczne : bieżące i opóźnione ( nie wyjaśniane przez model )

Ze względu na rolę pełnioną przez poszczególne zmienne w modelu możemy wyróżnić

• Zmienne objaśniane

•Zmienne objaśniające

Klasyfikacja modeli może być dokonana z punktu widzenia różnych kryteriów .

Ze względu na liczbę równań w modelu można wyróżnić:

• modele jednorównaniowe

• modele wielorównaniowe

Ze względu na postać analityczną równań modeli , można wyróżnić modele liniowe i nieliniowe .

Ze względu na rolę czynnika czasu w równaniach modelu wyróżnia się modele

• Statyczne (nie posiadające czynnika czasu )

• Dynamiczne ( w których występuje czynnik czasu - najlepszym przykładem jest model trendu )

Innym przykładem modelu dynamicznego jest model autoregresyjny , w którym wśród zmiennych objaśniających występuje opóźniona w czasie zmienna objaśniana.

Ze względu na walory poznawcze wyróżnia się następujące rodzaje modeli :

• Przyczynowo - opisowe wyrażające związki przyczynowo - skutkowe między zmiennymi objaśniającymi i objaśnianymi .

• Modele symptomatyczne , w których rolę zmiennych objaśniających pełnią zmienne skorelowane z odpowiednimi zmiennymi objaśnianymi , a nie wyrażające źródeł zmienności zmiennych objaśnianych.

Modele wielorównaniowe ze względu na budowę ( czyli charakter powiązań między zmiennymi endogenicznymi w modelu wielorównaniowym ) dzielimy na

Proste

Rekurencyjne

O równaniach współzależnych

Modelowanie ekonometryczne jest procesem wieloetapowym.

W każdym z etapów modelowania ekonometrycznego korzysta się z metod i narzędzi stosowanych w innych dyscyplinach naukowych. Ekonometria ma charakter interdyscyplinarny .

Proces budowy modelu ekonometrycznego obejmuje :

• Merytoryczną analizę zjawiska i konstrukcję modelu ( w etapie tym dokonujemy doboru zmiennych objaśniających kierując się znajomością dotychczasowej wiedzy ekonomicznej oraz korzystając z odpowiednich procedur np. teoria grafów lub metoda Z. Hellwiga )

• Typ związku ustalamy korzystając z tzw. wiedzy apriorycznej o modelowanym zjawisku lub innych procedur np. oceny wzrokowej itp. )

• Estymacja parametrów za pomocy KMNK lub innych metod np. największej wiarygodności, różniczki zupełnej

• Weryfikacja modelu ( weryfikacja merytoryczna i statystyczna za pomocą odpowiednich miar )

• Zastosowanie modelu ( do symulacji lub prognozowania )

Źródła danych wykorzystywanych do budowy modeli to

• Dane pierwotne

• Dane wtórne

Dane statystyczne mogą mieć

• Charakter szeregu czasowego , gdy badane zjawisko przedstawione jest kolejnych jednostkach czasu

• Danych przekrojowych , gdy dane wyrażają stan zjawiska w ustalonym czasie w odniesieniu do różnych obiektów np. firm , banków .

Wybrane pozycje literaturowe

.Aczel D.A Statystyka w zarządzaniu, PWN, Warszawa 2000
C. Chow, Ekonometria, PWN, Warszawa 1995.
S. Bartosiewicz, Ekonometria - technologia ekonomicznego przetwarzania informacji, PWE, Warszawa 1976.
Ekonometria . Metody - Zastosowania - Zadania . Pod redakcją W. Tomaszewskiego ( współautor M. Wierzbińska ) . UMCS Lublin 1983.
K. Kukuła (red.), Wprowadzenie do ekonometrii w przykładach i zadaniach, PWN, Warszawa 1996.
R.L.Klein, Wykłady z ekonometrii., PWE, Warszawa 1982.
E. Nowak, Zarys metod ekonometrii - zbiór zadań, PWN, Warszawa 1998.
Pawłowski Z. : Ekonometria .PWN. Warszawa 1969. Wydanie III.
W. Welfe, A. Welfe, Ekonometria stosowana, PWN, Warszawa 1996.
W. Welfe, Gospodarka polski w okresie transformacji - zasady modelowania ekonometrycznego, PWE Warszawa 2000.
Welfe A i inni, Ekonometria - zbiór zadań, PWE Warszawa 1997
Welfe : Ekonometria ,PWE. 1998
Wykłady i ćwiczenia z ekonometrii. Materiały dydaktyczne pod redakcją M.Woźniaka ( współautor M.Wierzbińska), UMCS Filia w Rzeszowie, Rzeszów 1999.
Ekonometria . Metody i analiza problemów ekonomicznych. Pod redakcją Krzysztofa Jajugi . Wydawnictwa Akademii Ekonomicznej im. Oskara Lanego we Wrocławiu, Wrocław 1998.
Dorosiewicz S.., Kołatkowski D. ,Kuszewski T., Podgórska M., Syczewska E.: Ekonometria . SGH, Warszawa .

Wykład drugi

Temat wykładu : Proces budowy jednorównaniowego modelu ekonometrycznego.

1. Założenia dotyczące klasycznego modelu ekonometrycznego

2. Przykład numeryczny

Zakładając, że związek między zmienną objaśnianą Y, a zmienną objaśniającą X jest liniowy zakłócony przez addytywny składnik losowy, to jednorównaniowy liniowy model ekonometryczny można sformułować w postaci następujących założeń.

Założenie 1.

Z zapisu wynika, że każda zaobserwowana wartość y_t jest liniową funkcją obserwacji na zmiennej objaśniającej x_t z dokładnością do składnika losowego ξ_t .

Założenie 2.

Obserwacje na zmiennej objaśniającej są ustalonymi ( tj. nielosowymi ) wartościami, takimi samymi w powtarzalnych próbach.

Założenie 3.

Składniki losowe ξ_t dla t= 1,2,3,..,n są niezależnymi zmiennymi losowymi o jednakowych rozkładach prawdopodobieństwa z wartością oczekiwaną równą zero, czyli

i stałą wariancją

Założenie 3 określa strukturę stochastyczną modelu. Nie precyzuje typu rozkładu prawdopodobieństwa składnika losowego ξ_t tylko określa główne parametry tego rozkładu czyli, tzw. parametry struktury stochastycznej modelu. Sformułowanie mówiące, że „ są niezależnymi zmiennymi losowymi „ implikuje, że dla każdej pary zmiennych losowych ( ξ_i , ξ_j ) ich kowariancja jest równa zero, czyli można zapisać:

i ≠ j

Założenie o niezależności i jednorodności wariancji składników losowych wraz z założeniem o zerowej wartości oczekiwanej tworzą tzw. klasyczny zestaw założeń o składniku losowym.

Z założenia o nielosowym charakterze zmiennej objaśniającej oraz z założenia o wartości oczekiwanej składnika losowego wynika, że zmienne objaśniająca i składnik losowy są niezależne. Tak więc możemy zapisać:

dla t = 1,2,..., n

Ważne konsekwencje ma założenie o wartości oczekiwanej składnika losowego.

Uwzględniając to założenia model możemy zapisać następująco :

dla t= 1,2,...,n

Zapis powyższy oznacza liniową funkcję regresji Y względem X , to jest funkcję przyporządkowującą wartością xt warunkowe wartości oczekiwane zmiennej objaśnianej yt .

Parametry strukturalne modelu α0 ,α1 są więc parametrami regresji, co umożliwia zastosowanie do ich szacowania odpowiednich metod estymacji parametrów funkcji regresji.

Składnikowi losowemu można nadać interpretację odchylenia od nieznanej funkcji regresji, czyli

dla t= 1,2,...,n

Klasyczny jednorównaniowy liniowy model ekonometryczny to model sformułowany dzięki założeniom.

Twierdzenie Gaussa - Markowa

W klasycznym modelu regresji liniowej najlepszym nieobciążonym estymatorem liniowym parametrów α_o , α₁ jest estymator, otrzymany metodą najmniejszych kwadratów .

METODA NAJMNIEJSZYCH KWADRATÓW

MNK - polega na wyznaczeniu takich ocen a_o, a₁ parametrów α_o,α₁ aby dla danych n obserwacji dokonanych na zmiennych (yt, xt) suma kwadratów odchyleń zaobserwowanych wartości zmiennej objaśnianej (Yt) od jej wartości teoretycznych wyznaczonych przez funkcję regresji, tj. funkcję:

osiągnęła minimum.

Poprzez przyrównanie do zera pierwszych pochodnych cząstkowych funkcji S względem α_o , α₁ otrzymujemy tzw. układ równań normalnych

Rozwiązując powyższy układ równań otrzymujemy następujące wzory na estymatory parametrów

0x08 graphic

Można również udowodnić, że standardowe błędy ocen parametrów ( określane inaczej jako średnie błędy szacunku parametrów ) można wyrazić następującymi wzorami

0x08 graphic

Przykład numeryczny

Załóżmy , że interesuje nas badanie zależności spożycia od dochodu narodowego. Dane potrzebne do badań zostały zmieszczone w poniższej tablicy

Tab.1 Spożycie i dochód narodowy

t	Spożycie	DN
1	3,1	4,3
2	3,3	4,7
3	3,6	5,2
4	3,9	5,7
5	4,2	6,3
6	4,7	6,9
7	5,1	7,4
8	5,4	7,7
9	5,5	8
10	5,7	7,8

Źródło : Gajda M. : Ekonometria praktyczna. Wyd. Absolwent 1989 .

Należy oszacować model i przeprowadzić interpretację uzyskanych wyników .

Do badań zostanie wykorzystany liniowy model ekonometryczny o następującej postaci :

gdzie : Y_t - jest to zmienna objaśniana w modelu ( spożycie )

X_t1 - zmienna objaśniająca ( dochód narodowy )

α_o , α₁ - parametry modelu , które należy oszacować

ξ_t - składnik losowy

Oceny parametrów modelu znajdziemy dzięki wykorzystaniu MNK , czyli wykorzystując odpowiednie wzory . Obliczenia są wykonane w arkuszu Excel , można również wykonać w programie Statistica PL w module Regresja wielokrotna

Tab.2Tablica pomocnicza do wyznaczenia ocen parametrów modelu

t	Spożycie	DN	( )		( )	²			X²
1	3,1	4,3	-1,35	-2,1	2,835	4,41	2,9842	0,0134	18,49
2	3,3	4,7	-1,15	-1,7	1,955	2,89	3,2643	0,0013	22,09
3	3,6	5,2	-0,85	-1,2	1,02	1,44	3,6124	0,0002	27,04
4	3,9	5,7	-0,55	-0,7	0,385	0,49	3,9614	0,0038	32,49
5	4,2	6,3	-0,25	-0,1	0,025	0,01	4,3802	0,0324	39,69
6	4,7	6,9	0,25	0,5	0,125	0,25	4,799	0,0098	47,61
7	5,1	7,4	0,65	1	0,65	1	5,148	0,0023	54,76
8	5,4	7,7	0,95	1,3	1,235	1,69	5,3574	0,0018	59,29
9	5,5	8	1,05	1,6	1,68	2,56	5,5668	0,0045	64,00
10	5,7	7,8	1,25	1,4	1,75	1,96	5,4272	0,0744	60,84
	4,45	6,4			11,66	16,7		0,1439	426,3

Źródło : Opracowanie własne .

Wykorzystując wzory na oceny parametrów otrzymujemy :

Oszacowany model ma postać następującą :

Ocena parametru *₀ wynosi - 0,0172 , co oznacza , że gdyby zmienne objaśniające naszego modelu ( w tym przykładzie jedna zmienna tj. dochód narodowy ) przybrały wartość zerową, to należałoby oczekiwać, że spożycie wynosiłoby -0,0172. Formalnie rzecz biorąc wszystko jest w porządku , wyraz wolny istotnie informuje o tym , jaki byłby poziom opisywanego zjawiska , gdyby wszystkie zmienne objaśniające modelu przybrały wartości zerowe. Trudno jednak sobie wyobrazić ujemną konsumpcję . Mamy do czynienia z przypadkiem , w którym wyraz wolny równania nie ma sensownej interpretacji ekonomicznej .

Ocena parametru *₁ wynosi 0,698 , oznacza to , że jeśli wartość zmiennej DN wzrośnie o jedną jednostkę , to oczekujemy , że spożycie wzrośnie o 0,698.

Następnie wyznaczamy średnie błędy szacunku . Najpierw należy wyznaczyć wariancję resztową .

0x08 graphic

Odchylenie standardowe reszt czyli pierwiastek z wariancji reszt, który wynosi s=0,134 , oznacza , że przewidywane przez oszacowane równanie wartości zmiennej objaśnianej czyli spożycie , średnio różnią się od empirycznych wartości tej zmiennej o 0, 134 .

Standardowe błędy szacunku równania informują nas z jaką dokładnością oszacowane równanie prognozuje w obrębie próby wartości zmiennej objaśnianej. Możemy powiedzieć , że szacując parametr *_o ( wyraz wolny ) mylimy się średnio o 0,214 , a szacując parametr *₁ ( stojący przy zmiennej objaśniającej - dochód narodowy ) pomyliliśmy się o 0,328.

Ważnym problemem jest sformułowanie przedziałów ufności dla otrzymanych ocen parametrów. Znając standardowe błędy ocen parametrów, oraz zakładając że składnik losowy ma rozkład normalny wówczas możemy zbudować przedziały ufności dla otrzymanych ocen parametrów w sposób następujący

Przyjmując poziom istotności
=0,1 z tablic odczytujemy
i możemy zapisać 90 procentowe [ tj. ( 1- α )* 100 ] przedziały ufności dla oszacowanych parametrów modelu, są one następujące :

[ - 0,185 - 1,8946*0,214 < α₀ < - 0,185 + 1,8946*0,214 ]

[ - 0,5904 < α₀ < 0,2204 ] Przedział ten z prawdopodobieństwem 0,9 nakryje parametr α₀ .

Przedział ufności dla parametru α₁ jest następujący :

[ 0,698 - 0,0328 * 1,894 < α₁, 0,698 + 0,0328 * 1,8946 ]

[ 0,63587 < α₁< 0,76014 ]

Wykład 3

Temat wykładu . Modele trendu.

1.Pojęcie trendu

2.Modele trendu liniowe i nieliniowe

3. Przykłady modeli nieliniowych ( przyczynowo - skutkowych )

Przez trend rozumie pewną krzywą ciągłą wyznaczoną przez wartość oczekiwaną procesu która jest funkcją ciągłą zmiennej czasowej t .Trend to ogólna tendencja rozwojowa , charakteryzująca dany szereg chronologiczny na przestrzeni dłuższego okresu czasu ( kilkunastu lub kilkudziesięciu lat ) .

Trend określany jest jako „ funkcja opisująca najbardziej istotne , trwałe zmiany rozmiarów zjawiska „

Trend definiowany jest jako „ zmiany zachodzące w ogólnym poziomie badanego zjawiska w sposób systematyczny i regularny „ Trendem nazywa się funkcję ( krzywą ) obrazującą proces zmiany badanej wielkości w czasie „

Modele trendu mogą przyjmować postać funkcji nieliniowych względem parametrów. Najczęściej wykorzystuje się funkcje nieliniowe sprowadzalne do postaci liniowej , aby można było dokonać estymacji klasycznymi metodami .

Modele szeregów czasowych, w których występują trend oraz wahania przypadkowe mogą być :

1. yt = f(t) +εt - modele addytywne

2. yt = f(t)*εt - modele multiplikatywne

gdzie :

f(t) - funkcja trendu

εt - zmienna losowa , charakteryzująca efekty oddziaływania wahań przypadkowych na trend szeregu, o wartości oczekiwanej równej zeru dla modelu (1) lub jedności dla modelu (2 ) i skończonej wariancji.

Najczęstszą postacią funkcji trendu jest funkcja liniowa :

Yt = α + βt + εt

. Reprezentuje ona stały kierunek rozwoju danego zjawiska (np. wielkości sprzedaży ) wyznaczony przez współczynnik kierunkowy prostej (β). Parametr ten jest współczynnikiem stałego przyrostu wartości zmiennej objaśnianej ( np. wielkości sprzedaży w jednostce czasu).

W przypadku , gdy wprowadzamy nowy towar na rynek i sprzedaż rośnie nieograniczenie , to można wykorzystać

funkcje wykładnicze

Właściwością tej funkcji jest stopa wzrostu wynosząca: β lub lnβ

Wielomian stopnia drugiego ( parabola)

0x08 graphic

Zaletą tej funkcji jest duża elastyczność , wynikająca z posiadania trzech parametrów . Dzięki temu funkcja ta może lepiej odzwierciedlać różne nieliniowe tendencje rozwojowe .

Gdy wzrost sprzedaży jest coraz wolniejszy wśród możliwych do zastosowania funkcji można wymienić następujące :

Logarytmiczna

Yt = α +β ln t , β > 0

Potęgowa

Yt= αtβ , 0 < β < 1

O wykładniku większym od zera i mniejszym od jeden.

Gdy wzrost jest coraz wolniejszy i zdąża do pewnego poziomu , to można wykorzystać funkcję

Mającą asymptotę poziomą

Obserwując cykl życia produktu ( wprowadzenie , wzrost, nasycenie , spadek ) można dla tego cyklu wykorzystać bardziej złożoną funkcję typu logistycznego:

Przebiegiem logistycznym charakteryzują się między innymi zjawiska rynkowe dotyczące popytu , zwłaszcza popytu na dobra trwałego użytkowania.

Ustalenie analitycznej postaci trendu sprowadza się do :

• Sporządzenia wykresu na podstawie danych empiryczny ( zaobserwowanych , oryginalnych )

• Analiza wykresu

• Sformułowanie hipotez dotyczących postaci analitycznej funkcji trendu

• Estymacja ( MNK , metoda Hotellinga np. dla funkcji logistycznej )

• Weryfikacja

Przykład

Sprzedaż rowerów górskich ( w tys. sztuk ) w latach 1985 - 1999 kształtowała się następująco : 10,3; 10,5; 10,6; 10,7; 11,0; 11,5; 12,0; 12,2;12,5;12,6; 13,0; 13,9; 14,4; 15,2; 16,0;

Należy oszacować parametry modelu trendu

0x08 graphic

Do badań wykorzystano trend liniowy. Wyniki uzyskano w module regresja wielokrotna.

Oszacowany model trendu ma postać :

0x08 graphic
0,235789 0,025933

t 39,54294 14,9559

R2=0,945 s=0,43395

Przykłady modeli nieliniowych ( przyczynowo - skutkowych )

Przykład

Przeciętne roczne spożycie tłuszczów bez masła ( w kg na osobę ) w zależności od miesięcznych dochodów ( w zł na osobę ) kształtuje się następująco

Dochód	800	1000	1250	1500	2000	2500
Spożycie	4,5	5,5	7,0	8,5	9,5	10,0

Oszacować parametry modelu :

• Funkcji potęgowej

•Funkcji Törnquista I rodzaju.

Funkcja potęgowa ma postać następującą :

gdzie:

Y- wielkość spożycia

X- wielkość dochodów

α₀ ,α₁ - parametry strukturalne, które należy wyznaczyć

Funkcję potęgową można sprowadzić do liniowości dzięki prostym przekształceniom tj.

0x08 graphic

Oszacowany model ma postać następującą:

Ostatecznie oszacowany model można zapisać

Ocena parametru α₁ - to elastyczność dochodu względem spożycia. Informuje o tym, że wraz ze wzrostem dochodu o 1 % spożycie wzrasta o 0,7248.

Ogólna postać funkcji Törnquista I rodzaju ma postać:

gdzie:

Y- wielkość spożycia

X- dochód

a ,b - parametry równania

W celu oszacowania parametrów tej funkcji, transformuje się ją do postaci liniowej :

0x08 graphic
gdzie

Oszacowana funkcja Törnquista I rodzaju ma postać :

Wykład 4

Temat wykładu - Zagadnienie doboru zmiennych objaśniających do modelu ekonometrycznego.

1. Uwagi wstępne

Wstępnym zadaniem przy budowie modelu ekonometrycznego jest określenie zmiennych objaśniających.

Głównym kryterium doboru zmiennych do modelu ekonometrycznego jest merytoryczna znajomość badanego zjawiska. Zadaniem ekonometryka jest wybrać takie czynniki ( zmienne objaśniające) , które mają istotny wpływ na kształtowanie się badanego zjawiska ( zmiennej objaśnianej). Powszechnie wiadomo z teorii ekonomii , że popyt (zakładamy , że jest to zmienna objaśniana) zależy od dochodu (zmienna objaśniająca - X₁) i ceny (zmienna objaśniająca X₂ ) oraz innych jeszcze czynników .

Warunkiem wstępnym , aby dana zmienna ( np. X_j ) mogła być uznana za zmienną objaśniającą w modelu , jest jej wystarczające zróżnicowania. Zmienną objaśniającą bowiem nie może być zmienna , której poszczególne obserwacje nie różnią się między sobą (lub różnią się w niewielkim stopniu). Nie jest to wtedy już zmienna , lecz stała (lub quasi - stała).

Do mierzenia poziomu zróżnicowania wykorzystuje się klasyczny współczynnik zmienności, dany wzorem :

0x08 graphic

odchylenie standardowe zmiennej x_j

Średnia arytmetyczna zmiennej x_j

Zwykle obiera się krytyczną wartość współczynnika zmienności V* ( np. V*= 0,1 ). Zmienne spełniające nierówność V_j < V^* uznaje się za mało zróżnicowane i eliminuje ze zbioru potencjalnych zmiennych objaśniających.

2. Metoda Z. Hellwiga

Procedura zaproponowana przez Z. Hellwiga jest wykorzystywana wówczas gdy dotychczasowa wiedza z teorii ekonomii jest niewystarczająca w procesie modelowania ekonometrycznego. Powszechnie wiadomo z teorii ekonomii od czego zależy np. kształtowanie się popytu konsumpcyjnego , co wpływa na wielkość produkcji w firmie itp. Opracowując ekonometryczny model popytu czy ekonometryczny model produkcji kierujemy się przede wszystkim znajomością ekonomii. W przypadku budowy modelu , gdzie nie wiadomo jakie i ile zmiennych należy brać pod uwagę , to korzystamy z gotowych algorytmów. Jednym z takich algorytmów jest metoda Z. Hellwiga.

Idea tej metody sprowadza się do wykonania szeregu czynności :

Określenie zmiennej objaśnianej
Ustalenie potencjalnej listy zmiennych „ kandydujących” do roli zmiennych objaśniających
Wyznaczenie współczynników korelacji między zmienną objaśnianą a potencjalnymi zmiennymi objaśniającymi ( czyli wektora R₀ )
Wyznaczenie współczynników korelacji między potencjalnymi zmiennymi objaśniającymi ( wyznaczenie macierzy R )
Ustalenie liczby kombinacji
Obliczenie pojemności indywidualnych nośników informacji
Obliczenie pojemności integralnej
Podjęcie decyzji , która z zaproponowanych zmiennych wejdzie do modelu ekonometrycznego

Formalny opis procedury

Zdefiniowanie wektora zmiennej objaśnianej

Określenie macierzy potencjalnych zmiennych objaśniających

Wyznaczenie wektora współczynników korelacji między zmienną objaśnianą a potencjalnymi zmiennymi objaśniającymi czyli :

Przy czym współczynnik korelacji między zmienną objaśnianą a pierwszą zmienną objaśniającą wyznaczamy w sposób następujący :

Wyznaczenie macierzy współczynników korelacji między potencjalnymi zmiennymi objaśniającymi czyli :

Przy czym współczynnik korelacji między pierwszą a drugą zmienną objaśniającą wyznaczamy następująco :

Ustalenie liczby kombinacji według wzoru K= 2 ^k -1 , gdzie k to liczba zmiennych objaśniających w modelu
Wyznaczenie pojemności indywidualnych nośników informacji według wzoru :

gdzie
- pojemność indywidualna k - tej kombinacji i j- tej zmiennej

- kwadrat współczynnika korelacji j- tej zmiennej objaśnianej ze zmienną objaśniającą

- współczynnik korelacji między i-tą a j - tą zmienną objaśniającą

7. Wyznaczenie pojemności integralnej według wzoru :

Przykład

Załóżmy , że dla pewnej zmiennej objaśnianej Y wybrano dwuelementowy zbiór „ kandydatek „ na zmienne objaśniające X = { X₁ , X₂ } . Macierze współczynników korelacji są dane :

Rozwiązanie :

Najpierw ustalamy liczbę kombinacji : K=2²-1=3

K₁ = {X₁}

K₂ = {X₂}

K₃ = { X₁ , X₂ }

Następnie wyznaczamy indywidualne pojemności informacyjne :

Pojemności integralne wynoszą :

H₁=o,49

H₂=0,25

H₃=0,627

Pojemność integralna trzecia jest największa , co świadczy , że do rozwiązania wejdą dwie zmienne objaśniające tj. X₁ i X₂ .

3. DOBÓR ZMIENNYCH OBJAŚNIAJĄCYCH ZA POMOCĄ GRAFÓW.

Główne założenia :

1. Zmienne objaśniające wchodzące w skład modelu nie powinny być skorelowane między sobą, tzn. r_ij=0 dla wszystkich kombinacji wskaźników i , j , gdzie i
j ( i ,j = 2,3,4,...k)

2. Zmienne objaśniające powinny pozostawać w związku korelacyjnym ze zmienną objaśnianą , tzn.
( j=2,3,...k ) ( przy czym k oznacza liczbę zmiennych występujących w modelu , w tym numerem 1 oznaczona jest zmienna objaśniana ) . W praktyce postulat braku korelacji między zmiennymi objaśniającymi jest niemożliwy do spełnienia , zatem stawiamy złagodzone założenie , wymagając, aby
( i,j=2,3,...,k ).

ETAPY DZIAŁAŃ W METODZIE GRAFÓW

Na podstawie danych empirycznych dotyczących n obserwacji dokonanych na k zmiennych budujemy macierz X o wymiarach ( n x k)

Z powyższych danych budujemy symetryczną macierz współczynników korelacji r_ij, którą oznaczamy jako W ( będzie to macierz o wymiarach ( k x k )

Z macierzy W przez wyłączenie pierwszej kolumny i pierwszego wiersza tworzymy macierz współczynników korelacji zmiennych objaśniających łączonych parami. Oznaczmy ją jako
.Wymiar tej macierzy wynosi ( k-1)x(k-1)

W odniesieniu do występujących współczynników korelacji weryfikujemy hipotezę H₀ : r_ij= 0 , i
j . Sprawdzianem tej hipotezy jest statystyka:

0x01 graphic

Wykorzystując macierz
, budujemy graf, w którym wierzchołkami są zmienne, a łukami współczynniki korelacji
. W rezultacie takiego postępowania mogą zajść następujące przypadki:

Powstał graf spójny, co oznacza, że wszystkie wybrane zmienne są ze sobą bezpośrednio skorelowane

Powstało kilka grafów spójnych, co oznacza, że występują grupy zmiennych skorelowanych ze sobą bezpośrednio lub pośrednio, podczas gdy inne grupy są ze sobą nie skorelowane

Powstały grafy spójne i wierzchołki izolowane , co oznacza , że obok grup zmiennych skorelowanych występują zmienne nie skorelowane z żadną z pozostałych

Powstały punkty odosobnione, co oznacza, że wszystkie zmienne są ze sobą nie skorelowane.

Następnie określamy stopień każdego węzła grafu k, tzn. liczbę łuków którymi jest on związany z innymi wierzchołkami. Dla wierzchołków izolowanych k=0.

W każdym grafie spójnym wyróżniamy wierzchołek o maksymalnym k. Jeżeli w danym grafie spójnym jest kilka takich wierzchołków, to wybieramy spośród nich wierzchołek charakteryzujący tę zmienną, która jest najmocniej skorelowana ze zmienną objaśnianą ( czyli zmienną ), dla której
jest maksymalny.

Wykład 5.

Temat wykładu - JEDNORÓWNANIOWY MODEL LINIOWY Z WIELOMA ZMIENNYMI OBJAŚNIAJĄCYMI - SFORMUŁOWANIE MODELU I JEGO ESTYMACJA.

Rozważmy model o następującej postaci:

gdzie: Y - zmienna endogeniczna ( zmienna losowa ),

X₁,X₂,...,X_k - zmienne egzogeniczne ( zmienne nielosowe ),

Z_t - zmienna losowa charakteryzująca wpływ czynnika losowego.

- parametry strukturalne modelu ekonometrycznego,

Zmienna nielosowa X_k przyjmuje wartości x_tk=1 dla t=1,2,...,n

Aby uprościć dalsze rozważania wprowadzimy następujące oznaczenia:

0x01 graphic

Uwzględniając wprowadzone oznaczenia , model ekonometryczny zapiszemy w postaci macierzowej, jako:

Założenia dotyczące struktury stochastycznej tego modelu są następujące:

Rozkład wektora losowego Z , a tym samym wektora Y jest rozkładem normalnym,
Nadzieja matematyczna ( średnia wartość oczekiwana ) wektora losowego Z jest wektorem zerowym [ E( Z ) =0 ] ,
Nadzieja matematyczna wektora losowego Y jest równa

0x01 graphic
=

Macierz kowariancji wektora losowego Z oraz wektora Y jest równa
, gdzie I jest macierzą jednostkową (oznacza to, że składowe wektora losowego Z są zmiennymi losowymi niezależnymi o jednakowej wariancji ).
Między zmiennymi X₁,X₂,...,X_k nie występuje współliniowość , co oznacza że rząd macierzy X jest równy k ( n > k), co oznacza że istnieje macierz odwrotna (X^TX)^-1.

Obecnie przystępujemy do szacowania nieznanych wartości parametrów strukturalnych modelu ekonometrycznego na podstawie obserwacji wykorzystując klasyczną metodę najmniejszych kwadratów ( KMNK ). Ogólną postać oceny szacowanego modelu zapiszemy w postaci macierzowej wprowadzając następujące oznaczenia:

Wektora zaobserwowanych wartości zmiennej losowej Y odpowiadające zadanym wartością zmiennych egzogenicznych, a mianowicie

0x01 graphic

Wektor ocen nielosowej części modelu ekonometrycznego, czyli

0x01 graphic

Wektor ocen szacowanych parametrów strukturalnych modelu ekonometrycznego jest następujący:

0x01 graphic

Postać dopasowanego równania do danych empirycznych można wyrazić następująco:

Wektor reszt wyraża się wzorem:

0x01 graphic

Funkcję kryterium dla dopasowania tego równania do danych empirycznych , zapiszemy w postaci macierzowej, a mianowicie:

lub

względnie

Następnie obliczając pierwszą pochodną i przyrównując ją do zera otrzymujemy :

Ostatecznie układ równań ma postać :

Ponieważ założyliśmy, że rząd macierzy wartości zmiennych objaśniających jest rzędu „k”, więc istnieje macierz odwrotna do macierzy ( X^TX ).

Uwzględniając ten fakt mamy :

Jeśli znamy parametr struktury stochastycznej modelu wówczas

macierz wariancji i kowariancji wektora estymatorów parametrów modelu ekonometrycznego ma postać :

Elementy leżące na głównej przekątnej tej macierzy to wariancje estymatorów poszczególnych parametrów modelu ekonometrycznego.

Jeśli nie znamy wartości parametru struktury stochastycznej modelu wówczas znajdujemy jej nieobciążony estymator dany wzorem :

W tym przypadku macierz wariancji i kowariancji przyjmuje postać następującą:

Następnie przystępujemy do budowy przedziałów ufności dla parametrów strukturalnych modelu ekonometrycznego przyjmując współczynnik ufności równy
. Gdy znana jest wartość parametru struktury stochastycznej modelu, wówczas podstawą budowy przedziału ufności jest zmienna zdefiniowana wzorem :

która jest zmienną losową standaryzowaną podlegająca rozkładowi normalnemu N(0,1). Przy tym założeniu przedział ufności dla parametru zapiszemy następująco:

Gdy nie jest znana wartość parametru struktury stochastycznej modelu, wówczas podstawą budowy przedziału ufności dla parametrów strukturalnych modelu jest zmienna losowa zdefiniowana wzorem:

0x01 graphic

która podlega rozkładowi t- Studenta o ( n - k ) stopniach swobody.

Przy tym założeniu przedział ufności dla parametru zapiszemy w postaci :

Z kolei tak zdefiniowane zmienne, w zależności od posiadanych informacji, dla zadanego poziomu istotności
wykorzystuje się do weryfikacji hipotezy statystycznej

0x01 graphic

Jeśli korzystamy ze zmiennej losowej U, wówczas obszar krytyczny tej zmiennej losowej , przy tak sformułowanej hipotezie alternatywnej ma postać :

Jeśli obliczona na podstawie wyników obserwacji wartość sprawdzianu przy założeniu prawdziwości hipotezy zerowej

0x01 graphic

należy do obszaru krytycznego, wówczas na przyjętym poziomie

istotności
hipotezę H_o odrzucamy .

Oznacza to , że i-ta zmienna objaśniająca wpływa w sposób istotny na kształtowanie się średniej wartości zmiennej objaśnianej. Przyjmijmy , że k - ta zmienna objaśniająca spełnia warunek X=1 . W tym przypadku parametr
traktujemy jako wyraz wolny w

analitycznej postaci naszego liniowego modelu ekonometrycznego.

Jeśli więc hipotezę H₀ odrzucamy , to oznacza , że wyraz wolny w

modelu jest różny od zera.

W pewnych przypadkach istotne znaczenie ma weryfikacja hipotezy zerowej sformułowanej następująco:

0x01 graphic

przy hipotezie alternatywnej H₁, że przynajmniej jedna składowa powyższego wektora jest różna od zera.

Sprawdzianem tak sformułowanej hipotezy jest zmienna losowa definiowana wzorem :

Przykład budowy modelu regresji liniowej

Model regresji liniowej zmiennej zależnej y względem zbioru k zmiennych objaśniających
jest określony równaniem :

gdzie:
jest punktem przecięcia powierzchni regresji z osią rzędnych ( wyrazem wolnym ), a każde
dla i = 1,2,...,k jest nachyleniem powierzchni regresji względem osi odpowiadającej zmiennej

Przykład

Firma produkująca chemikalia nasiliła kampanię promocji swoich produktów. Oprócz reklam radiowych i telewizyjnych zorganizowała pokazy działania swoich produktów w sklepach. W ciągu 10 tygodni firma śledziła swoje wydatki na reklamę radiową i telewizyjną (zmienna
) oraz wydatki na pokazy w sklepach (zmienna
). Wielkość tygodniowej sprzedaży produktów firmy w badanym okresie potraktowano jako zmienną zależną ( objaśnianą ). Analityk zatrudniony w tej firmie podjął próbę opracowania hipotetycznego modelu liniowej regresji o postaci
, korzystając z danych zebranych w trakcie badania. Badanie zostało przeprowadzone w ciągu 10 tygodni. Zebrane dane zostały zamieszczone w poniższej tablicy.

Zebrane informacje oraz niezbędne dane potrzebne do rozwiązania układu równań normalnych.


72	12	5	60	144	25	864	360
76	11	8	88	121	64	836	608
78	15	6	90	225	36	1170	468
70	10	5	50	100	25	700	350
68	11	3	33	121	9	748	204
80	16	9	144	256	81	1280	720
82	14	12	168	196	144	1148	984
65	8	4	32	64	16	520	260
62	8	3	24	64	9	496	186
90	18	10	180	324	100	1620	900
743	123	65	869	1615	509	9382	5040

źródło : Aczel A., Statystyka w zarządzaniu. PWN, Warszawa 2000.

Parametry równania regresji szacujemy metodą najmniejszych kwadratów (MNK). Przy dwóch zmiennych objaśniających, gdy modelem populacji jest równanie
, szacujemy równanie płaszczyzny, dla której suma kwadratów reszt, czyli odchyleń (
) dla wszystkich danych punktów ( wyników obserwacji ) jest najmniejsza.

Równanie normalne o następującej postaci :

otrzymano stosując rachunek różniczkowy, tj. obliczając pochodne cząstkowe z próby i przyrównując je do zera.

Wykorzystując dane z tablicy otrzymujemy:

Rozwiązanie tego układu równań dowolną metodą daje następujące wyniki:

,
,

Dzięki wykorzystaniu programu Statistica Pl 5.0 otrzymano następujące wyniki

( 2,4704) ( 0,280263) ( 0, 305249 )

t 19, 09191 5,69128 3,76332

- wyraz wolny określany jako punkt przecięcia z osią rzędnych oznacza, że gdyby zmienne
i
przybrały wartości zero, to należałoby oczekiwać, że średnia wartość sprzedaży wynosi 47,1649

( i =1,2) - to współczynniki kierunkowe (współczynniki nachylenia względem osi x )

Ocena współczynników regresji
wskazuje na przyrost lub spadek ( gdy współczynnik jest ujemny) wartości oczekiwanej E(y) na jednostkę przyrostu
jeśli pozostałe zmienne nie zmienią się.

Ocena parametru
wynosząca 1,599 oznacza, że jeśli wydatki na reklamę radiową i telewizyjną wzrosną o jednostkę ( przy założeniu , że wydatki na pokazy w sklepach nie zmienią się ), to wówczas wartość oczekiwana wartości sprzedaży wzrośnie o 1,599.

Ocena parametru
wynosząca 1,14875 oznacza, że gdy zmienna
czyli wydatki na pokazy w sklepach wzrosną o jednostkę ( przy założeniu ,że wydatki na reklamę radiową i telewizyjną są na stałym poziomie ) to oczekiwana wartość sprzedaży wzrośnie o 1,14875.

Do oceny modelu regresji wielorakiej służy test F, który odpowiada na pytanie: czy zachodzi liniowy związek regresyjny między zmienną objaśnianą (zależną ) y i którąkolwiek zmienną objaśniającą
( i=1,2)

Test F służy do weryfikacji hipotezy statystycznej o zachodzeniu liniowego związku między zmienną y a którąkolwiek ze zmiennych
.

Formułujemy hipotezę zerową wobec hipotezy alternatywnej w sposób następujący:

nie wszystkie
( i=1,2) są równe zeru

Jeśli hipoteza zerowa jest prawdziwa to liniowy związek między zmienną y i którąkolwiek ze zmiennych objaśniających występujących w hipotetycznym równaniu regresji nie zachodzi. Analiza regresji kończy się.

Odrzucenie hipotezy zerowej oznacza, że są statystyczne podstawy do przyjęcia iż zachodzi związek liniowy między zmienną y a co najmniej jedną zmienną objaśniającą
występującą w hipotetycznym równaniu.

Wartość statystyki F wynosi 86,34. Ponieważ wartość p jest mała prawie równa zeru to odrzucamy hipotezę , że oba współczynniki kierunkowe
i
są zerowe na korzyść hipotezy alternatywnej, że nie oba są zerowe i wnioskujemy , że są podstawy przyjęcia, iż zachodzi liniowy związek regresyjny między sprzedażą i co najmniej jedną ze zmiennych.

Test F potwierdza tylko lub odrzuca hipotezę o zachodzeniu związku między zmienną zależną ( objaśnianą ) a co najmniej jedną ze zmiennych objaśniających wprowadzonych do równania regresji. Gdy przyjmiemy, że taki związek zachodzi, musimy przeprowadzić dodatkowe testy w celu, podjęcia decyzji, które współczynniki kierunkowe
,
są różne od zera, za pomocą test t.

W przykładzie
wynosi 5,69128 a
. poziom p jest bardzo mały, wobec tego możemy wnioskować, że obie zmienne są istotne.

co oznacza, że kombinacja dwóch zmiennych objaśniających - reklama radiowa i telewizyjna oraz pokazy w sklepach - wyjaśnia zmienność sprzedaży w 96,1%.Zauważmy, że
wynosi 0,95 co jest wartością bliską nieskrępowanej wartości
.

Wnioskujemy, że model regresji bardzo dobrze pasuje do wyników obserwacji, ponieważ poważna część zmienności y została wyjaśniona przez
i
.

Zweryfikowany model można wykorzystać do prognozowania.

WYKŁAD 6.

Temat wykładu : Weryfikacja modeli ekonometrycznych

Weryfikacja modelu ma na celu stwierdzenie , czy oszacowany model dobrze opisuje badane zjawisko. Postuluje się , aby :

model ekonometryczny nie budził zastrzeżeń merytorycznych
model był bardzo dobrze dopasowany do danych empirycznych
wszystkie zmienne objaśniające modelu były istotne
reszty modelu posiadały odpowiednie własności

Weryfikacja obejmuje :

weryfikację merytoryczną
weryfikację statystyczną

Weryfikacja merytoryczna polega na sprawdzeniu , czy model ekonometryczny jest zgodny z wiedzą ekonomiczną na temat badanego zjawiska , teorią ekonomii, wreszcie ze zdrowym rozsądkiem.

Podczas weryfikacji merytorycznej badamy , na przykład :

Czy sensowne są znaki parametrów modelu ?
Czy skala parametrów jest do przyjęcia ?
Czy na podstawie oszacowanego modelu można prognozować ?

Weryfikacja merytoryczna oszacowanego modelu obejmuje interpretację ekonomiczną uzyskanych ocen parametrów. Wiadomo , że ocena a_j parametru strukturalnego α_j , dla j=1,2,3,..., k występującego przy zmiennej X_j , oznacza o ile przeciętnie wzrasta ( gdy a_j>0), albo zmniejsza się ( gdy a_j<0) wartość zmiennej objaśnianej Y, gdy przy niezmienionych wartościach innych zmiennych objaśniających wartość zmiennej X_jwzrasta o jednostkę .

Przykłady niepoprawnych modeli

Przykład

Załóżmy , że został oszacowany model o następującej postaci :

gdzie :

P_t - produkcja

M_t - majątek

Z_t - zatrudnienie

Ujemny znak parametru przy zatrudnieniu , nie jest sensowny , gdyż sugeruje , że produkcja wraz ze wzrostem zatrudnienia maleje , a spadkiem zatrudnienia wzrasta.

Przykład 2.

Załóżmy , że oszacowano model o następującej postaci :

Wydatki = 1,4 Dochód - 0,15 Cena

W tym modelu znaki parametrów są sensowne . Problem dotyczy skali parametrów , głównie przy dochodzie. Parametr ten jest większy od jedności , co sugeruje , że jeśli dochód wzrośnie o 1 zł , a ceny nie zmienią się , to przyrost wydatku wyniesie 1,4 , a więc więcej niż wynosi przyrost dochodu.

Weryfikacja statystyczna polega na badaniu :

Dopasowania modelu za pomocą współczynnika determinacji
Dopuszczalności modelu ze względu na współczynnik zbieżności
Wyrazistości modelu ze względu na współczynnik zmienności losowej
Istotności zmiennych objaśniających
Własności składnika losowego

Badanie dopasowania modelu za pomocą współczynnika determinacji , polega na wyznaczeniu tego współczynnika , według wzoru :

0x01 graphic

gdzie :

- wartość teoretyczna ( wyznaczona na podstawie oszacowanego modelu ) zmiennej objaśnianej dla t= 1,2,...,n

- wartość empiryczna ( zaobserwowana ) zmiennej objaśnianej w okresie t=1,...,n

- średnia arytmetyczna wartości empirycznej zmiennej objaśnianej

Współczynnik determinacji jest miarą dokładności dopasowania modelu do danych empirycznych. Współczynnik ten określa , jaka część zmienności zmiennej objaśnianej jest wyjaśniana przez model. Dla jednorównaniowego modelu ekonometrycznego z wyrazem wolnym wartość współczynnika determinacji jest wartością unormowaną z przedziału [ 0,1 ].

Skorygowany współczynnik determinacji - wykorzystuje się do oceny dopasowania modelu w przypadku , gdy n jest niewiele większe od k szacowanych parametrów. Poprawiony
jest zawsze mniejsze od R².

Skorygowany współczynnik determinacji wyraża się wzorem :

przy czym

gdzie : R² - współczynnik determinacji

k- liczba zmiennych objaśniających

n- liczba obserwacji

Badanie dopuszczalności modelu za pomocą współczynnika zbieżności :

Współczynnik zbieżności ( zgodności ) jest to stosunek wariancji resztowej
do wariancji zmiennej y , czyli
. Współczynnik zbieżności można zapisać za pomocą następującej formuły :

0x01 graphic

Miara ta mówi o udziale wariancji odchyleń od modelu ( reszt ) w ogólnej wariancji zmiennej objaśnianej . Im mniejsza wartość współczynnika zbieżności tym lepsze przyleganie modelu do opisywanego fragmentu rzeczywistości ekonomicznej.

Współczynnik ten jest miarą unormowaną i zawiera się w przedziale [0,1 ]. Im wartość współczynnika zbieżności jest bliższa zera, tym model lepiej opisuje badane zjawisko.

Między współczynnikiem zbieżności a współczynnikiem determinacji zachodzi relacja :

Wyrazistość modelu - możemy charakteryzować za pomocą współczynnika zmienności losowej danej wzorem :

gdzie :

- odchylenie standardowe reszt modelu

- średnia arytmetyczna zmiennej objaśnianej

Procedura weryfikacyjna polega na wyznaczeniu współczynnika zmienności losowej i porównaniu go z przyjętą z góry wartością krytyczną .

W przypadku gdy W > W_* , to model można uznać za wyrazisty. W przypadku , gdy
, to model budzi zastrzeżenia i powinien być poddany ponownej obróbce.

Weryfikacja składnika losowego

W procesie estymacji parametrów modelu ekonometrycznego formułuje się szereg założeń dotyczących składnika losowego. W etapie weryfikacji należy ustalić , czy przyjęte założenia są słuszne. Do badania własności odchyleń losowych wykorzystuje się odpowiednie testy statystyczne. Przeprowadzając analizę własności odchyleń losowych możemy ocenić , czy dobór zmiennych objaśniających jest właściwy oraz czy postać analityczna modelu jest odpowiednia.

Badanie losowości

Do weryfikacji losowości składników losowych służy test liczby serii.

Punktem wyjścia jest ciąg reszt uporządkowanych według kolejności czasu, w przypadku , gdy model jest budowany na podstawie danych dynamicznych.

W przypadku , gdy model jest budowany na podstawie danych przekrojowych , reszty porządkuje się według rosnących wartości zmiennej objaśniającej ( jeśli w modelu jest jedna zmienna objaśniająca ) lub według rosnących wartości wybranej zmiennej objaśniającej ( jeśli w modelu jest wiele zmiennych objaśniających ).

Dla uporządkowanego ciągu oblicza się liczbę serii S reszt modelu . Serią jest każdy podciąg reszt złożonych wyłącznie z elementów dodatnich i ujemnych.

Z tablic testu liczby serii dla danej liczby reszt dodatnich n₁ i liczby reszt ujemnych n₂ oraz przyjętego poziomu istotności α ( tj. dla α/2 i 1- α/2 ) odczytujemy dwie krytyczne liczby serii :
i
.

Jeśli
, to nie ma podstaw do odrzucenia hipotezy H_o Oznacza to , że rozkład odchyleń losowych jest losowy, a postać analityczna została dobrana trafnie. Jeśli
lub
to hipotezę H_o należy odrzucić i przyjąć hipotezę H₁ .

W przypadku , gdy
czyli w naszym przykładzie 3 < 6 < 9 , wobec tego nie ma podstaw do odrzucenia hipotezy H_o , co oznacza , że rozkład odchyleń jest losowy , a postać analityczna modelu została trafnie dobrana.

Badanie losowości składnika losowego - przykład

Mając dany wektor reszt

0x08 graphic

1.Formułujemy odpowiednie hipotezy statystyczne

H0 : składnik losowy ma rozkład losowy

H1 : składnik losowy nie ma rozkładu losowego

2. Przyporządkowanie resztom odpowiednich symboli

Jeżeli ei > 0 - to symbol A

Jeżeli ei < 0 - to symbol B

Uwaga ! Reszty równe zero w badaniach pomijamy.

W naszym przykładzie otrzymujemy następujący ciąg symboli

BBBAAAAABBBABBA

3. Ustalamy liczbę serii S

S=6

4. Ustalamy liczbę reszt dodatnich n₁ i ujemnych n₂

n₁ = 7 , n₂ = 8

5. Z tablic odczytujemy statystykę teoretyczną S₁, dla ustalonych wartości n₁, n₂ i α=0,05 ( test lewostronny )

S₁= 4

Z tablic odczytujemy statystykę teoretyczną S₂, dla ustalonych wartości n₁, n₂ i α=0,05 ( test prawostronny )

S₂= 12

6. Porównujemy wartości statystyk teoretycznych S₁, S₂ z wartościami empirycznymi S , w naszym przypadku zachodzi relacja

S₁ < S < S₂

to nie ma podstaw do odrzucenia hipotezy H₀. Oznacza to , że rozkład reszt jest losowy.

Badanie normalności rozkładu składnika losowego - sprowadza się do weryfikacji hipotezy , że dystrybuanta odchyleń F(e ) jest równa dystrybuancie rozkładu normalnego F_N ( e ).Do weryfikacji hipotezy o normalności rozkładu składnika losowego służy między innymi test zgodności Hellwiga .

Procedura testu Hellwiga jest następująca :

Przeprowadza się standaryzację reszt modelu według wzoru :

( t= 1,2,...,n )

gdzie :

- średnia arytmetyczna reszt e_t ( t= 1,2,...,n )

- odchylenie standardowe reszt oblicza się według wzoru :

0x01 graphic
, przy czym w przypadku szacowania modelu KMNK

Zestandaryzowane reszty porządkuje się według wartości niemalejących, w następujący sposób :
Z tablic dystrybuanty rozkładu normalnego odczytuje się wartość dystrybuanty
Wyznacza się tzw. cele I_t( t= 1,2,...,n ) , którymi są przedziały liczbowe o rozpiętości 1/n powstałe po podzieleniu odcinka [ 0,1 ] na n równych części.

Wartość dystrybuanty
przyporządkowuje się odpowiednim celom i określa się liczbę cel pustych K, tj. takich , do których nie trafiła żadna wartość
.

Z tablic testu zgodności Hellwiga dla danej liczby obserwacji n oraz dla przyjętego poziomu istotności α odczytuje się krytyczną liczbę cel pustych K^* tak , że
.

Przykład

0x08 graphic

1. Należy uporządkować reszty i zestandaryzować

2. Należy odczytać z tablic dystrybuanty rozkładu normalnego wartości F ( u i )

0x08 graphic

3. Należy utworzyć przedziały Ii „ cele „

0, 00000 - 0,06667 ++

0,06667 - 0,13333 +

0,13333 - 0, 2000 -

0,20000 - 0,26667 ++

0,26667 - 0,33333 -

0,33333 - 0,40000 +

0,40000 - 0,46667 ++

0,0,46667 - 0,53333 -

0,53333 - 0,60000 -

0,60000 - 066667 +

0,66667 - 0,73333 -

0,73333 - 0,80000 ++

0,80000 - 0,86667 +++

0,86667 - 0,93333 -

0,93333 - 1,0000 +

4. Ustalamy liczbę cel pustych K emp. = 6

5. Odczytujemy z tablic zgodności Hellwiga dla n=15 i α=0,05 wartości statystyk teoretycznych K₁ i K₂

K₁ = 2

K₂ = 7

W rozpatrywanym przypadku zachodzi nierówność

K₁< Kemp < K₂ .

Oznacza to , że nie ma podstaw do odrzucenia H_O , rozkład reszt jest zbliżony do rozkładu normalnego

Badanie autokorelacji odchyleń losowych

Celem badania jest sprawdzenie jednego z założeń KMNK , który brzmi :„ autokorelacja odchyleń losowych nie występuje (ciąg reszt jest ciągiem niezależnych zmiennych losowych)

Autokorelacja oznacza liniową zależność odchyleń losowych pochodzących z różnych okresów badania.

Badanie przeprowadzamy dla modeli zbudowanych w oparciu o czasowe szeregi danych.

Jeżeli autokorelacja występuje , oznacza to , że nie zostało spełnione jedno z założeń KMNK. Należy wrócić do etapu III procedury badań ekonometrycznych i dokonać ponownej estymacji parametrów metodą różniczki zupełnej.

Przyczyny autokorelacji

1.Własności pewnych zjawisk ekonomicznych

2.Błędy w sztuce ekonometrycznej

W większości przypadków , jeśli autokorelacja ma miejsce, to jest to autokorelacja pierwszego rzędu. Zdarzają się jednak sytuacje , gdy zachodzi autokorelacja wyższych rzędów , mimo , że nie występuje autokorelacja pierwszego rzędu.

Test Durbina - Watsona służy do badania autokorelacji pierwszego rzędu. Aby możliwe było zastosowanie tego testu , rozpatrywany model musi zawierać wyraz wolny. Składnik losowy powinien mieć rozkład normalny i w roli zmiennej objaśniającej nie może występować zmienna endogeniczna opóźniona w czasie .

Badanie autokorelacji odchyleń losowych

1.Etap 1

Sformułowanie hipotez statystycznych

0x08 graphic

Współczynnik korelacji reszt dotyczących okresów t z resztami z okresu poprzedniego t-1 nieistotnie różni się od zera - autokorelacja nie występuje

0x08 graphic

Współczynnik korelacji reszt dotyczących okresu t z resztami z okresu poprzedniego t-1 istotnie różni się od zera- autokorelacja występuje.

Etap 2.

Obliczenie współczynnika korelacji reszt z okresu t z resztami opóźnionymi o 1 okres ( współczynnik autokorelacji ) według wzoru

0x08 graphic

Gdzie

et - reszty z okresu bieżącego

et-1 - reszty opóźnione o jeden okres

Etap 3

Obliczenie statystyki empirycznej d według wzoru :

0x08 graphic

Etap 4

Odczytanie z tablic do testu Durbina - Watsona wartości statystyk teoretycznych d_L i d_U dla przyjętego poziomu istotności α, n obserwacji oraz k zmiennych objaśniających.

Etap 5

Jeżeli

To występuje autokorelacja dodatnia .

1.Gdy d > d_u - to nie ma podstaw do odrzucenia H₀, współczynnik autokorelacji jest nieistotny , autokorelacja nie występuje

2.Gdy d < d _L - to H₀ należy odrzucić na rzecz H₁, współczynnik autokorelacji istotnie różni się od zera , występuje autokorelacja pierwszego rzędu

3.Gdy

To przy użyciu testu Darbina - Watsona nie można podjąć żądnej decyzji . Należy zastosować inny test.

Jeżeli

To występuje autokorelacja ujemna . Należy obliczyć wartość statystyki d` , czyli d` = 4 - d

1. Gdy d` < d_L - H₀ należy odrzucić na rzecz H₁, współczynnik autokorelacji istotnie różni się od zera , występuje autokorelacja pierwszego rzędu

2.Gdy d` > d_u - nie ma podstaw do odrzucenia H₀ współczynnik autokorelacji jest nieistotny , autokorelacja nie występuje

3. Gdy

Nie można podjąć żadnej decyzji , należy zastosować inny test.

Test t - Studenta służy do badania autokorelacji pierwszego i wyższych rzędów

Etap I Sformułowanie hipotez statystycznych

Współczynnik korelacji reszt dotyczących okresu t z resztami z okresu t - r (gdzie r = 1,2,...,n ) nieistotnie różni się od zera - autokorelacja nie występuje .

Współczynnik korelacji reszt dotyczących okresu t z resztami z okresu t - r ( gdzie r = 1,2,...,n ) istotnie różni się od zera - występuje autokorelacja.

Etap II Obliczenie współczynnika korelacji reszt z okresu t z resztami opóźnionymi o r ( współczynnik autokorelacji ) według wzoru

0x08 graphic

Etap III Obliczenie statystyki empirycznej te według wzoru

Etap IV

Odczytanie z tablic do testu t- Studenta wartości statystyki teoretycznej t_t dla zadanego poziomu istotności α i n-2-r stopni swobody

Etap V

Sprawdzenie poniższych zależności

Gdy

0x08 graphic

To nie ma podstaw do odrzucenia H₀ , współczynnik autokorelacji nieistotnie różni się od zera - autokorelacja nie występuje.

Jeżeli te > tt to należy odrzucić hipotezę zerową ,na rzecz hipotezy alternatywnej - współczynnik autokorelacji istotnie różni się od zera - autokorelacja występuje.

Przykład

Badanie autokorelacji pierwszego rzędu z wykorzystaniem testu Durbina - Watsona

Wyniki obliczeń - współczynnika autokorelacji i statystyki Durbina - Watsona

wynoszą odpowiednio :

0x08 graphic

d= 1,2840855

n=15

k=2

d_L =095

d_U = 1,54

Gdy zachodzi następująca zależność :

d_L < d < d_U

To na podstawie testu Durbina - Watsona nie można podjąć decyzji o braku autokorelacji pierwszego rzędu.

Do zweryfikowania hipotez statystycznych należy zatem wykorzystać test t - Studenta .

Badanie autokorelacji pierwszego rzędu z wykorzystaniem testu t - Studenta

Krok 1. Formułujemy hipotezy statystyczne

Krok 2 . Obliczamy współczynnik autokorelacji , który wynosi

Krok 3. Obliczamy statystykę empiryczną t , która wynosi te = 1,1982099

Krok 4 . Odczytujemy z tablic rozkładu t- Studenta , dla poziomu istotności α = 0,05

i n-2-1 =12 stopni swobody , statystykę teoretyczną tt = 2,179

Krok 5 . Sprawdzamy relacje , gdy zachodzi nierówność te < tt to nie ma podstaw do odrzucenia H₀ i można przyjąć , że nie występuje autokorelacja odchyleń losowych pierwszego rzędu.

Badanie autokorelacji drugiego rzędu z wykorzystaniem testu t- Studenta

1.Formułujemy hipotezy statystyczne

2.Obliczamy wartość współczynnika korelacji , który wynosi :

Uwaga ! Przy obliczaniu współczynnika korelacji nie uwzględnia się dwóch pierwszych elementów wektora reszt z okresu t i dwóch ostatnich elementów wektora reszt z okresu t-2

3. Obliczamy wartość statystyki empirycznej te, która w naszym przykładzie wynosi te = 0,073159082

4. Odczytujemy z tablic rozkładu t- Studenta , dla przyjętego poziomu istotności α=0,05 i n - 2 - 2 = 11 stopni swobody , statystyka tt = 2,201

5. Sprawdzamy relację , w naszym przypadku te < tt. Nie ma podstaw do odrzucenia H₀ , można przyjąć , że nie występuje autokorelacja odchyleń losowych drugiego rzędu.

Badanie symetrii i stałości wariancji składnika losowego

Celem badania symetrii rozkładu składnika losowego jest sprawdzenie poprawności doboru postaci analitycznej modelu.

Jeżeli rozkład elementu losowego okaże się niesymetryczny , to należy wrócić do etapu II i dokonać ponownego wyboru postaci analitycznej modelu.

Sprawdzanie symetrii rozkładu elementu losowego.

Etap 1. Sformułowanie hipotez statystycznych

Element losowy ma rozkład symetryczny

Element losowy nie ma rozkładu symetrycznego

Gdzie : m - to liczba reszt dodatnich lub ujemnych

Etap 2 . Ustalenie wektora reszt e

Etap 3. Ustalenie liczby reszt dodatnich lub ujemnych

Uwaga ! Reszty równe zero w badaniach pomijamy

Etap 4. Zweryfikowanie na podstawie testów hipotez postawionych w etapie 1

Badanie symetrii za pomocą testu t- Studenta ( tylko dla małej próby )

Wyznaczenie statystyki według wzoru :

0x08 graphic

Statystykę teoretyczną t_t odczytujemy z tablic rozkładu t- Studenta , dla zadanego poziomu istotności α i n-1 stopni swobody .

Jeżeli

To nie ma podstaw do odrzucenia H₀, czyli rozkład jest symetryczny. Jeżeli spełniona jest nierówność

te > tt

To należy odrzucić H₀ na rzecz H₁ , rozkład reszt nie jest symetryczny.

Przykład

1.Formułujemy odpowiednie hipotezy statystyczne

2.Ustalamy wektor reszt e ( Zakładamy , że wektor reszt wynosi odpowiednio jak w poprzednich przykładach )

3. Określamy liczbę reszt dodatnich m₊ oraz liczbę obserwacji n m₊ = 7 , n= 15

4. Obliczamy wartość statystyki empirycznej te

0x08 graphic

5.Z Tablic t- Studenta odczytujemy wartość tt , dla n=15 i α=0,05 , t_t = 2,145

6. Zachodzi nierówność te < t_t .

Wobec tego rozkład jest symetryczny.

Badanie stacjonarności odchyleń losowych

Celem jest sprawdzenie stałości wariancji odchyleń losowych .

Jeżeli moduły reszt są skorelowane z czasem , to rozkład odchyleń losowych nie jest stacjonarny .

Badanie to przeprowadza się dla modeli zbudowanych w oparciu o szeregi czasowe danych.

Weryfikacja stacjonarności odchyleń losowych

Etap 1 . Sformułowanie hipotez statystycznych

Współczynnik korelacji modułów reszt z czasem nieistotnie różni się od zera, możemy przyjąć , że rozkład odchyleń losowych jest stacjonarny

Współczynnik korelacji modułów reszt z czasem istotnie różni się od zera, możemy przyjąć , że rozkład odchyleń losowych nie jest stacjonarny

Etap 2. Obliczenie współczynnika korelacji modułów reszt z czasem według wzoru

Gdzie : t- zmienna czasowa

Etap 3. Obliczenie statystyki empirycznej te według wzoru :

0x08 graphic

Etap 4. Odczytanie z tablic rozkładu t- Studenta wartości statystyki teoretycznej tt, dla zadanego poziomu istotności α i n-2 stopni swobody

Etap 5. Sprawdzenie poniższych zależności

Jeżeli spełniona jest powyższa relacja to nie ma podstaw do odrzucenia H₀ , współczynnik korelacji modułów reszt z czasem nieistotnie różni się od zera ( wariancja odchyleń losowych jest stała )

Jeżeli te > tt

to należy odrzucić H₀ , na rzecz H₁, współczynnik korelacji modułów reszt z czasem istotnie różni się od zera ( wariancja odchyleń losowych zmienia się w czasie )

Badanie istotności parametrów strukturalnych modelu.

Celem badania jest sprawdzenie istotności wpływu zmiennych objaśniających na zmienną objaśnianą.

Uwaga ! Warunkiem badania istotności parametrów strukturalnych jest spełnienie założenia o normalności rozkładu reszt.

Test F Fishera - Snedecora Jest najbardziej ogólnym testem statystycznym , który sprawdza czy przynajmniej jeden parametr strukturalny w sposób istotny różni się od zera.

Schemat postępowania przy weryfikacji istotności parametrów strukturalnych , z wykorzystaniem testu F Fishera - Snedecora.

Etap 1. Sformułowanie hipotez statystycznych

przy hipotezie alternatywnej H₁, że przynajmniej jedna składowa powyższego wektora jest różna od zera .

0x08 graphic

Etap 2. Wyznaczenie statystyki empirycznej F wyrażonej wzorem

Statystyka ta ma rozkład F o m₁ = k ( k liczba zmiennych objaśniających modelu ) oraz m₂ = n - ( k+1) stopniach swobody.

Statystykę teoretyczną F* odczytuje się z tablic do testu F dla zadanego poziomu istotności α oraz m₁ i m₂ stopni swobody.

Etap 3. Sprawdzanie poniższych zależności

Gdy zachodzi taka relacja , to brak podstaw do odrzucenia H_o , co oznacza , że wszystkie parametry strukturalne modelu w sposób nieistotny różnią się od zera, czyli procedurę budowy modelu trzeba rozpocząć od początku , ponieważ należy usunąć wszystkie zmienne objaśniające modelu .

W przypadku , gdy spełniona jest nierówność F > F*

to należy odrzucić H₀ na rzecz H₁ , co oznacza , że przynajmniej jeden z parametrów strukturalnych modelu w sposób istotny różni się od zera.

Jeżeli w wyniku weryfikacji istotności parametrów strukturalnych z wykorzystaniem test F Fishera - Snedecora okazało się , że przynajmniej jeden parametr strukturalny modelu jest istotnie różny od zera , wówczas należy sprawdzić istotność wszystkich parametrów strukturalnych modelu ( istotności wyrazu wolnego nie bada się ). W tym celu pomocny staje się test t- Studenta.

Test t- Studenta Schemat postępowania przy badaniu istotności parametrów strukturalnych z wykorzystaniem testu t- Studenta.

Etap I . Sformułowanie hipotez statystycznych

Ocena parametru strukturalnego stojącego przy i- tej zmiennej objaśniającej nieistotnie różni się od zera .

Ocena parametru strukturalnego stojącego przy i-tej zmiennej objaśniającej istotnie różni się od zera

Etap II . Wyznaczenie statystyki empirycznej według wzoru

0x08 graphic

Etap III. Odczytanie statystyki teoretycznej tt z tablic rozkładu t- Studenta dla danego poziomu istotności α i n-( k+1) stopni swobody

Etap IV Porównanie zależności

Jeśli zachodzi relacja

to nie ma podstaw do odrzucenia H₀ czyli ocena parametru stojącego przy i-tej zmiennej objaśniającej nieistotnie różni się od zera

Jeśli spełniona jest nierówność

to należy odrzucić H₀ na rzecz H₁, ocena parametru stojącego przy i - tej zmiennej objaśniającej istotnie różni się od zera.

Wykład 7. Wprowadzenie do prognozowania

Termin „ prognoza „ został wprowadzony do nauki przez Hipokratesa. W medycynie prognoza oznacza rokowanie o rozwoju i skutkach choroby .Greckie słowo gnoza oznacza wiedzę, zaś „ prognoza „ to uprzednia wiedza, przewidywanie. Pojęcie „ prognozy „ było różnie definiowane w literaturze. W definiowaniu prognozy głównym problemem jest czas, powstaje pytanie : czy prognoza powinna dotyczyć tylko przyszłości ?

H. STEINHAUS stoi na stanowisku, że prognoza to zarówno przepowiednia jak i szacowanie, a zatem nie uważał, iż prognoza musi dotyczyć przyszłości.

Takie stanowisko można również znaleźć w pracy Z. Hellwiga .Przez prognozę statystyczną rozumie każdy sąd, którego prawdziwość jest zdarzeniem losowym, przy czym prawdopodobieństwo tego zdarzenia jest znane i wystarczająco duże dla celów praktycznych. Z definicji tej wynika, że prognoza statystyczna i hipoteza statystyczna to pojęcia o zbliżonym znaczeniu.

S. Ostasiewicz rozumuje podobnie, twierdząc, że dopóki prognozowanie rozpatrujemy z logicznego punktu widzenia, to nie ma żadnej różnicy w postępowaniu nazywanym wyjaśnianiem a prognozowaniem, w obu przypadkach na podstawie teorii dedukujemy nowe fakty, a nowe to już istniejące, ale nam nie znane, lub takie, które nie miały miejsca.

W. Sadowski reprezentuje podobny pogląd. W pracy „Diagnoza i prognoza „ , traktując prognozę jako informację X o stanie świata zewnętrznego Z, przy czym informacja X może być bezpośrednią lub też pośrednią informacją o stanie Z.

A.Smoluk definiuje prognozę jako „ wnioskowanie o rzeczach niedostępnych bezpośrednio poznaniu, przeszkodą może być czas, przestrzeń lub jeszcze coś innego „

Definicja prognozy jako sądu o przyszłości posiada wielu zwolenników, wśród nich na uwagę zasługują prace takich autorów jak : Z. Pawłowski, A. Zeliaś, oraz Z. Czerwiński.

W pracach Z. Pawłowskiego można znaleźć rozróżnienie takich pojęć jak : predykcja i prognoza. Przez predykcję rozumie ogół zasad i metod wnioskowania o przyszłości na podstawie odpowiedniego modelu ekonometrycznego, opisującego pewien wycinek życia gospodarczego, natomiast prognoza to konkretny wynik predykcji.

Podobny pogląd reprezentuje A. Zeliaś w pracy: Teoria prognozy. Polskie Wydawnictwo Ekonomiczne. Warszawa 1997.

Prognozowanie według Z. Czerwińskiego, jest działalnością intelektualną , jest zawsze czyjąś prognozą ( osoby, zespołu osób, ogólnie prognostyka . ( Z. Czerwiński : Dylematy ekonomiczne. PWE, Warszawa,1992 )

Zdaniem M. Cieślak , prognozą określa się sąd o następujących właściwościach:

1. sformułowany z wykorzystaniem dorobku nauki

odnoszący się do określonej przyszłości
weryfikowalny empirycznie
niepewny, ale akceptowany.

Prognozy mogą spełniać szereg funkcji, w literaturze wymienia się :

funkcja preparacyjna czyli wspomagająca proces decyzyjny

funkcja aktywizująca prognozy polega na pobudzeniu do podejmowania działań sprzyjających realizacji prognozy, gdy zapowiada ona zdarzenia korzystne, i przeciwstawiających się jej realizacji, gdy przewidywane zdarzenia są oceniane jako niekorzystne
funkcja informacyjna, polegająca na oswajaniu ludzi z nadchodzącymi zmianami i zmniejszaniu lęku przed przyszłością
funkcja ostrzegawcza ma na celu ostrzeżenie przed nadejściem niepożądanych wydarzeń
funkcja badawcza sprowadza się do rozpoznania przyszłości

Podział prognoz ze względu na różne kryteria:

Ze względu na horyzont czasowy wyróżnia się : prognozy długo, średnio- i krótkookresowe,

perspektywiczne, operacyjne i strategiczne.

Ze względu na charakter lub strukturę :prognozy proste i złożone, ilościowe i jakościowe.

Ze względu stopień szczegółowości: prognozy ogólne i szczegółowe

Ze względu na zakres ujęcia :prognozy całościowe i częściowe, globalne i odcinkowe, kompleksowe i fragmentaryczne

Ze względu na zasięg terenowy :prognozy światowe, międzynarodowe, krajowe, regionalne ze względu na metodę opracowania: prognozy indukcyjne, dedukcyjne, minimalne i inne

Ze względu na cel i funkcję: prognozy ostrzegawcze, badawcze, normatywne, aktywne, pasywne i inne.

Procedura prognozowania obejmuje:

sformułowanie zadania prognostycznego ( polega na określeniu obiektu, zjawiska, zmiennych, które mają podlegać prognozowaniu oraz określeniu celu sporządzania prognoz i wymagań co do dopuszczalności i horyzontu prognozy ).
określenie przesłanek prognostycznych ( sprowadza się do sformułowania hipotez o czynnikach kształtujących zjawisko, zebranie zbioru danych potrzebnych do sporządzenia prognoz ).
wybór metody prognozowania (metody matematyczno- statystyczne czy nie matematyczne)
wyznaczenie prognozy ( zgodnie z założeniami przyjętymi w pierwszym etapie )
ocena dopuszczalności prognozy ( za pomocą odpowiednich miar )
weryfikacja prognozy polega na określeniu trafności prognoz za pomocą odpowiednich mierników.

Zasady predykcji

Zasady predykcji określają pewne warunki, jakie powinny być spełnione przy wyznaczaniu prognozy. W literaturze wymienia się dwie zasady :

1.zasada predykcji nieobciążonej polega na tym, że prognozę ustala się na poziomie nadziei matematycznej zmiennej prognozowanej w okresie t, a więc tak aby
. zasada ta ma znaczenie wówczas, gdy proces wnioskowania może być powtarzany wiele razy.

W warunkach jednorazowo przeprowadzanej predykcji zasada nieobciążoności traci na znaczeniu, wówczas należy stosować zasadę największego prawdopodobieństwa.

2.Zasada największego prawdopodobieństwa, polega na tym, że gdy zmienna prognozowana jest skokowa to za prognozę przyjmuje się tę wartość zmiennej, której odpowiada największe prawdopodobieństwo realizacji w czasie t, a przy zmiennej ciągłej prognoza jest równa tej zmiennej, dla której funkcja gęstości prawdopodobieństwa zmiennej y w okresie t posiada maksimum.

Podstawowe założenia predykcji

1.Znajomość ekonometrycznego modelu dla zmiennej prognozowanej

2.Stabilność w czasie relacji strukturalnych

3.Stabilność rozkładu składnika losowego

4.Znajomość wartości zmiennych objaśniających w okresie prognozowanym

5.Dopuszczalność ekstrapolacji poza próbę statystyczną

Prognoza punktowa i przedziałowa

Do prognozowania posługujemy się modelem oszacowanym na podstawie danych z okresów t=1,2,...,n mającym postać :

dla którego znane jest oszacowanie macierzy wariancji kowariancji estymatora a, czyli

0x01 graphic

Symbolem T oznaczymy okres prognozy, t > n .

Prognoza punktowa

Zakładamy, że wartości zmiennych egzogenicznych w modelu dla okresu t ma postać :

0x01 graphic

Prognozę wartości zmiennej endogenicznej w okresie prognozowanym ( T) wyznaczamy ze wzoru:

dla prognozy punktowej, średni błąd predykcji ex ante wyraża się wzorem :

Jeśli spełnione jest założenie, mówiące o tym, że składnik losowy w każdym z okresów ma rozkład normalny o wartości oczekiwanej 0 i skończonej i stałej wariancji
(
dla t = 1, 2, ..., n , to na podstawie modelu ekonometrycznego można wyznaczyć prognozy przedziałowe.

Przedział ufności ma postać następującą:

gdzie:

- jest przyjętym poziomem ufności

- odpowiednią wartością krytyczną odczytaną z tablic rozkładu t- Studenta

Otrzymany przedział liczbowy

stanowi prognozę przedziałową zmiennej y na okres T, a prawdopodobieństwo
jest miarą wiarygodności prognozy.

Wykorzystanie modelu regresji liniowej do prognozowania.

Regresja jest terminem, który na trwale zajął miejsce w statystyce i ekonometrii. oznacza on statystyczne metody modelowania związków między zmiennymi. Najpierw zajmiemy się prostą regresją liniową czyli modelowaniem związku między dwiema zmiennymi : zmienną zależną ( objaśnianą , endogeniczną ) oznaczoną jako y i zmienną niezależną (objaśniającą)

oznaczoną jako x.

Wyznaczanie prognozy punktowej i przedziałowej na podstawie modelu regresji.

Przykład Firma American Exspress jest przekonana, że posiadacze jej kart kredytowych podróżują w interesach lub dla przyjemności więcej niż inni ludzie. w ramach obszernych badań prowadzonych przez nowojorską firmę marketingową na zlecenie American Exspress podjęto próbę ustalenia związku między długością trasy podróży a obciążeniem karty kredytowej jej posiadacza.

Firma marketingowa pobrała próbę 25 posiadaczy kart kredytowych American Express zapisanych w rejestrze komputera i odnotowała obciążenia tych kart w pewnym okresie. do posiadaczy kart kredytowych rozesłano kwestionariusze z prośbą o podanie długości tras odbytych przez nich podróży. W tym samym czasie zebrano i przedstawiono w poniższej tablicy dane do badania przeprowadzonego na zlecenie firmy American Ekspress.

obciążenie kart ($)-y	Długość tras (w milach)-x
1 802	1 211
2 405	1 345
2 005	1 422
2 511	1 687
2 332	1 849
2 305	2 026
3 016	2 133
3 385	2 253
3 090	2 400
3 694	2 468
3 371	2 699
3 998	2 806
3 555	3 082
4 692	3 209
4 244	3 466
5 298	3 643
4 801	3 852
5 147	4 033
5 738	4 267
6 420	4 498
6 059	4 533
6 426	4 804
6 321	5 090
7 026	5 233
6 964	5 439

Na podstawie zebranych danych należy sporządzić wykres w którym rozrzut punktów będzie świadczył czy linia prosta będzie dobrze opisywała badaną zależność. Prezentując dane na wykresie można uzyskać odpowiedź na pytanie: czy występuje tendencja do wzrostu obciążenia kart kredytowych w miarę jak wzrasta długość tras podróży.

Wykorzystując program Statistica Pl, otrzymano następujące wyniki:

Oszacowany model ma postać następującą :

( 170,3368) ( 0,0497

t 1,61357 25,24821

- współczynnik determinacji

- współczynnik determinacji poprawiony

- błąd standardowy estymacji, informuje o przeciętnej wielkości odchyleń empirycznych wartości zmiennej zależnej od wyliczonych z modelu ( teoretycznych ). Mówi nam o stopniu dopasowania modelu do danych empirycznych. Im
mniejsze, tym lepiej dopasowany model.

Interpretacja ekonomiczna uzyskanych wyników

Ocena parametru
wynosząca 274,8497 oznacza, że gdyby zmienna x czyli długość tras przybrała wartość zerową, to należałoby oczekiwać, że średnie obciążenie kartami kredytowymi wyniesie 274,8497.

Ocena parametru
wynosi 1,2553 co oznacza, że jeśli długość tras wzrośnie o jednostkę, to należy oczekiwać, że średnie obciążenie kartami kredytowymi wzrośnie o 1,2553.

Błąd standardowy estymacji wynosi 318,16 - co oznacza, że przewidywane przez oszacowane równanie wartości zmiennej objaśnianej - obciążenie kart kredytowych średnio różnią się od empirycznych wartości tej zmiennej o 318,16.

Odchylenia standardowe estymatorów zwane średnimi albo standardowymi błędami szacunku parametrów wynoszą odpowiednio:

Możemy powiedzieć, że szacując wyraz wolny
wynoszący 274,8497 mylimy się średnio o 170,3368, a szacując parametr
stojący przy zmiennej x (długość tras ), wynoszący 1,2553 mylimy się średnio o 0,0497 . Powstaje pytanie, czy to dużo czy mało ?

Standardowe błędy szacunku nie są w praktyce wygodne do interpretacji, dużo łatwiej zinterpretować iloraz t zdefiniowany jako stosunek oceny do błędu szacunku parametrów.

Okazuje się, że ocena wyrazu wolnego jest 1,6 razy większa od błędu szacunku , natomiast w przypadku oceny parametru stojącego przy x , aż 25,3 razy większa od błędu szacunku.

Współczynnik determinacji wynoszący 0,9651 wskazuje na dobre dopasowanie równania do danych empirycznych. można powiedzieć, że za pomocą równania ( lub za pomocą zmiennych objaśniających) udało się objaśnić ) 0,9651 zmienności zmiennej objaśnianej, mówiąc prościej, że wahania zmiennej objaśnianej udało się objaśnić w 96,51%.

Przeprowadzona weryfikacja ( ocena ) modelu pod względem merytorycznym i statystycznym pozwala dopuścić oszacowaną funkcję regresji do prognozowania.

Prognozy punktowe na podstawie równania regresji jest bardzo łatwo stawiać. A cały zabieg sprowadza się do podstawienia za x takiej wartości, dla której chcemy przewidzieć wartość y.

Przypuśćmy, że w rozpatrywanym przykładzie z kartami kredytowymi American Exspress, chcemy przewidzieć, jakie będzie obciążenie kart kredytowych wśród tych posiadaczy kart, których trasa podróży osiągnie 4 000 mil w badanym okresie ?

Prognoza punktowa wyniesie:

Prognozy punktowe nie są wolne od wad i mogą być błędne. Błąd może pochodzić zarówno z niepewności szacunków, jak i z losowej zmienności położenia punktów w stosunku do linii regresji.

Prognozy przedziałowe

Jeśli spełnione jest założenie, mówiące o tym, że składnik losowy w każdym z okresów ma rozkład normalny o wartości oczekiwanej 0 i skończonej i stałej wariancji
(
dla t = 1, 2, ..., n ,to na podstawie modelu regresji liniowej można wyznaczyć prognozy przedziałowe.

Przedział predykcji ma postać następującą:

gdzie:

- jest przyjętym poziomem ufności

- wartość prognozy w punkcie

- średni błąd predykcji wyznaczony według wzoru 0x01 graphic

0x01 graphic
, n - liczba obserwacji,

- wartość t- Studenta odczytana z tablic rozkładu Studenta

gdy n < 30, przy przyjętym poziomie istotności i wyznaczonych stopniach swobody.

Otrzymany przedział liczbowy

stanowi prognozę przedziałową zmiennej y na okres T, a prawdopodobieństwo
jest miarą wiarygodności prognozy.

W naszym przykładzie przedział predykcji wynosi :

[ 5139,736 ; 5452,634 ]

Opierając się na wynikach badań możemy mieć 95 % zaufania do prognozy, że posiadacz karty, który przebył trasę o długości 4 000 mil w badanym okresie obciąży swoją kartę kredytową sumą od 5 139,736 do 5 452,634.

Wykład 8 Możliwości wykorzystania jednorównaniowych modeli ekonometrycznych w praktyce

Ekonometryczna analiza procesu produkcyjnego

Funkcją produkcji - tradycyjnie nazywa się model zależności pomiędzy wartością lub wielkością produkcji ( firmy , gospodarki ) a nakładami czynników produkcji użytych do wytwarzania tej produkcji (pracy , kapitału , surowców itp. ). Najczęściej rozpatruje się dwuczynnikową funkcje produkcji , uwzględniając kapitał ( K ) i pracę ( L ) jako dwa główne czynniki produkcji - jest to duże uproszczenie i uogólnienie tego zjawiska .

Opis rzeczywistych procesów produkcyjnych może wymagać uwzględnienia bardziej subtelnych podziałów i rozróżnień

Przy oznaczeniu wielkości ( wartości ) produkcji przez Q , wartości kapitału przez K oraz nakładów pracy przez L , funkcję produkcji można zapisać jako:

Q = (K,L)

Przy użyciu funkcji produkcji możemy badać , czy modelowany proces produkcji posiada pewne własności znane z ekonomii. Są one związane z wpływem zmian poszczególnych czynników produkcji na jej poziom, ze współzależnością pomiędzy czynnikami itp.. Gdy interesuje nas , jak zmieni się poziom produkcji pod wpływem zmian nakładu jednego z czynników produkcji , badamy krańcową produktywność danego czynnika

Krańcową produktywność danego czynnika obliczamy jako pochodną cząstkową funkcji produkcji względem danego czynnika , czyli

Krańcowa produktywność danego czynnika oznacza, o ile w przybliżeniu zmieni się wielkość produkcji , jeśli zwiększy się zużycie tego czynnika o jednostkę , przy nie zmienionych nakładach pozostałych czynników.

Często nie wystarcza wiedza o tym , o ile wzrośnie lub zmaleje produkcja w wielkościach absolutnych. Trzeba badać względne przyrosty produkcji pod wpływem zmian czynnika .

Elastyczność produkcji względem danego czynnika oznacza względny przyrost produkcji wywołany względnym wzrostem nakładu tego czynnika , przy pozostałych nakładach nie zmienionych.

Do obliczenia elastyczności produkcji Q względem nakładów czynnika X korzystamy z wzoru

lub w przybliżeniu

Ważnym zagadnieniem jest możliwość zastępowania w procesie produkcyjnym zużycia jednego czynnika przez inny , bez zmiany wielkości produkcji. Może się bowiem zdarzyć , że przy produkcji występują pewne ograniczenia dotyczące wykorzystania jednego z czynników. Jeśli istnieje możliwość substytucji , to tę samą wielkość produkcji można uzyskać przy zastępowaniu różnych kombinacji czynników. Substytucja czynników produkcji polega bowiem na możliwości zastępowania w procesie produkcyjnym zużycia jednego z czynników innymi czynnikami bez zmiany wielkości produkcji.

Następne ważne zagadnienie dotyczy tego , w jakim stopniu wielkość produkcji „ zareaguje „ na zwielokrotnienie zużycia czynników produkcji. Chodzi tu o możliwość zwiększenia poziomu produkcji dzięki zwiększeniu nakładów czynników.

Jeśli zwiększenie w jednakowym stopniu nakładów każdego z czynników produkcji powoduje zwiększenie wielkości produkcji w tym samym stopniu , to mówimy o stałych przychodach (korzyściach) skali. Jeśli powoduje zwiększenie produkcji w mniejszym stopniu - mamy do czynienia z malejącymi przychodami skali , a jeśli stopień zwiększania produkcji przekracza stopień wzrostu nakładów - z rosnącymi przychodami skali.

W celu sprawdzenia , z którym typem funkcji produkcji mamy do czynienia : o rosnących , malejących czy stałych przychodach skali , posługujemy się pojęciem jednorodności funkcji

Funkcja produkcji jednorodna stopnia r =1 charakteryzuje się stałymi korzyściami skali , funkcja jednorodna stopnia r < 1 , malejącymi korzyściami skali , a jednorodna stopnia r > 1 , rosnącymi korzyściami skali.

Funkcja produkcji prawidłowo opisująca rzeczywisty proces produkcji powinna posiadać następujące własności :

• Krańcowa produktywność każdego z czynników produkcji jest dodatnia

• Krańcowa produktywność każdego z czynników maleje wraz ze wzrostem nakładu tego czynnika

• Krańcowa produktywność każdego z czynników rośnie wraz ze wzrostem nakładu innego czynnika

• Krańcowa stopa substytucji czynników maleje wraz ze wzrostem nakładów każdego z czynników

Funkcja produkcji Cobba _ Douglasa jest jedną z funkcji powszechnie stosowanych do opisu procesu produkcji. Postać tej funkcji jest następująca :

Jest to funkcja potęgowa o argumentach oznaczających kolejne czynniki produkcji.

Można również uwzględnić zmiany w czasie , nie związane ze zmianami nakładów czynników produkcji. Są to tak zwane zmiany autonomiczne. Wyraża się je wprowadzając do wzoru określającego tę funkcję czynnik e^γ

Funkcja przyjmuje wtedy postać uogólnionej ( dynamicznej ) funkcji Cobba - Dauglasa

W celu zbadania elastyczności tej funkcji względem każdego z czynników obliczamy pochodne cząstkowe Q względem K oraz L.

Elastyczność funkcji Cooba - Dauglasa względem każdego czynnika jest więc stała i równa odpowiedniemu wykładnikowi potęgi.

Przykład

Oszacowano funkcję produkcji dla pewnego przedsiębiorstwa i otrzymano

Wnioski o modelowanym procesie produkcji :

1. Elastyczność produkcji względem kapitału jest równa 0,13 , czyli zwiększenie zużycia kapitału o jeden procent spowoduje wzrost produkcji równy w przybliżeniu o 0,13 procenta

2.Elastyczność produkcji względem pracy jest równa0,75

3.Suma ocen wykładników wynosi 0,88 , jest mniejsza od jedności , zatem badana funkcja produkcji wykazuje malejące korzyści skali.

Ekonometryczny model kosztów

Koszty - encyklopedyczna definicja

1.Wyrażone w pieniądzu zużycie środków produkcji i siły roboczej niezbędne w celu pozyskiwania dobra ( produktu lub usług )

2.Wszystkie zmniejszenia majątku niezbędne , aby produkt doprowadzić do stanu umożliwiającego jego sprzedaż .

Zadaniem ekonometrycznej analizy kosztów jest skonstruowanie modelu zależności kosztów całkowitych lub jednostkowych produkcji od czynników na nie wpływających.

Z. Pawłowski wyróżnia trzy grupy czynników determinujących koszty własne. Są to :

• czynniki obiektywne

• czynniki subiektywne

• czynniki przypadkowe

Do grupy czynników obiektywnych zalicza się wielkość produkcji oraz zmienne związane z realizowaniem procesu produkcyjnego , tj. wyposażenie techniczne, zmiany w technologii produkcji i organizacji pracy.

Grupa czynników subiektywnych obejmuje różnego rodzaju działania związane z zarządzaniem firmą . Działania te mają na celu zmniejszenie kosztów własnych związanych z działalnością firmy.

Trzecią grupę czynników tworzą zjawiska przypadkowe, które oddziałują na zmiany wielkości kosztów własnych w sposób niesystematyczny.

Liniowy model kosztów

Podstawową zmienną objaśniającą w modelu kosztów jest wielkość produkcji. Biorąc pod uwagę to założenie , liniowy model kosztów możemy zapisać następująco

Gdzie :

Y - koszty całkowite produkcji ( zmienna objaśniana )

X - wielkość produkcji ( zmienna objaśniająca )

α₁ ,α₀ - parametry modelu

Parametr α1 określa przeciętne koszty zmienne i informuje o ile wzrośnie Y gdy X wzrośnie o jednostkę ( np. wydatki na surowce, materiały , płace pracowników itd.. )

Parametr α0 informuje o wielkości przeciętnych kosztów stałych , wielkość ich pozostaje niezmienne, niezależnie od rozmiarów produkcji ( np. wydatki na amortyzację budynku fabrycznego ).

Liniowy model kosztów z wieloma zmiennymi objaśniającymi.

Jeżeli w modelu kosztów uwzględnimy jeszcze wpływ innych czynników ( poza produkcją ) to liniowy model możemy zapisać następująco

Gdzie :

Xi ( i=1,2,...,k) - zmienne objaśniające

αi (i=0, 1,2,...,k ) - parametry modelu

Ogólną postać funkcji potęgowej zapisać można w sposób następujący

Funkcja ta zostanie doprowadzona do postaci liniowej poprzez logarytmowanie obu jej stron , czyli

Log Y= log a + b log X

Gdy przyjmiemy następujące oznaczenia :

Log Y = Z , log X = P b= B log a = A , wówczas otrzymujemy funkcje liniową , którą należy zapisać , jako

Z = A + B P

W literaturze przedmiotu można spotkać następujące modele kosztów :

Ekonometryczna analiza popytu konsumpcyjnego

Popyt konsumpcyjny to preferencje ludności dotyczące nabycia dóbr konsumpcyjnych przy istniejących cenach tych dóbr i mające pokrycie w ich funduszu nabywczym.

Popyt na dane dobro jest zmienną obserwowaną w przypadku gdy nie ma ograniczeń ze strony podaży. Wówczas wielkość sprzedaży (zakupów) możemy utożsamiać z popytem na dane dobro.

Przy niedostatecznej podaży sprzedaż (zakupy ) jest mniejsza od popytu, którego nie można zaobserwować.

Ekonometryczna analiza popytu jest możliwa przy dostatecznej podaży ( przynajmniej w przeważającej części badanego okresu )

Ekonometryczną funkcję popytu konsumpcyjnego możemy zapisać w sposób następujący :

Gdzie :

Yt - wielkość popytu

X1t , X2t , ..., Xkt - czynniki określające popyt

εt - składnik losowy

Czynniki określające popyt , czyli zmienne objaśniające to:

• Cena danego dobra

• Dochody konsumentów ( względnie wydatki ogółem )

• Ceny dóbr substytucyjnych

• Ceny dóbr komplementarnych

• Ogólny poziom cen ( wskaźnik kosztów utrzymania )

• Struktura demograficzna i zawodowa badanej grupy konsumentów

• Wielkość popytu na dane dobro w okresach poprzednich ( zwłaszcza w przypadku dóbr trwałego użytkowania )

W literaturze przedmiotu wyróżnia się :

• Mikroekonomiczne funkcje popytu

• Makroekonomiczne funkcje popytu

Makroekonomiczne funkcje popytu szacuje się dla dużych zbiorowości konsumentów , np. ludności kraju czy regionu , na podstawie zagregowanych danych w postaci szeregów czasowych dotyczących wielkości sprzedaży danego dobra, cen tego dobra, ludności i ewentualnie innych zmiennych .

Mikroekonomiczne funkcje popytu konsumpcyjnego szacowane są na podstawie danych pochodzących z badań budżetów rodzinnych. Są to zwykle dane przekrojowe z jednego okresu czasu ( z jednego roku ) z różnych odpowiednio wylosowanych do badań gospodarstw domowych ( pracowniczych , emerytów i rencistów , chłopskich , czy pracujących na własny rachunek )

Dane przekrojowe z jednego okresu czasu nie pozwalają uchwycić wpływu zmian cen na popyt , stąd w mikroekonomicznych funkcjach popytu konsumpcyjnego podstawą , a często jedyną zmienną objaśniającą jest dochód ( względnie wydatki ogółem ).

W 1857 roku niemiecki statystyk E. Engel na podstawie badań budżetów rodzinnych sformułował szereg prawidłowości , między popytem ( wydatkami ) na dane dobro lub usługę a dochodami konsumentów. Prawidłowości te noszą nazwę krzywych Engla. Kształt tych krzywych jest różny dla różnych artykułów i usług konsumpcyjnych.

Dobra i usługi konsumpcyjne można podzielić na trzy grupy :

1.Dobra i usługi pierwszej potrzeby

2.Dobra i usługi wyższego rzędu

3.Dobra i usługi luksusowe

Wielkość popytu na poszczególne kategorie dóbr i usług zależeć będą głownie od pieniężnej siły nabywczej konsumentów.

Jako aproksymant krzywych Engla w skali mikroekonomicznej najczęściej używa się następujących funkcji :

Gdzie :

Y - popyt na usługę ( lub jednostkę konsumpcyjną )

X - wielkość dochodu w rodzinie na głowę ( lub na jednostkę konsumpcyjną )

Ciekawymi i powszechnie uznawanymi i akceptowanymi funkcjami popytu (odzwierciedlającymi prawa Engla ) są tzw. krzywe Törnquista - szwedzkiego ekonomisty. Funkcje te mają postać zależną od rodzaju dobra i usługi konsumpcyjnej.

Funkcje I typu ( dla dóbr pierwszej potrzeby czyli podstawowych ) mają postać :

Funkcja II typu ( dla dóbr i usług wyższego rzędu )

Funkcja III typu ( dla dóbr i usług luksusowych )

Parametry γ wyznaczają hierarchię pilności potrzeb , a parametry α poziom ich nasycenia.

Kształt krzywych Törnquista jest zgodny z ogólnymi procesami zachowania się konsumentów w zależności od wysokości dochodu ( zgodnie z prawem Engla ).

Prawo Engla mówi o tym :

• udział wydatków na żywność maleje w miarę wzrostu standardu życia ( dochodów ) badanych rodzin

• udział wydatków stałych ( np.. opłaty za mieszkanie , opał , wydatki na odzież ) pozostaje na stałym poziomie

• udział innych wydatków rośnie wraz z dochodem

Metody estymacji funkcji Törnquista

Oceny parametrów tych funkcji można wyznaczyć za pomocą KMNK w następujący sposób :

1.Za pomocą odpowiednich transformacji zmiennej objaśnianej , zmiennej objaśniającej i parametrów strukturalnych przekształcić równanie krzywej Törnqista do postaci liniowej względem nowych parametrów , a następnie zastosować KMNK

2.Przyjąć dwuetapową procedurę estymacji ( idea równań różnicowych )

Włoski ekonomista Vilfredo Pareto ( 1848 - 1923 ) stwierdził , że w większości przypadków , które badał , krzywe obrazujące rozkłady dochodów mają kształt zbliżony do siebie , są hiperbolami których równania można przedstawić za pomocą wzoru :