Ekonometria projekt

Akademia Górniczo–Hutnicza

im. Stanisława Staszica w Krakowie

Wydział Górnictwa i Geoinżynierii

PROJEKT

z przedmiotu „Ekonometria”

PROJEKT BUDOWY MODELU EKONOMETRYCZNEGO

Wykonały (grupa):

Zebranie danych statystycznych
Współczynnik zmienności
Dobór zmiennych objaśniających do modelu Met. I
Met. II
Identyfikacja i estymacja
Weryfikacja i wnioskowanie
Ocena końcowa

Kraków 2014/2015

Spis treści:

  1. Określenie celu badań

  2. Określenie specyfiki modelu ekonometrycznego

  3. Zebranie danych statystycznych (zestaw pierwotnych zmiennych objaśniających, krótki opis, graficzne ich przedstawienie, współczynnik zmienności)

  4. Dobór zmiennych objaśniających do modelu (2 metody)

  5. Identyfikacja modelu

  6. Estymacja parametrów strukturalnych modelu

  7. Weryfikacja modelu (współczynnik determinacji, współczynnik zbieżności)

  8. Wnioskowanie na podstawie modelu (podsumowanie, wykorzystanie)

  1. Określenie celu badań

Model ekonometryczny - jest podstawowym narzędziem w ekonometrii, służącym do analizy zależności zachodzących między różnymi zjawiskami.

Modele ekonometryczne buduje się w trzech celach:

- cel poznawczo-opisowy - opis mechanizmu kształtowania się zjawisk

ekonomicznych;

- cel diagnostyczny - ocena zbadanego wcześniej mechanizmu kształtowania się zjawisk ekonomicznych;

- cel predyktywny - przewidywanie w sensie czasowym i przekrojowym przebiegu zjawisk ekonomicznych;

Model skonstruowany został w celu poznawczym, dotyczącym kształtowania się liczby osób wyjeżdżających z Polski w ciągu roku. W modelu uwzględniono szereg zmiennych, mogących mieć wpływ na emigrację z Polski, wraz z ich wartościami na przestrzeni 9 lat (2005-2013). Ponadto celem jest zbadanie, w jaki sposób wyróżnione zmienne wpływają na badaną cechę oraz umożliwienie prognozowania kształtowania się liczby emigrantów opuszczających kraj w przyszłości.

  1. Określenie specyfiki modelu ekonometrycznego

W badaniach został wykorzystany model przyczynowo-skutkowy, który opisany jest następującym wzorem:


Y=f(X1,X2,,X10)

Y - przyczyna

Xi - skutek

Zastosowanie takiego modelu podyktowane jest jego specyfiką - w modelu takim wszystkie zmienne objaśniające mogą być traktowane jako przyczyny kształtowania się zmiennej objaśnianej.

Postać modelu:


Y=a0+a1X1+a2X2++akXk+ε

gdzie:

Y- zmienna objaśniana,

Xj zmienne objaśniające, j=1,2,3,…,k,

kj nieznane parametry strukturalne modelu, j=0,1,…,k

ε - składnik losowy

Pozostałe cechy modelu:

- model dynamiczny (ponieważ został uwzględniony czas),

- liniowy,

- jednorównaniowy,

- z wieloma zmiennymi objaśniającymi; wszystkie zmienne mają charakter ilościowy.

  1. Zebranie danych statystycznych (zestaw pierwotnych zmiennych objaśniających, krótki opis, graficzne ich przedstawienie, współczynnik zmienności)

Dane statystyczne wykorzystane do konstrukcji modelu ekonometrycznego pochodzą z Głównego Urzędu Statystycznego. Zestaw pierwotnych zmiennych objaśniających:

Zmienna objaśniana:

Y - liczba osób wyjeżdżających za granicę

Zmienne objaśniające:

X1 - stopa bezrobocia,

X2 - PKB [mln. zł],

X3 - miesięczne wydatki na 1 osobę [zł],

X4 - przeciętny miesięczny dochodów rozporządzalny na osobę [zł],

X5 - ustawowa granica ubóstwa [%],

X6 - średnie miesięczne wynagrodzenie brutto [zł],

X7 - średni czas poszukiwania pracy [m-c],

X8 - inflacja [%],

X9 - stopa procentowa [%],

X10 - procent firm zlikwidowanych [%].

Charakterystyka zmiennych objaśniających:

Zestawienie zmiennych w latach 2005-2013 zaprezentowano w tabeli poniżej:

Lata Y x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
2005 22242 17,6 983 690,3 761,46 18,1 2506,93 18,2 2,1 4,5 34,5
2006 46936 14,8 1 060 744,81 834,68 15,1 2636,81 18,7 1 4 43,8
2007 35480 11,2 1 177 809,95 928,87 14,6 2866,04 17,6 2,5 5 38,9
2008 30140 9,5 1 275 904,27 1045,52 10,6 3158,48 12,2 4,2 5 39,7
2009 18620 12,1 1 344 956,68 1114,49 8,3 3315,38 11 3,5 3,5 58,4
2010 17360 12,4 1 415 991,44 1192,82 7,4 3435 9,4 2,6 3,5 41,2
2011 19858 12,5 1 528 1015,12 1226,95 6,6 3625,21 10,6 4,3 4,5 63,1
2012 21200 13,4 1 595 1050,78 1278,43 7,2 3744,38 11,3 3,7 4,25 46,5
2013 32103 13,4 1 636 1061,7 1299,07 12,8 3877,43 11,8 0,9 2,5 40,4

Graficzna prezentacja zmiennych:

Współczynniki zmienności

Dobierając zmienne do modelu należy zweryfikować ich poprawność pod względem takich cech, jak: dostatecznie duża zmienność, rodzaj i poziom istniejących związków pomiędzy zmiennymi.

Do modelu ekonometrycznego nie powinno się wprowadzać danych o względnie niskiej zmienności (czyli zmiennych prawie stałych) sprawdzono, czy wszystkie kandydatki cechują się odpowiednią zmiennością, przekraczającą 19,0%). W tym celu wyznaczono współczynnik zmienności dla każdej kandydatki.

Współczynnik zmienności dany jest następującym wzorem:


$$\mathbf{W}_{\mathbf{x}}\mathbf{=}\frac{\mathbf{S}\mathbf{(}\mathbf{x}\mathbf{)}}{\overset{\overline{}}{\mathbf{x}}}\mathbf{*}\mathbf{100}\mathbf{\ \ \lbrack\%\rbrack}$$

gdzie:

S(x) - odchylenie standardowe zmiennej,

x ̅ - średnia arytmetyczna wielkości zmiennej na przestrzeni lat.

Kształtowanie się wartości współczynnika zmienności dla poszczególnych zmiennych objaśniających przyjętych do budowy modelu ekonometrycznego przedstawiono w tabeli poniżej. Zmienne wyróżnione pogrubioną czcionką to zmienne przechodzące do dalszych badań (a więc zmienne: x5, x7, x8, x9, x10).

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
x. śr. 12,99 1334,78 913,89 1075,81 11,19 3240,63 13,42 2,76 4,08 45,17
S(x) 2,28 231,85 136,09 196,34 4,14 487,41 3,65 1,27 0,81 9,50
w. zm. 17,56% 17,37% 14,89% 18,25% 37,03% 15,04% 27,22% 46,19% 19,84% 21,03%

Dla wybranych pięciu zmiennych z najwyższym współczynnikiem zmienności utworzono macierz korelacji , znajdującą się poniżej.

  x5 x7 x8 x9 x10 y
x5 1 0,9058 -0,6761 0,1456 -0,6852 0,6038
x7 0,9058 1 -0,5312 0,3826 -0,5024 0,6857
x8 -0,6761 -0,5312 1 0,5283 0,5311 -0,6007
x9 0,1456 0,3826 0,5283 1 -0,0853 0,0861
x10 -0,6852 -0,5024 0,5311 -0,0853 1 -0,3737
y 0,6038 0,6857 -0,6007 0,0861 -0,3737 1

Wektor korelacji R0:


$$R_{0} = \begin{bmatrix} 0,6038 \\ 0,6857 \\ - 0,6007 \\ 0,0861 \\ - 0,3737 \\ \end{bmatrix}$$

4. Dobór zmiennych objaśniających do modelu

Metoda grafowa

Metoda analizy grafów polega na doborze zmiennych objaśniających na podstawie analizy schematu powiązań między nimi oraz siły wzajemnego związku.

Pierwszym etapem jest skonstruowanie wektora współczynników korelacji każdej ze zmiennych objaśniających ze zmienną objaśnianą (oznaczanego przez R0) oraz macierzy współczynników korelacji zmiennych objaśniających między sobą (oznaczanej jako R).

Następnym krokiem jest zweryfikowanie hipotezy o statystycznej nieistotności współczynników korelacji między zmiennymi objaśniającymi.

W dalszej kolejności eliminuje się statystycznie nieistotne współczynniki korelacji.

W ten sposób otrzymujemy macierz R'. Na podstawie macierzy R' budujemy graf powiązań między zmiennymi objaśniającymi, w którym wierzchołkami są zmienne, a łączącymi je krawędziami - istotne współczynniki korelacji.

Macierz R z zaznaczonymi na czerwono wartościami maksymalnymi z każdej kolumny:

x5 x7 x8 x9 x10
x5 1 0,9058 -0,6761 0,1456 -0,6852
x7 0,9058 1 -0,5312 0,3826 -0,5024
x8 -0,6761 -0,5312 1 0,5283 0,5311
x9 0,1456 0,3826 0,5283 1 -0,0853
x10 -0,6852 -0,5024 0,5311 -0,0853 1

Najmniejsza wartość z zaznaczonych na czerwono to wartość r*, która jest równa 0,5283. Następnie zerujemy w tabeli wszystkie współczynniki, których bezwzględna wartość jest mniejsza bądź równa r*, zgodnie z poniższym wzorem:

Macierz R':

  x5 x7 x8 x9 x10
x5 1 0,9058 -0,6761 0 -0,6852
x7 0,9058 1 -0,5312 0 0
x8 -0,6761 -0,5312 1 0 0,5311
x9 0 0 0 1 0
x10 -0,6852 0 0,5311 0 1

Na podstawie danych niezerowych zawartych w tabeli tworzymy graf.

Grafy przedstawiają się następująco:

Dobór zmiennych do modelu w metodzie grafowej:

  1. Najpierw wchodzą zmienne bez połączeń,

  2. W następnej kolejności zmienne z najwyższą liczbą połączeń,

  3. Jeśli dwie zmienne mają tyle samo połączeń, to wchodzi ta, która ma wyższą bezwzględną wartość współczynnika korelacji ze zmienną objaśnianą.

W tym przypadku zmienną odosobnioną jest x9, i to ona wchodzi w pierwszej kolejności do modelu.

Ponieważ niema już żadnych innych zmiennych odosobnionych, sprawdzamy drugi graf zgodnie z punktem 2 i 3.

Najwięcej połączeń, a zarazem taką samą ich liczbę, mają zmienne x5 oraz x8. Należy więc sprawdzić, która z nich ma wyższą wartość współczynnika korelacji. Z wektora korelacji można odczytać, że jego wartość bezwzględna dla x5=0,6037, natomiast dla x8=0,6007. W związku z tym zmienna x5 ma pierwszeństwo i to ona wchodzi do modelu.

Zmienne wchodzące do modelu: x5, x9.

Metoda Hellwiga

Metoda Hellwiga - zwana również metodą optymalnego wyboru predyktant, metodą wskaźników pojemności informacji – formalna metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona w 1968 roku przez Zdzisława Hellwiga.

Zmienne, które wybieramy do modelu powinny być silnie skorelowane ze zmienną objaśnianą, a słabo skorelowane między sobą. Nie jest to jednak ścisłe kryterium doboru zmiennych, oprócz tego występuje kryterium liczbowe, tzw. pojemność integralna kombinacji nośników informacji. W tym przypadku nośnikami informacji są wszystkie zmienne objaśniające.

Pojemność integralna kombinacji nośników informacji dla k-tej kombinacji jest sumą indywidualnych pojemności nośników informacji, które wchodzą w skład tej kombinacji. Jest ona kryterium wyboru odpowiedniej kombinacji zmiennych objaśniających, a wybieramy tę kombinację, gdzie Hk jest największa.

W obliczeniach korzystano z następujących wzorów:

k – numer kombinacji

j – numer zmiennej dla której jest obliczana pojemność

rj – współczynnik korelacji j z y

rij – współczynnik korelacji i z j

L = 2x-1

L = 25-1 = 31

Obliczenia dla wszystkich kombinacji zawarto w tabeli poniżej:

Nr Kombinacja Indywidualne pojemności nośników informacji h Integralna pojemność nośników informacji H
1 {x5} h 1,5 0,36452614
2 {x7} h 2,7 0,47021192
3 {x8} h 3,8 0,36084049
4 {x9} h 4,9 0,00742182
5 {x10} h 5,10 0,13965169
6 {x5,x7} h 6,5 0,19127198 0,43799877
h 6,7 0,24672679
7 {x5,x8} h 7,5 0,21748472 0,432770496
h 7,8 0,21528578
8 {x5,x9} h 8,5 0,3181967 0,324675245
h 8,9 0,00647855
9 {x5,x10} h 9,5 0,21631031 0,299179817
h 9,10 0,08286951
10 {x7,x8} h 10,7 0,3070872 0,542745826
h 10,8 0,23565863
11 {x7,x9} h 11,7 0,34009252 0,345460539
h 11,9 0,00536802
12 {x7,x10} h 12,7 0,31297385 0,405926257
h 12,10 0,0929524
13 {x8,x9} h 13,8 0,2361058 0,240962058
h 13,9 0,00485626
14 {x8,x10} h 14,8 0,23567402 0,326884057
h 14,10 0,09121004
15 {x9,x10} h 15,9 0,0068385 0,135514155
h 15,10 0,12867566
16 {x5,x7,x8} h 16,5 0,14118523 0,497608221
h 16,7 0,19294703
h 16,8 0,16347596
17 {x5,x7,x9} h 17,5 0,17769627 0,388029132
h 17,7 0,20547628
h 17,9 0,00485658
18 {x5,x7,x10} h 18,5 0,14068936 0,39978173
h 18,7 0,19525451
h 18,10 0,06383785
19 {x5,x8,x9} h 19,5 0,20010218 0,368227051
h 19,8 0,16369102
h 19,9 0,00443385
20 {x5,x8,x10} h 20,5 0,15437519 0,380869744
h 20,8 0,16348337
h 20,10 0,06301119
21 {x5,x9,x10} h 21,5 0,19910757 0,284014138
h 21,9 0,00602959
h 21,10 0,07887698
22 {x7,x8,x9} h 22,7 0,24569543 0,429051036
h 22,8 0,17520781
h 22,9 0,00814779
23 {x7,x8,x10} h 23,7 0,23122144 0,474866901
h 23,8 0,17496993
h 23,10 0,06867553
24 {x7,x9,x10} h 24,7 0,24944929 0,342463863
h 24,9 0,00505608
h 24,10 0,08795849
25 {x8,x9,x10} h 25,8 0,17521632 0,266212603
h 25,9 0,00459954
h 25,10 0,08639674
26 {x5,x7,x8,x9} h 26,6 0,13364845 0,439344259
h 26,7 0,16676547
h 26,8 0,13190543
h 26,9 0,00702491
27 {x5,x7,x8,x10} h 27,5 0,02897226 0,372078577
h 27,7 0,15996867
h 27,8 0,13177056
h 27,10 0,05136708
28 {x5,x7,x9,x10} h 28,5 0,13320403 0,367732354
h 28,7 0,16848643
h 28,9 0,00459983
h 28,10 0,06144207
29 {x5,x8,x9,x10} h 29,5 0,14540913 0,342214155
h 29,8 0,13191025
h 29,9 0,00421886
h 29,10 0,06067592
30 {x7,x8,x9,x10} h 30,7 0,19460803 0,403525135
h 30,8 0,13928838
h 30,9 0,00371798
h 30,10 0,06591075
31 {x5,x7,x8,x9,x10} h 31,5 0,10681459 0,412089342
h 31,7 0,14154483
h 31,8 0,11046025
h 31,9 0,00346523
h 31,10 0,04980445

W metodzie Hellwiga do modelu wchodzą zmienne z kombinacji, której HC jest najwyższe. Najwyższą wartość HC w powyższej tabeli ma kombinacja 10-ta {x7,x8}, tak więc do modelu wchodzą zmienne x7 oraz x8.

5. Identyfikacja modelu i estymacja jego parametrów strukturalnych

Biorąc pod uwagę zmienne przyjęte w poszczególnych metodach (x5 oraz x9 w metodzie grafowej oraz x7, x8 w metodzie Hellwiga), poniżej przedstawiono postać modeli utworzonych za pomocą tych zmiennych. Następnie każdy z modeli został poddane weryfikacji.

Metoda grafowa - postać modelu:


Y=a0+a1X5+a2X9+ε

Y - liczba osób wyjeżdżających za granicę

X5 - ustawowa granica ubóstwa [%],

X9 - stopa procentowa [%],

ε - składnik losowy

Metoda Hellwiga - postać modelu:


Y=a0+a1X7+a2X8+ε

Y - liczba osób wyjeżdżających za granicę

X7 - średni czas poszukiwania pracy [m-c],

X8 - inflacja [%],

ε - składnik losowy

Korzystając z funkcji REGLINP, w programie Microsoft Excel, obliczono wartości estymatorów α0, α1, α2. Dla każdej metody w odpowiednich tabelach zamieszczono obliczone wartości estymatorów oraz pozostałe wartości statystyk, które możemy wyznaczyć za pomocą funkcji REGLINP. Dodatkowo wartości współczynnika determinacji zaznaczono na niebiesko.

Objaśnienia poszczególnych wartości funkcji REGLINP znajdują się w tabeli poniżej.

α2 α1 α0 Parametry strukturalne
D(α2) D(α1) D(α0) Błędy standardowe parametrów
R2 Se Nie dotyczy Współczynnik determinacji; standardowy błąd modelu
F Df Nie dotyczy Statystyka F; liczba stopni swobody
SSR SSE Nie dotyczy Regresyjna suma kwadratów, resztkowa suma kwadratów

Metoda grafowa - wyniki zastosowania funkcji REGLINP:

-21,60

1435,56

11130,22

3998,162

781,791

17623,85

0,365

9063,361

#N/D!

1,721

6,000

#N/D!

282730419

492867045

#N/D!

Postać modelu:

Y = 111330,22 + 1435,56x5 -21,60x9

Metoda Hellwiga - wyniki zastosowania funkcji REGLINP:

-2547,68

1376,62

15647,33

2505,603

873,004

16655,64

0,548

7643,118

#N/D!

3,638

6,000

#N/D!

425093992

350503472

#N/D!

Postać modelu:

Y = 15647,33 + 1376,62x7 - 2547,68x8

6. Weryfikacja modelu

W celu odpowiedniej weryfikacji modelu stosuje się współczynnik determinacji R2. Współczynnik ten jest miarą stopnia, w jakim model wyjaśnia kształtowanie się zmiennej objaśnianej. Ze statystyk REGLINP wynika, iż współczynnik determinacji R2 kształtuje się na poziomie 0,365 w metodzie grafowej oraz na poziomie 0,548 w przypadku metody Hellwiga. W celu potwierdzenia wiarygodności tego wyniku współczynnik determinacji obliczono także ze wzoru:

gdzie: 𝑦𝑡̂ – wartości wynikające z modelu

𝑦𝑡 – wartości rzeczywiste zmiennej

𝑦̅ – wartość średnia

Ze względu na wyższą wartość R2 funkcji REGLINP dla zmiennych wybranych w metodzie Hellwiga, obliczenia zostaną dokonane tylko dla tej metody.

Wartości potrzebne do obliczenia współczynnika determinacji z powyższego wzoru zawarte zostały w tabeli:

x7 x8 𝑦𝑡  𝑦𝑡̂
18,2 2,1 22242 35351,686
18,7 1 46936 38842,444
17,6 2,5 35480 33506,642
12,2 4,2 30140 21741,838
11 3,5 18620 21873,27
9,4 2,6 17360 21963,59
10,6 4,3 19858 19284,478
11,3 3,7 21200 21776,72
11,8 0,9 32103 29598,534

𝑦̅ = 27104,33333

𝑦𝑡̂ - 𝑦̅ (𝑦𝑡̂ - 𝑦̅)2 𝑦𝑡 - 𝑦̅ (𝑦𝑡 - 𝑦̅)2
8247,353 68018826,008 -4862,333 23642285,444
11738,111 137783242,023 19831,667 393295002,778
6402,309 40989556,263 8375,667 70151792,111
-5362,495 28756356,200 3035,667 9215272,111
-5231,063 27364023,597 -8484,333 71983912,111
-5140,743 26427242,019 -9744,333 94952032,111
-7819,855 61150137,434 -7246,333 52509346,778
-5327,613 28383463,830 -5904,333 34861152,111
2494,201 6221036,966 4998,667 24986668,444
SUMA 425093884,341 SUMA 775597464,000


$$R^{2} = \frac{425093884,341}{775597464,000} = 0,548$$

Wartość R2 obliczona na podstawie wzoru jest identyczna jak ta, którą wskazała funkcja REGLINP w programie Microsoft Excel.

Wartość maksymalna współczynnika determinacji, która świadczy o idealnym dopasowaniu modelu, wynosi 1. Otrzymana na podstawie obliczeń wartość informuje, iż zmienna objaśniana jest wyjaśniana przez model w 54,8 %. Dopasowanie w przedziale od 0,5-0,6 wartości R2 jest określane jako słabe. Model nie wyjaśnia więc poprawnie kształtowania się zmiennej objaśnianej.

Dopełnieniem współczynnika determinacji jest współczynnik zbieżności, który określa w jakim stopniu zmienna objaśniana nie została wyjaśniona przez model. Wyrażony jest on wzorem:

W przypadku powyższego modelu współczynnik zbieżności kształtuje się na poziomie 45,2%.

7. Wnioski

Jak wynika z uzyskanych wyników, skonstruowane modele nie objaśniają dobrze kształtowania się liczby emigrantów z Polski w ciągu roku. Dopasowanie na poziomie 30-50% jest bardzo niskie i oznacza, że zmienne wchodzące w skład modelu wyjaśniają zmienną celu na poziomie 30-50% - pozostała część jest objaśniana przez zmienne, które nie weszły w skład modelu, stąd mogą pojawiać się duże rozbieżności między wartościami rzeczywistymi oraz wyliczony z modelu (co bardzo dobrze ukazuje tabela z zestawieniem danych do obliczenia współczynnika determinacji). Żaden z modeli nie nadaje się więc do wykorzystania w celach oszacowania liczby osób emigrujących z kraju - wyniki w wielu przypadkach byłyby obarczone ogromnym błędem.

Słabe dopasowanie modelu może wynikać z następujących przyczyn:

Należałoby więc ponownie przemyśleć kwestię zmiennych, które mogą mieć bezpośredni wpływ na podjęcie decyzji o opuszczeniu kraju oraz wyeliminować wszystkie nieprawidłowe dane.

Podsumowując, model skonstruowany w projekcie, ze względu na niskie dopasowanie, nie nadaje się do wykorzystania w prognozowaniu liczby emigrantów z Polski.


Wyszukiwarka

Podobne podstrony:
Ekonometria projekt
ekonomika projekt3wałek doxx
Ekonometria I projekt C
EKONOMIA, projekt4, Czas w miesiącach
Ekonometria I projekt B
wsb Kufel ekonometria projekt na zaliczenie wykładu
Ekonometria projekt
instrukcja rozpowszechnania dokumentacji, EKONOMIA, Projektowanie dokumentacji systemowej
ekonomika projekt saimon
proj z ekonomiki jaca, Budownictwo UTP, semestr 4, Ekonomika, Ekonomika projekt
ekonomika projekt moj
ekonomika projekt saimon2
ekonomika projekt
Ekonometria I projekt A
Ekonomika projekt Projekt ekonomika
polityka ekonomiczna projekt
Ekonometria projekt
ekonomika projekt3wałek doxx
Ekonometria I projekt C

więcej podobnych podstron