Ekonometria projekt

Akademia Górniczo–Hutnicza

im. Stanisława Staszica w Krakowie

Wydział Górnictwa i Geoinżynierii

PROJEKT

z przedmiotu „Ekonometria”

PROJEKT BUDOWY MODELU EKONOMETRYCZNEGO

Wykonały (grupa):

Zebranie danych statystycznych
Współczynnik zmienności
Dobór zmiennych objaśniających do modelu	Met. I
	Met. II
Identyfikacja i estymacja
Weryfikacja i wnioskowanie
Ocena końcowa

Kraków 2014/2015

Spis treści:

Określenie celu badań
Określenie specyfiki modelu ekonometrycznego
Zebranie danych statystycznych (zestaw pierwotnych zmiennych objaśniających, krótki opis, graficzne ich przedstawienie, współczynnik zmienności)
Dobór zmiennych objaśniających do modelu (2 metody)
Identyfikacja modelu
Estymacja parametrów strukturalnych modelu
Weryfikacja modelu (współczynnik determinacji, współczynnik zbieżności)
Wnioskowanie na podstawie modelu (podsumowanie, wykorzystanie)

Określenie celu badań

Model ekonometryczny - jest podstawowym narzędziem w ekonometrii, służącym do analizy zależności zachodzących między różnymi zjawiskami.

Modele ekonometryczne buduje się w trzech celach:

- cel poznawczo-opisowy - opis mechanizmu kształtowania się zjawisk

ekonomicznych;

- cel diagnostyczny - ocena zbadanego wcześniej mechanizmu kształtowania się zjawisk ekonomicznych;

- cel predyktywny - przewidywanie w sensie czasowym i przekrojowym przebiegu zjawisk ekonomicznych;

Model skonstruowany został w celu poznawczym, dotyczącym kształtowania się liczby osób wyjeżdżających z Polski w ciągu roku. W modelu uwzględniono szereg zmiennych, mogących mieć wpływ na emigrację z Polski, wraz z ich wartościami na przestrzeni 9 lat (2005-2013). Ponadto celem jest zbadanie, w jaki sposób wyróżnione zmienne wpływają na badaną cechę oraz umożliwienie prognozowania kształtowania się liczby emigrantów opuszczających kraj w przyszłości.

Określenie specyfiki modelu ekonometrycznego

W badaniach został wykorzystany model przyczynowo-skutkowy, który opisany jest następującym wzorem:

Y=f(X₁,X₂,…,X₁₀)

Y - przyczyna

X_i - skutek

Zastosowanie takiego modelu podyktowane jest jego specyfiką - w modelu takim wszystkie zmienne objaśniające mogą być traktowane jako przyczyny kształtowania się zmiennej objaśnianej.

Postać modelu:

Y=a₀+a₁X₁+a₂X₂+…+a_kX_k+ε

gdzie:

Y- zmienna objaśniana,

X_j zmienne objaśniające, j=1,2,3,…,k,

k_j nieznane parametry strukturalne modelu, j=0,1,…,k

ε - składnik losowy

Pozostałe cechy modelu:

- model dynamiczny (ponieważ został uwzględniony czas),

- liniowy,

- jednorównaniowy,

- z wieloma zmiennymi objaśniającymi; wszystkie zmienne mają charakter ilościowy.

Zebranie danych statystycznych (zestaw pierwotnych zmiennych objaśniających, krótki opis, graficzne ich przedstawienie, współczynnik zmienności)

Dane statystyczne wykorzystane do konstrukcji modelu ekonometrycznego pochodzą z Głównego Urzędu Statystycznego. Zestaw pierwotnych zmiennych objaśniających:

Zmienna objaśniana:

Y - liczba osób wyjeżdżających za granicę

Zmienne objaśniające:

X1 - stopa bezrobocia,

X2 - PKB [mln. zł],

X3 - miesięczne wydatki na 1 osobę [zł],

X4 - przeciętny miesięczny dochodów rozporządzalny na osobę [zł],

X5 - ustawowa granica ubóstwa [%],

X6 - średnie miesięczne wynagrodzenie brutto [zł],

X7 - średni czas poszukiwania pracy [m-c],

X8 - inflacja [%],

X9 - stopa procentowa [%],

X10 - procent firm zlikwidowanych [%].

Charakterystyka zmiennych objaśniających:

stopa bezrobocia - stosunek liczby osób bezrobotnych do liczby ludności aktywnej ekonomicznie,
PKB - opisuje zagregowaną wartość dóbr i usług finalnych wytworzonych na terenie danego kraju w określonej jednostce czasu,
ustawowa granica ubóstwa - kwota dochodów, która zgodnie z obowiązującą ustawą o pomocy społecznej uprawnia do ubiegania się o przyznanie świadczenia pieniężnego,
inflacja - proces wzrostu przeciętnego poziomu cen w gospodarce; skutkiem tego procesu jest spadek siły nabywczej pieniądza krajowego,
stopa procentowa - koszt kapitału albo inaczej cena, jaka przysługuje posiadaczowi kapitału z racji udostępnienia go innym na określony czas. Koszt ten wyrażony jest zazwyczaj jako procent od pożyczonej sumy i mierzony jest w ujęciu rocznym,
procent zlikwidowanych firm - liczba zlikwidowanych w danych roku firm w stosunku do istniejących, wyrażona w procentach.

Zestawienie zmiennych w latach 2005-2013 zaprezentowano w tabeli poniżej:

Lata	Y	x1	x2	x3	x4	x5	x6	x7	x8	x9	x10
2005	22242	17,6	983	690,3	761,46	18,1	2506,93	18,2	2,1	4,5	34,5
2006	46936	14,8	1 060	744,81	834,68	15,1	2636,81	18,7	1	4	43,8
2007	35480	11,2	1 177	809,95	928,87	14,6	2866,04	17,6	2,5	5	38,9
2008	30140	9,5	1 275	904,27	1045,52	10,6	3158,48	12,2	4,2	5	39,7
2009	18620	12,1	1 344	956,68	1114,49	8,3	3315,38	11	3,5	3,5	58,4
2010	17360	12,4	1 415	991,44	1192,82	7,4	3435	9,4	2,6	3,5	41,2
2011	19858	12,5	1 528	1015,12	1226,95	6,6	3625,21	10,6	4,3	4,5	63,1
2012	21200	13,4	1 595	1050,78	1278,43	7,2	3744,38	11,3	3,7	4,25	46,5
2013	32103	13,4	1 636	1061,7	1299,07	12,8	3877,43	11,8	0,9	2,5	40,4

Graficzna prezentacja zmiennych:

Współczynniki zmienności

Dobierając zmienne do modelu należy zweryfikować ich poprawność pod względem takich cech, jak: dostatecznie duża zmienność, rodzaj i poziom istniejących związków pomiędzy zmiennymi.

Do modelu ekonometrycznego nie powinno się wprowadzać danych o względnie niskiej zmienności (czyli zmiennych prawie stałych) sprawdzono, czy wszystkie kandydatki cechują się odpowiednią zmiennością, przekraczającą 19,0%). W tym celu wyznaczono współczynnik zmienności dla każdej kandydatki.

Współczynnik zmienności dany jest następującym wzorem:

$$\mathbf{W}_{\mathbf{x}}\mathbf{=}\frac{\mathbf{S}\mathbf{(}\mathbf{x}\mathbf{)}}{\overset{\overline{}}{\mathbf{x}}}\mathbf{*}\mathbf{100}\mathbf{\ \ \lbrack\%\rbrack}$$

gdzie:

S(x) - odchylenie standardowe zmiennej,

x ̅ - średnia arytmetyczna wielkości zmiennej na przestrzeni lat.

Kształtowanie się wartości współczynnika zmienności dla poszczególnych zmiennych objaśniających przyjętych do budowy modelu ekonometrycznego przedstawiono w tabeli poniżej. Zmienne wyróżnione pogrubioną czcionką to zmienne przechodzące do dalszych badań (a więc zmienne: x5, x7, x8, x9, x10).

	x1	x2	x3	x4	x5	x6	x7	x8	x9	x10
x. śr.	12,99	1334,78	913,89	1075,81	11,19	3240,63	13,42	2,76	4,08	45,17
S(x)	2,28	231,85	136,09	196,34	4,14	487,41	3,65	1,27	0,81	9,50
w. zm.	17,56%	17,37%	14,89%	18,25%	37,03%	15,04%	27,22%	46,19%	19,84%	21,03%

Dla wybranych pięciu zmiennych z najwyższym współczynnikiem zmienności utworzono macierz korelacji , znajdującą się poniżej.

	x5	x7	x8	x9	x10	y
x5	1	0,9058	-0,6761	0,1456	-0,6852	0,6038
x7	0,9058	1	-0,5312	0,3826	-0,5024	0,6857
x8	-0,6761	-0,5312	1	0,5283	0,5311	-0,6007
x9	0,1456	0,3826	0,5283	1	-0,0853	0,0861
x10	-0,6852	-0,5024	0,5311	-0,0853	1	-0,3737
y	0,6038	0,6857	-0,6007	0,0861	-0,3737	1

Wektor korelacji R₀:

$$R_{0} = \begin{bmatrix} 0,6038 \\ 0,6857 \\ - 0,6007 \\ 0,0861 \\ - 0,3737 \\ \end{bmatrix}$$

4. Dobór zmiennych objaśniających do modelu

Metoda grafowa

Metoda analizy grafów polega na doborze zmiennych objaśniających na podstawie analizy schematu powiązań między nimi oraz siły wzajemnego związku.

Pierwszym etapem jest skonstruowanie wektora współczynników korelacji każdej ze zmiennych objaśniających ze zmienną objaśnianą (oznaczanego przez R₀) oraz macierzy współczynników korelacji zmiennych objaśniających między sobą (oznaczanej jako R).

Następnym krokiem jest zweryfikowanie hipotezy o statystycznej nieistotności współczynników korelacji między zmiennymi objaśniającymi.

W dalszej kolejności eliminuje się statystycznie nieistotne współczynniki korelacji.

W ten sposób otrzymujemy macierz R'. Na podstawie macierzy R' budujemy graf powiązań między zmiennymi objaśniającymi, w którym wierzchołkami są zmienne, a łączącymi je krawędziami - istotne współczynniki korelacji.

Macierz R z zaznaczonymi na czerwono wartościami maksymalnymi z każdej kolumny:

	x5	x7	x8	x9	x10
x5	1	0,9058	-0,6761	0,1456	-0,6852
x7	0,9058	1	-0,5312	0,3826	-0,5024
x8	-0,6761	-0,5312	1	0,5283	0,5311
x9	0,1456	0,3826	0,5283	1	-0,0853
x10	-0,6852	-0,5024	0,5311	-0,0853	1

Najmniejsza wartość z zaznaczonych na czerwono to wartość r*, która jest równa 0,5283. Następnie zerujemy w tabeli wszystkie współczynniki, których bezwzględna wartość jest mniejsza bądź równa r*, zgodnie z poniższym wzorem:

Macierz R':

	x5	x7	x8	x9	x10
x5	1	0,9058	-0,6761	0	-0,6852
x7	0,9058	1	-0,5312	0	0
x8	-0,6761	-0,5312	1	0	0,5311
x9	0	0	0	1	0
x10	-0,6852	0	0,5311	0	1

Na podstawie danych niezerowych zawartych w tabeli tworzymy graf.

Grafy przedstawiają się następująco:

Dobór zmiennych do modelu w metodzie grafowej:

Najpierw wchodzą zmienne bez połączeń,
W następnej kolejności zmienne z najwyższą liczbą połączeń,
Jeśli dwie zmienne mają tyle samo połączeń, to wchodzi ta, która ma wyższą bezwzględną wartość współczynnika korelacji ze zmienną objaśnianą.

W tym przypadku zmienną odosobnioną jest x9, i to ona wchodzi w pierwszej kolejności do modelu.

Ponieważ niema już żadnych innych zmiennych odosobnionych, sprawdzamy drugi graf zgodnie z punktem 2 i 3.

Najwięcej połączeń, a zarazem taką samą ich liczbę, mają zmienne x5 oraz x8. Należy więc sprawdzić, która z nich ma wyższą wartość współczynnika korelacji. Z wektora korelacji można odczytać, że jego wartość bezwzględna dla x5=0,6037, natomiast dla x8=0,6007. W związku z tym zmienna x5 ma pierwszeństwo i to ona wchodzi do modelu.

Zmienne wchodzące do modelu: x5, x9.

Metoda Hellwiga

Metoda Hellwiga - zwana również metodą optymalnego wyboru predyktant, metodą wskaźników pojemności informacji – formalna metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona w 1968 roku przez Zdzisława Hellwiga.

Zmienne, które wybieramy do modelu powinny być silnie skorelowane ze zmienną objaśnianą, a słabo skorelowane między sobą. Nie jest to jednak ścisłe kryterium doboru zmiennych, oprócz tego występuje kryterium liczbowe, tzw. pojemność integralna kombinacji nośników informacji. W tym przypadku nośnikami informacji są wszystkie zmienne objaśniające.

Pojemność integralna kombinacji nośników informacji dla k-tej kombinacji jest sumą indywidualnych pojemności nośników informacji, które wchodzą w skład tej kombinacji. Jest ona kryterium wyboru odpowiedniej kombinacji zmiennych objaśniających, a wybieramy tę kombinację, gdzie Hk jest największa.

W obliczeniach korzystano z następujących wzorów:

wzór na pojemności indywidualne

k – numer kombinacji

j – numer zmiennej dla której jest obliczana pojemność

rj – współczynnik korelacji j z y

rij – współczynnik korelacji i z j

wzór na pojemność integralną:

wzór na liczbę kombinacji:

L = 2^x-1

L = 2⁵-1 = 31

Obliczenia dla wszystkich kombinacji zawarto w tabeli poniżej:

Nr	Kombinacja	Indywidualne pojemności nośników informacji h	Integralna pojemność nośników informacji H

1	{x5}	h _1,5	0,36452614
2	{x7}	h _2,7	0,47021192
3	{x8}	h _3,8	0,36084049
4	{x9}	h _4,9	0,00742182
5	{x10}	h _5,10	0,13965169

6	{x5,x7}	h _6,5	0,19127198	0,43799877
		h _6,7	0,24672679
7	{x5,x8}	h _7,5	0,21748472	0,432770496
		h _7,8	0,21528578
8	{x5,x9}	h _8,5	0,3181967	0,324675245
		h _8,9	0,00647855
9	{x5,x10}	h _9,5	0,21631031	0,299179817
		h _9,10	0,08286951
10	{x7,x8}	h _10,7	0,3070872	0,542745826
		h _10,8	0,23565863
11	{x7,x9}	h _11,7	0,34009252	0,345460539
		h _11,9	0,00536802
12	{x7,x10}	h _12,7	0,31297385	0,405926257
		h _12,10	0,0929524
13	{x8,x9}	h _13,8	0,2361058	0,240962058
		h _13,9	0,00485626
14	{x8,x10}	h _14,8	0,23567402	0,326884057
		h _14,10	0,09121004
15	{x9,x10}	h _15,9	0,0068385	0,135514155
		h _15,10	0,12867566
16	{x5,x7,x8}	h _16,5	0,14118523	0,497608221
		h _16,7	0,19294703
		h _16,8	0,16347596
17	{x5,x7,x9}	h _17,5	0,17769627	0,388029132
		h _17,7	0,20547628
		h _17,9	0,00485658
18	{x5,x7,x10}	h _18,5	0,14068936	0,39978173
		h _18,7	0,19525451
		h _18,10	0,06383785
19	{x5,x8,x9}	h _19,5	0,20010218	0,368227051
		h _19,8	0,16369102
		h _19,9	0,00443385

20	{x5,x8,x10}	h _20,5	0,15437519	0,380869744
		h _20,8	0,16348337
		h _20,10	0,06301119
21	{x5,x9,x10}	h _21,5	0,19910757	0,284014138
		h _21,9	0,00602959
		h _21,10	0,07887698
22	{x7,x8,x9}	h _22,7	0,24569543	0,429051036
		h _22,8	0,17520781
		h _22,9	0,00814779
23	{x7,x8,x10}	h _23,7	0,23122144	0,474866901
		h _23,8	0,17496993
		h _23,10	0,06867553
24	{x7,x9,x10}	h _24,7	0,24944929	0,342463863
		h _24,9	0,00505608
		h _24,10	0,08795849
25	{x8,x9,x10}	h _25,8	0,17521632	0,266212603
		h _25,9	0,00459954
		h _25,10	0,08639674
26	{x5,x7,x8,x9}	h _26,6	0,13364845	0,439344259
		h _26,7	0,16676547
		h _26,8	0,13190543
		h _26,9	0,00702491
27	{x5,x7,x8,x10}	h _27,5	0,02897226	0,372078577
		h _27,7	0,15996867
		h _27,8	0,13177056
		h _27,10	0,05136708
28	{x5,x7,x9,x10}	h _28,5	0,13320403	0,367732354
		h _28,7	0,16848643
		h _28,9	0,00459983
		h _28,10	0,06144207
29	{x5,x8,x9,x10}	h _29,5	0,14540913	0,342214155
		h _29,8	0,13191025
		h _29,9	0,00421886
		h _29,10	0,06067592

30	{x7,x8,x9,x10}	h _30,7	0,19460803	0,403525135
		h _30,8	0,13928838
		h _30,9	0,00371798
		h _30,10	0,06591075
31	{x5,x7,x8,x9,x10}	h _31,5	0,10681459	0,412089342
		h _31,7	0,14154483
		h _31,8	0,11046025
		h _31,9	0,00346523
		h _31,10	0,04980445

W metodzie Hellwiga do modelu wchodzą zmienne z kombinacji, której HC jest najwyższe. Najwyższą wartość HC w powyższej tabeli ma kombinacja 10-ta {x7,x8}, tak więc do modelu wchodzą zmienne x7 oraz x8.

5. Identyfikacja modelu i estymacja jego parametrów strukturalnych

Biorąc pod uwagę zmienne przyjęte w poszczególnych metodach (x5 oraz x9 w metodzie grafowej oraz x7, x8 w metodzie Hellwiga), poniżej przedstawiono postać modeli utworzonych za pomocą tych zmiennych. Następnie każdy z modeli został poddane weryfikacji.

Metoda grafowa - postać modelu:

Y=a₀+a₁X₅+a₂X₉+ε

Y - liczba osób wyjeżdżających za granicę

X₅ - ustawowa granica ubóstwa [%],

X₉ - stopa procentowa [%],

ε - składnik losowy

Metoda Hellwiga - postać modelu:

Y=a₀+a₁X₇+a₂X₈+ε

Y - liczba osób wyjeżdżających za granicę

X₇ - średni czas poszukiwania pracy [m-c],

X₈ - inflacja [%],

ε - składnik losowy

Korzystając z funkcji REGLINP, w programie Microsoft Excel, obliczono wartości estymatorów α0, α1, α2. Dla każdej metody w odpowiednich tabelach zamieszczono obliczone wartości estymatorów oraz pozostałe wartości statystyk, które możemy wyznaczyć za pomocą funkcji REGLINP. Dodatkowo wartości współczynnika determinacji zaznaczono na niebiesko.

Objaśnienia poszczególnych wartości funkcji REGLINP znajdują się w tabeli poniżej.

α₂	α₁	α₀	Parametry strukturalne
D(α₂)	D(α₁)	D(α₀)	Błędy standardowe parametrów
R2	Se	Nie dotyczy	Współczynnik determinacji; standardowy błąd modelu
F	Df	Nie dotyczy	Statystyka F; liczba stopni swobody
SSR	SSE	Nie dotyczy	Regresyjna suma kwadratów, resztkowa suma kwadratów

Metoda grafowa - wyniki zastosowania funkcji REGLINP:

-21,60	1435,56	11130,22
3998,162	781,791	17623,85
0,365	9063,361	#N/D!
1,721	6,000	#N/D!
282730419	492867045	#N/D!

Postać modelu:

Y = 111330,22 + 1435,56x₅ -21,60x₉

Metoda Hellwiga - wyniki zastosowania funkcji REGLINP:

-2547,68	1376,62	15647,33
2505,603	873,004	16655,64
0,548	7643,118	#N/D!
3,638	6,000	#N/D!
425093992	350503472	#N/D!

Postać modelu:

Y = 15647,33 + 1376,62x₇ - 2547,68x₈

6. Weryfikacja modelu

W celu odpowiedniej weryfikacji modelu stosuje się współczynnik determinacji R2. Współczynnik ten jest miarą stopnia, w jakim model wyjaśnia kształtowanie się zmiennej objaśnianej. Ze statystyk REGLINP wynika, iż współczynnik determinacji R2 kształtuje się na poziomie 0,365 w metodzie grafowej oraz na poziomie 0,548 w przypadku metody Hellwiga. W celu potwierdzenia wiarygodności tego wyniku współczynnik determinacji obliczono także ze wzoru:

gdzie: 𝑦𝑡̂ – wartości wynikające z modelu

𝑦𝑡 – wartości rzeczywiste zmiennej

𝑦̅ – wartość średnia

Ze względu na wyższą wartość R² funkcji REGLINP dla zmiennych wybranych w metodzie Hellwiga, obliczenia zostaną dokonane tylko dla tej metody.

Wartości potrzebne do obliczenia współczynnika determinacji z powyższego wzoru zawarte zostały w tabeli:

x₇	x₈	𝑦𝑡	𝑦𝑡̂
18,2	2,1	22242	35351,686
18,7	1	46936	38842,444
17,6	2,5	35480	33506,642
12,2	4,2	30140	21741,838
11	3,5	18620	21873,27
9,4	2,6	17360	21963,59

10,6	4,3	19858	19284,478
11,3	3,7	21200	21776,72
11,8	0,9	32103	29598,534

𝑦̅ = 27104,33333

𝑦𝑡̂ - 𝑦̅	(𝑦𝑡̂ - 𝑦̅)²	𝑦𝑡 - 𝑦̅	(𝑦𝑡 - 𝑦̅)²
8247,353	68018826,008	-4862,333	23642285,444
11738,111	137783242,023	19831,667	393295002,778
6402,309	40989556,263	8375,667	70151792,111
-5362,495	28756356,200	3035,667	9215272,111
-5231,063	27364023,597	-8484,333	71983912,111
-5140,743	26427242,019	-9744,333	94952032,111
-7819,855	61150137,434	-7246,333	52509346,778
-5327,613	28383463,830	-5904,333	34861152,111
2494,201	6221036,966	4998,667	24986668,444
SUMA	425093884,341	SUMA	775597464,000

$$R^{2} = \frac{425093884,341}{775597464,000} = 0,548$$

Wartość R2 obliczona na podstawie wzoru jest identyczna jak ta, którą wskazała funkcja REGLINP w programie Microsoft Excel.

Wartość maksymalna współczynnika determinacji, która świadczy o idealnym dopasowaniu modelu, wynosi 1. Otrzymana na podstawie obliczeń wartość informuje, iż zmienna objaśniana jest wyjaśniana przez model w 54,8 %. Dopasowanie w przedziale od 0,5-0,6 wartości R² jest określane jako słabe. Model nie wyjaśnia więc poprawnie kształtowania się zmiennej objaśnianej.

Dopełnieniem współczynnika determinacji jest współczynnik zbieżności, który określa w jakim stopniu zmienna objaśniana nie została wyjaśniona przez model. Wyrażony jest on wzorem:

W przypadku powyższego modelu współczynnik zbieżności kształtuje się na poziomie 45,2%.

7. Wnioski

Celem projektu było sformułowanie modelu ekonometrycznego, na podstawie którego można szacować liczbę osób wyjeżdżających z Polski w ciągu roku, w oparciu o wybrane zmienne z początkowo przyjętych dziesięciu,
Na etapie obliczania współczynnika zmienności, którego krytyczną wartość przyjęto na poziomie 19%, do dalszego badania pozostało pięć zmiennych objaśniających z najwyższymi wartościami współczynnika zmienności - dzięki temu można było wyeliminować zmienne stałe lub prawie stałe, które nie mają zasadniczego wpływu na zmienną objaśnianą,
Dobór zmiennych wchodzących do modelu przeprowadzono za pomocą dwóch metod - metody grafowej oraz metody wskaźnika pojemności informacji (Hellwiga). Zmienne wskazane przez obie metody nie pokryły się - metoda grafowa wskazała zmienną x5 oraz x9, natomiast metoda Hellwiga - zmienną x7 oraz x8. Brak powtórzenia chociażby jednej zmiennej znacznie komplikuje budowę modelu, ponieważ nie ma jednoznacznego wskazania na zmienne mające istotny wpływ na zmienną celu. Z tego powodu obie metody zostały zakwalifikowane do dalszego badania,
Przy estymacji parametrów modelu posłużono się funkcją REGLINP w programie Microsoft Excel. Program zwrócił również wartość współczynnika determinacji R², który określa w jakim stopniu model objaśnia kształtowanie się zmiennej celu. Wartości współczynnika determinacji dla obu metod kształtują się na niskim poziomie - 36,5% dla zmiennych z metody grafowej (dopasowanie niezadowalające) oraz 54,8% dla zmiennych z metody Hellwiga (dopasowanie słabe).
Ze względu na wyższą wartość współczynnika determinacji dla zmiennych z metody Hellwiga, to one zostały wybrane do sprawdzenia poprawności weryfikacji modelu poprzez ponowne obliczenie współczynnika determinacji - wynik obliczeń był identyczny jak w przypadku wyniku zwróconego przez Excel. Dodatkowo obliczono współczynnik zbieżności, który jest różnicą między jednością o wartością współczynnika determinacji - jego wartość kształtuje się więc na poziomie 45,2%.

Jak wynika z uzyskanych wyników, skonstruowane modele nie objaśniają dobrze kształtowania się liczby emigrantów z Polski w ciągu roku. Dopasowanie na poziomie 30-50% jest bardzo niskie i oznacza, że zmienne wchodzące w skład modelu wyjaśniają zmienną celu na poziomie 30-50% - pozostała część jest objaśniana przez zmienne, które nie weszły w skład modelu, stąd mogą pojawiać się duże rozbieżności między wartościami rzeczywistymi oraz wyliczony z modelu (co bardzo dobrze ukazuje tabela z zestawieniem danych do obliczenia współczynnika determinacji). Żaden z modeli nie nadaje się więc do wykorzystania w celach oszacowania liczby osób emigrujących z kraju - wyniki w wielu przypadkach byłyby obarczone ogromnym błędem.

Słabe dopasowanie modelu może wynikać z następujących przyczyn:

wybrano niewłaściwe zmienne (zmienne nie były wystarczająco silnie powiązane ze zmienną objaśniającą lub były skorelowane ze sobą),
współczynnik zmienności został przyjęty na zbyt niskim poziomie, przez co do badań dopuszczono zmienne o zbyt niskiej zmienności, które nie mogły stanowić dobrego materiału do skonstruowania modelu,
w zbiorze danych dla poszczególnych zmiennych znalazły się wartości odstające, które mogły przełożyć się na wyniki późniejszych obliczeń.

Należałoby więc ponownie przemyśleć kwestię zmiennych, które mogą mieć bezpośredni wpływ na podjęcie decyzji o opuszczeniu kraju oraz wyeliminować wszystkie nieprawidłowe dane.

Podsumowując, model skonstruowany w projekcie, ze względu na niskie dopasowanie, nie nadaje się do wykorzystania w prognozowaniu liczby emigrantów z Polski.

Wyszukiwarka

Podobne podstrony:
Ekonometria projekt
ekonomika projekt3wałek doxx
Ekonometria I projekt C
EKONOMIA, projekt4, Czas w miesiącach
Ekonometria I projekt B
wsb Kufel ekonometria projekt na zaliczenie wykładu
Ekonometria projekt
instrukcja rozpowszechnania dokumentacji, EKONOMIA, Projektowanie dokumentacji systemowej
ekonomika projekt saimon
proj z ekonomiki jaca, Budownictwo UTP, semestr 4, Ekonomika, Ekonomika projekt
ekonomika projekt moj
ekonomika projekt saimon2
ekonomika projekt
Ekonometria I projekt A
Ekonomika projekt Projekt ekonomika
polityka ekonomiczna projekt
Ekonometria projekt
ekonomika projekt3wałek doxx
Ekonometria I projekt C

więcej podobnych podstron