Akademia Górniczo–Hutnicza
im. Stanisława Staszica w Krakowie
Wydział Górnictwa i Geoinżynierii
PROJEKT
z przedmiotu „Ekonometria”
PROJEKT BUDOWY MODELU EKONOMETRYCZNEGO
Wykonały (grupa):
Zebranie danych statystycznych | ||
---|---|---|
Współczynnik zmienności | ||
Dobór zmiennych objaśniających do modelu | Met. I | |
Met. II | ||
Identyfikacja i estymacja | ||
Weryfikacja i wnioskowanie | ||
Ocena końcowa |
Kraków 2014/2015
Spis treści:
Określenie celu badań
Określenie specyfiki modelu ekonometrycznego
Zebranie danych statystycznych (zestaw pierwotnych zmiennych objaśniających, krótki opis, graficzne ich przedstawienie, współczynnik zmienności)
Dobór zmiennych objaśniających do modelu (2 metody)
Identyfikacja modelu
Estymacja parametrów strukturalnych modelu
Weryfikacja modelu (współczynnik determinacji, współczynnik zbieżności)
Wnioskowanie na podstawie modelu (podsumowanie, wykorzystanie)
Określenie celu badań
Model ekonometryczny - jest podstawowym narzędziem w ekonometrii, służącym do analizy zależności zachodzących między różnymi zjawiskami.
Modele ekonometryczne buduje się w trzech celach:
- cel poznawczo-opisowy - opis mechanizmu kształtowania się zjawisk
ekonomicznych;
- cel diagnostyczny - ocena zbadanego wcześniej mechanizmu kształtowania się zjawisk ekonomicznych;
- cel predyktywny - przewidywanie w sensie czasowym i przekrojowym przebiegu zjawisk ekonomicznych;
Model skonstruowany został w celu poznawczym, dotyczącym kształtowania się liczby osób wyjeżdżających z Polski w ciągu roku. W modelu uwzględniono szereg zmiennych, mogących mieć wpływ na emigrację z Polski, wraz z ich wartościami na przestrzeni 9 lat (2005-2013). Ponadto celem jest zbadanie, w jaki sposób wyróżnione zmienne wpływają na badaną cechę oraz umożliwienie prognozowania kształtowania się liczby emigrantów opuszczających kraj w przyszłości.
Określenie specyfiki modelu ekonometrycznego
W badaniach został wykorzystany model przyczynowo-skutkowy, który opisany jest następującym wzorem:
Y=f(X1,X2,…,X10)
Y - przyczyna
Xi - skutek
Zastosowanie takiego modelu podyktowane jest jego specyfiką - w modelu takim wszystkie zmienne objaśniające mogą być traktowane jako przyczyny kształtowania się zmiennej objaśnianej.
Postać modelu:
Y=a0+a1X1+a2X2+…+akXk+ε
gdzie:
Y- zmienna objaśniana,
Xj zmienne objaśniające, j=1,2,3,…,k,
kj nieznane parametry strukturalne modelu, j=0,1,…,k
ε - składnik losowy
Pozostałe cechy modelu:
- model dynamiczny (ponieważ został uwzględniony czas),
- liniowy,
- jednorównaniowy,
- z wieloma zmiennymi objaśniającymi; wszystkie zmienne mają charakter ilościowy.
Zebranie danych statystycznych (zestaw pierwotnych zmiennych objaśniających, krótki opis, graficzne ich przedstawienie, współczynnik zmienności)
Dane statystyczne wykorzystane do konstrukcji modelu ekonometrycznego pochodzą z Głównego Urzędu Statystycznego. Zestaw pierwotnych zmiennych objaśniających:
Zmienna objaśniana:
Y - liczba osób wyjeżdżających za granicę
Zmienne objaśniające:
X1 - stopa bezrobocia,
X2 - PKB [mln. zł],
X3 - miesięczne wydatki na 1 osobę [zł],
X4 - przeciętny miesięczny dochodów rozporządzalny na osobę [zł],
X5 - ustawowa granica ubóstwa [%],
X6 - średnie miesięczne wynagrodzenie brutto [zł],
X7 - średni czas poszukiwania pracy [m-c],
X8 - inflacja [%],
X9 - stopa procentowa [%],
X10 - procent firm zlikwidowanych [%].
Charakterystyka zmiennych objaśniających:
stopa bezrobocia - stosunek liczby osób bezrobotnych do liczby ludności aktywnej ekonomicznie,
PKB - opisuje zagregowaną wartość dóbr i usług finalnych wytworzonych na terenie danego kraju w określonej jednostce czasu,
ustawowa granica ubóstwa - kwota dochodów, która zgodnie z obowiązującą ustawą o pomocy społecznej uprawnia do ubiegania się o przyznanie świadczenia pieniężnego,
inflacja - proces wzrostu przeciętnego poziomu cen w gospodarce; skutkiem tego procesu jest spadek siły nabywczej pieniądza krajowego,
stopa procentowa - koszt kapitału albo inaczej cena, jaka przysługuje posiadaczowi kapitału z racji udostępnienia go innym na określony czas. Koszt ten wyrażony jest zazwyczaj jako procent od pożyczonej sumy i mierzony jest w ujęciu rocznym,
procent zlikwidowanych firm - liczba zlikwidowanych w danych roku firm w stosunku do istniejących, wyrażona w procentach.
Zestawienie zmiennych w latach 2005-2013 zaprezentowano w tabeli poniżej:
Lata | Y | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | x10 |
---|---|---|---|---|---|---|---|---|---|---|---|
2005 | 22242 | 17,6 | 983 | 690,3 | 761,46 | 18,1 | 2506,93 | 18,2 | 2,1 | 4,5 | 34,5 |
2006 | 46936 | 14,8 | 1 060 | 744,81 | 834,68 | 15,1 | 2636,81 | 18,7 | 1 | 4 | 43,8 |
2007 | 35480 | 11,2 | 1 177 | 809,95 | 928,87 | 14,6 | 2866,04 | 17,6 | 2,5 | 5 | 38,9 |
2008 | 30140 | 9,5 | 1 275 | 904,27 | 1045,52 | 10,6 | 3158,48 | 12,2 | 4,2 | 5 | 39,7 |
2009 | 18620 | 12,1 | 1 344 | 956,68 | 1114,49 | 8,3 | 3315,38 | 11 | 3,5 | 3,5 | 58,4 |
2010 | 17360 | 12,4 | 1 415 | 991,44 | 1192,82 | 7,4 | 3435 | 9,4 | 2,6 | 3,5 | 41,2 |
2011 | 19858 | 12,5 | 1 528 | 1015,12 | 1226,95 | 6,6 | 3625,21 | 10,6 | 4,3 | 4,5 | 63,1 |
2012 | 21200 | 13,4 | 1 595 | 1050,78 | 1278,43 | 7,2 | 3744,38 | 11,3 | 3,7 | 4,25 | 46,5 |
2013 | 32103 | 13,4 | 1 636 | 1061,7 | 1299,07 | 12,8 | 3877,43 | 11,8 | 0,9 | 2,5 | 40,4 |
Graficzna prezentacja zmiennych:
Współczynniki zmienności
Dobierając zmienne do modelu należy zweryfikować ich poprawność pod względem takich cech, jak: dostatecznie duża zmienność, rodzaj i poziom istniejących związków pomiędzy zmiennymi.
Do modelu ekonometrycznego nie powinno się wprowadzać danych o względnie niskiej zmienności (czyli zmiennych prawie stałych) sprawdzono, czy wszystkie kandydatki cechują się odpowiednią zmiennością, przekraczającą 19,0%). W tym celu wyznaczono współczynnik zmienności dla każdej kandydatki.
Współczynnik zmienności dany jest następującym wzorem:
$$\mathbf{W}_{\mathbf{x}}\mathbf{=}\frac{\mathbf{S}\mathbf{(}\mathbf{x}\mathbf{)}}{\overset{\overline{}}{\mathbf{x}}}\mathbf{*}\mathbf{100}\mathbf{\ \ \lbrack\%\rbrack}$$
gdzie:
S(x) - odchylenie standardowe zmiennej,
x ̅ - średnia arytmetyczna wielkości zmiennej na przestrzeni lat.
Kształtowanie się wartości współczynnika zmienności dla poszczególnych zmiennych objaśniających przyjętych do budowy modelu ekonometrycznego przedstawiono w tabeli poniżej. Zmienne wyróżnione pogrubioną czcionką to zmienne przechodzące do dalszych badań (a więc zmienne: x5, x7, x8, x9, x10).
x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | x10 | |
---|---|---|---|---|---|---|---|---|---|---|
x. śr. | 12,99 | 1334,78 | 913,89 | 1075,81 | 11,19 | 3240,63 | 13,42 | 2,76 | 4,08 | 45,17 |
S(x) | 2,28 | 231,85 | 136,09 | 196,34 | 4,14 | 487,41 | 3,65 | 1,27 | 0,81 | 9,50 |
w. zm. | 17,56% | 17,37% | 14,89% | 18,25% | 37,03% | 15,04% | 27,22% | 46,19% | 19,84% | 21,03% |
Dla wybranych pięciu zmiennych z najwyższym współczynnikiem zmienności utworzono macierz korelacji , znajdującą się poniżej.
x5 | x7 | x8 | x9 | x10 | y | |
---|---|---|---|---|---|---|
x5 | 1 | 0,9058 | -0,6761 | 0,1456 | -0,6852 | 0,6038 |
x7 | 0,9058 | 1 | -0,5312 | 0,3826 | -0,5024 | 0,6857 |
x8 | -0,6761 | -0,5312 | 1 | 0,5283 | 0,5311 | -0,6007 |
x9 | 0,1456 | 0,3826 | 0,5283 | 1 | -0,0853 | 0,0861 |
x10 | -0,6852 | -0,5024 | 0,5311 | -0,0853 | 1 | -0,3737 |
y | 0,6038 | 0,6857 | -0,6007 | 0,0861 | -0,3737 | 1 |
Wektor korelacji R0:
$$R_{0} = \begin{bmatrix}
0,6038 \\
0,6857 \\
- 0,6007 \\
0,0861 \\
- 0,3737 \\
\end{bmatrix}$$
4. Dobór zmiennych objaśniających do modelu
Metoda grafowa
Metoda analizy grafów polega na doborze zmiennych objaśniających na podstawie analizy schematu powiązań między nimi oraz siły wzajemnego związku.
Pierwszym etapem jest skonstruowanie wektora współczynników korelacji każdej ze zmiennych objaśniających ze zmienną objaśnianą (oznaczanego przez R0) oraz macierzy współczynników korelacji zmiennych objaśniających między sobą (oznaczanej jako R).
Następnym krokiem jest zweryfikowanie hipotezy o statystycznej nieistotności współczynników korelacji między zmiennymi objaśniającymi.
W dalszej kolejności eliminuje się statystycznie nieistotne współczynniki korelacji.
W ten sposób otrzymujemy macierz R'. Na podstawie macierzy R' budujemy graf powiązań między zmiennymi objaśniającymi, w którym wierzchołkami są zmienne, a łączącymi je krawędziami - istotne współczynniki korelacji.
Macierz R z zaznaczonymi na czerwono wartościami maksymalnymi z każdej kolumny:
x5 | x7 | x8 | x9 | x10 | |
---|---|---|---|---|---|
x5 | 1 | 0,9058 | -0,6761 | 0,1456 | -0,6852 |
x7 | 0,9058 | 1 | -0,5312 | 0,3826 | -0,5024 |
x8 | -0,6761 | -0,5312 | 1 | 0,5283 | 0,5311 |
x9 | 0,1456 | 0,3826 | 0,5283 | 1 | -0,0853 |
x10 | -0,6852 | -0,5024 | 0,5311 | -0,0853 | 1 |
Najmniejsza wartość z zaznaczonych na czerwono to wartość r*, która jest równa 0,5283. Następnie zerujemy w tabeli wszystkie współczynniki, których bezwzględna wartość jest mniejsza bądź równa r*, zgodnie z poniższym wzorem:
Macierz R':
x5 | x7 | x8 | x9 | x10 | |
---|---|---|---|---|---|
x5 | 1 | 0,9058 | -0,6761 | 0 | -0,6852 |
x7 | 0,9058 | 1 | -0,5312 | 0 | 0 |
x8 | -0,6761 | -0,5312 | 1 | 0 | 0,5311 |
x9 | 0 | 0 | 0 | 1 | 0 |
x10 | -0,6852 | 0 | 0,5311 | 0 | 1 |
Na podstawie danych niezerowych zawartych w tabeli tworzymy graf.
Grafy przedstawiają się następująco:
Dobór zmiennych do modelu w metodzie grafowej:
Najpierw wchodzą zmienne bez połączeń,
W następnej kolejności zmienne z najwyższą liczbą połączeń,
Jeśli dwie zmienne mają tyle samo połączeń, to wchodzi ta, która ma wyższą bezwzględną wartość współczynnika korelacji ze zmienną objaśnianą.
W tym przypadku zmienną odosobnioną jest x9, i to ona wchodzi w pierwszej kolejności do modelu.
Ponieważ niema już żadnych innych zmiennych odosobnionych, sprawdzamy drugi graf zgodnie z punktem 2 i 3.
Najwięcej połączeń, a zarazem taką samą ich liczbę, mają zmienne x5 oraz x8. Należy więc sprawdzić, która z nich ma wyższą wartość współczynnika korelacji. Z wektora korelacji można odczytać, że jego wartość bezwzględna dla x5=0,6037, natomiast dla x8=0,6007. W związku z tym zmienna x5 ma pierwszeństwo i to ona wchodzi do modelu.
Zmienne wchodzące do modelu: x5, x9.
Metoda Hellwiga
Metoda Hellwiga - zwana również metodą optymalnego wyboru predyktant, metodą wskaźników pojemności informacji – formalna metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona w 1968 roku przez Zdzisława Hellwiga.
Zmienne, które wybieramy do modelu powinny być silnie skorelowane ze zmienną objaśnianą, a słabo skorelowane między sobą. Nie jest to jednak ścisłe kryterium doboru zmiennych, oprócz tego występuje kryterium liczbowe, tzw. pojemność integralna kombinacji nośników informacji. W tym przypadku nośnikami informacji są wszystkie zmienne objaśniające.
Pojemność integralna kombinacji nośników informacji dla k-tej kombinacji jest sumą indywidualnych pojemności nośników informacji, które wchodzą w skład tej kombinacji. Jest ona kryterium wyboru odpowiedniej kombinacji zmiennych objaśniających, a wybieramy tę kombinację, gdzie Hk jest największa.
W obliczeniach korzystano z następujących wzorów:
wzór na pojemności indywidualne
k – numer kombinacji
j – numer zmiennej dla której jest obliczana pojemność
rj – współczynnik korelacji j z y
rij – współczynnik korelacji i z j
wzór na pojemność integralną:
wzór na liczbę kombinacji:
L = 2x-1
L = 25-1 = 31
Obliczenia dla wszystkich kombinacji zawarto w tabeli poniżej:
Nr | Kombinacja | Indywidualne pojemności nośników informacji h | Integralna pojemność nośników informacji H |
---|---|---|---|
1 | {x5} | h 1,5 | 0,36452614 |
2 | {x7} | h 2,7 | 0,47021192 |
3 | {x8} | h 3,8 | 0,36084049 |
4 | {x9} | h 4,9 | 0,00742182 |
5 | {x10} | h 5,10 | 0,13965169 |
6 | {x5,x7} | h 6,5 | 0,19127198 | 0,43799877 |
---|---|---|---|---|
h 6,7 | 0,24672679 | |||
7 | {x5,x8} | h 7,5 | 0,21748472 | 0,432770496 |
h 7,8 | 0,21528578 | |||
8 | {x5,x9} | h 8,5 | 0,3181967 | 0,324675245 |
h 8,9 | 0,00647855 | |||
9 | {x5,x10} | h 9,5 | 0,21631031 | 0,299179817 |
h 9,10 | 0,08286951 | |||
10 | {x7,x8} | h 10,7 | 0,3070872 | 0,542745826 |
h 10,8 | 0,23565863 | |||
11 | {x7,x9} | h 11,7 | 0,34009252 | 0,345460539 |
h 11,9 | 0,00536802 | |||
12 | {x7,x10} | h 12,7 | 0,31297385 | 0,405926257 |
h 12,10 | 0,0929524 | |||
13 | {x8,x9} | h 13,8 | 0,2361058 | 0,240962058 |
h 13,9 | 0,00485626 | |||
14 | {x8,x10} | h 14,8 | 0,23567402 | 0,326884057 |
h 14,10 | 0,09121004 | |||
15 | {x9,x10} | h 15,9 | 0,0068385 | 0,135514155 |
h 15,10 | 0,12867566 | |||
16 | {x5,x7,x8} | h 16,5 | 0,14118523 | 0,497608221 |
h 16,7 | 0,19294703 | |||
h 16,8 | 0,16347596 | |||
17 | {x5,x7,x9} | h 17,5 | 0,17769627 | 0,388029132 |
h 17,7 | 0,20547628 | |||
h 17,9 | 0,00485658 | |||
18 | {x5,x7,x10} | h 18,5 | 0,14068936 | 0,39978173 |
h 18,7 | 0,19525451 | |||
h 18,10 | 0,06383785 | |||
19 | {x5,x8,x9} | h 19,5 | 0,20010218 | 0,368227051 |
h 19,8 | 0,16369102 | |||
h 19,9 | 0,00443385 |
20 | {x5,x8,x10} | h 20,5 | 0,15437519 | 0,380869744 |
---|---|---|---|---|
h 20,8 | 0,16348337 | |||
h 20,10 | 0,06301119 | |||
21 | {x5,x9,x10} | h 21,5 | 0,19910757 | 0,284014138 |
h 21,9 | 0,00602959 | |||
h 21,10 | 0,07887698 | |||
22 | {x7,x8,x9} | h 22,7 | 0,24569543 | 0,429051036 |
h 22,8 | 0,17520781 | |||
h 22,9 | 0,00814779 | |||
23 | {x7,x8,x10} | h 23,7 | 0,23122144 | 0,474866901 |
h 23,8 | 0,17496993 | |||
h 23,10 | 0,06867553 | |||
24 | {x7,x9,x10} | h 24,7 | 0,24944929 | 0,342463863 |
h 24,9 | 0,00505608 | |||
h 24,10 | 0,08795849 | |||
25 | {x8,x9,x10} | h 25,8 | 0,17521632 | 0,266212603 |
h 25,9 | 0,00459954 | |||
h 25,10 | 0,08639674 | |||
26 | {x5,x7,x8,x9} | h 26,6 | 0,13364845 | 0,439344259 |
h 26,7 | 0,16676547 | |||
h 26,8 | 0,13190543 | |||
h 26,9 | 0,00702491 | |||
27 | {x5,x7,x8,x10} | h 27,5 | 0,02897226 | 0,372078577 |
h 27,7 | 0,15996867 | |||
h 27,8 | 0,13177056 | |||
h 27,10 | 0,05136708 | |||
28 | {x5,x7,x9,x10} | h 28,5 | 0,13320403 | 0,367732354 |
h 28,7 | 0,16848643 | |||
h 28,9 | 0,00459983 | |||
h 28,10 | 0,06144207 | |||
29 | {x5,x8,x9,x10} | h 29,5 | 0,14540913 | 0,342214155 |
h 29,8 | 0,13191025 | |||
h 29,9 | 0,00421886 | |||
h 29,10 | 0,06067592 |
30 | {x7,x8,x9,x10} | h 30,7 | 0,19460803 | 0,403525135 |
---|---|---|---|---|
h 30,8 | 0,13928838 | |||
h 30,9 | 0,00371798 | |||
h 30,10 | 0,06591075 | |||
31 | {x5,x7,x8,x9,x10} | h 31,5 | 0,10681459 | 0,412089342 |
h 31,7 | 0,14154483 | |||
h 31,8 | 0,11046025 | |||
h 31,9 | 0,00346523 | |||
h 31,10 | 0,04980445 |
W metodzie Hellwiga do modelu wchodzą zmienne z kombinacji, której HC jest najwyższe. Najwyższą wartość HC w powyższej tabeli ma kombinacja 10-ta {x7,x8}, tak więc do modelu wchodzą zmienne x7 oraz x8.
5. Identyfikacja modelu i estymacja jego parametrów strukturalnych
Biorąc pod uwagę zmienne przyjęte w poszczególnych metodach (x5 oraz x9 w metodzie grafowej oraz x7, x8 w metodzie Hellwiga), poniżej przedstawiono postać modeli utworzonych za pomocą tych zmiennych. Następnie każdy z modeli został poddane weryfikacji.
Metoda grafowa - postać modelu:
Y=a0+a1X5+a2X9+ε
Y - liczba osób wyjeżdżających za granicę
X5 - ustawowa granica ubóstwa [%],
X9 - stopa procentowa [%],
ε - składnik losowy
Metoda Hellwiga - postać modelu:
Y=a0+a1X7+a2X8+ε
Y - liczba osób wyjeżdżających za granicę
X7 - średni czas poszukiwania pracy [m-c],
X8 - inflacja [%],
ε - składnik losowy
Korzystając z funkcji REGLINP, w programie Microsoft Excel, obliczono wartości estymatorów α0, α1, α2. Dla każdej metody w odpowiednich tabelach zamieszczono obliczone wartości estymatorów oraz pozostałe wartości statystyk, które możemy wyznaczyć za pomocą funkcji REGLINP. Dodatkowo wartości współczynnika determinacji zaznaczono na niebiesko.
Objaśnienia poszczególnych wartości funkcji REGLINP znajdują się w tabeli poniżej.
α2 | α1 | α0 | Parametry strukturalne |
---|---|---|---|
D(α2) | D(α1) | D(α0) | Błędy standardowe parametrów |
R2 | Se | Nie dotyczy | Współczynnik determinacji; standardowy błąd modelu |
F | Df | Nie dotyczy | Statystyka F; liczba stopni swobody |
SSR | SSE | Nie dotyczy | Regresyjna suma kwadratów, resztkowa suma kwadratów |
Metoda grafowa - wyniki zastosowania funkcji REGLINP:
|
|
|
---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
Postać modelu:
Y = 111330,22 + 1435,56x5 -21,60x9
Metoda Hellwiga - wyniki zastosowania funkcji REGLINP:
|
|
|
---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
Postać modelu:
Y = 15647,33 + 1376,62x7 - 2547,68x8
6. Weryfikacja modelu
W celu odpowiedniej weryfikacji modelu stosuje się współczynnik determinacji R2. Współczynnik ten jest miarą stopnia, w jakim model wyjaśnia kształtowanie się zmiennej objaśnianej. Ze statystyk REGLINP wynika, iż współczynnik determinacji R2 kształtuje się na poziomie 0,365 w metodzie grafowej oraz na poziomie 0,548 w przypadku metody Hellwiga. W celu potwierdzenia wiarygodności tego wyniku współczynnik determinacji obliczono także ze wzoru:
gdzie: 𝑦𝑡̂ – wartości wynikające z modelu
𝑦𝑡 – wartości rzeczywiste zmiennej
𝑦̅ – wartość średnia
Ze względu na wyższą wartość R2 funkcji REGLINP dla zmiennych wybranych w metodzie Hellwiga, obliczenia zostaną dokonane tylko dla tej metody.
Wartości potrzebne do obliczenia współczynnika determinacji z powyższego wzoru zawarte zostały w tabeli:
x7 | x8 | 𝑦𝑡 | 𝑦𝑡̂ |
---|---|---|---|
18,2 | 2,1 | 22242 | 35351,686 |
18,7 | 1 | 46936 | 38842,444 |
17,6 | 2,5 | 35480 | 33506,642 |
12,2 | 4,2 | 30140 | 21741,838 |
11 | 3,5 | 18620 | 21873,27 |
9,4 | 2,6 | 17360 | 21963,59 |
10,6 | 4,3 | 19858 | 19284,478 |
---|---|---|---|
11,3 | 3,7 | 21200 | 21776,72 |
11,8 | 0,9 | 32103 | 29598,534 |
𝑦̅ = 27104,33333
𝑦𝑡̂ - 𝑦̅ | (𝑦𝑡̂ - 𝑦̅)2 | 𝑦𝑡 - 𝑦̅ | (𝑦𝑡 - 𝑦̅)2 |
---|---|---|---|
8247,353 | 68018826,008 | -4862,333 | 23642285,444 |
11738,111 | 137783242,023 | 19831,667 | 393295002,778 |
6402,309 | 40989556,263 | 8375,667 | 70151792,111 |
-5362,495 | 28756356,200 | 3035,667 | 9215272,111 |
-5231,063 | 27364023,597 | -8484,333 | 71983912,111 |
-5140,743 | 26427242,019 | -9744,333 | 94952032,111 |
-7819,855 | 61150137,434 | -7246,333 | 52509346,778 |
-5327,613 | 28383463,830 | -5904,333 | 34861152,111 |
2494,201 | 6221036,966 | 4998,667 | 24986668,444 |
SUMA | 425093884,341 | SUMA | 775597464,000 |
$$R^{2} = \frac{425093884,341}{775597464,000} = 0,548$$
Wartość R2 obliczona na podstawie wzoru jest identyczna jak ta, którą wskazała funkcja REGLINP w programie Microsoft Excel.
Wartość maksymalna współczynnika determinacji, która świadczy o idealnym dopasowaniu modelu, wynosi 1. Otrzymana na podstawie obliczeń wartość informuje, iż zmienna objaśniana jest wyjaśniana przez model w 54,8 %. Dopasowanie w przedziale od 0,5-0,6 wartości R2 jest określane jako słabe. Model nie wyjaśnia więc poprawnie kształtowania się zmiennej objaśnianej.
Dopełnieniem współczynnika determinacji jest współczynnik zbieżności, który określa w jakim stopniu zmienna objaśniana nie została wyjaśniona przez model. Wyrażony jest on wzorem:
W przypadku powyższego modelu współczynnik zbieżności kształtuje się na poziomie 45,2%.
7. Wnioski
Celem projektu było sformułowanie modelu ekonometrycznego, na podstawie którego można szacować liczbę osób wyjeżdżających z Polski w ciągu roku, w oparciu o wybrane zmienne z początkowo przyjętych dziesięciu,
Na etapie obliczania współczynnika zmienności, którego krytyczną wartość przyjęto na poziomie 19%, do dalszego badania pozostało pięć zmiennych objaśniających z najwyższymi wartościami współczynnika zmienności - dzięki temu można było wyeliminować zmienne stałe lub prawie stałe, które nie mają zasadniczego wpływu na zmienną objaśnianą,
Dobór zmiennych wchodzących do modelu przeprowadzono za pomocą dwóch metod - metody grafowej oraz metody wskaźnika pojemności informacji (Hellwiga). Zmienne wskazane przez obie metody nie pokryły się - metoda grafowa wskazała zmienną x5 oraz x9, natomiast metoda Hellwiga - zmienną x7 oraz x8. Brak powtórzenia chociażby jednej zmiennej znacznie komplikuje budowę modelu, ponieważ nie ma jednoznacznego wskazania na zmienne mające istotny wpływ na zmienną celu. Z tego powodu obie metody zostały zakwalifikowane do dalszego badania,
Przy estymacji parametrów modelu posłużono się funkcją REGLINP w programie Microsoft Excel. Program zwrócił również wartość współczynnika determinacji R2, który określa w jakim stopniu model objaśnia kształtowanie się zmiennej celu. Wartości współczynnika determinacji dla obu metod kształtują się na niskim poziomie - 36,5% dla zmiennych z metody grafowej (dopasowanie niezadowalające) oraz 54,8% dla zmiennych z metody Hellwiga (dopasowanie słabe).
Ze względu na wyższą wartość współczynnika determinacji dla zmiennych z metody Hellwiga, to one zostały wybrane do sprawdzenia poprawności weryfikacji modelu poprzez ponowne obliczenie współczynnika determinacji - wynik obliczeń był identyczny jak w przypadku wyniku zwróconego przez Excel. Dodatkowo obliczono współczynnik zbieżności, który jest różnicą między jednością o wartością współczynnika determinacji - jego wartość kształtuje się więc na poziomie 45,2%.
Jak wynika z uzyskanych wyników, skonstruowane modele nie objaśniają dobrze kształtowania się liczby emigrantów z Polski w ciągu roku. Dopasowanie na poziomie 30-50% jest bardzo niskie i oznacza, że zmienne wchodzące w skład modelu wyjaśniają zmienną celu na poziomie 30-50% - pozostała część jest objaśniana przez zmienne, które nie weszły w skład modelu, stąd mogą pojawiać się duże rozbieżności między wartościami rzeczywistymi oraz wyliczony z modelu (co bardzo dobrze ukazuje tabela z zestawieniem danych do obliczenia współczynnika determinacji). Żaden z modeli nie nadaje się więc do wykorzystania w celach oszacowania liczby osób emigrujących z kraju - wyniki w wielu przypadkach byłyby obarczone ogromnym błędem.
Słabe dopasowanie modelu może wynikać z następujących przyczyn:
wybrano niewłaściwe zmienne (zmienne nie były wystarczająco silnie powiązane ze zmienną objaśniającą lub były skorelowane ze sobą),
współczynnik zmienności został przyjęty na zbyt niskim poziomie, przez co do badań dopuszczono zmienne o zbyt niskiej zmienności, które nie mogły stanowić dobrego materiału do skonstruowania modelu,
w zbiorze danych dla poszczególnych zmiennych znalazły się wartości odstające, które mogły przełożyć się na wyniki późniejszych obliczeń.
Należałoby więc ponownie przemyśleć kwestię zmiennych, które mogą mieć bezpośredni wpływ na podjęcie decyzji o opuszczeniu kraju oraz wyeliminować wszystkie nieprawidłowe dane.
Podsumowując, model skonstruowany w projekcie, ze względu na niskie dopasowanie, nie nadaje się do wykorzystania w prognozowaniu liczby emigrantów z Polski.