Opole 2015
Politechnika Opolska
Wydział Elektrotechniki, Automatyki i
Informatyki
Ekonometria
Kierunek studiów: Informatyka
Prowadzący:
Rok akademicki: 2014/2015
dr inż. Arkadiusz Gardecki
Rok studiów: I
Wykonał:
Semestr: I
Adam Czech
Kierunek: Informatyka
Przedmiot: Ekonometria
2
Opole 2015
1. Cel projektu
Celem projektu jest stworzenie programu, który z podanych danych statycznych
wspomoże budowę jednorównaniowego modelu ekonometrycznego. Program ten ma w łatwy
i przystępny, z punku widzenia użytkownika, realizować obliczenia z danych zawartych w
pliku tekstowym.
2. Dane statystyczne
Dane statyczne umieszczone w pliku tekstowym:
Tabela 1 Dane statystyczne wykorzystane w modelu
Lp.
Rok
Liczba
emigracji
(w tys.)
Bezrobocie
(w tys.)
Zarobki
(w PLN)
Populacji
(w tys.)
PKB
(w mln.)
Y
X
1
X
2
X
3
X
4
1
2003
786
3176
800
38191
103,4
2
2004
1000
3000
824
38174
105,1
3
2005
1450
2773
849
38157
103,5
4
2006
1950
2309
899
38125
106,2
5
2007
2270
1747
934
38116
107,2
6
2008
2210
1474
1126
38136
103,9
7
2009
2100
1893
1276
38167
102,6
8
2010
2000
1955
1317
38530
103,7
9
2011
2060
1983
1386
38538
104,8
10
2012
2130
2137
1500
38533
101,8
11
2013
2196
2158
1600
38496
101,7
Gdzie:
Y – Ilość ludzi na emigracji w tysiącach,
X1 - Ilość zarejestrowanych bezrobotnych w tysiącach,
X2 – Średnie wynagrodzenie brutto w złotówkach,
X3 – Ilość mieszkańców w kraju,
X4 - PKB (Przychód Krajowy Brutto) w milionach.
Kierunek: Informatyka
Przedmiot: Ekonometria
3
Opole 2015
3. Współczynniki korelacji
Liczba określająca w jakim stopniu zmienne są współzależne. Jest to miara korelacji
Między zmienną objaśnianą Y i zmiennymi objaśniającymi X
i
. Ocena ta została wykonan
przy pomocy wzoru na r
i.
Do obliczenia wykorzystano wzór:
n
t
i
ti
n
t
t
n
t
i
ti
t
i
x
x
y
y
x
x
y
y
r
1
2
1
2
1
)
(
)
(
)
)(
(
Po obliczeniu poszczególnych współczynników korelacji otrzymano R
0
:
R
0
-0,9502
0,6572
0,2549
0,0913
W następnej kolejności obliczone zostały współczynniki korelacji między
potencjalnymi zmiennymi objaśniającymi. Aby tego dokonać wykorzystano wzór:
n
t
j
jt
n
t
i
it
n
t
j
jt
i
it
ij
x
x
x
x
x
x
x
x
r
1
2
1
2
1
)
(
)
(
)
)(
(
Po podstawieniu odpowiednich elementów do wzoru otrzymano macierz
współczynników korelacji R:
R
1
-0,6135
-0,1838
-0,0919
-0,6135
1
0,7995
-0,4987
-0,1838
0,7995
1
-0,4003
-0,0919
-0,4987
-0,4003
1
Kierunek: Informatyka
Przedmiot: Ekonometria
4
Opole 2015
4. Wybór zmiennych objaśniających
Do wyboru zmiennych wyjaśniających posłuży metoda współczynników korelacji
wielorakiej dla poziomu istotności α=0,1.
Metoda Z. Pawłowskiego jest to metoda doboru zmiennych objaśniających do modelu
statystycznego w szczególności modelu ekonometrycznego.
Aby dokonać wyboru zmiennych w pierwszej kolejności budujemy tzw. macierz
rozszerzoną W:
𝑾 = [
𝟏
𝑹
𝟎
𝑻
𝑹
𝟎
𝑹 ]
gdzie:
W – pełną macierzą korelacji
Macierze R oraz W wykorzystujemy do budowy współczynnika korelacji wielorakiej C
i
,
który jest miarą liniowej zależności między zmienną objaśnianą a liniową kombinacją
zmiennych objaśniających.
Obliczony jest ze wzoru:
𝑪
𝒊
= √𝟏 −
𝐝𝐞𝐭(𝑾
𝒊
)
𝐝𝐞𝐭(𝑹
𝒊
)
5. Oszacowanie parametrów strukturalnych modelu
Stosując Metodę Najmniejszych Kwadratów oszacowano parametry strukturalne modelu,
oszacowanie to odbyło się po wybraniu zmiennych objaśniających.
Wzór ogólny tego modelu to:
𝒚 = 𝒂
𝟏
𝒙
𝟏
+ 𝒂
𝟐
𝒙
𝟐
+ 𝒂
𝟑
Wyznaczenie parametrów
a
i
, było możliwe dzięki wzorowi:
𝒂 = (𝑿
𝑻
𝑿)
−𝟏
𝑿
𝑻
𝒀
Kierunek: Informatyka
Przedmiot: Ekonometria
5
Opole 2015
Aby skorzystać z wzoru potrzebne było wyznaczenie macierzy X oraz Y. Macierz X
sprowadza się do wybrania kolumn reprezentujących wartości zmiennych X
1
, X
2
z tabeli z
danymi oraz dopisanie do niej kolumny jednostkowej, czyli kolumny samych jedynek.
Macierz Y to tak naprawdę wartości zmiennej Y z tabeli danych statystycznych:
Y =
786
1000
1450
1950
2270
2210
2100
2000
2060
2130
X =
3176
800
1
3000
824
1
2773
849
1
2309
899
1
1747
934
1
1474
1126
1
1893
1276
1
1955
1317
1
1983
1386
1
2137
1500
1
Kierunek: Informatyka
Przedmiot: Ekonometria
6
Opole 2015
Posiadając już macierz Y i X wyznaczono współczynniki
a
1
,
a
2
i
a
3.
Następnym
etapem jest wyznaczenie macierzy transponowanej X
T
:
X
T
=
786
1000 1450 1950 2270 2210 2100 2000 2060 2130
3176 3000 2773 2309 1747 1474 1893 1955 1983 2137
1
1
1
1
1
1
1
1
1
1
Otrzymaną macierz X
T
pomnożono przez macierz X w wyniku czego otrzymano
macierz X
T
X:
X
T
X =
53237203 23678431 22447
23678431 12521871 10911
22447
10911
10
Otrzymaną macierz odwrócono i pomnożono przez iloczyn macierzy X
T
i Y :
(X
T
X)
-1
=
0
0
-0,002
0
0
-0,005
-0,002 -0,005
9,663
X
T
Y=
0
0
-0,0021
0
0
-0,0045
-0,0021 -0,0045
9,6627
Po wykonaniu wszystkich tych operacji otrzymujemy macierz
a
:
a=
0
0
-0.0193254
0
0
-0.0483135
-0.0202923 0.0434835 93.3706968
Kierunek: Informatyka
Przedmiot: Ekonometria
7
Opole 2015
Gdy otrzymaną macierz
a
podstawimy do ogólnego wzoru opisującego model otrzymujemy:
𝒚 = −𝟎, 𝟖𝟐𝟐𝟖𝑿
𝟏
+ 𝟎, 𝟐𝟒𝟎𝟏𝑿
𝟐
+ 𝟑𝟑𝟖𝟎, 𝟓𝟖𝟕
6. Weryfikacja modelu
Aby dokonać weryfikację modelu wybrane zostały współczynniki i hipotezy.
Na początku została wyznaczona wariancja składnika resztowego
𝑺
𝒖
, wyznaczony został
przy pomocy wzoru:
𝑺
𝒖
𝟐
=
𝟏
𝒏 − 𝒌
[𝒀
𝑻
𝒀 − 𝒀
𝑻
𝑿𝒂]
𝑺
𝒖
= √𝒔
𝒖
𝟐
𝑺
𝒖
= 𝟐𝟏𝟎, 𝟒𝟗𝟕𝟔
Kolejnym krokiem było określenie błędów średnich szacunku parametrów:
𝑫
𝟐
(𝒂) = 𝑺
𝒖
𝟐
(𝑿
𝑻
𝑿)
−𝟏
D(a
1
) = 0,0249,
D(a
2
) = 0,1152,
D(a
3
) = 428148,1011
Do wyznaczenia współczynnika zbieżności wykorzystany został wzór:
𝝋
𝟐
=
𝒀
𝑻
𝒀−𝒀
𝑻
𝑿𝒂
(𝒀−𝒀̅)
𝑻
(𝒀−𝒀̅)
= 𝟎, 𝟓𝟎𝟎
Współczynnik determinacji określony wzorem:
𝑹
𝟐
= 𝟏 − 𝝋
𝟐
= 𝟎, 𝟓𝟎𝟎
Kierunek: Informatyka
Przedmiot: Ekonometria
8
Opole 2015
Ostatnim wyznaczonym współczynnikiem jest współczynnik zmienności losowej
V:
𝑽 =
𝑺
𝒖
𝒀
̅ ∗ 𝟏𝟎𝟎%
𝑽 = 𝟏𝟏, 𝟕𝟐%
Zweryfikowany wzór modelu:
𝒚 = −𝟎, 𝟖𝟐𝟐𝟖𝒙
𝟏
+ 𝟎, 𝟐𝟒𝟎𝟏𝒙
𝟐
+ 𝟑𝟑𝟖𝟎, 𝟓𝟖𝟔𝟔
(0,0249)
(0,1152) (428148,1011)
7. Statystyka t-Studenta
Statystyka t-Studenta została wykorzystana w celu sprawdzenia.
Hipoteza zerowa w postaci:
𝑯
𝟎
: 𝜶
𝒊
= 𝟎
oraz hipotezę alternatywną w postaci:
𝑯
𝟏
:𝜶
𝒊
≠ 𝟎
Dla statystyki testowej danej wzorem:
𝒕
𝒊
=
𝒂
𝒊
𝑫(𝒂
𝒊
)
otrzymano następujące wartości:
t1 = -33,044
t2 = 2,08442
Dla poziomu istotności
=0,1 oraz n=7 (liczba stopni swobody) z tablic testu t-
Studenta została odczytana wartość
t
1,8946.
Dla poziomu istotności
=0,1 dokonano następujących porównań:
|𝐭
𝟏
| > 𝐭
𝛂
, bo 33,044 > 1,8946
|𝐭
𝟐
| > 𝐭
𝛂
,, bo 2,08442 > 1,8946.
Kierunek: Informatyka
Przedmiot: Ekonometria
9
Opole 2015
Z wykonanych porównań wynika, że należy odrzucić hipotezę H
0
i za słuszną uznać hipotezę
alternatywną.
5. Statystyka F rozkładu Fischera Snedecora
Po wykonaniu sprawdzenia przy pomocy statystki t-Studenta wykonano sprawdzenia,
czy dopasowanie oszacowanego modelu do danych empirycznych jest wystarczające.
Wykorzystano w tym celu statystykę F rozkładu Fischera Snedecora. Na początku zostały
określone hipotezy:
𝑯
𝟎
: 𝜶
𝟏
= 𝟎 ʌ 𝜶
𝟐
= 𝟎 ʌ 𝜶
𝟑
= 𝟎
𝑯
𝟏
: 𝜶
𝟏
≠ 𝟎 v 𝜶
𝟐
≠ 𝟎 v 𝜶
𝟑
≠ 𝟎
Korzystając ze statystyki określonej wzorem:
𝑭 =
𝑹
𝟐
𝟏 − 𝑹
𝟐
∗
𝒏 − 𝒌
𝒌 − 𝟏
gdzie
R
2
=1-
𝝋
𝟐
= 1-0,500 = 0,500
otrzymano
F = 8
Następnie z tablic Fischera Snedecora odczytano wartość krytyczną statystyki dla poziomu
istotności α = 0,1 oraz stopni swobody m
1
=1 i m
2
=8 równą F
α
= 3,46. Kolejnym krokiem było
wykonanie porównania:
F>F
α
, bo 8>3,46
Z wykonanego porównania wynika, że należy przyjąć hipotezę H
1
.
Kierunek: Informatyka
Przedmiot: Ekonometria
10
Opole 2015
6. Graficzna prezentacja wyników
Dla otrzymanego wzoru określającego model ekonometryczny wykonano porównanie
rzeczywistego przebiegu zmiennej objaśnianej z symulacyjnym przebiegiem tej zmiennej.
Otrzymane wyniki przedstawiono w poniższej tabeli. Dodatkowo zaprezentowano wartość
otrzymaną w kolejnym kroku (okresie) funkcji predykcyjnej dla danych z 2000 roku.
Rok
Rzeczywisty Y
Symulacyjny Y
2003
786
959,4538
2004
1000
1110,029
2005
1450
1302,807
2006
1950
1696,591
2007
2270
2167,408
2008
2210
2438,132
2009
2100
2129,394
2010
2000
2088,224
2011
2060
2081,753
2012
2130
1982,413
2003
786
959,4538
Graficzne porównanie rzeczywistego Y z symulacyjnym:
Wykres przedstawia średnią liczbę emigracji z Polski w latach 2003 – 2012. Wykres został
sporządzony dokładnie z instrukcjami, które zostały podane na zajęciach.
0
500
1000
1500
2000
2500
3000
2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
Śred
n
ia
li
cz
b
a
emi
gr
ac
ji
Rok
Rzeczywisty Y
Symulacyjny Y
Kierunek: Informatyka
Przedmiot: Ekonometria
11
Opole 2015
7. Wnioski
Dzięki przeprowadzonym statystyką t-studenta i F rozkładu Fischera Snedecora,
można stwierdzić, że zmienne objaśniające wpływają na zmienną endogeniczną. W oby
przypadkach prawidłowe okazały się hipotezy H
1
.
Dzięki graficznemu przedstawieniu modelu, również można potwierdzić poprawność
sporządzonego modelu. Jak można zaobserwować przebiegi zmiennej objaśniającej i
symulacyjnej są podobne. Oczywiście występują w nich drobne różnice, jednak wartości
predykcyjne są bardzo bliskie realnym.