Ekonometria II projekt C

Autor opracowania: Marek Walesiak
PROJEKT C MODEL NIELINIOWY
funkcja produkcji z dwiema zmiennymi objaśniającymi
Nazwisko i imię studenta 1: ..........................................
Kierunek i rok studiów studenta 1: ......
Numer grupy studenta 1: .....
Nazwisko i imię studenta 2: ..........................................
Kierunek i rok studiów studenta 2: ......
Numer grupy studenta 2: .....
Uwagi dla studentów:
1. Program R należy pobrać ze strony: http://cran.r-project.org/
2. Co najmniej jeden projekt (A, B, C, D) należy przesłać na e-mail prowadzącego laboratoria
3. Projekty można wykonywać osobiście lub w zespołach dwuosobowych (liczba zrealizowanych
projektów oraz jakość i estetyka wykonania będzie decydować o ocenie z laboratorium dla
przedmiotu Ekonometria)
4. Liczba obserwacji (dane w postaci szeregów przekrojowych z roku 2009 lub 2010) w projekcie
A, B oraz C musi wynosić co najmniej 12, a w projekcie D co najmniej 30. Dla danych staty-
stycznych należy koniecznie podać zródło
5. Nie wolno w projektach stosować zmiennych użytych w przykładowych projektach prezentowa-
nych na laboratoriach (nie dotyczy projektu C)
6. Wraz z każdym projektem opracowanym w edytorze Word (może też być jego odpowiednik z
pakietu OpenOffice) należy przesłać:
a) plik (pliki) danych w formacie csv
b) odpowiednie procedury w programie R
7. Termin przesłania projektu (projektów): do 03 stycznia 2012 roku
8. Proszę przesyłać projekty z własnych e-maili podając w e-mailu skład zespołu (imię i nazwisko,
rok i forma studiów, numer grupy lub specjalność)
9. Warunkiem przyjęcia projektu (projektów) jest uzyskanie pozytywnej odpowiedzi od prowadzą-
cego laboratoria
10. Odpowiedzi na e-maile informujące o akceptacji projektu lub projektów będą przesyłane w cią-
gu siedmiu dni od ich nadesłania
11. Odrzucane będą projekty, które wykonali inni studenci
1
Autor opracowania: Marek Walesiak
PROJEKT C MODEL NIELINIOWY
funkcja produkcji z dwiema zmiennymi objaśniającymi
1. Zebrać z Roczników Statystycznych co najmniej 12 obserwacji na zmiennej objaśnianej i
dwóch zmiennych objaśniających (dane w postaci szeregów przekrojowych) do modelu
funkcji produkcji
Dane przekrojowe (województwa Polski z 2006 r.)
y produkcja sprzedana przemysłu województwa w mln zł (ceny bieżące),
x1 liczba pracujących w przemyśle województwa w tys. osób (stan na koniec roku),
x2 wartość brutto środków trwałych w przemyśle województwa w mln zł (bieżące ceny ewidencyjne).
yródło: Rocznik statystyczny województw. Główny Urząd Statystyczny, Warszawa 2007.
a) wprowadzić dane statystyczne do programu EXCEL w następującym układzie:
Plik Dane_przekrojowe_f_prod
b) zapisać dane w formacie csv na dysku
(podać nazwę pliku Dane_przekrojowe_f_prod.csv)
2
Autor opracowania: Marek Walesiak
Funkcja produkcji:
b1 b2
y =� b0x1 x2 ex� (1)
Transformacja liniowa (w programie R log oznacza logarytm naturalny):
log y =� logb0 +� b1 log x1 +� b2 log x2 +�x�
Podstawianie: log y =� z , logb0 =� a , log x1 =� v1, log x2 =� v2
z =� a +� b1v1 +� b2v2 +�x� (2)
2. Wykorzystując w programie R procedurę
Reg_wieloraka_model_nieliniowy_f_prod_2010.r:
a) oszacować metodą najmniejszych kwadratów parametry strukturalne modelu (2). Zapisać po-
stać modelu (2) z oszacowanymi parametrami podając w nawiasach pod ocenami estymato-
rów parametrów ich błędy. Podać interpretację parametrów strukturalnych oraz błędów esty-
matorów parametrów strukturalnych dla modelu (2),
b) zinterpretować obliczone parametry struktury stochastycznej dla modelu (2) (standardowy
błąd oceny, współczynnik determinacji, skorygowany współczynnik determinacji),
c) za pomocą testów t i F sprawdzić istotność współczynników regresji modelu (2),
d) przedstawić wykres płaszczyzny regresji modelu (2),
e) wyznaczyć i zinterpretować przedziały ufności dla parametrów strukturalnych modelu (2),
f) wykorzystując test Shapiro-Wilka sprawdzić czy składnik losowy modelu (2) ma rozkład
normalny,
g) sprawdzić za pomocą VIF czy w modelu (2) nie występuje problem przybliżonej współlinio-
wości,
h) wykorzystując test Goldfelda-Quandta sprawdzić czy nie występuje niejednorodność warian-
cji składników losowych dla modelu (2),
i) za pomocą testów Durbina-Watsona oraz Breuscha-Godfreya zbadać czy w modelu nie wy-
stępuje autokorelacja pierwszego stopnia dla modelu (2),
j) sprawdzić czy w zbiorze danych występują obserwacje nietypowe dla modelu (2),
k) sprawdzić, które obserwacje są wpływowe, a które nie są wpływowe dla modelu (2),
l) zapisać postać modelu (1) z oszacowanymi parametrami. Podać interpretację współczynników
elastyczności punktowej produkcji oraz obliczyć i zinterpretować efekt skali produkcji (ESP).
ODPOWIEDZI Z WYKORZYSTANIEM obliczeń w programie R
a) oszacować metodą najmniejszych kwadratów parametry strukturalne modelu (2)
[1] Wyniki estymacji MNK
Call:
3
Autor opracowania: Marek Walesiak
lm(formula = log(y) ~ log(x1) + log(x2), data = d, x = TRUE,
y = TRUE)
Residuals:
Min 1Q Median 3Q Max
-0,34626 -0,07106 -0,01740 0,05555 0,33718
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1,2691 1,0854 1,169 0,2633
log(x1) 0,6238 0,2362 2,640 0,0204 *
log(x2) 0,5935 0,2090 2,839 0,0139 *
---
Signif. codes: 0 *** 0,001 ** 0,01 * 0,05 . 0,1 1
Residual standard error: 0,1892 on 13 degrees of freedom
Multiple R-squared: 0.9522, Adjusted R-squared: 0.9449
F-statistic: 129.6 on 2 and 13 DF, p-value: 2,594e-09
a) zapisać postać modelu (2) z oszacowanymi parametrami podając w nawiasach pod oce-
nami estymatorów parametrów ich błędy
ę =�1,2691+� 0,6238v1 +� 0,5935v2
(1,0854) (0,2362) (0,2090)
a) podać interpretację parametrów strukturalnych oraz błędów estymatorów parametrów
strukturalnych dla modelu (2)
Ć
b1 =� 0,6238 wzrost (spadek) logarytmu liczby pracujących w przemyśle województwa (warto-
ści zmiennej objaśniającej v1) o jednostkę spowoduje wzrost (spadek) logarytmu produkcji sprze-
danej przemysłu województwa (zmienna objaśniana z) średnio o 0,6238 jednostki (ceteris paribus);
Ć
b2 =� 0,5935 wzrost (spadek) logarytmu wartości brutto środków trwałych w przemyśle woje-
wództwa (wartości zmiennej objaśniającej v2) o jednostkę spowoduje wzrost (spadek) logarytmu
produkcji sprzedanej przemysłu województwa (zmienna objaśniana z) średnio o 0,5935 jednostki
(ceteris paribus);
� =�1,2691 (wyraz wolny) brak w tym przypadku interpretacji ekonomicznej.
S(�) =�1,0854 szacując parametr a , gdybyśmy mogli wiele razy pobrać próbę z tej samej po-
pulacji generalnej, mylimy się średnio in plus i in minus o 1,0854 ( a =�1,2691ą�1,0854),
Ć
S(b1) =� 0,2362 szacując parametr b1, gdybyśmy mogli wiele razy pobrać próbę z tej samej po-
pulacji generalnej, mylimy się średnio in plus i in minus o 0,2362 (b1 =� 0,6238 ą� 0,2362 ),
Ć
S(b2) =� 0,2090 szacując parametr b2 , gdybyśmy mogli wiele razy pobrać próbę z tej samej po-
pulacji generalnej, mylimy się średnio in plus i in minus o 0,2090 (b2 =� 0,5935 ą� 0,2090 ).
b) zinterpretować obliczone parametry struktury stochastycznej dla modelu (2) (standar-
dowy błąd oceny, współczynnik determinacji, skorygowany współczynnik determinacji)
standardowy błąd oceny (Residual standard error: 0,1892) wartości empiryczne
zmiennej objaśnianej (logarytm produkcji sprzedanej przemysłu województwa) odchylają się od
wartości teoretycznych przeciętnie o 0,1892 jednostki.
współczynnik determinacji (Multiple R-Squared: 0.9522) 95,22% zmienności zmiennej
objaśnianej (logarytm produkcji sprzedanej przemysłu województwa) zostało wyjaśnionych
przez zbudowany model.
skorygowany współczynnik determinacji (Adjusted R-squared: 0.9449) 94,49% wa-
riancji zmiennej objaśnianej (logarytm produkcji sprzedanej przemysłu województwa) zostało
wyjaśnionych przez zbudowany model.
4
Autor opracowania: Marek Walesiak
c) za pomocą testów t i F sprawdzić istotność współczynników regresji dla modelu (2)
Test t
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1,2691 1,0854 1,169 0,2633
log(x1) 0,6238 0,2362 2,640 0,0204 *
log(x2) 0,5935 0,2090 2,839 0,0139 *
Z uwagi na to, że dla a a� =� 0,05 <� 0,2633 nie ma podstaw do odrzucenia hipotezy zerowej.
Oznacza to, że parametr a nieistotnie różni się od zera.
Z uwagi na to, że dla b1 a� =� 0,05 >� 0,0204 hipotezę zerową odrzucamy. Oznacza to, że parametr
b1 istotnie różni się od zera. Zmienna objaśniająca v1 ma istotny wpływ na zmienną objaśnianą z.
Z uwagi na to, że dla b2 a� =� 0,05 >� 0,0139 hipotezę zerową odrzucamy. Oznacza to, że parametr
b2 istotnie różni się od zera. Zmienna objaśniająca v2 ma istotny wpływ na zmienną objaśnianą z.
Test F
F-statistic: 129.6 on 2 and 13 DF, p-value: 2,594e-09
Z uwagi na to, że a� =� 0,05 >� 2,594e -� 09 (UWAGA! e -� 09 oznacza przesunięcie przecinka w
lewo o 9 miejsc) hipotezę zerową należy odrzucić. Oznacza to, że regresja jako całość jest istotna.
d) przedstawić wykres płaszczyzny regresji modelu (2)
12
11
11,5
10
11,0
10,5
10,0
9
4,0
9,5
4,5
5,0
5,5
9,0
6,0
e) wyznaczyć i zinterpretować przedziały ufności dla parametrów strukturalnych dla mo-
delu (2)
[1] Przedziały ufności dla parametrów
2,5 % 97,5 %
(Intercept) -1,0757379 3,613934
log(x1) 0,1133937 1,134155
log(x2) 0,1419439 1,045118
Z prawdopodobieństwem 0,95 przedział [�-�1,076; 3,614]� pokryje nieznaną wartość parametru a
z modelu z =� a +� b1v1 +� b2v2 +�x� .
5
l
o
g
(
y)
)
x2
(
g
o
l
l
o
g
(
x1
)
Autor opracowania: Marek Walesiak
Z prawdopodobieństwem 0,95 przedział [�0,113; 1,134]� pokryje nieznaną wartość parametru b1 z
modelu z =� a +� b1v1 +� b2v2 +�x� .
Z prawdopodobieństwem 0,95 przedział [�0,142; 1,045]� pokryje nieznaną wartość parametru b2 z
modelu z =� a +� b1v1 +� b2v2 +�x� .
Węższe (szersze) przedziały ufności można uzyskać poprzez zmniejszenie (zwiększenie) pozio-
mu ufności.
f) wykorzystując test Shapiro-Wilka sprawdzić czy składnik losowy ma rozkład normalny
dla modelu (2)
[1] Wyniki testu Shapiro-Wilka
Shapiro-Wilk normality test
data: reg$residuals
W = 0,9454, p-value = 0,4205
Z uwagi na to, że a� =� 0,05 Ł� p -� value =� 0,4205 nie ma podstaw do odrzucenia hipotezy o nor-
malności rozkładu składnika losowego.
g) sprawdzić za pomocą VIF czy w modelu nie występuje problem przybliżonej współli-
niowości dla modelu (2)
[1] VIF - czynnik inflacji wariancji
log(x1) log(x2)
8,888769 8,888769
Wartości VIFj >� 1 informują ile razy wariancja estymatora parametru jest większa od wariancji
prawdziwej (tzn. nie zakłóconej współliniowością statystyczną). Wartości VIFj >� 20 wskazują na
problemy związane ze współliniowością. W analizowanym modelu nie występuje problem związa-
ny ze współliniowością zmiennych objaśniających.
h) wykorzystując test Goldfelda-Quandta sprawdzić czy nie występuje niejednorodność
wariancji składników losowych
[1] Wyniki testu Goldfelda-Quandta
Goldfeld-Quandt test
data: reg
GQ = 0,8334, df1 = 3, df2 = 2, p-value = 0,5859
Nie ma podstaw do odrzucenia hipotezy zerowej, że składnik losowy jest homoskedastyczny
(a� =� 0,05 Ł� p -� value =� 0,5859 ).
i) za pomocą testów Durbina-Watsona oraz Breuscha-Godfreya zbadać czy w modelu nie
występuje autokorelacja pierwszego stopnia
[1] Wyniki testów Durbina-Watsona oraz Breuscha-Godfreya na auto-
korelację pierwszego stopnia
lag Autocorrelation D-W Statistic p-value
1 0,0005780169 1,988776 0,494
Alternative hypothesis: rho > 0
Breusch-Godfrey test for serial correlation of order 1
data: reg
LM test = 0, df = 1, p-value = 0,998
Oba testy potwierdzają brak w modelu autokorelacji reszt pierwszego stopnia, z uwagi na to, że
a� =� 0,05 Ł� p -� value .
6
Autor opracowania: Marek Walesiak
j) sprawdzić czy w zbiorze danych występują obserwacje nietypowe (rys. z lewej strony)
Mazowieckie
Opolskie
5 10 15
5 10 15
numer obserwacji
numer obserwacji
Obserwacje nietypowe (outliers) charakteryzują się dużą resztą. Tego typu obserwacje wpływają
na pogorszenie dopasowania modelu do danych. Dla szacowanego modelu z =� a +� b1v1 +� b2v2 +�x�
jest jedna reszta nietypowa (woj. mazowieckie). W przypadku wystąpienia reszt nietypowych model
należy oszacować i zweryfikować powtórnie z pominięciem obserwacji nietypowych.
k) sprawdzić, które obserwacje są wpływowe, a które nie są wpływowe (rys. z prawej stro-
ny)
Obserwacje wpływowe (influential observations) silnie oddziałują na oszacowane parametry
strukturalne. Włączenie do zbioru danych tych obserwacji powoduje, że znacznie zmieniają się
oszacowane parametry modelu. Dla szacowanego modelu z =� a +� b1v1 +� b2v2 +�x� obserwacja doty-
czące woj. opolskiego jest wpływowa. Należy więc oszacować i zweryfikować powtórnie model z
pominięciem tego województwa.
l) zapisać postać modelu (1) z oszacowanymi parametrami. Podać interpretację współ-
czynników elastyczności punktowej produkcji oraz obliczyć i zinterpretować efekt skali
produkcji (ESP)
z =� a +� b1v1 +� b2v2 +�x� (2)
gdzie: log y =� z , logb0 =� a , log x1 =� v1, log x2 =� v2
ę =�1,2691+� 0,6238v1 +� 0,5935v2
(1,0854) (0,2362) (0,2090)
logb0 =� a , exp(a) =� b0 ; exp(1,2691) =� b0 ; b0 =� 3,5576
0,6238 0
w =� 3,5576�� x1 �� x2,5935 (1)
Współczynniki elastyczności punktowej: Ex =� 0,6238 i Ex =� 0,5935.
1 2
Ex =� 0,6238 wzrost (spadek) liczby pracujących w przemyśle województwa o 1% spowoduje
1
wzrost (spadek) produkcji sprzedanej przemysłu województwa w przybliżeniu o 0,6238% (ceteris
paribus).
Ex =� 0,5935 wzrost (spadek) wartości brutto środków trwałych w przemyśle województwa o
2
1% spowoduje wzrost (spadek) produkcji sprzedanej przemysłu województwa w przybliżeniu o
0,5935% (ceteris paribus).
ESP =� Ex +� Ex =� 0,6238 +� 0,5935 =�1,2173 .
1 2
Zatem funkcja (1) jest funkcją o rosnących przyrostach, dla której efektywne jest zwiększanie
nakładów.
7
hat values
reszty studentyzowane
0,2
0,4
0,6
0,8
-4
-2
0
2
4

Wyszukiwarka

Podobne podstrony:
Ekonometria II projekt A
Ekonometria II projekt B
Ekonometria II projekt D
Ekonometria II projekt D
pytania dyplomowe z kierunku studiow Ekonomia I i II stopnia ZL
Ekonometria II wykład 5 13
Budynki szkeletowe II Projektowanie ram
WM II projekt 1 skręcanie
Ekonomia II semestr
ROZDZIAŁ II Projektowanie sieci kątowo liniowej II klasy
AIR II projekt 1 WM
biznes i ekonomia mistrz sprzedazy wydanie ii rozszerzone arkadiusz bednarski ebook
J2ME Praktyczne projekty Wydanie II j2mep2
projekt II

więcej podobnych podstron