plik


Autor opracowania: Marek Walesiak PROJEKT A  MODEL LINIOWY z co najmniej trzema zmiennymi obja[niajcymi (4-7 potencjalnych zmiennych obja[niajcych + dobr zmiennych) Nazwisko i imi studenta 1: .......................................... Kierunek i rok studiw studenta 1: ...... Numer grupy studenta 1: ..... Nazwisko i imi studenta 2: .......................................... Kierunek i rok studiw studenta 2: ...... Numer grupy studenta 2: ..... Uwagi dla studentw: 1. Program R nale|y pobra ze strony: http://cran.r-project.org/ 2. Co najmniej jeden projekt (A, B, C, D) nale|y przesBa na e-mail prowadzcego laboratoria 3. Projekty mo|na wykonywa osobi[cie lub w zespoBach dwuosobowych (liczba zrealizowanych projektw oraz jako[ i estetyka wykonania bdzie decydowa o ocenie z laboratorium dla przedmiotu Ekonometria) 4. Liczba obserwacji (dane w postaci szeregw przekrojowych z roku 2009 lub 2010) w projekcie A, B oraz C musi wynosi co najmniej 12, a w projekcie D co najmniej 30. Dla danych staty- stycznych nale|y koniecznie poda zrdBo 5. Nie wolno w projektach stosowa zmiennych u|ytych w przykBadowych projektach prezentowa- nych na laboratoriach (nie dotyczy projektu C) 6. Wraz z ka|dym projektem opracowanym w edytorze Word (mo|e te| by jego odpowiednik z pakietu OpenOffice) nale|y przesBa: a) plik (pliki) danych w formacie csv b) odpowiednie procedury w programie R 7. Termin przesBania projektu (projektw): do 03 stycznia 2012 roku 8. Prosz przesyBa projekty z wBasnych e-maili podajc w e-mailu skBad zespoBu (imi i nazwisko, rok i forma studiw, numer grupy lub specjalno[) 9. Warunkiem przyjcia projektu (projektw) jest uzyskanie pozytywnej odpowiedzi od prowadz- cego laboratoria 10. Odpowiedzi na e-maile informujce o akceptacji projektu lub projektw bd przesyBane w ci- gu siedmiu dni od ich nadesBania 11. Odrzucane bd projekty, ktre wykonali inni studenci 1 Autor opracowania: Marek Walesiak PROJEKT A  MODEL LINIOWY z co najmniej trzema zmiennymi obja[niajcymi (4-7 potencjalnych zmiennych obja[niajcych + dobr zmiennych) 1. Zebra z Rocznikw Statystycznych co najmniej 12 obserwacji na zmiennej obja[nianej i 4-7 potencjalnych zmiennych obja[niajcych (dane w postaci szeregw przekrojowych) Dane przekrojowe (wg wojewdztw Polski w roku 2005) y  produkt krajowy brutto wojewdztwa Polski w mln zB (ceny bie|ce), x1  nakBady inwestycyjne w wojewdztwie w mln zB (ceny bie|ce), x2  warto[ brutto [rodkw trwaBych wojewdztwa w mln zB (bie|ce ceny ewidencyjne), x3  pracujcy w wojewdztwie w tys. osb, x4  produkcja sprzedana przemysBu wojewdztwa w mln zB (ceny bie|ce), x5  stopa bezrobocia rejestrowanego w wojewdztwie w %. yrdBo: dane dotyczce produktu krajowego brutto s z Rocznika statystycznego wojewdztw 2007, pozo- staBe z Rocznika statystycznego wojewdztw 2006. a) wprowadzi dane statystyczne do programu EXCEL w nastpujcym ukBadzie: Plik Dane_przekrojowe_PKB b) zapisa dane w formacie csv na dysku (poda nazw pliku Dane_przekrojowe_PKB.csv) 2 Autor opracowania: Marek Walesiak 2. Zastosowa przy doborze zmiennych statystyczne kryteria wyboru midzy modelami re- gresji (kryterium Theila maksymalnego skorygowanego wspBczynnika determinacji, kryteria bazujce na minimalizacji [redniokwadratowego bBdu predykcji Mallowsa, kryteria informacyj- ne: Akaike (AIC), Schwartza (BIC)). Wybra na podstawie jednego z kryteriw zmienne obja- [niajce do modelu1. Zastosowa w programie R procedur AIC_BIC_adjr2_Cp.r Wynik z programu R [1] "Najlepsza kombinacja zmiennych wg AIC to: 1, 2, 3, 4 z warto- [ci miary: 258,440306449048" [1] "Najlepsza kombinacja zmiennych wg BIC to: 1, 2, 3, 4 z warto- [ci miary: 262,303250060246" [1] "Najlepsza kombinacja zmiennych wg adjr2 to: 1, 2, 3, 4, 5 z warto[ci miary: 0,996815506925318" [1] "Najlepsza kombinacja zmiennych wg Cp to: 1, 2, 3, 4 z warto- [ci miary: 5,30346700096197" [1] "DokBadne wyniki w pliku wynik_AIC_BIC_adjr2_Cp.csv" Do modelu liniowego zostan wybrane zmienne obja[niajce x1, x2, x3 i x4. Zatem model ma posta: y = b0 + b1x1 + b2x2 + b3x3 + b4x4 +x 3. Wykorzystujc w programie R procedur Reg_wieloraka_model_liniowy_hiperplaszczyzna_2010.r a) oszacowa metod najmniejszych kwadratw parametry strukturalne modelu z wybranymi zmiennymi. Zapisa posta modelu z oszacowanymi parametrami podajc w nawiasach pod ocenami estymatorw parametrw ich bBdy. Poda interpretacj parametrw strukturalnych oraz bBdw estymatorw parametrw strukturalnych, b) zinterpretowa obliczone parametry struktury stochastycznej (standardowy bBd oceny, wspB- czynnik determinacji, skorygowany wspBczynnik determinacji), c) za pomoc testw t i F sprawdzi istotno[ wspBczynnikw regresji, d) wyznaczy i zinterpretowa przedziaBy ufno[ci dla parametrw strukturalnych, e) wykorzystujc test Shapiro-Wilka sprawdzi czy skBadnik losowy ma rozkBad normalny, f) sprawdzi za pomoc VIF czy w modelu nie wystpuje problem przybli|onej wspBliniowo- [ci, g) wykorzystujc test Goldfelda-Quandta sprawdzi czy nie wystpuje niejednorodno[ warian- cji skBadnikw losowych 1 Wybra wariant z co najmniej trzema zmiennymi obja[niajcymi. 3 Autor opracowania: Marek Walesiak h) za pomoc testw Durbina-Watsona oraz Breuscha-Godfreya zbada czy w modelu nie wy- stpuje autokorelacja pierwszego stopnia i) sprawdzi czy w zbiorze danych wystpuj obserwacje nietypowe j) sprawdzi, ktre obserwacje s wpBywowe, a ktre nie s wpBywowe ODPOWIEDZI Z WYKORZYSTANIEM obliczeD w programie R a) oszacowa metod najmniejszych kwadratw parametry strukturalne modelu z wybra- nymi zmiennymi [1] Wyniki estymacji MNK Call: lm(formula = y ~ x1 + x2 + x3 + x4, data = d, x = TRUE, y = TRUE) Residuals: Min 1Q Median 3Q Max -4447,813 -1497,929 -5,696 1710,408 4731,755 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -150,92985 2008,93467 -0,075 0,941461 x1 3,98625 0,54714 7,286 1,57e-05 *** x2 0,05511 0,01869 2,948 0,013256 * x3 11,41188 6,99426 1,632 0,131034 x4 0,32510 0,06678 4,868 0,000496 *** --- Signif. codes: 0  *** 0,001  ** 0,01  * 0,05  . 0,1   1 Residual standard error: 2839 on 11 degrees of freedom Multiple R-squared: 0.9976, Adjusted R-squared: 0.9967 F-statistic: 1143 on 4 and 11 DF, p-value: 2,529e-14 a) zapisa posta modelu z oszacowanymi parametrami podajc w nawiasach pod ocenami estymatorw parametrw ich bBdy w = -150,930+ 3,986 x1 + 0,055 x2 +11,412 x3 + 0,325 x4 (2008,935) (0,547) (0,019) (6,994) (0,067) a) poda interpretacj parametrw strukturalnych oraz bBdw estymatorw parametrw strukturalnych  b1 = 3,986  wzrost (spadek) warto[ci nakBadw inwestycyjnych wojewdztwa (warto[ci zmien- nej obja[niajcej x1) o 1 mln zB spowoduje wzrost (spadek) produktu krajowego brutto wojewdz- twa (zmienna obja[niana y) [rednio o 3,986 mln zB (ceteris paribus);  b2 = 0,055  wzrost (spadek) warto[ci brutto [rodkw trwaBych wojewdztwa (warto[ci zmien- nej obja[niajcej x2) o 1 mln zB spowoduje wzrost (spadek) produktu krajowego brutto wojewdz- twa (zmienna obja[niana y) [rednio o 0,055 mln zB (ceteris paribus);  b3 =11,412  wzrost (spadek) liczby pracujcych w wojewdztwie (warto[ci zmiennej obja[nia- jcej x3) o 1 tys. osb spowoduje wzrost (spadek) produktu krajowego brutto wojewdztwa (zmienna obja[niana y) [rednio o 11,412 mln zB (ceteris paribus);  b4 = 0,325  wzrost (spadek) produkcji sprzedanej przemysBu wojewdztwa (warto[ci zmiennej obja[niajcej x4) o 1 mln zB spowoduje wzrost (spadek) produktu krajowego brutto wojewdztwa (zmienna obja[niana y) [rednio o 0,325 mln zB (ceteris paribus);  b0 = -150,930 (wyraz wolny)  brak w tym przypadku interpretacji ekonomicznej.  S(b0) = 2008,935  szacujc parametr b0 , gdyby[my mogli wiele razy pobra prb z tej samej populacji generalnej, mylimy si [rednio in plus i in minus o 2008,935 (b0 = -150,930 2008,935), 4 Autor opracowania: Marek Walesiak  S(b1) = 0,547  szacujc parametr b1, gdyby[my mogli wiele razy pobra prb z tej samej po- pulacji generalnej, mylimy si [rednio in plus i in minus o 0,547 (b1 = 3,986 0,547 ),  S(b2) = 0,019  szacujc parametr b2 , gdyby[my mogli wiele razy pobra prb z tej samej po- pulacji generalnej, mylimy si [rednio in plus i in minus o 0,019 (b2 = 0,055 0,019 ),  S(b3) = 6,994  szacujc parametr b3 , gdyby[my mogli wiele razy pobra prb z tej samej po- pulacji generalnej, mylimy si [rednio in plus i in minus o 6,994 (b3 =11,412 6,994 ),  S(b4) = 0,067  szacujc parametr b4 , gdyby[my mogli wiele razy pobra prb z tej samej po- pulacji generalnej, mylimy si [rednio in plus i in minus o 0,067 (b4 = 0,325 0,067 ), b) zinterpretowa obliczone parametry struktury stochastycznej (standardowy bBd oceny, wspBczynnik determinacji, skorygowany wspBczynnik determinacji), standardowy bBd oceny (Residual standard error: 2839)  warto[ci empiryczne zmiennej obja[nianej (produkt krajowy brutto wojewdztwa) odchylaj si od warto[ci teore- tycznych przecitnie o 2839 mln zB. wspBczynnik determinacji (Multiple R-Squared: 0.9976)  99,76% zmienno[ci zmiennej obja[nianej (produkt krajowy brutto wojewdztwa) zostaBo wyja[nionych przez zbudowany mo- del. skorygowany wspBczynnik determinacji (Adjusted R-squared: 0.9967)  99,67% wa- riancji zmiennej obja[nianej (produkt krajowy brutto wojewdztwa) zostaBo wyja[nionych przez zbudowany model. c) za pomoc testw t i F sprawdzi istotno[ wspBczynnikw regresji Test t Estimate Std. Error t value Pr(>|t|) (Intercept) -150,92985 2008,93467 -0,075 0,941461 x1 3,98625 0,54714 7,286 1,57e-05 x2 0,05511 0,01869 2,948 0,013256 x3 11,41188 6,99426 1,632 0,131034 x4 0,32510 0,06678 4,868 0,000496 Z uwagi na to, |e dla b0 a = 0,05 < 0,941461 nie ma podstaw do odrzucenia hipotezy zerowej. Oznacza to, |e parametr b0 nieistotnie r|ni si od zera. Z uwagi na to, |e dla b1 a = 0,05 >1,57e - 05 hipotez zerow odrzucamy. Oznacza to, |e para- metr b1 istotnie r|ni si od zera. Zmienna obja[niajca x1 ma istotny wpByw na zmienn obja[nia- n y. Z uwagi na to, |e dla b2 a = 0,05 > 0,013256 hipotez zerow odrzucamy. Oznacza to, |e para- metr b2 istotnie r|ni si od zera. Zmienna obja[niajca x2 ma istotny wpByw na zmienn obja[nia- n y. Z uwagi na to, |e dla b3 a = 0,05 < 0,131034 nie ma podstaw do odrzucenia hipotezy zerowej. Oznacza to, |e parametr b3 nieistotnie r|ni si od zera. Zmienna obja[niajca x3 nie ma istotnego wpBywu na zmienn obja[nian y. Z uwagi na to, |e dla b4 a = 0,05 > 0,000496 hipotez zerow odrzucamy. Oznacza to, |e para- metr b4 istotnie r|ni si od zera. Zmienna obja[niajca x4 ma istotny wpByw na zmienn obja[nia- n y. Test F F-statistic: 1143 on 4 and 11 DF, p-value: 2,529e-14 5 Autor opracowania: Marek Walesiak Z uwagi na to, |e a = 0,05 > 2,529e -14 (UWAGA! e -14 oznacza przesunicie przecinka w lewo o 14 miejsc) hipotez zerow nale|y odrzuci. Oznacza to, |e regresja jako caBo[ jest istotna. d) wyznaczy i zinterpretowa przedziaBy ufno[ci dla parametrw strukturalnych [1] PrzedziaBy ufno[ci dla parametrw 2,5 % 97,5 % (Intercept) -4,572565e+03 4,270706e+03 x1 2,782001e+00 5,190509e+00 x2 1,396466e-02 9,624931e-02 x3 -3,982372e+00 2,680614e+01 x4 1,781145e-01 4,720831e-01 Z prawdopodobieDstwem 0,95 przedziaB [- 4572,565;4270,706] pokryje nieznan warto[ para- metru b0 z modelu y = b0 + b1x1 + b2x2 + b3x3 + b4x4 +x . Z prawdopodobieDstwem 0,95 przedziaB [2,782; 5,191] pokryje nieznan warto[ parametru b1 z modelu y = b0 + b1x1 + b2x2 + b3x3 + b4x4 +x . Z prawdopodobieDstwem 0,95 przedziaB [0,014; 0,096] pokryje nieznan warto[ parametru b2 z modelu y = b0 + b1x1 + b2x2 + b3x3 + b4x4 +x . Z prawdopodobieDstwem 0,95 przedziaB [- 3,982; 26,806] pokryje nieznan warto[ parametru b3 z modelu y = b0 + b1x1 + b2x2 + b3x3 + b4x4 +x . Z prawdopodobieDstwem 0,95 przedziaB [0,178; 0,472] pokryje nieznan warto[ parametru b4 z modelu y = b0 + b1x1 + b2x2 + b3x3 + b4x4 +x . W|sze (szersze) przedziaBy ufno[ci mo|na uzyska poprzez zmniejszenie (zwikszenie) pozio- mu ufno[ci. e) wykorzystujc test Shapiro-Wilka sprawdzi czy skBadnik losowy ma rozkBad normalny [1] Wyniki testu Shapiro-Wilka Shapiro-Wilk normality test data: reg$residuals W = 0,983, p-value = 0,9827 Z uwagi na to, |e a = 0,05 p - value = 0,9827 nie ma podstaw do odrzucenia hipotezy o nor- malno[ci rozkBadu skBadnika losowego. f) sprawdzi za pomoc VIF czy w modelu nie wystpuje problem przybli|onej wspBliniowo[ci [1] VIF - czynnik inflacji wariancji x1 x2 x3 x4 25,65694 5,42586 21,22442 13,42201 Warto[ci VIFj > 1 informuj ile razy wariancja estymatora parametru jest wiksza od wariancji prawdziwej (tzn. nie zakBconej wspBliniowo[ci statystyczn). Warto[ci VIFj > 20 wskazuj na problemy zwizane ze wspBliniowo[ci. Problem zwizany ze wspBliniowo[ci wystpuje w tym modelu szczeglnie dla zmiennych obja[niajcych x1 i x3. g) wykorzystujc test Goldfelda-Quandta sprawdzi czy nie wystpuje niejednorodno[ wariancji skBadnikw losowych [1] Wyniki testu Goldfelda-Quandta Goldfeld-Quandt test data: reg GQ = 1,6221, df1 = 3, df2 = 3, p-value = 0,3504 6 Autor opracowania: Marek Walesiak Nie ma podstaw do odrzucenia hipotezy zerowej, |e skBadnik losowy jest homoskedastyczny (a = 0,05 p - value = 0,3504 ). h) za pomoc testw Durbina-Watsona oraz Breuscha-Godfreya zbada czy w modelu nie wystpuje autokorelacja pierwszego stopnia [1] Wyniki testw Durbina-Watsona oraz Breuscha-Godfreya na auto- korelacj pierwszego stopnia lag Autocorrelation D-W Statistic p-value 1 0,06648353 1,391266 0,135 Alternative hypothesis: rho > 0 Breusch-Godfrey test for serial correlation of order 1 data: reg LM test = 0,1109, df = 1, p-value = 0,7391 Oba testy potwierdzaj brak w modelu autokorelacji reszt pierwszego stopnia, z uwagi na to, |e a = 0,05 p - value . i) sprawdzi czy w zbiorze danych wystpuj obserwacje nietypowe (rys. z lewej strony) Wielkopolskie Mazowieckie Wielkopolskie Zlskie Mazowieckie 5 10 15 5 10 15 numer obserwacji numer obserwacji Obserwacje nietypowe (outliers) charakteryzuj si du| reszt. Tego typu obserwacje wpBywaj na pogorszenie dopasowania modelu do danych. Dla szacowanego modelu y = b0 + b1x1 + b2x2 + b3x3 + b4x4 +x s dwie reszty nietypowe (woj. mazowieckie i woj. wielkopol- skie). W przypadku wystpienia reszt nietypowych model nale|y oszacowa i zweryfikowa po- wtrnie z pominiciem obserwacji nietypowych. j) sprawdzi, ktre obserwacje s wpBywowe, a ktre nie s wpBywowe (rys. z prawej stro- ny) Obserwacje wpBywowe (influential observations) silnie oddziaBuj na oszacowane parametry strukturalne. WBczenie do zbioru danych tych obserwacji powoduje, |e znacznie zmieniaj si oszacowane parametry modelu. Dla szacowanego modelu y = b0 + b1x1 + b2x2 + b3x3 + b4x4 +x ob- serwacje dotyczce woj. mazowieckiego, [lskiego i wielkopolskiego s wpBywowe. Nale|y wic oszacowa i zweryfikowa powtrnie model z pominiciem tych dwch wojewdztw. 7 1,5 1,0 hat values reszty studentyzowane 0,5 -4 -2 0 2 4 6

Wyszukiwarka

Podobne podstrony:
Ekonometria II projekt C
Ekonometria II projekt B
Ekonometria II projekt D
Ekonometria II projekt D
pytania dyplomowe z kierunku studiow Ekonomia I i II stopnia ZL
Ekonometria II wykład 5 13
Budynki szkeletowe II Projektowanie ram
WM II projekt 1 skręcanie
Ekonomia II semestr
ROZDZIAŁ II Projektowanie sieci kątowo liniowej II klasy
AIR II projekt 1 WM
biznes i ekonomia mistrz sprzedazy wydanie ii rozszerzone arkadiusz bednarski ebook
J2ME Praktyczne projekty Wydanie II j2mep2
projekt II

więcej podobnych podstron