PROJEKT A – MODEL LINIOWY
z co najmniej trzema zmiennymi objaśniającymi
(4-7 potencjalnych zmiennych objaśniających + dobór zmiennych)
Nazwisko i imię studenta 1: Krzysztof Ochab
Kierunek i rok studiów studenta 1: Ekonomia
Numer grupy studenta 1: II
1. Zebrać z Roczników Statystycznych co najmniej 12 obserwacji na zmiennej objaśnianej i 4-7 potencjalnych zmiennych objaśniających (dane w postaci szeregów przekrojowych)
(2009-2010)
Dane przekrojowe ()
y –
x1 –
x2 –
x3 –
x4 –
Źródło: ()
a) wprowadzić dane statystyczne do programu EXCEL w następującym układzie:
(make screena)
Pozostałe elementy Courier New
b) zapisać dane w formacie csv na dysku (podać nazwę pliku Dane_przekrojowe_PKB.csv)
2. Zastosować przy doborze zmiennych statystyczne kryteria wyboru między modelami re-gresji (kryterium Theila maksymalnego skorygowanego współczynnika determinacji, kryteria bazujące na minimalizacji średniokwadratowego błędu predykcji Mallowsa, kryteria informacyj-ne: Akaike (AIC), Schwartza (BIC)). Wybrać na podstawie jednego z kryteriów zmienne obja-śniające do modelu1. Zastosować w programie R procedurę AIC_BIC_adjr2_Cp.r
Wynik z programu R;
[1] "Najlepsza kombinacja zmiennych wg AIC to: 1, 2, 3, 4 z wartością miary: 258,440306449048"
[1] "Najlepsza kombinacja zmiennych wg BIC to: 1, 2, 3, 4 z wartością miary: 262,303250060246"
[1] "Najlepsza kombinacja zmiennych wg adjr2 to: 1, 2, 3, 4, 5 z wartością miary: 0,996815506925318"
[1] "Najlepsza kombinacja zmiennych wg Cp to: 1, 2, 3, 4 z wartością miary: 5,30346700096197"
[1] "Dokładne wyniki w pliku wynik_AIC_BIC_adjr2_Cp.csv"
3. Wykorzystując w programie R procedurę
Reg_wieloraka_model_liniowy_hiperplaszczyzna_2010.r
a) oszacować metodą najmniejszych kwadratów parametry strukturalne modelu z wybranymi zmiennymi. Zapisać postać modelu z oszacowanymi parametrami podając w nawiasach pod ocenami estymatorów parametrów ich błędy. Podać interpretację parametrów strukturalnych oraz błędów estymatorów parametrów strukturalnych,
b) zinterpretować obliczone parametry struktury stochastycznej (standardowy błąd oceny, współ-czynnik determinacji, skorygowany współczynnik determinacji),
c) za pomocą testów t i F sprawdzić istotność współczynników regresji,
d) wyznaczyć i zinterpretować przedziały ufności dla parametrów strukturalnych,
e) wykorzystując test Shapiro-Wilka sprawdzić czy składnik losowy ma rozkład normalny,
f) sprawdzić za pomocą VIF czy w modelu nie występuje problem przybliżonej współliniowo-ści,
g) wykorzystując test Goldfelda-Quandta sprawdzić czy nie występuje niejednorodność warian-cji składników losowych
h) za pomocą testów Durbina-Watsona oraz Breuscha-Godfreya zbadać czy w modelu nie wy-stępuje autokorelacja pierwszego stopnia
i) sprawdzić czy w zbiorze danych występują obserwacje nietypowe
j) sprawdzić, które obserwacje są wpływowe, a które nie są wpływowe
ODPOWIEDZI Z WYKORZYSTANIEM obliczeń w programie R
a) oszacować metodą najmniejszych kwadratów parametry strukturalne modelu z wybra-nymi zmiennymi
Call:
lm(formula = y ~ x1 + x2 + x3 + x4, data = d, x = TRUE, y = TRUE)
Residuals:
Min 1Q Median 3Q Max
-4447,8 -1497,9 -5,7 1710,4 4731,8
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -150,92985 2008,93467 -0,075 0,941461
x1 3,98625 0,54714 7,286 1,57e-05 ***
x2 0,05511 0,01869 2,948 0,013256 *
x3 11,41188 6,99426 1,632 0,131034
x4 0,32510 0,06678 4,868 0,000496 ***
---
Signif. codes: 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ 0,1 ‘ ’ 1
Residual standard error: 2839 on 11 degrees of freedom
Multiple R-squared: 0.9976, Adjusted R-squared: 0.9967
F-statistic: 1143 on 4 and 11 DF, p-value: 2,529e-14
a) zapisać postać modelu z oszacowanymi parametrami podając w nawiasach pod ocenami estymatorów parametrów ich błędy
ˆ y