(ró)=
□
R
7. Jaką interpretację maja współczynnikami regresji w modelu liniowym względem zmiennych objaśniających?
Model ekonometryczny (empiryczny) to tak model:
Yi=P1=P2x2j+P3x3j+... +Pkxki+Ei
Warunkową wartość oczekiwana zmiennej yi
E-wartość oczekiwana
E(yi/Xki)= p-i+p2x2i+---+Pkxki+E9Ei)=0
Pod warunkiem E(Ei)=0 pochodne wartości
oczekiwanej po zmiennej
j3k- mierzymy oczekiwaną zmienną yi jako efekt zmiany Xki o jednąjednostkę przy pozostałych zmiennych bez zmian.
8 Jaką interpretację mają współczynnikami regresji w modelu podwójnie logarytmicznym.
Jeżeli model: Iny-p2lnx2i+p3lnx3i+...pklnxki jeżeli x2i wzrośnie o 1 % to yi zmieni się (wzrośnie lub spadnie) o b2 (złotówki zmienne są na parametry mamy elastyczność); Parametry interpretowane sąjako elastyczności Przykładowa interpretacja: wraz ze spadkiem (wzrostem) zmiennej X o jednostkę zmienna Y zmaleje (wzrośnie) o b%.
13 Proszę wyprowadzić wzory na współczynnik determinacji i skorygowany współczynnik determinacji oraz podać ich interpretację.
— 1
Żeby zinterpretować R2 trzeba przemnożyć 100%. Zmienność yi została wyjaśniona przez zmienność zmiennych objaśniających w R2%. Ta dekompozycja jest prawdziwa jeśli w modelu występuje stała. Jeśli dodajemy do równania regresji kolejne zmienne objaśniające to R2 rośnie, nawet jeśli dodamy zmienną bezsensowną
14.Proszę omówić zasady wprowadzania do równania regresji resorów 0-1.
1 .Zdefiniować zmiennąjakościową np 'wykształcenie: podstawowe, średnie, zawodowe. Załóżmy, że poziom bazowy to wykształcenie podstawowe (poziomu bazowego nie wprowadzamy do równania).
2. Pozostałe poziomy rozkodowujemy na: średnie -1 - jeżeli maja wykszt.- średnie
- 0 - w pozostałych przypadkach (podstawowe, wyższe)
Wyższe-1-dla wykszt. Wyższego
-0-dla średnie, podstawowego
3. zmienne rozkodowane wprowadzamy do równania regresji yi=Pi+p2 średnie; +(33wyższe+p4*wiek+£i
Interpretacja:
(3-1 zawiera efekt poziomu bazowego(wyksztł. Podstawowe)
p2 średni dochód dla osób z wykształceniem średnim jest £ p2 jest jednostek niższy średni dochód dla wykształcenia bazowego (podstawowego) przy pozostałych zmiennych na tym samym poziomie p3 średni dochód dla osób z wykształceniem wyższym £ p3 niż średni dochód dla osób z wykształceniem bazowym (podstawowym)
11.Na czym polega statystyczna istotność zmiennej objaśniającej?
Istotność poszczególnych zmiennych sprawdza się stawiając hipotezy: H0:pk=0 Hi=(3k=0
Hipoteza zerowa mówi, że parametr pk objaśniającej Xki-0 czyli zmienna objaśniająca Xki jest zmienną nieistotną. Hipoteza 1 mówi, że parametr pk stojący przy zmiennej objaśniającej Xki jest różne od zera, jest zmienną istotną. Musimy obliczyć statystykę + — BK-fE.
testową t-studenta I——— —
bk - jest to estymator nieznanego parametru Pk
Pk - jest to nieznany parametr w modelu s.e(bk)-odchylenie standardowe estymatora Pk
Obliczają t studenta zakładamy prawidłowość hipotezy zerowej
j-— M&'-—$ SM
$«££&$% S-SfSM} czyli statystyka to iloraz oszacowania dla parametru pk który, jest Bk i odchylenie Bk. Następnie wyznaczymy statystykę krytyczną z
tablic t 1 — §?! — .kici- poziom istotności prawdopodobieństwa popełnienia błędu pierwszego rodzaju stopnia swobody n-k n- liczebność próbki
k - liczba zmiennych objaśniających + stała Podjęcie decyzji: jeżeli statystyka testowa wpada do przedziału to przyjmujemy hipotezę o czyli zmienna badana Xki jest zmienna nieistotną jeżeli statystyka wpada poza ten przedział to uznajemy Xki za istotną.
12. Proszę zinterpretować wzór dekompozycyjny
zmienności całkowitej y na zmienność wyjaśnioną i niewyjaśnioną (reszta)?
Współczynnik determinacji R2 dobrać dopasowania równania regresji do danych empirycznych wyrażona jest przez tzw współczynnik determinacji oznaczony przez R2=ESS/TSS = 1- RSS/TSS gdzie:
ESS zmienność wyjaśniona w modelu TSS całkowita zmienność w modelu (całkowita suma kwadratów)
RSS część niewyjaśniona w modelu. Współczynnik ten określa jaką część zmienności zmiennej objaśnionej y jest wyjaśniona łącznie przez zmienność wszystkich zm iennych objaśniających x2... xk zmienność całkowitą zmiennej objaśnianej y oznaczonąw literaturze angielskiej TSS, mierzymy ze pomocą sumy kwadratów odchyleń obserwacji zmiennej objaśnianej od średniej TSS=en(y1-y)2. Jeżeli model zawiera stałą p1 to całkowita sumą kwadratów możemy zdekomponować na dwa składniki:
1. na wyjaśnioną (równanie regresji) sumę kwadratów, oznaczoną przez ESS. ESS=I"(y-y)2
ESS wyjaśniona suma kwadratów która jest równa sumie kwadratów różnic pomiędzy wartością dopasowaną a średnia.
2. reszte niewyjaśnioną sumę kwadratów oznaczoną RSS
RSS= Ine2i ____
9. Proszę sformułować twierdzenie Gaussa-Markowa i je zinterpretować.
Twierdzenie Gaussa-Markowa: wektor b jest liniowym, nieobciążonym i najlepszym estymatorem wektora parametrów b oraz jest podstawowym twierdzeniem o własnościach estymatorów wyznaczonych za pomocąMNK. Twierdzenie brzmi: W klasycznym modelu regresji liniowej najlepszym liniowym i nieobciążonym estymatorem wektora parametrów b jest b wyznaczone za pomocą MNK.-
1) = (X X) X y o macierzy
wariancji-kowariancji-
1 .Estymator b jest estymatorem liniowym,
gdyż jest liniowa funkcja zmiennej losowej y.
2. b jest estymatorem nieobciążonym, to znaczy E(b).
3. Estymator b jest estymatorem najlepszym, co oznacza, że ma minimalna, macierz wariancji-kowariancji, wynosząca
_ikh ® '■ ' ■* Estymator
taki nazywamy estymatorem efektywnym.
10. Co to jest błąd standardowy estymatora? Proszę podać wzór dla przypadku regresji wielorakiej i go zinterpretować.
Standardowy błąd szacunku ( = standardowy błąd estymatora) parametru pi standardowy błąd bi równy jest jego odchyleniu standardowemu (czyli pierwiastkowi z jego wariancji). Standardowy błąd szacunku parametru pi mówi o ile jednostek wartość bi różni sie od nieznanej wielkości parametru pi.
15. Co to jest współliniowość? Jakie SA symptomy, metody wykrywania i jak można przezwyciężyć środki zaradcze?
Współliniowość jest to dokładna lub bardzo wysoka korelacja pomiędzy wartościami zmiennych objaśniających. Współliniowość dzielimy na:
a) dokładna -błąd badacza
b) niedokładna - wysoka korelacja między zmiennymi objaśniającymi - duża zależność.
1. symptomy współliniowości
IDuże odchylenie standardowe s.e(bi) - mała statystyka t-J^. znaczna część zmiennych
objaśniających będzie statystycznie nie istotna. F= wysokie r2 odrzucenie hipotezy zero
2. nie właściwe współczynniki, nie właściwe znaki
3. dodanie obserwacji zmienia statystycznie istotne oszacowanie współczynnika.
II metody wykrywania
yi=Pi+P2x2i+P3x3i+-+Pkxki+ei aby wykryć
niedokładności współliniowości w modelu k-1
w regresji yi=pi+p2x2i+p3x3i+• ••+Pkxkiei-R2
k-1 x2i=aO+a1x3i+a2x4i+Ei=R2
x3i=OO+(t>1x2i+02x4i+£i=R23
x4i=L(0+i-i1 x2i+ą2x3i+si=R24
R2k >R2 występuje xki, powoduje niedokładną
współliniowość
III. jak można przedsięwziąć środki zaradcze. Kroki wyrzucić zmienną która powoduje problem współliniowości. Krok2 możemy podnieść do kwadratu zmienną objaśniającą Krok3 szeregi czasowe Axt=XT-xt-1 Krok4 dodanie obserwacji do próby.
Współliniowość oznacza dokładna lub bardzo wysoka korelacje miedzy regresorami. Symptomy współliniowości Występowaniu współliniowości towarzysza następujące objawy:
1. Współczynniki maja bardzo duże biedy standardowe i w związku z tym znaczna liczba regresorów jest nieistotna, nawet wtedy, gdy łącznie są one istotne, a R2 jest wysokie.
2. Współczynniki regresji mogą mieć niewłaściwe znaki i niedopuszczalna wielkość.
3. Małe zmiany w zbiorze danych
statystycznych (na przykład dodanie jednej lub kilku nowych obserwacji) mogą prowadzić do znacznych zmian oszacowań współczynników regresji przy niektórych zmiennych. Analogiczne zjawiska obserwujemy, gdy w próbie jest mała liczba obserwacji i mała zmienność zmiennych objaśniających. Zaobserwowanie objawów występowania współliniowości skłania do sprawdzenia, czy rzeczywiście mamy do czynienia ze współliniowością._
16. Na czym polega uogólniona metoda najmniejszych kwadratów?
UMNK (uogólniona metoda najmniejszych kwadratów) założenia:
KMRL:
Var(Ei)=sig2 (E - homoskedastyczne)
Cov (Ei,Ei)=0 (brak autokorelacji)
Var (E)=sig2T
Mamy macierz jednostkową 52 0 0 52
E jest sfery styczne do niego dążymy jeżeli var —(Ei) równa się sig2 (E - homoskedastyczne) lub / i cov (Ei,Ei)=0 (brak autokorelacji) wtedy Var (E) =sigQ
b- estymator b nie jest estymatorem najlepszym. Jezli składnik losowy nie jest sfery styczny to wykorzystujemy uogólniona metodę najmniejszych kwadratów (UMNK).
Zakładamy jakąś postać braku sferyczności na podstawie próby szacujemy postać występującej w niej materię Omega (SUMNK) to jest stosowane w praktyce.
17. Proszę przedstawić test Durbina-Wadsona i go omówić.
Ho:cov (£t, £t-i)=0 (brak autokorelacji I rzędu) Hi:cov (£t, £t-i)^0 (występuję autokorelacja I rzędu)
Kroki szacujemy regresję i uzyskujemy reszty mi = reszty.
Współczynnik autokorelacji I rzędu
T=1,...T
Krok2 Statystyka testowa DW:
a) dostatecznie dużej DW=2*(1-ró)
b) jak mała DW=2*(1-ró)-....
Krok3 statystka krytyczna. Uzyskujemy ze ; specjalnych tablic DW: d1 -dolna wartość krytyczna . du- górna granica krytyczna . Krok4 Podjęcie decyzji 0—dl—u—2—4-du—4-dl-
| DW należy [o,2];[2,4] do którego należy obszar | statystyka testowa DW.
18. Co to jest standardowy błąd prognozy i przedział prognozy.
Standardowy błąd prognozy jest średni błędem o który różni się prognoza y=x’ Tb od pojedynczej relacji zmiennej prognozowej yT+s=X’T+s|3+£T+s Przedział prognozy jest przedziałem ufności dla pojedynczej relacji zmiennej prognozowanej yT+S, jest ...wyznaczony analogicznie do przedziału ufności dla pojedynczego parametru Bk P(yT+S-tn-k.
19. Jaki są skutki pominięcia w konaniu regresji istotnych zmiennych objaśniających?
yi=(3i+p2x2i+...+Pkxki+ei - model ograniczony yi=Pi+p2X2i+...+pkxki+Ei...+a1Z1i+a2Z2i+.amZITlj+Ei i model bez ograniczeń j 1 budując model ekonometryczny powinniśmy j do niego włączyć wszystkie zm ienne j objaśniające, które wpływają na badane zjawisko na podstawie teorii a następnie eliminować zmienne nieistotne 2.jeśli szacujemy równanie pierwsze a poprawny jest model drugi to występuje problem pominięcia zmiennych objaśniających. Skutki:
b- będzie estymatorem obciążonym
E(b)=0(x’x)'VZa
Wyjątki:
a=0 «a1=a2=...am=0 są nieistotne X’Z=0 estymator b jest nieobciążony
20. Jakie są efekty dodania do równania regresji nieistotnych zmiennych objaśniających? yi=p1+p2x2l+....+pkxki+Ei yi=Pi+p2X2i+....+pkXkj+Ei
szacujemy model drugi a w rzeczywistości
poprawny jest model pierwszy.
Efekt: b- estymatorem nieobciążonym nieefektywnym będzie miał dużą wariancję t= bi/se(bi) estymator nieefektywny, który ma dużą wariancję, problem z istotnością.
21. Proszę przedstawić test Wnite a i go omówić?
Ho:var (£j)=sigm2(£jest homoskodastyczne) Hbvar (£1)=sigma r (sjest hetroskodastyczne) Kroki Szacujemy regresję: yi= yi=Pi+P2x2i+p3x3i+-+ Pkxki+ei - reszty =ei i ei2 Krok2 przeprowadzamy regresje pomocniczą •2 2 2* ei +Qi +a2x2i+a3x3i+a4x2| +Q5x3i +a6X2rx3i+Ei statystyka testowa W=n*R2 n- liczebność próbki
statystyka krytyczna A2(k-1)- odrzucamy H0 H0=a2=a3=a4=...a6=0 (£ jest homoskodastyczne)
22. Jak testujemy hipotezę o nieistotności określonego podzbioru regresorów? Przedstawiamy dwa modele
1) model z ograniczeniami
yi=p1+p2x2i+...+Pkxki+Ei
2) model bez ograniczeń yi=
Pi+p2x2i+• • • +Pkxki+Ei- •aiZ1i+a2Z2i+... amZmi+E| np.: dochód =pi+p2wiek+p3płeć+ Ei dochód = Pi+P2wiek+P3pleć+ai staż + Ei
3) testujemy: czy określony podzbiór regresora jest: Ho;a1=a2...=am=0
H0= a,=0 a2=0
am=0
Hi: nie wszystkie ai...am są równe zero