Dobór zmiennych objaśniających do modelu ekonometrycznego
Eliminacja zmiennych quasi-stałych
Metoda Hellwiga - oparta na zasadzie wyboru ze zbioru potencjalnych zmiennych objaśniających x1, x2, ..., xm takich zmiennych, które są:
silnie skorelowane ze zmienną objaśnianą y,
słabo skorelowane między sobą.
Macierz współczynników korelacji
|
y |
x1 |
x2 |
... |
xm |
y |
1 |
r1 |
r2 |
... |
rm |
x1 |
r1 |
1 |
r12 |
... |
r1m |
x2 |
r2 |
r21 |
1 |
... |
r2m |
... |
... |
... |
... |
1 |
... |
xm |
rm |
rm1 |
rm2 |
... |
1 |
Rozpatrujemy wszystkie kombinacje potencjalnych zmiennych objaśniających, która wynosi:
L=2m-1
1. Pojemność indywidualna nośnika informacji hlj
hlj∈<0,1>
l=1, 2, ..., L - numer kombinacji,
j=1, 2, ..., ml - numer zmiennej w kombinacji,
ml - liczba zmiennych w rozpatrywanej kombinacji.
2. Pojemność integralna nośników informacji
Hl∈<0,1>
Kryterium: max Hl
Metoda istotności korelacji
1. Wyznacza się krytyczną wartość współczynnika korelacji r* według:
gdzie: tα,s jest wartością statystyki odczytanej z tablic wartości krytycznych rozkładu t-Studenta dla poziomu istotności α oraz s=n-2
2. Do zbioru potencjalnych zmiennych objaśniających wchodzą wszystkie zmienne, dla których zachodzi:
|rj| > r*
3. Spośród wybranych zmiennych jako objaśniającą powołuje się zmienną Xh, dla której zachodzi:
|rh| = max{|rj|}
4. Do zbioru potencjalnych zmiennych objaśniających dołącza się wszystkie zmienne (spośród wybranych w punkcie 2), dla których zachodzi:
|rhj| < r*
Metody sekwencyjne
eliminacji - wychodzi się z modelu z wszystkimi potencjalnymi zmiennymi i stopniowo się je eliminuje,
selekcji - rozpoczyna się od modelu z jedną, odpowiednio dobraną zmienną, i dołącza się następne.
Przykład metody eliminacji - metoda regresji krokowej „wstecz”
Szacuje się model z wszystkimi potencjalnymi zmiennymi.
Dla każdej zmiennej określa się bezwzględną wartość empiryczną statystyki t-Studenta (t).
Minimalną wartość statystyki t-Studenta porównuje się z wartością krytyczną tα,s.
Jeżeli t < tα,s z modelu usuwamy odpowiadającą jej zmienną objaśniającą, ponownie szacujemy model i wracamy do punktu 2.
Jeżeli t > tα,s to za ostateczną wersję przyjmujemy model z rozważanym ostatnio zestawem zmiennych objaśniających.
Przykład metody selekcji - metoda regresji krokowej „wprzód”
Mając m potencjalnych zmiennych objaśniających szacujemy m modeli z jedna zmienną objaśniającą. Wybieramy taką zmienną, która ma co do wartości bezwzględnej maksymalna wartość statystyki t-Studenta (t). Jeżeli parametr β1 jest statystycznie istotny przechodzimy do kroku 2. W przeciwnym przypadku żadna z potencjalnych zmiennych objaśniających nie wyjaśnia kształtowania się zmiennej objaśnianej.
Budujemy m-1 modeli z dwiema zmiennymi objaśniającymi, z których jedną jest wybrana w kroku 1. Spośród dołączonych zmiennych wybieramy taką, która ma co do wartości bezwzględnej maksymalną wartość statystyki t-Studenta t. Z powstałego modelu usuwamy zmienne, którym odpowiadają nieistotne parametry.
Postępowanie kończy się, gdy do modelu nie można dołączyć żadnej z potencjalnych zmiennych objaśniających.
31