Laboratoryjne zajęcie N2
Specyfikacja zmiennych, występujących w modelu ekonometrycznym
Zmienne objaśniające w modelu ekonometrycznym z formalnego punktu widzenia powinny się odznaczać następującymi własnościami:
mieć odpowiednio wysoką zmienność;
być silnie skorelowane ze zmienną objaśnianą;
być słabo skorelowane między sobą;
być silnie skorelowane z innymi zmiennymi nie pełniącymi roli zmiennych objaśniających, które zmienne objaśniające reprezentują.
Eliminowania zmiennych quasi-stałych
Niech [x1k, x2k, … xnk] będą realizacjami zmiennej Xk, k = 1, 2, …, K. Miarą poziomu zmienności zmiennej Xk jest współczynnik zmienności Vk, określony jako stosunek odchylenia standardowego Sk zmiennej Xk do jej średniej arytmetycznej mk, czyli:
, (1)
gdzie
(2)
jest średnią arytmetyczną zmiennej Xk;
(3)
jest odchyleniem standardowym zmiennej Xk.
Eliminowanie zmiennych quasi-stałych na podstawie wartości współczynnika zmienności Vk odbywa się w sposób następujący.
Oblicza się współczynniki zmienności Vk dla poszczególnych badanych zmiennych Xk, k=1,2,…,K według wzorów (1), (2), (3).
Obiera się krytyczna wartość Vk* współczynnika zmienności (np. Vk* = 0,05).
Zmienna o numerze k, dla której jest spełniona nierówność
Vk ≤ Vk* (4)
uznaje się za quasi-stałą i eliminuje się ze zbioru zmiennych kandydujących do roli objaśniających (k = 1, 2, …, K). Uważamy że zmienna te nie wnosi istotnych informacji o zmiennej objaśnianej.
Aby ocenić siłę liniowej zależności zmiennej objaśnianej Y i potencjalnych zmiennych objaśniających X1, X2, ..., XK, oraz siłę liniowej zależności między potencjalnymi zmiennymi objaśniającymi X1, X2, ..., XK, pomiędzy sobą, oblicza się współczynniki korelacji:
;
,
oraz
.
Współczynniki te są przedstawione w postaci wektora korelacji R0, oraz macierzy R.
Prosta metoda grafowa
Wyznaczyć krytyczną wartość r* współczynnika korelacji według wzoru:
. (5)
Przeprowadzić eliminowanie związków nieistotnych: Współczynniki korelacji rks macierzy R, dla których zachodzi relacja |rks| ≤ r*, uznajemy za nieistotne i zastępujemy ich w macierzy R zerami. Zmodyfikowaną w ten sposób macierz R oznaczamy jako R', a ją elementy jako r'ks.
Na podstawie macierzy R' budujemy graf, w którym wierzchołkami są potencjalne zmienne objaśniające X1, X2, … XK , a wiązadłami występują współczynniki korelacji r'ks ≠ 0.
Zmienne należące do różnych spójnych podgrafów traktujemy jako niezależne. Zostawiamy zmienne, reprezentowane przez punkty odosobnione.
Dla nie odosobnionych spójnych podgrafów określamy stopień g każdego węzła grafu, tj. liczbę wiązadeł, którymi jest on związany z innymi węzłami.
W każdym grafie spójnym wyróżniamy węzeł o maksymalnym stopniu g. Węzeł ten reprezentuje zmienną, która jest bezpośrednio związana z największą liczbą pozostałych zmiennych, będących węzłami tego samego spójnego podgrafu i w tym sensie gromadzi w sobie najwięcej informacji z pozostałych zmiennych.
Jeżeli w danym grafie spójnym jest kilka węzłów o takim samym maksymalnym stopniu g, to wybieramy spośród nich węzeł, charakteryzujący tą zmienną Xk, dla której współczynnik korelacji rk ze zmiennej objaśnianej Y jest maksymalny.
Ostatecznie jako zmienne objaśniające pozostawiamy zmienne, reprezentujące punkty izolowane oraz wyróżnione z grafów spójnych według kryterium maksymalnej wartości g, oraz kryterium maksymalnej wartości rk.