5. Przypadek dwóch zmiennych objaśniających1
Głównym celem omawiania zastosowania metody najmniejszych kwadratów do modelu z dwiema zmiennymi objaśniającymi jest pokazanie tzw. ,,efektu dołączenia zmiennej objaśniającej''. Co się zdarzyć może, kiedy badacz decyduje się na dołączenie dodatkowej zmiennej objaśniającej? Zakładamy (optymistycznie), że ma on pewną teorię ekonomiczną, która stanowi uzasadnienie jego wyboru. W istocie jednak, rozważania tego punktu dotyczą sytuacji dość ogólnej, tzn. dołączenia dowolnej zmiennej objaśniającej, wybranej albo na podstawie teorii ekonomicznej albo metodą ,,prób i błędów''.
Zapiszmy model teoretyczny w postaci:
. (5.1)
Zgodnie z przyjętymi zasadami, oceny parametrów strukturalnych oznaczymy jako: , , . Wartością teoretyczną zmiennej endogenicznej będzie:
(5.2)
natomiast resztą
. (5.3)
Funkcją kryterium MNK, jest zapisana poniżej suma kwadratów reszt:
. (5.4)
Ponownie pokazujemy, że jest to kwadratowa funkcja ocen parametrów strukturalnych:
(5.5)
Obliczając pochodne cząstkowe względem kolejnych ocen parametrów oraz przyrównując do zera otrzymujemy:
, (5.6)
, (5.7)
. (5.8)
Dokonując przekształceń oraz porządkując składniki sumy otrzymujemy układ trzech równań normalnych, umożliwiający, jeśli spełnione są warunki numeryczne modelu, wyznaczenie ocen trzech parametrów strukturalnych , , :
, (5.9)
, (5.10)
. (5.11)
Rozwiązując ten układ (np. metodą podstawiania) otrzymujemy ostateczne wyrażenia na oceny parametrów2:
(5.12)
(5.13)
(5.14)
gdzie , zdefiniowane poniżej jako
(5.15)
jest wyznacznikiem układu, natomiast :
, są estymowanymi kowariancjami pomiędzy zmienną endogeniczną oraz zmiennymi objaśniającymi , ,
jest kowariancją pomiędzy zmiennymi objaśniającymi , ,
, są estymowanymi wariancjami zmiennych objaśniających , .
Postarajmy się obecnie wyjaśnić na czym polega ,,efekt dołączenia nowej zmiennej''. Patrząc na oceny parametrów , stwierdzamy, że zależą one od kowariancji między zmiennymi objaśniającymi. Kowariancja jest miarą siły i kierunku skorelowania zmiennych. W szczególności jeżeli zmienne są nieskorelowane, to kowariancja między nimi jest równa zero3. Tak więc w sytuacji, gdy zmienne objaśniające są nieskorelowane tj., , wtedy funkcja redukuje się do:
(5.16)
i oceny parametrów strukturalnych dane są wzorami:
, (5.17)
, (5.18)
, (5.19)
gdzie, jak pamiętamy, jest oceną parametru w modelu , natomiast jest oceną parametru w modelu .
Widzimy obecnie w sposób wyraźny, analizując licznik wyrażenia na , że o wartości oceny parametru przy zmiennej objaśniającej decyduje nie tylko kowariancja tej zmiennej ze zmienną endogeniczną , ale również siła i kierunek skorelowania zmiennej ze zmienną (mierzone kowariancją ) oraz siła i kierunek powiązania pomiędzy zmienna endogeniczną a zmienną (mierzone oceną współczynnika w modelu ). Znak oceny w modelu dwuczynnikowym nie musi być zatem taki sam, jak znak kowariancji (współczynnika korelacji) pomiędzy zmienną a zmienną endogeniczną, jeśli tylko w modelu występuje inna zmienna objaśniająca tak silnie skorelowana ze zmienną oraz ze zmienną, że:
. (5.20)
Co więcej, zmienna może być silnie skorelowana ze zmienną , a mimo to ocena parametru przy tej zmiennej może być zerowa, jeśli . Możliwa jest również sytuacja, gdy zmienna nie jest skorelowana ze zmienną endogeniczną , natomiast ocena parametru przy tej zmiennej będzie niezerowa
(5.21)
i zależeć będzie tylko od skorelowania tej zmiennej ze zmienną oraz od powiązania zmiennej ze zmienną endogeniczną. Podobne uwagi dotyczą oceny .
Wniosek jaki można wysnuć w konkluzji przeprowadzonego rozumowania jest taki, że wprowadzenie dowolnej zmiennej objaśniającej do zbioru zmiennych objaśniających wpływa na oszacowania wszystkich pozostałych parametrów, jeśli tylko wprowadzona zmienna objaśniająca jest skorelowana z pozostałymi zmiennymi objaśniającymi. Korekta oszacowań może być znacząca, łącznie ze zmianą znaku oszacowania, po dodaniu nowej zmiennej objaśniającej. Zatem budowanie modelu ekonometrycznego bez teorii ekonomicznej, metodą prób i błędów nie jest procedurą właściwą. Badacz powinien ,,kontrolować’’ budowę modelu, włączając tylko takie zmienne, dla których znajduje uzasadnienie apriori. Słowem badacz po oszacowaniu parametrów modelu jest w stanie odpowiedzieć, czy otrzymane oceny mają sensowną interpretację (w sensie znaku i wielkości oceny)4.
Przykład 5.1
Zanalizujemy obecnie, jak zmieniły się oceny parametrów modelu kosztów całkowitych, po dołączeniu stopy inflacji do zbioru zmiennych objaśniających. Wykorzystując wzory zapisane wyżej wyznaczymy oceny parametrów modelu kosztów w zależności od wielkości produkcji oraz stopy inflacji :
.
Oszacowania otrzymano na podstawie tego samego zestawu obserwacji na podstawie którego oszacowano parametry modelu kosztów z jedną zmienną objaśniającą (zobacz tablica 3.1).
.
Tablica 5.1 Koszty zaobserwowane, teoretyczne oraz reszty dwuczynnikowego modelu kosztów
Miesiąc | t | Koszty zaobserwowane | Produkcja | Stopa Inflacji |
Koszty teoretyczne |
Reszty |
---|---|---|---|---|---|---|
1998M1 | 1 | 115020 | 139 | 3,1 | 116682,0 | -1661,60 |
1998M2 | 2 | 98037 | 69 | 1,7 | 95895,3 | 2141,67 |
1998M3 | 3 | 152520 | 140 | 0,6 | 122384,0 | 30136,00 |
1998M4 | 4 | 113479 | 201 | 0,7 | 142900,0 | -29421,20 |
1998M5 | 5 | 132301 | 141 | 0,4 | 123153,0 | 9148,15 |
1998M6 | 6 | 104041 | 143 | 0,4 | 123833,0 | -19791,50 |
1998M7 | 7 | 147050 | 282 | -0,4 | 172787,0 | -25737,30 |
1998M8 | 8 | 180057 | 258 | -0,6 | 165060,0 | 14997,00 |
1998M9 | 9 | 169410 | 308 | 0,6 | 179478,0 | -10068,30 |
1998M10 | 10 | 194690 | 296 | 0,6 | 175400,0 | 19289,80 |
1998M11 | 11 | 186430 | 256 | 0,5 | 162021,0 | 24409,20 |
1998M12 | 12 | 115310 | 160 | 0,8 | 128752,0 | -13441,90 |
Źródło: dane ze sprawozdawczości spółki ,,X’’
Pokażemy obecnie jak wyznaczono wartości teoretyczne kosztów dla dwóch przykładowych miesięcy (1998M1, tj. dla t=1 oraz 1998M8 tj. dla t=8) . Wartości te są obliczone na podstawie oszacowanego modelu kosztów:
;
.
Możemy zatem stwierdzić, że dla wielkości produkcji zaobserwowanej w miesiącu pierwszym , czyli sztuk oraz stopy inflacji , koszty teoretyczne wyniosą złotych. Taką wielkość kosztów całkowitych zaobserwowano by w miesiącu pierwszym, gdyby nie występowały zakłócenia losowe modelu. W miesiącu ósmym koszty teoretyczne, obliczone dla wielkości produkcji sztuk oraz stopy inflacji równej , wyniosły złotych. Koszty rzeczywiste w tych okresach są inne, niż wynika to z teorii. Reszty w tym okresie, będące oszacowaniem efektów działania czynników zakłócających, są obliczone jako różnice:
;
.
Źródło: opracowanie własne z wykorzystaniem programu GRETL
Źródło: opracowanie własne z wykorzystaniem programu GRETL
Rozważmy na koniec jednoczynnikowy model kosztów całkowitych, w którym jedynym czynnikiem objaśniającym jest stopa inflacji. Wykorzystując wzory metodę najmniejszych kwadratów wyznaczymy oceny parametrów modelu kosztów zapisanego w postaci:
.
Oszacowania, które otrzymano na podstawie danych z tablicy 3.1 są następujące:
.
Widzimy, że i w tym przypadku nastąpiły zmiany ocen parametrów oraz , w porównaniu do modelu dwuczynnikowego.
Tablica 5.2 Koszty zaobserwowane, teoretyczne oraz reszty jednoczynnikowego modelu kosztów
Miesiąc | t | Koszty zaobserwowane | Stopa Inflacji |
Koszty teoretyczne |
Reszty |
---|---|---|---|---|---|
1998M1 | 1 | 115020 | 139 | 3,1 | 101218 |
1998M2 | 2 | 98037 | 69 | 1,7 | 125219 |
1998M3 | 3 | 152520 | 140 | 0,6 | 144076 |
1998M4 | 4 | 113479 | 201 | 0,7 | 142362 |
1998M5 | 5 | 132301 | 141 | 0,4 | 147505 |
1998M6 | 6 | 104041 | 143 | 0,4 | 147505 |
1998M7 | 7 | 147050 | 282 | -0,4 | 161220 |
1998M8 | 8 | 180057 | 258 | -0,6 | 164649 |
1998M9 | 9 | 169410 | 308 | 0,6 | 144076 |
1998M10 | 10 | 194690 | 296 | 0,6 | 144076 |
1998M11 | 11 | 186430 | 256 | 0,5 | 145791 |
1998M12 | 12 | 115310 | 160 | 0,8 | 140648 |
Źródło: dane ze sprawozdawczości spółki ,,X”
W tablicy 5.3 zamieszczamy porównanie ocen parametrów modeli kosztów otrzymanych na podstawie modeli zawierających różne zestawy zmiennych objaśniających.
Tablica 5.3 Porównanie ocen parametrów otrzymanych na podstawie modelu stałej wartości
oczekiwanej oraz modeli jedną i dwiema zmiennymi objaśniającymi
Oceny parametrów strukturalnych | |
---|---|
Model | |
142362,1 | |
71792,2 | |
154363 | |
76092,4 |
Źródło: opracowanie własne
Różnice w oszacowaniach wyrazu wolnego wynikają z tego, że w każdym z modeli średnia wielkość kosztów jest korygowana o średnie efekty różnych zestawów czynników objaśniających.
Zrozumienie różnic w oszacowaniach parametrów przy zmiennych objaśniających, w nawiązaniu do wzorów, które wyprowadziliśmy na początku tego wykładu, wymaga zanalizowania parametrów rozkładów zmiennych modelu kosztów. W tablicy 5.4 zamieszczone są średnie arytmetyczne oraz odchylenia standardowe, natomiast w macierzy zamieszczono oceny współczynników korelacji pomiędzy parami zmiennych.
Tablica 5.4 Średnie i odchylenia standardowe
zmiennych modelu kosztów
Zmienna modelu | |
---|---|
Ocena parametru | |
Średnia arytmetyczna |
142362,1 |
Odchylenie standardowe |
34120,0 |
Źródło: opracowanie własne
Macierzą współczynników korelacji między zmiennymi modelu kosztów jest5 :
.
Zmiany oszacowania parametru są wynikiem skorelowania występującego między zmienną a dołączoną zmienną (w naszym przypadku jest to umiarkowane skorelowanie ujemne, równe ) oraz skorelowania zmiennej ze zmienną endogeniczną (również ujemnego, równego ). W efekcie korekta oszacowania parametru z tytułu dołączenia zmiennej jest ujemna, powodująca spadek oceny tego parametru z wielkości w modelu jednoczynnikowym, do w modelu dwuczynnikowym. Podobne wnioski można zdefiniować dla ocen parametru .
Źródło: opracowanie własne z wykorzystaniem programu GRETL
Źródło: opracowanie własne z wykorzystaniem programu GRETL
Materiał dydaktyczny do wykorzystania przez studentów uczestniczących w wykładzie z Ekonometrii, prowadzonym przez Tadeusza W. Bołta.↩
Przekształcenia, które trzeba wykonać, aby otrzymać wynik nie są trudne. Większość słusznie potraktowałaby je jako zbyt uciążliwe. Stąd pomijamy ich prezentację, zakładając, że dociekliwi wykonają je samodzielnie. Wszyscy natomiast mogą je znaleźć np. w książce G.S.Maddala, Introduction to Econometrics, str. 129-132.↩
Współczynnik korelacji pomiędzy dwoma zmiennymi , można zapisać w postaci: .↩
W przypadku modeli dynamicznych ważne jest dodatkowo by oceny parametrów miały sensowną interpretację krótko i długookresową.↩
Oceny kowariancji, które faktycznie występują we wzorach na oceny parametrów otrzymamy zgodnie z: .↩