Estymacja modelu jednorównaniowego z pomocą programu GRETL
GRETL jest darmowym programem przeznaczonym do estymacji opisowych modeli ekonometrycznych. Jego najnowszą wersję można pobrać z następującej strony:
http://gretl.sourceforge.net
Zakładamy, że program został pobrany i zainstalowany w systemie. Dlatego skupimy się na wczytywaniu danych, estymacji oraz prezentacji wyników.
1. Model dla danych przekrojowych
Na początek zajmiemy się estymacją bazującą na danych o charakterze przekrojowym. Wykorzystamy w tym celu udostępniony na stronie KBO przykładowy model nr 1, w którym badano wpływ wybranych czynników na cenę zmywarek.
GRETL oferuje kilka sposobów wprowadzania danych, od ręcznego wpisywania poszczególnych wartości po rozbudowane opcje importu. W praktyce często mamy do czynienia z sytuacją, w której dysponujemy danymi zapisanymi w formacie jednego z arkuszy kalkulacyjnych. Jest to wygodne ze względu na łatwość wykonywania obliczeń, przekształceń i różnych analiz. Właśnie arkusz kalkulacyjny stanie się w naszym przypadku punktem wyjścia.
Aby umożliwić import danych do GRETL-a należy się odpowiednio przygotować. Arkusz pliku, z którego planujemy skorzystać powinien zawierać jedynie dane przeznaczone do importu znajdujące się w kolejnych kolumnach (lub wierszach). Dobrym nawykiem jest podanie nazw szeregów w pierwszym wierszu. Rysunek 1 przedstawia fragment tak przygotowanych danych.
Rys. 1. Dane w arkuszu przygotowane do importu
C - cena zmywarki (zł)
Zw - zużycie wody w jednym cyklu (litry)
PU - pojemność użytkowa (liczba kompletów)
PH - Poziom hałasu (dB)
Nasze dane znalazły się w skoroszycie Excela. Kiedy arkusz jest gotowy z menu Plik programu GRETL wybieramy: Otwórz dane/Import/Excel… i wskazujemy położenie pliku z danymi. Po wybraniu pliku ujrzymy okno, w którym podajemy dokładną lokalizację zakresu danych. W tym celu wskazujemy nazwę arkusza (u nas Arkusz2) oraz początek zakresu wraz z nazwami szeregów (komórka A1), tak jak ilustruje to rysunek 2.
Rys. 2. Wskazanie arkusza i początku zakresu zawierającego dane
W następnej kolejności zostaniemy zapytani o sposób potraktowania importowanych danych (rysunek 3). Przypominamy, że nasz model bazuje na danych przekrojowych. Wybieramy więc Nie.
Rys. 3. Określenie rodzaju importowanych danych
Dane zostały wczytane do GRETL-a i pojawiły się w głównym oknie programu. Zapisanie ich do pliku z rozszerzeniem .gdt pozwoli korzystać z nich w przyszłości.
Jesteśmy gotowi do estymacji równania. Aby wybrać interesujące nas zmienne możemy kliknąć ikonę z symbolem „bety” na pasku szybkiego uruchamiania lub wybrać z menu: Model/Klasyczna metoda najmniejszych kwadratów… W wyświetlonym oknie (por. rys. 4) wskazujemy zmienną zależną (cena C) oraz zmienne niezależne (pozostałe zmienne oraz wyraz wolny oznaczony jako const). Oczywiście w charakterze objaśnienia nie musimy wybierać wszystkich zmiennych znajdujących się na liście. Przyciskiem OK zatwierdzamy wybór.
Po dokonaniu estymacji GRETL wyświetla okno z wynikami prezentowane na ilustracji 5. Parametry modelu znajdują się w kolumnie współczynniki, istotność oszacowań zaś w kolumnie t-Studenta, obok której podano wartości p dla tego testu. Poniżej znalazły się ogólne charakterystyki modelu m.in. współczynnik determinacji.
Rys. 4. Wybór zmiennych do modelu przekrojowego
Rys. 5. Okno z wynikami estymacji
Wykres wartości empirycznych i dopasowanych otrzymamy wybierając w oknie przedstawionym na rysunku 5 menu: Wykresy/wykres empirycznych i wyrównanych/względem obserwacji. Jeżeli wykres ten składa się z punktów a chcemy go otrzymać w wersji liniowej należy kliknąć prawym klawiszem myszy na obszarze wykresu i wybrać Edycja. Następnie w karcie Linie wybieramy typ/linie.
W tym miejscu warto wspomnieć o możliwości zapisywania wyników jako tzw. ikon sesji. Pozwalają one zachować wyniki estymacji lub wykres na wypadek przyszłego wykorzystania. Przydaje się to w sytuacji kiedy estymujemy kilka wariantów tego samego modelu i chcemy je porównać. Aby zapisać rezultaty estymacji z menu Plik na rysunku 5 wybieramy Zapisz jako ikonę sesji.
W głównym oknie programu wybieramy Widok/Ikony sesji (można też użyć odpowiedniej ikony na pasku szybkiego uruchamiania). Nasze wyniki na rysunku 6 znajdują się pod nazwą Model 1. Inne warianty można dodawać jako kolejne ikony, a następnie przeciągnąć wybrane z nich na ikonę Tabela model, która pozwala jednocześnie wyświetlić i porównać kilka różnych modeli pod warunkiem wszakże, iż wszystkie one mają tę samą zmienną zależną.
Rys. 6. Okno ikon sesji
Wyobraźmy sobie, że wykonaliśmy estymację drugiego modelu, który od tego zaprezentowanego na rysunku 5 różni się brakiem zmiennej PH. Zapisaliśmy ikonę sesji jako Model 2 a następnie w oknie ikon sesji przeciągamy po kolei każdą z ikon odpowiadających zapisanym modelom na Tabela model.
Rysunek 7 przedstawia porównanie obu wymienionych wcześniej modeli w oparciu o kilka podstawowych charakterystyk. Oprócz oszacowań parametrów znalazły się tam m.in. wartości statystyk testu t-Studenta oraz skorygowany współczynnik determinacji.
Jak widać z rysunku 6, podobne operacje da się wykonać także na wykresach. Tabela wykresów powstaje w analogiczny sposób tzn. zapisujemy ikony sesji i przeciągamy je na Tabela wykres. Jednak kliknięcie na tę ikonę spowoduje wygenerowanie pliku .pdf w związku z czym, aby go obejrzeć musimy posiadać zainstalowane odpowiednie oprogramowanie. Niekoniecznie musi to być produkt firmy Adobe.
Rys. 7. Tabela modeli prezentująca porównanie wyników dwóch wariantów estymacji
2. Model dla szeregów czasowych
Rozważymy teraz estymację modelu, w którym uzależniono wartość produkcji koksu i produktów rafinacji ropy naftowej (mld zł) od ilości ładunków przewiezionych transportem samochodowym (mln t) oraz importu ropy (mln t). Dane miesięczne obejmowały okres od października 2007 do lipca 2008.
W przypadku szeregów czasowych podczas importu danych podajemy więcej parametrów niż miało to miejsce dla danych przekrojowych. Na pytanie z rysunku 3 odpowiadamy Tak i przechodzimy do opcji związanych z ustalaniem zakresu danych. Zaznaczymy opcję Szeregi czasowe a następnie Miesięczne. Jako startową obserwację wprowadzamy 2007:10.
Po utworzeniu szeregów czasowych jesteśmy gotowi do estymowania równania, które wykonujemy w sposób analogiczny do opisanego poprzednio. W przypadku modelu czasowego możemy być jednak dodatkowo zainteresowani testowaniem zjawiska autokorelacji. W tym celu w oknie z wynikami estymacji wybieramy Testy/test Durbina-Watsona. Pojawi się wówczas okno z wartością statystyki DW wraz z poziomem prawdopodobieństwa p.
Załóżmy teraz, że nasz model ma zawierać opóźnioną o jeden okres zmienną wyrażającą wpływ ilości przewożonych ładunków. Jak zauważymy okno tworzenia modelu nieco różni się od tego zaprezentowanego na rysunku 4. Pojawiła się w nim opcja opóźnienia. Okno związane z tą opcją znajduje się na rysunku 8. Zmienna sam została na nim opóźniona o jeden okres. Naciśnięcie OK powoduje automatyczną zmianę specyfikacji modelu (patrz rys. 9).
Rys. 8. Ustalanie opóźnień dla zmiennych
Rys. 9. Wybór zmiennych do modelu czasowego
Dalsze postępowanie jest analogiczne do już opisanego.
Inną, często spotykaną transformacją jest logarytm zmiennej. Załóżmy, że chcemy estymować model nieliniowy, w którym wykorzystamy logarytmy zmiennych, które utworzymy korzystając z możliwości GRETL-a.
W tym celu najpierw zaznaczamy interesujące nas zmienne w głównym oknie programu. Następnie z menu wybieramy Dodawanie zmiennych/logarytmy dla wybranych zmiennych. Lista zmiennych rozszerzyła się o nowe pozycje co ilustruje rysunek 10.
Rys. 10. Dołączenie zmiennych zlogarytmowanych
Dysponujemy teraz sześcioma zmiennymi, które mogą wziąć udział w tworzeniu modelu.
Więcej informacji na temat korzystania z programu GRETL można z naleźć w książce Tadeusza Kufla pt Ekonometria. Rozwiązywanie problemów z wykorzystaniem programu GRETL, wydanej przez PWN
GRETL obsługuje wiele innych arkuszy kalkulacyjnych, w tym również używanych w systemie operacyjnym Linux.
1