Przewodnik
Gnu Regresja Gretl Użytkownika, Econometrics i Czas serie
Allin Cottrell
Dział Ekonomii
Obudzi Las uniwersytet
Ryszard “Jack” Lucchetti
Dipartimento di Economia
Universit à Politecnica delie Marche
czerwca, 2008
Pozwolenia jest przyznanego, by skopiować, rozprowadza i / lub zmodyfikuj ten dokument pod okresami GNU Wolnego Pozwolenia Dokumentacji, Wersja 1.1 lub jakaś późniejsza wersja opublikowało przez Wolne Założenie Oprogramowania (zobaczyć < http://www.gnu.org/licenses/fdl.html >).
Zawartości
1 Wprowadzenie 1
Cechy za jednym spojrzeniem 1
1.2 Uznań 1
Instalujące programy 2
1 Bieżący program 4
2 Dostający się zaczął się 5
Pozwolony nas biec regresja 5
Oszacowania przetworzyć 7 głównych menu okna 8
2.4 Klawiatura skrótów 11 gretl pasek narzędzi 11
3 Tryby pracujących 13
Rozkaz scenariuszy 13
Oszczędnościowy scenariusz sprzeciwia się 15
3.3 gretl konsoli 15 Sesja pojęcie 16
4 Dane pliki 19
Ojczysty format 19
Inne struktury pliku danych 19
4.3 Dwójkowe bazy danych 19
Tworzące dane rejestrują od podstaw 20
Budującego zestawu danych 22
4.6 Brakujące wartości danych 26
4.7 Rozmiar maksymalny zbiorów danych 27
Danych rejestruje zbiory 27
5 Specjalne funkcje wewnątrz genr 30
Wprowadzenia 30
5.2 Długo biegnie niezgodność 30
5.3 Czas serie filtrów 30 specyfików danych
Panelu 32
ja
Zadowala
ii
Ponownie
pobierający
próbkę i ładowanie początkowe 34
Łączne gęstości i p wartości 34
5.7 Obsługiwania brakujące wartości 35
Aportujące wewnętrzne zmienne 36
Numeryczne postępowania 37
5.10 dyskretny Fourier przekształca 39
6 próbujący Łódź podwodna zestaw danych 43
Wprowadzenia 43
Ustawiającego próbka 43
Ograniczającemu próbce 44
6.4 Przypadkowemu próbującemu 45
6.5 rzeczy menu Próbki 45
7 Wykresów i wątki 46
7.1 Gnuplot wykresów 46
8 Dyskretne zmienne 49
Deklarujące zmienne 49
8.2 jak dyskretnych Rozkazów dla dyskretnych zmiennych 50
9 Pętla constructs warianty Sterowanie
pętlą sterowania pętlą 54
Wprowadzenia 54 54
Stopniowy tryb 57
9.4 Pętla przykładów 57
10 zdefiniowało na Użytkowniku funkcje 62
Definiujący funkcja 62
Wołający funkcja 63
Usuwający funkcję 64
10.4 szczegółów programowania Funkcji 64
Funkcja paczek 69
11 Nazwało listy i sznury 74
Nazywane listy 74
Nazywane sznury 77
12 Macierz manipulacji 81
Tworzące macierze 81
12.2 Puste macierze 82
12.1 Zawartości
iii
Selekcja łodzi podwodnej macierzy 82
Macierz operatorów 84
12.5 Macierz skalar operatorów 85
Macierz funkcji 85
Macierz accessors 91
12.8 Namespace zagadnień 92
12.9 Tworzących serie danych od macierzy 93
12.10Matrices i listy 93
12.11Deleting macierz 94
12.12Printing macierz 94
12.13Example: macierze używania OLS 95
13 Oszukuje arkusz 96
Zestawu
danych sprawującego się 96
Tworzenie / modyfikujące zmienne 97
II Ekonometryczne metody 100
14 Krzepkie oszacowanie macierzy kowariancji 101
Wprowadzenia 101
14.2 Rozgniewany przekrojowe dane i HCCME 102 danych serii
Razu i macierze kowariancji HAC 103
Specjalne zagadnienia z danymi panelu 107
15 Panel danych 109
Oszacowania modeli panelu 109
15.2 modeli panelu Dynamie 113
Panel ilustracji: Stół Świata Penn 115
16 Nieliniowy najmniejszy sąuares 117
Wprowadzenia i przykłady 117
Inicjujące parametry 117
16.3 okna dialogu NLS 118
Analityczne i numeryczne pochodne 118
Kierowanie końca 119
16.6 Szczegółów dalej kod 119
16.7 Numeryczny aceuracy 119
17 oszacowania prawdopodobieństwa Maksimum 122
17.1 ML Ogólnego oszacowania z gretl 122
Zawartości iv
Gamma oszacowania 124
Stochastycznego granicznego było kosztowanego funkcją 125
17.4 GARCH modeli 126
Analityczne pochodne 128
Zdebagować ML scenariuszy 129
17.7 Używające funkcje 130
18 GMM oszacowania 134
Wprowadzenia i terminologia 134
OLS jako GMM 135
TSLS jako GMM 137
18.4 opcji macierzy Kowariancji 137
18.5 prawdziwy przykład: Konsumpcja Bazowała Model Cennika Zalety 139
19 kryteriów wyboru Modelu 143
Wprowadzenia 143
19.2 Informacje kryteriów 143
20 modeli serii Razu 145
Wprowadzenia 145
ARIMA modeli 145 testów korzenia
Części 150
20.4 FIGLARNYCH i GARCH 152
21 Cointegration i Modele Skorygowania Błędu Wektora 156
Wprowadzenia 156 Modeli Skorygowania Błędu
Wektora jako reprezentacja cointegrated systemu 157
Interpretacji deterministic komponentów 158
21.4 Johansen cointegration przeprowadza badania 160
21.5 Identyfikacji cointegration wektory 161
Tu identyfikujące restrykcje 163
Numerycznych metod rozwiązania 169
22 Dyskretnych i zostawany cenzurowany zależne zmienne 172
Logit i probit modele 172
22.2 Tobit model 176
23 Quantile regresji 179
Wprowadzenia 179
basic składni 179
23.1 Zawartości
v Przedziałów
ufności 180
Wielokrotny ąuantiles 180
23.5 Duże zestawy danych 181
III Techniczne szczegóły 183
24 Gretl i TjX 184
Wprowadzenia 184
24.2 związane TpX rzeczy menu 184
Świetnie nastawiające są złożone produkcja 186
Charakter encodings 188
24.5 Instalujący i uczącego się TpX 189
25 Gretl i R 190
Wprowadzenia 190
Zaczynający
się interakcyjna R sesja 190
Bieżący R scenariusz 193
25.4 Biorącej rzeczy tylnej i naprzód 193
25.5 Współdziałania z R od CLI 197
26 Diagnozowanie gretl 200
Bug sprawozdania 200
Pomocnicze programy 200
27 złącze wiersza zlecenia 201
Gretl w konsoli 201
27.2 CLI składni 201
IV Aneksów 202 szczegóły pliku Danych 203 formatu krajowca basica
A.l 203
A.2 Tradycyjny ESL format 203
A.3 Dwójkowe szczegóły bazy danych 204
B Danych importuje przez ODBC 206
B.l ODBC oprze pojęcia 206
C Budynek gretl 212
Zawartości vi
Cl Reąuirements 212
C.2 Buduje instrukcje: step-by-step przewodnik 212
D Numeryczna dokładność 216
E Związane wolne oprogramowanie 217
F Wykazu URLs 218
Bibliografii 219
Rozdziału 1
Wprowadzenie
1.1 za jednym spojrzeniem
Gretl jest econometrics paczką, w tym podzielona biblioteka, program klienta rozkaz linii i graficzny interfejs użytkownika.
User-friendly Gretl oferuje intuicyjny interfejs użytkownika; to jest bardzo łatwo, by wstać i biegnie z ekonometryczną analizą. Dzięki jego stowarzyszeniu z econometrics podręcznikami przez Ramu Ramanathan, Jeffrey Wooldridge i James Towar i Mark Watson, który paczka oferuje wielu plikom danych praktyki i scenariuszom rozkazu. Ci dobrze są zrobieni adnotacjami i dostępny. Dwa inne przydatne zasoby dla gretl użytkownicy są dostępną dokumentacją i gretl użytkownikami < http://gretl.sourceforge.net/lists.html > lista adresowa.
Elastyczny Możesz wybrać twój preferowany punkt na spektrum od interakcyjny wskaż i kliknij dzielić na partie przetwarzanie i może łatwo łączyć te podejścia.
“Dom” platforma Rozgniewana platforma Gretl's jest Linuks ale to jest również dostępne dla PANI Windowsa i X KOŚĆ Płaszcza nieprzemakalnego i powinno pracować nad jakimś Unix podobnym systemem, który ma odpowiednie podstawowe biblioteki (zobacz Aneks C).
Otwarte źródło pełny kod źródłowy dla gretl jest dostępne dla kogoś, kto chce do krytyki to, załatać to lub rozciągnąć to. Zobacz Aneks C.
Wyszukany Gretl oferuje pełny zasięg najmniejszych kwadratów opartych kosztorysantów, też dla pojedynczych wyrównania i dla systemów, zawierając autoagresje wektora i modele skorygowania błędu wektora. Sev-eral kosztorysanci prawdopodobieństwa określonego maksimum (np. probit, ARIMA, GARCH) również jest dostarczone tubylczo; bardziej wysunięte do przodem metody oszacowania mogą zostać wprowadzone przez użytkownika przez ogólne prawdopodobieństwo maksimum lub nieliniowy GMM.
Rozszerzalni Użytkownicy mogą ulepszyć gretl przez pisanie ich własnych funkcji i postępowań w scenariusz ing języku gretl's, który zawiera rozsądnie szeroki zasięg funkcji macierzy.
Dokładny Gretl gruntownie został testowany na kilku testach sprawnością, między których NIST ence zestawy danych. Zobacz Aneks D.
Internet gotowy Gretl może wejść i zaaportować bazy danych od serwującego w Obudzić Uniwersytet Lasu. PANI Windows version przychodzi z updater programem, który będzie dostrzegać, kiedy jest nowa wersja dostępna i oferuje opcję samochodowego uaktualniania.
Międzynarodowy Gretl doprowadzi do jego produkcji po angielsku, Francuza, Włocha, Hiszpana, Polaka, Portugalczyka, Niemca lub Baska, zależąc od ustawienia języka rodzimego twojego komputera.
1.2 Uznań, które baza kodu gretl pierwotnie wywiodła się z program ESL (“Biblioteki Oprogramowania Econometrics”), napisany przez Profesora Ramu Ramanathan Uniwersytetu Kalifornii, San Santiaga. Jesteśmy dużo w długu do Profesora Ramanathan dla robienia ten kod dostępny pod GNU Ogólnym Publicznym Pozwoleniem i dla pomagania prowadzić wczesny rozwój gretl's.
Dzielę
na
rozdziały 1.. Wprowadzenie
2 Jesteśmy autorom kilku econometrics podręczników również wdzięczni dla pozwolenia do paczki dla gretl, który różne zestawy danych związane z ich tekstami. Ta lista aktualnie zawiera Williama Greene, au thor Ekonometrycznej Analizy; Jeffrey Wooldridge (Wstępny Econometrics: Nowoczesne Podejście); James Towar i Mark Watson { Wprowadzenie do Econometrics); Damodar Gujarati (basic Econometrics); Russell Davidson i James MacKinnon (Ekonometryczna Teoria i Metody); i Marno Ver-beek (Przewodnik do Nowoczesnego Econometrics).
GARCH oszacowanie wewnątrz gretl jest oparty dalej kod deponował wewnątrz archowum Dziennika z Odniósł się Econometrics około Profesorowie Fiorentini, Calzolari i Panattoni i kod wygenerować p wartości, ponieważ Osioł Pełniejsze testy jest z powodu Jamesa MacKinnon. Wewnątrz każdy przypadek jesteśmy wdzięczny do autorów dla pozwolenia na użycie ich praca.
W odniesieniu do internacjonalizacja gretl, dzięki jadą do Ignacio Díaz-Emparanza (Hiszpan), Michał Robitaille i Florent Bresson (Francuz) , Cristian Rigamonti (Włoch), Tadeusz Kufel i Paweł Kufel (Polak), Markus Hahn i Sven Schreiber (Niemiec), Hélio Guilherme (Portugalczyk) i Susan Orbe (Basąue).
Gretl odnosił korzyść znacznie od pracy licznych producentów wolnego, otwartego źródła oprogramowanie: ponieważ specyfiki proszę widzą, Appendix C. Our dzięki są z powodu Ryszarda Stailman Wolnego Oprogramowania Założenie, dla jego poparcie wolnego oprogramowania ogólnie i, ponieważ zgadzając się do “zaadoptuj” gretl jako GNU program wewnątrz szczególny.
Wielu użytkowników gretl przedłożyło przydatne sugestie i sprawozdania błędu. Wewnątrz to związek particular dzięki są z powodu Ignacio Díaz-Emparanza, Tadeusz Kufel, Paweł Kufel, Alan Isaac, Cri Rigamonti, Sven Schreiber, Talha Jałta, Andree Rosenblad i Sztylet Eddelbuettel, utrzymuje gretl paczka dla Debian GNU / Linuks.
1.3 Instalując programy Iinux
Dalej Linux1 platforma masz wybór zestawiania sam gretl kod lub robienie użycie wstępnie budowanej paczki. Budynek gretl z źródła isnecessaryif youwant wejść rozwój wersja lub przystosuj gretl do twojego potrzebuje, ale to bierze ąuite kilka skills; najwięcej, który użytkownicy będą chcieć pójść po wstępnie budowaną paczkę.
Trochę propozycja standardu cecha dystrybucji Linuks gretl jako część ich: Debian, na przykład lub Ubuntu (we wrzechświecie skład). Jeżeli to przedstawia się tak, zupełnie musisz zrobić jest instalować gretl twój paczka kierownik wyboru (np. synaptyczny). Przygotujesz-do-bieg paczki są dostępny w rpm format (odpowiedni dla Czerwonego Kapelusza Linuks i odpowiedziany systemy) dalej gretl strona internetowa < http://gretl.sourceforge.net >.
Jakkolwiek, jesteśmy pełen nadziei tak trochę użytkownicy z kodowaniem umiejętności mogą rozważyć gretl wystarczająco zainteresowanie ing, by być warte poprawianie i rozciąganiem. dokumentacja libgretl API w żaden sposób kompletny, ale możesz znaleźć trochę szczegóły około następujące związek “Libgretl API docs” dalej gretl domowa strona. Ludzie zainteresowali wewnątrz gretl rozwój są mile widzianym, by zaprenumerować do gretl-devel < http://gretl.sourceforge.net/lists.html > lista adresowa.
Jeżeli wolisz, by zestawić twojemu własnemu (lub używa Unix system, dla który wstępnie budowany paczkom są nie dostępny), instrukcje dalej budujące gretl można znaleźć wewnątrz Aneks C.
PANI Windows PANI Windows version przychodzi jako jednobarwne wyciąganie wykonywalne. Instalacja jest tylko sprawa pobierania gretl_instal 1 .wykonywalny i bieżący to program. Będziesz podpowiedziany, ponieważ miejsce, by zainstalować paczkę. system obsługiwania
ifn to ręczny używamy “Linuks” jak shorthand, by odnosić / Linuks. Co jest powiedziane w nim, około że Linuks głównie odnosi się do innego Unix typ systemy także, chociaż trochę miejscowe modyfikacje mogą zostać potrzebowane.
Rozdział 1. Wprowadzenie
3
Uaktualnianie,
Jeżeli twój komputer jest łączony do Internetu, wtedy dalej początkowego gretl może zapytać jego do domu strona internetowa w Obudzić się Uniwersytet Lasu, by zobaczyć, jeżeli trochę uaktualnienie programu są dostępny; jeżeli tak, okno otworzy się w górę informowanie ty tego fakt. Jeżeli chcesz przyśpieszać to cecha, sprawdzić, że pudło splamiło się “Powiedzieć mi o gretl uaktualnieniu” poniżej gretl's “Narzędzia, Preferencje, Ogólne” menu. PANI Windows version programu idzie krok dalszy: to mówi ty tak możesz uaktualnić gretl automatycznie, jeśli chcesz. Aby zrobić temu, nastąpić instrukcje w wyskakującym menu okno: zamknąć się gretl wtedy bieg program tytułował “gretl updater” (powinieneś znaleźć to wraz z głównym gretl program podobnie, poniżej Programy nagłówek wewnątrz Windows Początek menu). Gdy tylko updater uzupełnił jego praca możesz wznowić gretl.
Rozdzielić ja
Biegnięcie program
4
Rozdział 2
Dostający
się zaczął się
2.1 Pozwala nam biegną regresja
To wprowadzenie głównie jest nagięte do graficznego klienta program; proszę zobaczyć Rozdział 27 poniżej i Odniesienie Rozkazu Gretl dla szczegółów dalej rozkaz linia program, gretlcli. Możesz dostarczyć imię danych rejestrują do otwartego jako dyskusja do gretl, ale na pozwolił nam nie robić tak razie: tylko ogień w górę program.1 Powinieneś zobaczyć główne okno (które będzie trzymać się informacje o dane ustawiły ale, które jest w pierwszym luka) i różne menu, trochę ich niepełnosprawnych najpierw. w tym momencie może robić? Możesz przeglądnąć dostarczone dane pliki (lub bazy danych), otwarty dane plik, utwórz nowy plik danych, przeczytaj rzeczy pomocy lub otwórz scenariusz rozkazu. Ponieważ teraz pozwól przeglądać dostarczone pliki danych. Pod Plik menu wybierają “Otwarte dane, Próbka plik”. Drugie okno notatnik typu otworzy się, przedstawiając zbiory danych, które pliki dostarczyły z paczką (widzą Cyfrę 2.1). Wybierz pierwszy tabulator, “Ramanathan”. Numerowanie plików w tej sekcji odpowiada organizacji rozdziału Ramanathan (2002), które zawiera dyskusję analizy tych danych. Dane będą przydatne dla praktyka zamierza nawet bez tekstu.
Cyfra 2.1: okno plików danych Praktyki,
Jeżeli wybierasz rząd w tym oknie i klikasz na “Informację” to otwiera okno pokazujące informację o umieszczonym dane w ąuestion (na przykład, na źródłach i definicjach zmiennych). Jeżeli znajdujesz plik, który jest, zainteresowania, możesz otworzyć to przez klikanie dalej “Otwierają się”lub tylko podwójnie klikający na imieniu pliku. Na razie otwórzmy się data3-6.
«• Wewnątrz gretl okna zawierające listy, podwójnie klikający dalej linia rozpoczyna domyślne działanie dla zrzeszonego wejścia listy: np. pokazując wartości serii danych, otwierając plik.
^ lub coiwenience, który będę odnosić po prostu jako gretl w tej instrukcji. Zauważ, jakkolwiek, że określone imię programu różni się zgodnie z platformą komputera. Na Iinux to nazywa się gretl_xll kiedy na PANI Windows it jest gretlw32.exe. Na Linuks systemach scenariusz banderoli nazywany gretl również jest zainstalowany - zobaczyć również Odniesienie Rozkazu Gretl.
5
Chapter2. Cetting zaczął
6
Ten plik zawiera dane dotyczące do klasycznego ekonometrycznego “kasztanu”, funkcji konsumpcji. Okno danych powinno teraz pokazać imię aktualnego pliku danych, ogólnego zasięgu danych i spróbować zasięg i imiona zmiennych wraz z krótkimi opisowymi etykietkami - zobaczyć Cyfra 2.2.
Cyfra 2.2: Główne okno, z plikiem danych praktyki otwartym
ok, co możemy zrobić teraz? Jak dobrze pójdzie różne opcje menu powinny być dość samo objaśniający. Dla teraz zanurzymy w Model menu; krótki tournee wszystkich głównych menu okna być oddany Sekcję 2.3 poniżej.
Model menu gretl's oferuje liczne różne ekonometryczne procedury oszacowania. Najprostszy i najwięcej standardu jest Zwykłe Najmniejsze Kwadraty (OLS). Wybieranie OLS rozrywa okienko dialogowe wołające dla specyfikacji modelu - zobaczyć Cyfra 2.3.
Cyfra 2.3: Model specyfikacja rozmawiaj,
By wybrać zależną zmienną, podświetlić zmienną, którą chcesz w liście na lewo i kliknąć “Woleć” guzik, który wskazuje do Zależnej zmiennej szczeliny. Jeżeli sprawdzasz “Ustawione jako zaniedbanie” pudło, które ta zmienna wstępnie wybrana jako zależny kiedy potem otwierasz okienko dialogowe modelu. Skrót: podwójnie klikający na zmiennej na lewo wybiera to, które jak zależny jak również ustawia temu jako zaniedbanie. Aby wybrać niezależne zmienne, podświetlić ich na lewo i kliknąć “Dodać” guzik (lub kliknąć
Chapter2. Cetting zaczął
7
właściwego guzika myszy ponad podświetloną zmienną). Wybierają kilka zmiennej w polu listy, ciągnąć mysz ponad nimi; aby wybrać kilka nieciągłych zmiennych, przymocować Ctrl klucz i kliknąć na zmienne ciebie chcą. Przebiegają regresję z konsumpcją jako zależna zmienna i dochód jako niezależny, klik Ct do Zależnej szczeliny i dodają Yt do Niezależnej listy zmiennych.
2.2 Oszacowanie produkcji,
Gdy tylko wyszczególniłeś model, okno pokazujące produkcję regresji wydają się. Produkcja jest rozsądnie wszechstronna i w format standardu (Cyfrze 2.4).
Cyfra 2.4: okno produkcji Modelu okno produkcji zawiera menu, które pozwalają ci, aby zbadać lub powielić reszty i dopasowane wartości i przebiegnąć różne diagnostyczne testy na modelu.
Dla większości modeli jest również opcja, by drukować produkcję regresji w KTpX formacie. Zobacz Spierzchnięcie ter 24 dla szczegółów.
Aby importować gretl przetworzył do procesora słowa, możesz kopiować i wkleić od okna produkcji, używając jego Artykuł menu (lub Kopia guzik, w jakichś kontekstach) do programu wynikowego. Wielu (nie wszystko) gretl okna oferują opcję kopiowania w RTF (Microsoffs “Bogatym Formacie Tekstu”) lub jako ETgK. Jeżeli kleisz do procesora słowa, RTF może być dobrą opcją, ponieważ tabelaryczne formatowanie produkcji jest preserved.2 Alternatywnie, możesz uratować produkcję do (czystego tekstu) rejestrować wtedy importować plik do programu wynikowego. Kiedy kończysz gretl sesję, dano tobie opcję ratowania cały produkcji od sesji do pojedynczego pliku.
Zauważ, że na pulpicie gnoma i pod PANIĄ Windowsem, Plik menu zawiera rozkaz, by wysłać produkcję bezpośrednio do drukarza.
»s" klejenie lub importowanie czysty tekst gretl przetworzył do procesora słowa, wybranego monospaced lub maszyna do pisania -tytułował czcionka (np. Kurier) zachować produkcję, jest tabelaryczne formatując. Wybierz smali czcionkę (10-punktu Kurier powinien zrobić) by zapobiec linie produkcji od bycia rozbity w złym miejscu.
2Note że kiedy skopiujesz jako RTF pod PANIĄ Windowsem, Windows tylko pozwoli ci, by skleić materiał do appli kationów, które “rozumieją” RTF. W ten sposób będziesz w stanie skleić do PANI Worda, ale nie do notatnika. Zauważ również tak tam wydaje się być błędem w trochę wersje Windows, zgodnie, z którym skleić nie będą pracować właściwie, chyba że “cel” podanie (np. PANI Word) już biegnie przed kopiowaniem materiału w ąuestion.
Chapter2. Cetting zaczął
8
2.3 główne menu okna
Czytając na lewo do właściwego wzdłuż baru menu głównego okna, znajdujemy Plik, Narzędzia, Dane, Widok, Dodają, Próbują, Zmienna, Model i Pomóc menu.
• Plik menu
Otwarte dane: Otwórz ojczysty plik danych gretl lub importuj od innych formatów. Zobacz Rozdział 4..
Dodaj dane: Dodaj dane do aktualnego roboczego zbioru danych, od pliku danych gretl, rozdzielonego przez przecinek pliku wartości lub pliku arkusza kalkulacyjnego.
Uratuj dane: Uratuj aktualnie otwarty ojczysty plik danych gretl.
Uratuj dane jako: Wypisz aktualny umieszczony dane w ojczystym formacie, z opcją używania gzip kompresji danych. Zobacz Rozdział 4..
Eksport dane: Wypisz aktualny umieszczony dane w Przecinku Oddzielnym Wartości (CSV) formatują lub formaty GNU R lub Oktawy GNU. Zobacz Rozdział 4 jak również Aneks E.
Wyślij do: Wyślij aktualnym danym ustawił jako e-mail załącznik.
Nowy zbiór danych: Pozwala ci, by utworzyć czysty zbiór danych, przygotowany do pisania w wartościach lub dla importowania serie z bazy danych. Patrzcie poniżej dla więcej na bazach danych.
Czysty zbiór danych: Oczyść aktualne dane wyruszył poza wspomnieniem. Ogólnie nie musisz zrobić tego (od otwieranie nowego pliku danych automatycznie oczyszcza stary jeden) ale czasami to jest przydatne.
Scenariusz pliki: “scenariusz” jest plikiem zawierającym seąuence gretl rozkazów. Ta rzecz zawiera wejścia, które pozwoliły ci otwierać scenariuszowi ciebie utworzyć poprzednio, (“Użytkownik plik”), otworzyć scenariusz próbki lub otworzyć okno edytora, w którym możesz utworzyć nowy scenariusz.
Sesja pliki: “sesja” rejestrują zawiera migawkę poprzedniej gretl sesji, zawieranie zbioru danych użyło i jakieś modele lub wykresy, które uratowałeś. Pod tę rzeczą możesz otworzyć uratowaną sesję lub uratować aktualną sesję.
Bazy danych: Pozwala ci, by przeglądnąć różne duże bazy danych, albo na twoim własnym komputerze lub, jeżeli jesteś łączony do internetu, na gretl serwerze bazy danych. Zobacz Sekcję 4.3 dla szczegółów.
Funkcja pliki: Radzi “paczki funkcji” (widzą Sekcję 10.5), które pozwala ci, by wejść funkcje napisane przez innych użytkowników i dzielić tych napisanych przez ciebie.
Wyjście: Opuść program. Będziesz podpowiedziany, by uratować jakąś unratowała pracę.
• Narzędzia menu
Statystyczne stoły: Spojrzenie w górę krytyczne wartości, ponieważ zwykle użył dystrybucji (normalny lub Gaussian, f, chi kwadrat, F i Durbin-Watson).
Poszukiwacz P wartości: Znajdź p wartości od Gaussian, f, chi kwadratu, F, gamma, binominalny lub Poisson dystrybucji. Zobacz również pvalue rozkazem w Odniesieniu Rozkazu Gretl.
Dystrybucja powiela: Doprowadzić do wykresów różnych dystrybucji prawdopodobieństwa. W wynikającym oknie wykresu, menu podręczne zawiera rzecz “Dodają inną krzywą”, które umożliwia ci nałożenie dalej spiskować (na przykład, możesz narysować t dystrybucję z różnymi innymi stopniami wolności).
Test statystyczny kalkulator: Obliczają dane testu i p wartości dla zasięgu z wspólnym hy-pothesis testy (populacja znaczą, niezgodność i proporcja; różnica środków, niezgodności i proporcje).
Nonparametric przeprowadza badania: Obliczają dane testu dla różnych nonparametric testów (Znak test, test sumy szeregu Wilcoxon, Wilcoxon podpisał test szeregu, Przebiega test).
- Chapter2. Cetting zaczął
9
Nasienia dla przypadkowy numeruje: Ustawić nasienie dla generatora liczb losowych (domyślnie to jest ustawiony oparty na czasie systemu kiedy jest program zaczęty).
Rozkaz kloc: Otwórz okno zawierające zapis rozkazów wykonanych dotychczas.
Cretl pociesza: Otworzyć się “pocieszyć” okno, do którego możesz napisać rozkazy jako ty używający program rozkaz linii, gretlcli, (w przeciwieństwie do używania wskaże i kliknie).
Gnu początku R: Zacznij R (jeżeli to jest zainstalowane na twoim systemie)i władować kopię danych ustawić aktualnie otwarty w gretl. Zobacz Aneks E.
Rodzaj zmienne: Przestaw wykaz zmiennych w głównym oknie, albo przez ID numerują lub alfabetycznie z nazwiska.
Orszak testu NIST: Sprawdź, że numeryczna dokładność gretl przeciw odniesieniu wynika dla linearna regresja zrobiła dostępny około (USA) Narodowy Instytut Standardów i Technol-ogy.
Preferencje: Ustaw ścieżki do różnego pliki gretl musi wejść. Wybierz czcionkę, w której gretl pokazuje produkcję tekstu. Przyśpieszaj lub znieś gretl's posyła wiadomość o dostępności uaktualnienia programu. Skonfiguruj pasek narzędzi głównego okna i tak dalej. Zobacz, że Gretl Dowodzi Odniesienie dla dalszych szczegółów.
• Dane menu
Wybierają wszystko: Kilka rzeczy menu postępuje według tych zmiennych, które aktualnie są wybrane w głównym oknie. Ta rzecz pozwala ci wybrać wszystkie zmienne.
Pokaz wartości: Rozrywa okno z prostym (nie edytowalny) wydrukowanie wartości wybranej zmiennej lub zmiennych.
Wydaj wartości: Otwiera okno arkusza kalkulacyjnego, gdzie możesz wydać wartości wybranych zmiennych.
Dodaj obserwacje: Daje okienko dialogowe, w którym możesz woleć, by dodać na końcu aktualnego zestawu danych kilku obserwacji; dla użycia z przewidywaniem.
Usunięcie dodatkowe obserwacje: Aktywny tylko, jeżeli dodatkowe obserwacje zostały dodane automati-cally wewnątrz proces przewidywania; skreśla te dodatkowe obserwacje.
Przeczytana informacja, Wydaj informację: “Lektura informacja” tylko pokazuje informację streszczenia dla aktualnego pliku danych; “Wydaj informację” pozwala ci, by zrobić zmiany na to (jeżeli masz pozwolenie, na zrobienie tak).
Drukuj opis: Otwiera okno zawierające fuli opis aktualnego zestawu danych, cluding informacja streszczenia i jakaś określona informacja o każdej ze zmiennych.
Dodaj markery przypadku: Podpowiada dla imienia pliku tekstu zawierającego “markery przypadku” (krótkie sznury identyfikujące indywidualne obserwacje) i dodaje tę informację do zbioru danych. Zobacz Rozdział 4..
Markery przypadku usunięcia: Aktywny tylko, jeżeli zestaw danych ma markery przypadku identyfikujące obser-vations; usuwa te markery przypadku.
Zestaw danych struktura: odwoływać się do serii okienek dialogowych, które pozwalają, tobie, by zmienić się struc-tural interpretacja aktualnego zestawu danych. Na przykład jeżeli dane były wczytane jako sekcja krzyża, możesz nakłonić program do zinterpretowania ich jako serie czasu lub jako panel. Zobacz również sekcja 4.5.
Kompaktowe dane: Dla danych czas serii z wyżej niż roczny freąuency, daje ci opcję sprasować dane do niższego freąuency, używając jedną z czterech metod upakowania (średnia, suma, początek okresu lub końca okresu).
Rozszerz dane: Dla danych czas serii, daje ci opcję rozszerzania danych do wyższego freąuency.
Przestaw dane: Zmień każdą obserwację w zmienną i vice versa (lub innymi słowy, każdy rząd macierzy danych zostaje kolumnę w zmodyfikowanej macierzy danych); może być przydatny z importowanymi danymi, które zostać wczytany, “bokiem”.
- Chapter2. Cetting zaczął
1 Och
• Widok menu
Ikona widok: Otwiera okno pokazujące zawartość aktualnej sesji jako zbiór ikon; zobacz sekcja 3.4.
Craph wyszczególnił vars: Daje wybór pośrodku wątkowi serii czasu, regularnemu X do y wątkowi niewielkiej ilości, X do y impulsy używania wątku (pionowym barom), X do y wątkowi “z oddzieleniem czynnika” (tzn. z punktami kolorowymi różnie liczącymi do wartości danej zmiennej smoczka), boxplots i 3-D wykres. Wydaje okienko dialogowe, gdzie wyszczególniasz zmienne, by powielić. Zobacz Rozdział 7 dla szczegółów.
Wielokrotne wykresy: Pozwala ci, by skomponować zbiór z w górę do sześciu smali wykresach, albo parami niewielka ilość wątki lub wykresy czas serii. Ci są pokazani razem w pojedynczym oknie.
Streszczenie dane: Pokazuje fuli ustawił opisowych danych dla zmienne wybrały w głównym oknie.
Korelacja macierz: Pokazuje parami współczynniki korelacji dla wybranych zmiennych.
Zestawienie tabelaryczne krzyża: Pokazuje rozgniewane zestawienie tabelaryczne wybranych zmiennych. To pracuje tylko, jeżeli co najmniej dwie zmienne w danych ustawionych zostały oznaczone jako dyskretny (widzą Rozdział 8).
Główne komponenty: Doprowadza do Głównej Analizy Komponentów dla wybranego koślawości ables.
Mahalonobis odległości: Liczy Mahalonobis odległość każdej obserwacji z środka strefy wybranego zbioru zmiennych.
Rozgniewany korelogram: Liczy i powiela rozgniewany korelogram dla dwóch wybranego koślawości ables.
Dodaj, że menu Oferuje różne transformacje standardu zmiennych (kloce, opóźnienia, sąuares, itd..) że możesz zechcieć dodać do zbioru danych. Również daje opcja dodawania przypadkowych zmiennych i (dla danych czas serii) dodawania sezonowych zmiennych smoczka (np. zmienne smoczka ąuarterly dla ąuarterly danych).
Próbka menu
Zbiór zasięg: Wybierz inny start i / lub kończąc punkt dla aktualnej próbki, w zasięgu danych dostępnych.
Przywróć fuli zasięg: jasny.
Zdefiniuj, oparty na smoczku: Podana smoczek (wskaźnik) zmienną z wartościami 0 lub 1, to spada od aktualnej próbki wszystkie obserwacje, dla których zmienna smoczka ma wartość 0..
Ogranicz, oparty na kryterium: Podobny do podobnie powyższych, chyba że tak nie potrzebujesz wstępnie zdefiniowany zmienny: dostarczasz Boollowskie wyrażenie (np. sqft > 1400) i próbka jest ograniczona do obserwacji zadowalających ten warunek. Zobacz wejście dla genr w Odniesieniu Rozkazu Gretl dla szczegółów na Boollowskie operatorach, którzy mogą zostać użyty.
Przypadkowa łódź podwodna próbka: Narysuj przypadkową próbkę od fuli zestawu danych.
Upuść wszystek obs z gubieniem wartości: Kropla od aktualnej próbki wszystkich obserwacji, dla które co najmniej jedna zmienna ma brakującą wartość (widzą Sekcję 4.6).
Policz chybianie ceni: Daj raportowi w sprawie obserwacji, gdzie dane cenią chybia. Może być przydatny w badaniu zbioru danych panelu, gdzie to jest ąuite wspólny, by spotkać chybiające wartości.
Ustaw gubienie kodu wartości: Ustaw numeryczną wartość, która będzie zinterpretowana, jako “chybianie” lub “nie dostępny”. To być przeznaczony dla użycia z importowanymi danymi, kiedy gretl nie uznał, że kod wartości gubiącyużył.
- Chapter2. Cetting zaczął
11
• Zmienne menu Większość rzeczy poniżej tu zoperuj pojedynczą zmienną jednocześnie. “Aktywna”
zmienna jest odłożona podświetlanie tego (klikającego na jego rzędzie) w głównym oknie danych. Większość opcji będzie najjaśniejsza. Zauważ, że możesz przemianować zmienną i możesz wydać jego opisową etykietę
poniżej “Wydawać cechy”. Możesz również “Zdefiniować nową zmienną” przez formułkę (np. włączając
jakąś funkcję jednego lub więcej istniejących zmiennych). Dla składni takich formułek, spojrzenia w pomocy elektronicznej dla “Wygenerować składnię zmiennej” lub zobaczyć, że genr rozkazuje w
Odniesieniu Rozkazu Gretl. Jeden prosty przykład:
foo = xl * x2 utworzy nowy zmienny foo jako produkt dotychczasowy zmienne xl i x2. W tych formułkach, zmienne muszą być z bibliografią z nazwiska, nie numerować.
Model menu Dla szczegółów na różnych kosztorysantach zaoferowanych pod tym menu proszę konsultują Odniesienie Rozkazu Gretl. Również zobacz, jak Rozdział 16 odnośnie oszacowania nieliniowych modeli.
Pomóż menu Proszę używać tego jako potrzebowany! To daje szczegóły na składnia reąuired w różnych wejściach dialogu.
2.4 Klawiatura skrótów pracowanie w głównym gretl oknie, jakieś wspólne działania mogą zostać wykonane używanie klawiatury, jako pokazany w stole poniżej.
Powrót Otwiera okno pokazujące wartości aktualnie wybranych zmiennych: to jest to sam jako wybieranie “Danych, Wartości Pokazu”.
Skreśl Naciskanie tego klucza ma efekt skreślania wybranych zmiennych. confirma-tion jest reąuired, do zapobiegnij przypadkowe usunięcie.
e Ma ten sam efekt, ponieważ wybieranie “Wydają cechy” od “Zmienna” menu.
F2 To sam jako “e”. Zawarty dla zgodności z innymi programami.
g Ma ten sam efekt, ponieważ wybieranie “Definiują nową zmienną” od “Zmienna”
menu (które sporządza mapę na genr rozkaz). h Otwiera okno pomocy dla gretl rozkazów. FI To sam jako “h”. Zawarty dla zgodności z innymi programami. r Odświeża zmienną listę w głównym oknie: ma ten sam efekt, ponieważ wybieranie
“Odświeżają okno” od “Dane” menu. t Powiela wybrany zmienny; wykres linii jest użyty dla zestawów danych czas serii,
podczas
gdy wątek dystrybucji jest użyty dla rozgniewany przekrojowych danych.
2.5 gretl paska narzędzi
na dnie lewego głównego okna zdaje pasek narzędzi.
Ikony mają następne funkcje, czytając od odchodzony do właściwego:
1.. Rozpocznij program kalkulatora. Funkcja komfortu w przypadku chcesz ąuick dostęp do kalkulatora kiedy pracujesz w gretl. Domyślny program jest calc.exe pod PANIĄ Windowsem lub xcalc pod systemem okna x. Możesz zmienić program pod “Narzędziami, Preferencjami, Ogólnym” menu “, Programami” tabulator.
Chapter2. Dostawanie się zaczęło 12
Zaczynają nowy scenariusz. Otwiera okno edytora, w którym możesz napisać, serie rozkazów, by zostać wysłany do programu jako wypiek.
Otwórz gretl konsolę. Skrót do “Gretl pociesza” rzecz menu (Sekcję 2.3 powyżej).
Otwórz okno ikony sesji gretl.
Otwórz okno pokazujące dostępne paczki funkcji gretl.
Otwórz tę instrukcję w PDF formacie.
Otwarty pomocy podobnie, ponieważ scenariusz dowodzi składnię (tzn. wykaz z szczegółami zupełnie dostępnych rozkazów).
Otwórz okienko dialogowe dla definiowania wykresu.
Otwórz okienko dialogowe dla szacowania modelu używającego zwykłe najmniejsze kwadraty.
10.. Otwarte sporządzające listę zestawy danych próbki okno dostarczyło z gretl i trochę inny plik danych collec-tions to zostać zainstalowany.
Jeżeli nie obchodzi cię to, by mieć pasek narzędzi pokazany, możesz obrócić to pod “Narzędziami, Preferencjami, Ogólnymi” menu: tylko unsprawdzasz bix etykietowany “pokazać gretl pasek narzędzi”.
Rozdział 3
Tryby pracowania
3.1 Rozkazu pisze scenariusz,
Ponieważ wykonujesz rozkazuje w gretl, używając GUI i wypełniając wejścia dialogu, te rozkazy są rejestrowane w formie “scenariusza” lub pliku wsadowego. Takie scenariusze mogą zostać wydane i odnośnie przebiegany, używając albo gretl albo klient rozkaz linii, gretlcli.
Obejrzą aktualny stan scenariusza w jakimś punkcie w gretl sesji, wybrać “Rozkaz kloc” pod Narzędzia menu. Ten plik dziennik nazywa się session.inp i to jest nadpisane kiedykolwiek zaczynasz nową sesję. Aby zachować to, uratować scenariusz pod innym imieniem. Scenariusz pliki będą znalezione najwięcej łatwo, używając selekcjonera pliku GUI, jeżeli nazywasz ich z rozszerzeniem “.inp”.
Aby otworzyć scenariuszowi ciebie napisał niezależnie, użyć “Pliku, Scenariusz plików” rzecz menu; utworzyć scenariusz od użycia rysy “Plik, Scenariusz pliki, Nowy scenariusz” rzecz lub guzik paska narzędzi “nowego scenariusza” . W jednych z dwóch przypadków okno scenariusza otworzy się (widzieć Cyfrę 3.1).
Cyfra 3.1: Scenariusz okno, wydawanie pliku zleceń, który pasek narzędzi na szczycie okna scenariusza oferuje następnym funkcjom (odeszło do właściwego): (1) Ratuje plik; (2) Ratuje plik pod wyszczególnionym imieniem; (3) Drukuje plik (ta opcja nie jest dostępna na wszystkich platformach); (4) Wykonuje rozkazy w pliku; (5) Kopia wybrała tekst; (6) Klei wybrany tekst; (7) Znajduje i zastępuje tekst; (8) Odpina ostatni Kleją lub Zastępują działanie; (9) Pomaga (jeżeli umieszczasz kursor w słowie rozkazu i naciskasz znak zapytania, któremu dostaniesz pomoc na tym rozkazie); (10) Blisko okno.
Kiedy wykonujesz scenariusz, około klikając dalej Wykonać ikonę lub około pilny Ctrl-r, zupełnie przetworzyć jest skierowany do pojedynczego okna, gdzie to może zostać wydane, zostawany uratowany lub skopiowany do podręcznego notatnika. Uczą się więcej o możliwościach pisania scenariusza, spojrzeć na gretl Pomoc rzecz “Rozkaz odniesienie” ,
13
Rozdziału 3.. Tryby obsługiwania
14
lub początku w górę program rozkaz linii gretlcli i skonsultuj jego pomoc lub skonsultuj Odniesienie Rozkazu Gretl.
Jeżeli przebiegasz scenariusz kiedy część tego jest podświetlona, gretl tylko przebiegnie tę porcję. Ponadto, jeżeli chcesz przebiegnąć tylko aktualną linię, możesz zrobić tak około pilny Ctrl-Enter.1
Klikając właściwą mysz guzik wewnątrz okno edytora scenariusza doprowadza do menu podręcznego. To daje ci opcję wykonywania jednych z dwóch linii, na których kursor jest usytuowanym lub wybranego regionu scenariusza, jeżeli jest wybór na miejscu. Jeżeli scenariusz jest edytowalny, to menu również daje opcję dodawania lub usuwania markerów komentarza od początku linii lub linii.
gretl paczka zawiera ponad 70 “praktyka” scenariuszami. Większość tych odnosi się do Ramanathan (2002), ale oni mogą również zostać użyty jako wolno stojący wprowadzenie do pisania scenariusza w gretl i do różnych punktów ekonometrycznej teorii. Możesz zbadać pliki praktyki poniżej “Plikiem, Scenariusz plikami, Praktyka plikiem” Tam znajdziesz wykaz plików wraz z krótkim opisem punktów, które oni ilustrują i dane, które oni zatrudniają. Otwórz jakiś plik i przebiegnij to, by zobaczyć produkcję. Zauważ, że długie rozkazy w scenariuszem mogą zostać rozbite ponad dwoma lub więcej liniami, używając backslash jako charakter kontynuacji.
Możesz, jeśli chcesz, użyć GUI układ sterowania i piszące scenariusz podejście razem, wykorzystując każdą metodę, gdzie to oferuje większemu komfortowi. Tu są dwie sugestie.
Otwórz plik danych w GUI. Zbadaj dane - wygeneruj wykresy, regresje biegu, wykonują testy. Wtedy otwórz Rozkaz kloc, zredaguj z jakimiś zbytecznymi rozkazami i uratuj to pod określonym imieniem. Przebiegnij scenariusz, by wygenerować pojedynczy plik zawierający zwięzły zapis twojej pracy.
Zacznij się przez zakładanie nowy plik scenariusza. Wprowadź jakieś rozkazy, które mogą zostać wymagane, by ustawić w górę transformacje danych, (zobacz genr rozkaz w Odniesieniu Rozkazu Gretl). Typowo ten rodzaj rzeczy może zostać skończony więcej skutecznie przez rozkazy złożone z przezornością niż wskazać i kliknąć. Wtedy zaoszczędź i przebiegnij scenariusz: okno danych GUI będzie uaktualnione odpowiednio. Teraz możesz przeprowadzić dalsze badanie danych przez GUI. Rewizytują dane w późniejszym punkcie, otwierają się i wznawiają “przygotowawczy” piszą scenariusz według pierwszy.
Scenariusze i pliki danych
Jedne wspólna droga robienia ekonometrycznego badania z gretl jest następująco: skomponować scenariusz; wykonaj scenariusz; zbadaj produkcję; zmodyfikuj scenariusz; przebiegnij to znów - z ostatnimi trzema krokami powtórzonymi jako wielu razy jako konieczny. W tym kontekście, notatce, że kiedy otworzysz dane, włącz do dokumentacji to oczyszcza większość wewnętrznego stanu gretl's. To jest, dlatego prawdopodobnie dobry pomysł, by mieć twój początek scenariusza z otwartym rozkazem: plik danych odnośnie otwierany za każdym razem i możesz być pewny dostajesz “świeże” skutki.
Dalej wskaż powinienem być znany. Kiedy idziesz, by otworzyć nowy plik danych przez graficzną powierzchnię międzyfazową, zawsze jesteś podpowiedziany: otwieranie nowego pliku danych zgubią jakąś unratowała pracę, naprawdę chcesz zrobić to? Kiedy wykonujesz scenariusz, który otwiera plik danych, jakkolwiek, , nie jesteś podpowiedziany. Założenie jest tym w tym przypadku nie będziesz gubić jakiejś pracy, ponieważ praca jest ucieleśniona w samym scenariuszu (i to byłoby drażnienie, by zostać podpowiedziane w każdym powtarzaniu cyklu pracy opisanego powyżej).
To środki powinieneś uważać, jeżeli obsłużyłeś używanie graficznej powierzchni międzyfazowej i wtedy zdecydujesz przebiegnąć scenariusz: aktualny plik danych będzie zastąpiony bez jakichś pytań spytanych i to jest twoja odpowiedzialność, by uratować jakieś zmiany na twoje dane najpierw.
1This cecha nie jest unikalna do gretl; inne ekonometryczne paczki oferują to sam udogodnienie. Jakkolwiek doświadczenie pokazuje tej chwili to może być znacząco przydatny, to może również prowadzić do pisanie scenariuszy dinozaura, które nigdy nie są znaczone, by zostać wykonane, wszystko natychmiast, ale raczej używa jako chaotyczny skład, by wiśnią-wybrać skrawki od. Odkąd gretl pozwala ci, by mieć kilka okien scenariusza otwiera się równocześnie, możesz zechcieć trzymać twoje scenariusze schludne i rozsądnie małe.
Rozdział 3.. Tryby obsługiwania
15
3.2 Oszczędnościowych przedmiotów scenariusza
Kiedy szacujesz model używający wskazać i kliknąć, skutki modelu są pokazane w oddzielnym oknie, menu propozycji, które pozwoliły ci, wykonują testy, rysują wykresy, uratować dane od modelu i tak dalej. Zazwyczaj kiedy szacujesz model używający scenariusz, który tylko dasz nieinteraktywnemu wydrukowaniu skutków. Możesz, jakkolwiek, zaplanować dla modele oszacowały w scenariuszu, by “zostać schwytane”, żeby mogłeś zbadać ich interaktywnie kiedy jest scenariusz skończony. Tu jest przykład składni dla osiągania tego efektu:
Model1 <- ols Ct 0 Yt, który
To jest, piszesz imię dla modelu, by zostać uratowany poniżej, wtedy z powrotem wskazujący “strzała zadania”, wtedy rozkaz modelu. Możesz użyć imion, które wbiły przestrzenie, jeśli chcesz, ale takie imiona muszą zostać zawinięte w podwójnych cytatach:
"Model 1" <- ols Ct, który 0 Yt
Modeli zaoszczędziło w ten sposób wyda się jako ikony w oknie widoku ikony gretl (widzi Sekcję 3.4) po tym, jak scenariusz jest wykonany. Ponadto, możesz zaplanować mieć nazywany model pokazany (w jego własnym oknie) automatycznie następująco:
Model1.show
Znów, jeżeli imię zawiera przestrzenie, to musi zostać zacytowane:
"Model 1".pokaż, że
To samym udogodnienie może zostać użyte dla wykresów. Na przykład co następuje utworzy wątek Ct przeciw Yt, uratować to pod imieniem “CrossPlot” (to wyda się pod tym imieniem w oknie widoku ikony)i mieć to pokazane:
CrossPlot <- gnuplot Ct Yt CrossPlot.show, któremu Możesz również uratować produkcję od wybranych rozkazów jako nazwane części tekstu (znów, ci wydają się w oknie ikony sesji, skąd możesz otworzyć ich później). Na przykład ten com mand wysyła produkcję od podwyższonego Osioł Pełniejszego testu do “przedmiotu tekstu” nazywanego ADF1 i pokazanego to w oknie:
ADF1 <- adf, który 2 x1 ADF1.show
Przedmioty zaoszczędziły w ten sposób (czy modele, wykresy lub części produkcji tekstu) może zostać zniszczony używając rozkaz .uwolnij dodany do imienia przedmiotu, jako w ADF1.free.
3.3 gretl konsola dalsza opcja jest dostępna dla twojego komfortu informatyki. Pod “Narzędzia” menu gretl's znajdziesz rzecz “Gretl pociesza” (jest również “otwarta gretl konsola” guzikiem na pasku narzędzi w głównym oknie). To otwiera okno, w którym możesz napisać rozkazy i wykonujesz ich pojedynczo (przez naciskanie Klawisza Enter) interaktywnie. To jest zasadniczo to sam jako tryb gretlcli's działania, oprócz że GUI jest uaktualniony opartego na rozkazach wykonanych od konsoli, umożliwiając tobie pracowanie z powrotem i naprzód jak sobie życzysz.
W konsoli, masz “historię rozkazu”; to jest, możesz użyć w górze i klawisz strzałki w dół, by nawigować wykaz rozkazu, do którego stajesz do daty. Możesz zaaportować, zredagować i wtedy ponownie wejść poprzedni rozkaz.
Rozdział 3.. Tryby pracowania
16
W trybie konsoli, możesz utworzyć, pokazać i uwolnić przedmioty (modele, wykresy lub tekst) aa opisany ponad dla trybu scenariusza.
3.4 Sesja pojęcie
gretl oferuje pomysł “sesji” jako sposób trzymania szlaku twojej pracy i rewizytowania tego później. Podstawowy pomysł ma dostarczyć iconic przestrzeń zawierającą różne przedmioty dotyczące do twojej aktualnej roboczej sesji (widzą Cyfrę 3.2). Możesz dodać przedmioty (reprezentowane przez ikony) do tej przestrzeni, ponieważ idziesz razem. Jeżeli ratujesz sesję, te dodane przedmioty powinny być dostępne znów, jeżeli odnośnie-otwierasz się sesję później.
Cyfra 3.2: Ikona widok: jeden model i jeden wykres zostać dodany do domyślnych ikon,
Jeżeli zaczynasz gretl i otwierasz zbiór danych, wtedy wybierz “Ikona widok” od Widok menu, powinieneś zobaczyć podstawowy domyślny zbiór ikon: ci dają ci szybki dostęp do informacji o danych ustawił (jeżeli jakiś), macierz korelacji (“Korelacje”) i opisowe dane streszczenia (“Streszczenie”). Wszyscy ci są przyśpieszani przez podwójnie klikający związaną ikonę. “Dane ustawiły” ikona jest trochę bardziej złożony: podwójnie klikający otwiera dane we wbudowanym arkuszu kalkulacyjnym, ale możesz również naprawiasz-kliknąć na ikonę dla menu innych działań.
Dodają model do Ikona widoku, pierwszej oceny to używające Model menu. Wtedy ściągnij Plik menu w oknie modelu i wybierz “Zaoszczędzić do sesji jako ikona...” lub “Zaoszczędź jako ikona i zamknij się”. Po prostu uderzając S klucz ponad okno modelu jest skrótem do ten ostatniego działania.
Aby dodać wykres, najpierw utworzyć to (pod Widok menu, “Powiel wyszczególniony vars”lub przez jeden z innych wygenerowujących wykresu rozkazów gretl's). Kliknij na okno wykresu, by wychować menu wykresu i wybierz “Zaoszczędzać do sesji jako ikona”.
Raz na model lub wykres jest dodany jego ikona wyda się w oknie widoku Ikony. Podwójnie klikający na ikonie wyświetla przedmiot, dobrze klikający wychowuje menu, które pozwala ci pokazują lub skreślają przedmiot. To menu kontekstowe również daje ci opcję wydawania wykresów.
Stół modelu
W ekonometrycznym badaniu to jest wspólne oszacować kilka modeli z wspólny zależny koślawości zdolny - modele różniące się w odniesienia, do którym niezależne zmienne są zawarte lub może w odniesieniu do kosztorysanta używanego. W tej sytuacji to jest dogodne przedstawić skutki regresji w formie stołu, gdzie każda kolumna zawiera skutki (oceny współczynnika i błędy standardu) dla danego modelu i każdy rząd zawiera oceny dla danej zmiennej przez modele.
W okno widoku Ikony gretl dostarcza znaczy budowania takiego stołu (i kopiując to w prostym
Rozdziale 3. Tryby obsługiwania
17
tekstu, LAT X lub Bogatego Formatu Tekstu). Tu jest jak zrobić to:2 E
Ocena model, który chciałbyś włączyć do stołu i w oknie pokazu modelu, pod Plik menu, wybierają “Zaoszczędzać do sesji jako ikona” lub “Zaoszczędzać jako ikona i zamknąć się”.
Powtórka krok 1 dla innych modeli, by zostać włączony do stołu (w górę do sumie sześciu modeli).
Kiedy będziesz szacować modele, otwórz widok ikony twojej gretl sesji, przez se lecting “Ikona widok” pod Widok menu w głównym gretl oknie lub przez klikanie “widok ikony sesji” ikony na gretl pasku narzędzi.
W Ikona widoku, jest ikona etykietowana “Model stół”. Zdecyduj, który model, którym chciałbyś wydać się w najdalszej na lewie kolumnie stołu modelu i dodaj to do stołu, albo przez ciągnięcie jego ikony na ikonę stołu Modelu lub prawnie klikający na ikonie modelu i wybieranie “Dodają, by umodelować stół” od menu podręcznego.
Powtórka krok 4 dla innych modeli chciałbyś włączyć do stołu. Drugi model wybrany wyda się w drugiej kolumnie od lewych i tak dalej.
Kiedy będziesz skończony skomponować stół modelu, pokazać to przez podwójnie klikający na jego ikonie. Pod Artykuł menu w oknie, które wydaje się, masz opcję kopiowania stołu do podręcznego notatnika w różnych formatach.
Jeżeli porządkowanie modeli w stole nie jest tym, co chciałeś, właściwy kliknąć na ikonę stołu modelu i wybrać “Czysty stół”. Wtedy wróć, by wkroczyć do 4 powyższej i spróbować znów.
Cyfra 3.3: Przykładem stołem modelu
2The modelu stół może również zostać zbudowany bez --interaktywnie, w trybie scenariusza. Dla szczegółów dalej jak, aby zrobić to, zobaczyć wejście dla modeltab w Odniesieniu Rozkazu Gretl.
Prosty przykład stołu modelu gretl's jest pokazany w Cyfra 3.3.
Rozdział 3.. Tryby pracowania
18 strona wykresu “strona wykresu” ikona w oknie sesji oferuje znaczy kładzenia razem kilka wykresów dla bycia w druku na pojedynczej stronie. To udogodnienie pracuje tylko, jeżeli będziesz mieć BTpX składający system zainstalowany i jest w stan wygenerować i obejrzeć albo PDF albo Postscriptum output.3
W oknie widoku Ikony, możesz wlec się do ośmiu wykresów na ikonę strony wykresu. Kiedy ty podwójne kliknięcie na ikonie (lub właściwych klik i wybierz “Pokazać”), strona zawierająca wybrane wykresy (w PDF lub EPS formacie) jest skomponowana i jest otworzona w twoim widzu. Stamtąd powinieneś być w stanie drukować stronę.
Do elear strona wykresu, właściwy kliknąć na jego ikonę i wybierz “Czysty”.
Na systemach inny niż PANI Windows, możesz musieć dostosować ustawienie dla program obejrzał postscriptum. Znajdź, że pod “Programy” tabulatorem w Preferencje okienku dialogowym (pod “Narzędzia” menu w głównym oknie). Na Windows, możesz musieć dostosować twoje stowarzyszenia pliku, żeby odpowiedni widz został nazwany dla “Otworzyć się” działanie na plikach z .ps rozszerzenie. FIXME dyskutuje PDF tu.
Oszczędność i sesje odnośnie otwierającego,
Jeżeli tworzysz modele lub wykresy, że myślisz, że możesz zechcieć odnośnie-badają później, wtedy przed ąuitting gretl wybiera “Sesja pliki, Uratować sesję” od Plik menu i dać imię, pod którym uratować sesję. Odnośnie-otwierają się sesję później, jeden z dwóch
Początek gretl wtedy odnośnie-otwierają się plik sesji przez pójście do “Pliku, Sesja plików, Otwartej sesji”lub
Od wiersza zlecenia, typ gretl -r sessionfile, gdzie jest sessionfile imieniem, pod którym sesja została uratowana.
3For PDF przetworzony ciebie potrzebuje pdflatex i albo PDF czytelnika Cegły niewypalanej albo xpdf na Xli. Dla Postscriptum, musisz mieć dvips i ghostscript zainstalował, wraz z widzem takim jak gv, ggv lub kghostview. delault widz lor systemy inny niż PANI Windows jest gv.
Rozdział, który 4
Dane pliki
4.1 Ojczysty format
gretl ma jego własny format dla plików danych. Większość użytkowników będzie chcieć przeczytać lub napisać takie pliki po za sam gretl, ale czasami to może być przydatny i fuli wyszczególnia dalej struktury pliku być oddany Aneks A.
4.2 Inne dane struktury pliku
gretl przeczyta różny inne układy danych.
Czysty tekst (ASCII) pliki. Ci mogą zostać wprowadzony używając gretfs “Plik, Otwarte Dane, Import ASCII...” rzecz menu lub rozkaz scenariusza importu. Dla szczegółów, na którym gretl oczekuje od takiego hles, zobacz Sekcja 4.4.
Rozdzielone przez Przecinek Wartości (CSV) hles. Ci mogą zostać importowany używając gretl's “Plik, Otwarte Dane, Import CSV...” rzecz menu lub rozkaz scenariusza importu. Zobacz również Sekcja 4.4.
Arkusze kalkulacyjne: PANI Excel, Cnumeric i Otwarty Dokument (ODS). Ci również są przyniesieni w using gretfs “Plik, Otwarte Dane, Import” menu. reąuirements dla takiego hles być oddany Section 4.4.
Stata dane hles (.dta).
Eviews workhles (.wfl).1
JMulTi dane hles.
Kiedy importujesz dane z ASCII lub CSV formatów, gretl otwiera “diagnostyczne” okno, sprawozdanie ing na jego postępie w czytaniu danych. Jeżeli spotykasz problem z źle formatowanymi danymi, wiadomości w tym oknie powinny dać cię sprawować się na hxing problem.
Wersja 1.7.5, gretl również oferuje ODBC connctivity. Zostać ostrzeżony: to jest niedawna cecha znaczona dla nieco posuniętych naprzód użytkowników; to może nadal mieć kilka szorstkich krawędzi i nie ma żadnej GUI powierzchni międzyfazowej dla tego jeszcze. Zainteresowani czytelnicy chcą hnd więcej informacji w aneksie B.
Dla komfortu kogoś brakującego, by roznieść się więcej złożone dane analizę, gretl ma udogodnienie dla pisania danymi w ojczystych formatach GNU R, Oktawa, JMulTi i PcCive (zobacz Aneks E). W GUI kliencie ta opcja jest znaleziona pod “Plikiem, Eksport danymi” menu; w użyciu klienta rozkaz linii rozkaz sklepu z odpowiednią flagą opcji.
4.3 Dwójkowych baz danych,
Ponieważ pracowanie z dużymi ilościami danych gretl jest dostarczone z radzącą bazy danych procedurą. Baza danych, w przeciwieństwie do pliku danych, nie jest przeczytanym bezpośrednio do workspace programu. Baza danych może zawrzeć serie zmieszanego freąuencies i spróbować zasięgi. Otwierasz bazę danych i wybierasz
1See http://www.ecn.wfu.edu/eviews_format/. < http://www.ecn.wfu.edu/eviews_format/ >
19
Rozdziału 4.. Dane włączają do dokumentacji
20
serii, by importować do roboczego zestawu danych. Możesz wtedy uratować te serie w ojczystych, jeśli chcesz pliku danych formatu. Bazy danymi mogą zostać wchodzone przez rzecz menu gretl's “Plik, Bazy danych”.
Dla szczegółów dalej format gretl baz danych, zobacz Aneks A.
Online dostęp do baz danych wersji 0.40, gretl jest w stanie wejść bazy danych przez internet. Kilka baz danych jest dostępne od Obudzić Uniwersytet Lasu. Twój komputer musi zostać łączony do internetu dla tej opcji do pracy. Proszę zobacz opis “dane” rozkazu pod Pomoc menu gretl's.
«• Odwiedź stronę danych gretl < http://gretl.sourceforge.net/gretl_data.html > dla szczegółów i uaktualnienia na dostępnych danych.
Obca baza danych formatuje
Dzięki Thomasowi Doan Estima, który zrobił dostępny specyfikację formatu bazy danych używanego przez SZCZURY 4 (Analizę Regresji Serii Czasu), gretl może poradzić takie bazy danych - lub co najmniej, podzespół to sam, mianowicie bazy danych czas serii zawierające miesięcznie i ąuarterly serie.
Gretl może również importować dane z PcCive baz danych. Ci biorą formę pary plików, jednego zawierania faktycznych danych (z przyrostkiem .bn7) i jedna zawierająca dodatkowa informacja (.in7).
4.4 Tworzenia pliku danych od rysy Tam jest kilku drogami robienia to:
Znaleźć lub utworzyć używanie edytor tekstowy, plik danych czystego tekstu i otworzyć to z gretl's “Importowi ASCII” opcja.
Użyj twojego ulubionego arkusza kalkulacyjnego, by założyć plik danych, uratuj to w Przecinku Oddzielnym Wartości formatują w razie konieczności (to nie powinien być konieczny, jeżeli format arkusza kalkulacyjnego jest PANIĄ Excelem, Gnu meric lub Otwartym Dokumentem), wtedy użyj jednej z “Import” opcji gretl's.
Użyj wbudowanego arkusza kalkulacyjnego gretl's.
Wybrani serie danych od odpowiedniej bazy danych.
Użycie twój ulubiony edytor tekstowy lub inne narzędzia oprogramowania do utwórz dane rejestrować wewnątrz gretl format inde-pendently.
Tu są kilku komentuje i wyszczególnia na tych metodach.
Wspólne punkty na importowane dane
Opcje (1) i (2) włączają używanie “import” mechanizmu gretl's. Dla gretl, by przeczytać takie dane sukces-w pełnych, pewne ogólne warunki muszą zostać zadowolone:
• Pierwszy rząd musi zawrzeć ważne zmienne imiona. Ważne zmienne imię jest 15 maksimum charakterów; początki z listem; i zawiera nic tylko listy, numery i podkreśl charakter, _. (Dłużej zmienne imiona będą okrojone do 15 charaktery.) Glualifications do powyższych: pierwszy, w przypadku ASCII lub CSV imporcie, jeżeli plik nie zawrze żadnego rzędu ze zmiennymi imionami, program automatycznie doda imiona, vi, v2 i tak dalej. Drugi, przez “pierwszy rząd” jest znaczony pierwszym związanym rzędem. W przypadku ASCII i CSV importów, czystych rzędów i rzędów rozpoczynających od znaku haszyszu, #, jest zignorowane. W przypadku z Wceluj i Gnumeric importy, jesteś przedstawiony z okienkiem dialogowym, gdzie możesz wybrać offset do arkusza kalkulacyjnego, żeby gretl zignorował wyszczególniony numer rzędów i / lub kolumny.
Rozdział 4.. Dane pliki
21
Dane wartości: ci powinni utworzyć prostokątny blok, z jedną zmienną na kolumnie (i jedna obserwacja na rzędzie). Numer zmiennych (kolumny danych) muszą dopasować numer zmiennych imion podanych. Zobacz również sekcja 4.6. Dane numeryczne są oczekiwane, ale w przypadku importowania od ASCII / CSV, oferty programu ograniczyły sprawowanie się charakter (sznur) danych: jeżeli dana kolumna zawiera dane charakteru tylko, kolejne numeryczne kody są zastąpione dla sznurów i, gdy tylko import jest kompletny, że stół jest drukowany pokazując korespondencję między sznurami i kodami.
Daty (lub etykiety obserwacji): Opcjonalnie, pierwsza kolumna może zawrzeć sznury taki jak daty lub etykiety dla rozgniewany przekrojowych obserwacji. Takie sznury mają maksimum 8 charakterów (tak , jak w przypadku zmiennych imion, dłuższe sznury będą skrócone). Kolumna tego rodzaju powinna zostać zmierzana z sznur obs lub datą lub pierwsze wejście rzędu może zostać zostawione czysto.
Dla dat, by zostać rozpoznany jako taki, sznury daty muszą trzymać się jednego lub innego zbioru określonych formatów, następująco. Dla rocznych danych: 4-cyfra lata. Dla ąuarterfy danych: 4-cyfra rok, mający za sobą separator (jednych z dwóch okresów, dwukropka lub listu Q), mających za sobą 1-cyfra ąuarter. Przykłady: 1997.1, 2002:3, 1947Q1. Dla miesięcznych danych: 4-cyfra rok, mający za sobą okres lub dwukropek, mający za sobą dwucyfrowy miesiąc. Przykłady: 1997.01, 2002:10..
CSV pliki mogą użyć przecinka, przestrzeni lub tabulatora jako separator kolumny. Kiedy używasz “Importu CSV” rzecz menu, którą jesteś podpowiedziany, by wyszczególnić separatorem. W przypadku “Importu ASCII” program usiłuje samochodowy-dostrzegać separator, który został użyty.
Jeżeli używasz arkusza kalkulacyjnego, by przygotować twoje dane, jesteś w stanie przeprowadzić różne transformacje “surowych” danych z łatwością (dodając rzeczy w górę, biorąc procenty lub cokolwiek): notatka, jakkolwiek, że możesz również zrobić ten rodzaj rzeczy łatwo - może więcej łatwo - w gretl, przez używanie narzędzi pod “Dodać” menu.
Dodając importowane dane, które Możesz zechcieć założyć zestaw danych po kawałku gretl, przez przyrostowy import danych z innych źródeł. To jest poparty przez “Plik, Dodać dane” rzeczy menu: gretl sprawdzi nowe dane dla conformability z dotychczasowy zestaw danych i, jeżeli wszystko wydaje się ok, połączą dane. Możesz dodać nowe zmienne w ten sposób, pod warunkiem dane freąuency pasuje tamten z dotychczasowy zestaw danych. Lub możesz dodać nowe obserwacje dla serii danych, które są już obecne; w tym przypadku zmienne imiona muszą pasować poprawnie. Zauważ, że domyślnie (to jest, jeżeli wybierasz “Otwarte dane” niż “Dodawać dane”), otwieranie nowego pliku danych zamyka prąd jeden.
Używając wbudowany arkusz kalkulacyjny
Poniżej gretl's “Plik, Nowy zbiór danych” menu, które możesz wybrać rodzaj zestawu danych, który chcesz założyć (np. serie czasu ąuarterly, rozgniewany przekrojowe). Wtedy będziesz podpowiedziany dla zaczynania się i kończenia dat (lub numery obserwacji) i imię pierwszej zmiennej, by dodać do zestawu danych. Po dostarczeniu tej informacji będzie stawać wobec prostego arkusza kalkulacyjnego, do którego możesz napisać wartości danych. W oknie arkusza kalkulacyjnego, klikanie właściwego guzika myszy odwołają się do menu kontekstowego, które umożliwia ci dodanie nowa zmienna (kolumny), dodać obserwację (dodają rząd u stóp arkusza)lub wstawić obserwację w wybranym punkcie (przesunąć dane na dół i wstawić czysty rząd.)
Gdy tylko stajesz dane do arkusza kalkulacyjnego do ty importować tych do workspace gretl's używającego arkusza kalkulacyjnego “Stosują zmiany” guzik.
Proszę zauważ, że arkusz kalkulacyjny gretl's jest ąuite basie i nie ma żadnego poparcia dla funkcji lub formułek. Dane transformacje są zrobione przez “Dodać” lub “Zmienna” menu w głównym gretl oknie.
Wybieranie od bazy danych
Innej alternatywy ma założyć twój zestaw danych przez wybieranie zmiennych od bazy danych.
Rozdział 4.. Dane pliki
22
Rozpoczyna od gretl's “Plik, Bazy danych” rzecz menu. To ma cztery widelce: “Gretl ojczysty”, “ŁAPIE SZCZURY 4”, “PcGive” i “Na serwerze bazy danych”. Powinieneś być w stanie znaleźć plik fedstl.bin w selekcjonerze pliku, który otwiera się, jeżeli wolisz “Gretl ojczysta” opcja - ten plik, który zawiera duży zbiór USA makroekonomiczny serii czasu, jest dostarczony z dystrybucją.
Nie znajdziesz niczego poniżej “ŁAPIE SZCZURY 4” , chyba że nabyłeś SZCZURY data.2, Jeżeli naprawdę posiadasz ŁAPIE SZCZURY dane powinieneś wejść do gretl's “Narzędzia, Preferencje, Ogólne” dialog, wybrać Bazy danych tabulator i wypełnić poprawną ścieżkę do twoich SZCZURY plików.
Jeżeli twój komputer jest łączony do internetu, powinieneś znaleźć kilka baz danych (w Obudzić Uniwersytet Lasu) poniżej “Na serwerze bazy danych”. Możesz przeglądnąć tych na odludziu; również masz opcję instalowania ich na twój własny komputer. Początkowe odległe okno baz danych ma przedstawienie rzeczy, dla każdego pliku, czy to już jest zainstalowane lokalnie (i, jeżeli tak, jeżeli miejscowa wersja jest nowoczesny z wersją w Obudzić Las).
Zakładając, że zdołałeś otworzyć bazę danych, którą możesz importować wybrany serie do workspace gretl's przez używanie “Serii, Importu” rzecz menu w oknie bazy danych lub przez menu kontekstowe, że ap gruszki, jeżeli klikasz właściwy guzik myszy lub przez ciągnięcie serii do głównego okna programu.
Tworząc plik danych gretl niezależnie
Można utworzyć plik danych w jednym lub innym z własnych formatów gretl's używających edytora tekstowego lub oprogramowanie obrabia takie jak awk, sed lub perl. To może być dobrym wyborem, jeżeli masz duże ilości danych już w maszyna czytelnej formie. Będziesz oczywiście musieć studiować gretl układy danych (XML formatu lub “tradycyjny” format) jak opisanego wewnątrz Aneks A.
4.5 Budowanie zestawu danych
Raz twój dane są przeczytane około gretl, to może być konieczne, by dostarczyć trochę informacje o naturze danych. Odróżniamy między trzema rodzajami zestawów danych:
Skrzyżować sekcja
Czas serie
Wprawiać
płycizny dane pierwszorzędowe narzędzie do robienie to jest “Dane, Zestaw danych struktura” wejście menu w graficznej grzebiesz-twarzy lub setobs rozkazie dla scenariuszy i powierzchni międzyfazowej rozkaz linii.
Skrzyżuj przekrojowe dane
Przez sekcję krzyża, którą znaczymy obserwacje na zbiorze “części” (które może być firmami, krajami, dividuals lub czymkolwiek) we wspólnym punkcie w samą porę. To jest domyślna interpretacja dla pliku danych: jeżeli gretl nie ma dostatecznej informacji, by zinterpretować dane jako czas serie lub panel dane, oni automatycznie są zinterpretowani jako sekcja krzyża. W nieprawdopodobnym wydarzeniu tak rozgniewany przekrojowe dane źle są zinterpretowane jako serie czasu, możesz poprawić to około wybieranie “Dane, Zestaw danych struc-ture” menu podobnie. Kliknij “rozgniewany przekrojowy” przełącznik w okienku dialogowym, które wydaje się, wtedy klik “Naprzód”. Klik “ok” potwierdzić twój wybór.
Dane serii czasu
Kiedy będziesz importować dane z arkusza kalkulacyjnego lub pliku czystego tekstu, gretl zrobi dość forsowne wysiłki, by zebrać informację czas serii od pierwszej kolumny danych, jeżeli to spogląda w ogóle wiarogodny, że taka informacja może być obecna. Jeżeli struktura czas serii jest obecna ale nie uznaje, znów ty
2See www.estima.com < http://www.estima.com/ >
Rozdział 4.. Dane pliki
23
może użyć “Danych, Zestaw danych struktury” rzecz menu. Wybierz “Czas serie” i kliknij “Naprzód”; wybierz odpowiedni dane freąuency i kliknij “Naprzód” znów; wtedy wybierz lub stawaj do obserwacji startu i kliknij “Naprzód” jeszcze raz. W końcu, klik “ok” aby potwierdzić interpretację czas serii, jeżeli to jest poprawne (lub klik “Z powrotem” zrobić dostosowanie jeżeli zajdzie taka potrzeba).
Oprócz basie interesu dostawania się zbiór danych zinterpretowany jako serie czasu, dalsze zagadnienia mogą powstać odnosząc się do freąuency danych czas serii. W zbiorze danych czas serii gretl, wszystkie serie muszą mieć ten sam freąuency. Sądźmy, że chciałbyś sprawiać, że połączony zestaw danych użyty serie, które, w ich oryginalnym stanie, nie są wszystkimi ten sam freąuency. Na przykład jakieś serie są miesięczne i niektórzy są ąuarterly.
Twój pierwszy krok ma sformułować strategię: chcesz skończyć się z ąuarterly, czy miesięczne dane ustawiły? basie wskazują, by zauważyć tu tak “sprasować” dane od wyższego freąuency (np. miesięcznik) do niższego freąuency (np. ąuarterly) jest zwykle nieproblematyczny. Gubisz informacje w robieniu tak, ale ogólnie to jest doskonale uprawomocnić, by wziąć (mówić) średnią trzech miesięcznych obserwacji, by utworzyć ąuarterly obserwację. Z drugiej strony “rozszerzając” dane od niewysoko do wyższego freąuency nie jest, ogólnie, ważnym działaniem.
W większości wypadków wtedy, najlepsza strategia ma zacząć się przez tworzenie zbioru danych niższego freąuency i wtedy sprasować wyższe freąuency dane, by pasować. Kiedy importujesz wyższy freąuency dane z bazy danych do aktualnego zbioru danych, dano tobie wybór metody upakowania (średnia, suma, początek okresu lub końca okresu). W większości przykładów “średnia” jest prawdopodobna być odpowiednia.
Możesz również importować niższy freąuency dane do zbioru danych wysokiej częstości, ale to jest polecony. Który gretl robi ten przypadek jest po prostu odgięty wartości niższy freąuency serii jako wielu razy jako reąuired. Na przykład sądzimy my mają ąuarterly serie z wartością 35.5 w 1990:1, pierwszy ąuarter 1990.. Na ekspansji do miesięcznego, wartość 35.5 będzie wyznaczony do obserwacji dla stycznia, lutego i marca 1990.. Rozszerzona zmienna jest, dlatego bezużyteczna dla drobnej analizy czas serii, po za specjalną okoliczność, gdzie wiesz, że zmienna w ąuestion naprawdę faktycznie pozostaje stała ponad łodzią podwodną okresami.
Kiedy aktualny dane freąuency jest odpowiedni, gretl oferuje zarówno “Kompaktowe dane” i “Rozszerzyć dane” opcje pod “Dane” menu. Te opcje operują zbiór danych całości, sprasować lub exanding zupełnie serie. Oni powinni zostać rozważony “ekspert” opcjami i powinien zostać użyty z ostrożnością.
Panel dane
Panel dane są z natury trzema wymiarowym - wymiary będące zmienną, rozgniewany przekrojową część i czas okres. Na przykład szczególny numer w zbiorem danych panelu mógłby zostać zidentyfikowany jako obserwacja na towarze kapitału dla Ogólnych Motorów 1980. (notatka na terminologii: używamy okresy “rozgniewany przekrojowej części”, “części” i “grupy” zamiennie poniżej, by odnosić. Ci mogliby, na przykład, być firmami, krajami lub osobami.)
Dla reprezentacji w tekstowym pliku komputera (jak również dla wewnętrznych obliczeń gretl's) trzy wymiary muszą jakoś zostać spłaszczone do drugiej. To “wyrównywanie się” włącza biorące warstwy danych, które naturalnie układałyby w stóg w trzecim wymiarze i układając w stóg ich w pionowym wymiarze.
Gretl zawsze oczekuje, by dane zostały ułożone “przez obserwację”, to jest, taki, że każdy rząd reprezentuje obserwację (i każdy zmienny oceupies jeden i tylko jedna kolumna). W tym kontekście wyrównywanie się zbioru danych panelu może zostać zrobione w obu z dwóch dróg:
Ułożony
w
stóg serie czasu: kolejne pionowe bloki każdy obejmują serie czasu dla danej części.
Ułożone w stóg sekcje krzyża: kolejne pionowe bloki każdy obejmują rozgniewaną sekcję dla danego okresu.
Możesz dane wejścia w którymkolwiek przygotowaniu są bardziej dogodne. Wewnątrz jakkolwiek, gretl zawsze sklepy wprawiają płycizny dane w formie ułożonych w stóg serii czasu.
Rozdział 4.. Dane pliki
24
Kiedy importujesz dane panelu do gretl od arkusza kalkulacyjnego lub przecinek rozdzielił format, natura panelu danych nie będzie rozpoznana automatycznie (najbardziej prawdopodobny dane będą potraktowane jako “niedatowany”). Interpretacja panelu może zostać narzucona na danych używających graficzną powierzchnię międzyfazową lub przez setobs rozkaz.
W graficznej powierzchni międzyfazowej, użyj rzeczy menu “Dane, Zestaw danych struktura”. W pierwszym okienku dialogowym, które wydaje się, wybierz “Wprawiać płycizny”. W następnym dialogu masz potrójny wybór. Pierwsze dwie opcje, “Ułożone w stóg serie czasu” i “Ułożone w stóg sekcje krzyża” są przydatne, jeżeli zbiór danych już jest zorganizowany w jednej z tych dwóch dróg. Jeżeli wybierasz też tych opcji, następny krok ma wyszczególnić numer rozgniewany przekrojowych części w zbiorze danych. Trzecia opcja, “zmienne indeksu Użycia”, jest przydatna, jeżeli zbiór danych zawiera dwie zmienne, które zaopatrują w spis części i okresy czasu odpowiednio; następny krok jest wtedy, by wybrać te zmienne. Na przykład plik danych mógłby zawrzeć zmienną kodu kraju i zmienną reprezentującą rok obserwacji. W tym przypadek gretl może zrekonstruować strukturę panelu danych nie zważając z jak są rzędy obserwacji zorganizowane.
setobs rozkaz ma opcje ta paralela ci w graficznej powierzchni międzyfazowej. Jeżeli odpowiednie zmienne indeksu są dostępne, możesz zrobić, na przykład
setobs unitvar timevar --panel vars,
gdzie jest unitvar zmienną, że indexes części i timevar jest zmienną zaopatrującą w spis okresy. Alternatywnie możesz użyć forma setobs freq 1:1 struktura, gdzie freq zastępuje się “wielkością bloku” danych (to jest, numer okresów w przypadku ułożonych w stóg serii czasu lub numeru części w przypadku ułożonych w stóg rozgniewanych sekcji) i struktura jest albo --układałeś w stóg -serie czasu lub --układałeś w stóg -krzyżujesz-sekcja. Dwa przykłady są dane poniżej: pierwszy nadaje się do panelu w formie ułożonych w stóg serii czasu z obserwacjami od 20 okresów; drugi dla był ułożony w stóg krzyż dzieli z 5 częściami.
setobs 20 1:1 --układałeś w stóg -serie czasu setobs 5 1:1 --układałeś w stóg -krzyżujesz-sekcja
Panel dane zaplanowały przez zmienną
Publicznie dostępne dane panelu czasami przychodzą zorganizowany “przez zmienną.” Sądzimy my mają dane na temat dwóch zmiennych, xl i x2, dla każdego z 50 stanów w każdym z 5 lat (dających sumę 250 obserwacji na zmiennej). Jedna tekstowa reprezentacja takiego zbioru danych rozpoczynałaby od bloku dla xl, z 50 rzędami odpowiadającymi stanom i 5 kolumnom odpowiadającym latom. To byłby podążony, pionowo, przez blok z tę sam strukturą dla zmiennego x2. Fragment takiego pliku danych jest pokazany poniżej, z quinquennial obserwacjami 1965-1985. Miej wrażenie, że stół kontynuował dla 48 więcej stanów, mających za sobą inne 50 rzędów dla zmiennego x2.
xl
1965 1970 1975 1980 1985
Arkansas 100.0 110.5 118.7 131.2 160.4
AZ 100.0 104.3 113.8 120.9 140.6,
Jeżeli datafile z tym rodzajem struktury będzie przeczytany do gretl, 3, program zinterpretuje kolumny jako odmienne zmienne, więc dane nie będą użyteczne “jako jest.” Ale jest mechanizm dla poprawiania sytuacji, mianowicie funkcja stosu w genr rozkazie.
Rozważ pierwszą kolumnę danych w fragment powyżej: pierwsze 50 rzędów tej kolumny tworzy rozgniewaną sekcję dla zmiennego xl w roku 1965.. Jeżeli moglibyśmy utworzyć nową zmienną przez układanie w stóg
3Note, że będziesz musieć zmodyfikować taki datafile nieznacznie zanim to może zostać przeczytane w ogóle. Linia zawierająca zmiennym imieniem (w tym przykładem xl) jest musiana, by zostać usunięta i tak chce początkowy rząd zawierający lata, inaczej oni będą wzięci jako numeryczne dane.
Rozdział 4.. Dane włączają do dokumentacji
25
pierwszych 50 wejść w drugiej kolumnie pod pierwszymi 50 wejściami w pierwszym, po drodze robilibyśmy dane ustawiły “przez obserwację” (w pierwszym dwóch form wspomnianych powyżej, ułożony w stóg rozgniewane sekcje). To jest, mielibyśmy kolumnę obejmującą rozgniewaną sekcję dla xl w 1965, mającym za sobą rozgniewaną sekcję dla tej sam zmiennej w 1970..
Następny gretl scenariusz ilustruje jak możemy skończyć układanie w stóg, dla zarówno xl, jak i x2. Zakładamy, że oryginalny plik danych nazywa się panel.txt i, że w tym pliku kolumny są zmierzane z “zmienne imiona” pi, p2..., p5. (Kolumny nie są naprawdę zmiennymi, ale w pierwszej kolejności “udajemy” , że są oni.)
otworzyć panel.txt
genr xl = stos(pl..p5) --długość = 50
genr x2 = stos(pl..p5) --wyrównać = 50 --długość = 50
setobs 50 1:1 --sklep układałeś w stóg -krzyżujesz-sekcji panel.gdt xl x2, który druga linia ilustruje składnię funkcji stosu. Podwójne kropki w parenthe ses wskazują zasięg zmiennych, by zostać ułożony w stóg: tu chcemy ułożyć w stóg wszystkie 5 kolumien (dla wszystkich 5 lat). Zbiór danych fuli zawiera 100 rzędów; w układaniu w stóg zmiennego xl chcielibyśmy przeczytać tylko pierwsze 50 rzędów od każdej kolumny: osiągamy to przez dodawanie --długość = 50.. Zauważ, że, jeżeli chcesz ułożyć w stóg nieciągły zbiór kolumien, możesz położyć rozdzieloną przez przecinek listę w nawiasach, jako w
genr x = stos(pl, p3, p5)
Na linii 3, które robimy układanie w stóg dla zmiennego x2. Znów chcemy alengthof50 dla komponentów ułożonych w stóg serii, ale ten raz chcemy, by gretl zaczął czytanie od 50. rzędu oryginalnych danych i wyszczególniamy --wyrównać = 50.. Linia 4 narzuca danym interpretację panelu; w końcu, ratujemy dane w gretl formacie, z interpretacją panelu, zrzucając oryginał “zmienne” pi przez p5.
Obrazujący scenariusz powyższy jest odpowiedni kiedy numer z zmienny zostać przetworzony jest smali. Kiedy wtedy jest wiele zmiennych w danych ustawić to będzie bardziej skuteczny, by użyć rozkazu robią pętlę, by skończyć układanie w stóg, jako pokazany w następnym scenariuszu. Struktura jest przypuszczona, by być tym samym jako w poprzednia sekcja (50 częściach, 5 okresach), ale z 20 zmiennymi niż 2.
otwarta panel.txt pętla dla ja = 1..20
genr k = ($ ja - 1) * 50
genr x $ ja = stos(pl..p5) --wyrównaj = k --długość = 50 endloop
setobs 50 1.01 --sklep układałeś w stóg -krzyżujesz-sekcji panel.gdt xl x2 x3 x4 x5 x6 x7 x8 x9 xl0 \ marker danych
Panelu x20 xl9 xl8 xl7 xl6 xl5 xl4 xl3 xl2
xli zawiązuje
To może być pomocny z danymi panelu, by mieć obserwacje zostały zidentyfikowane przez mnemoniczne markery. Specjalna funkcja w genr rozkazie jest dostępna w tym celu.
W przykład powyżej, sądzą wszystkie stany jest zidentyfikowany przez kody dwóch listu w najdalszej na lewie kolumnie oryginalnego datafile. Kiedy układające w stóg działanie będzie wykonane, te kody będą ułożone w stóg wraz z wartościami danych. Jeżeli pierwszy rząd jest oznaczony Arkansas dla Arkansas, wtedy marker Arkansas skończy się bycie pokazane na każdym rzędzie zawierającym obserwację dla Arkansas. Thafs zupełnie bardzo dobrze, ale te markery nie mówią nam niczego o dacie obserwacji. Aby prostować to, które moglibyśmy zrobić:
Rozdział 4.. Dane pliki
26
genr czas
genr rok = 1960 + (5 * czas)
genr markery = "% s:% d", marker, rok pierwsza linia wygenerowuje 1-oparty indeks reprezentujący okres każdej obserwacji i druga linia używa zmiennej czasu, by wygenerować zmienną reprezentującą rok obserwacji. Trzecia linia zawiera tę specjalną cechę: jeżeli (i tylko, jeżeli) imię nowej “zmiennej” by wygenerować jest markerami, porcją rozkazu podążającego eąuals znak jest wzięty jako sznur formatu C stylu (które musi zostać zawinięte w podwójnym ąuotes), mający za sobą rozdzielony przez przecinek wykaz dyskusji. Dyskusje będą drukowane zgodnie z podanym formatem, by utworzyć nowy zbiór markerów obserwacji. Ważne dyskusje są jeden z dwóch imion zmiennych w zestawie danych lub marker sznura, który oznacza wstępnie istniejący marker obserwacji. Format specifiers, który jest prawdopodobny być przydatny w tym kontekście, są % s dla sznura i % d dla całości. Sznury mogą zostać skrócone: na przykład %.3s użyje tylko pierwszych trzech charakterów sznura. Siekają początkowe charaktery poza istniejącym markerem obserwacji budując nowy jeden, możesz użyć markera składni + n, gdzie jest n liczbą całkowitą dodatnią: w przypadku pierwsze n charaktery będą opuszczone.
Po rozkazach powyżej jest przetworzony, wtedy, markery obserwacji będą spoglądać jak, na przykład, Arkansas:1965, gdzie są kod stanu dwóch listu i rok obserwacji splecione razem z dwukropkiem.
4.6 Brakujących wartości danych
Ci są reprezentowani wewnątrz jako DBL_MAX, największa liczba zmiennopozycyjna, która może być rewstępnie sented na systemie, (które jest prawdopodobne być co najmniej 10 do władzy 300 i tak nie powinien zostać zdezorientowany z prawowitymi wartościami danych). W pliku danych ojczystego formatu oni powinni zostać reprezentowany jako NA. Importując CSV dane gretl akceptuje kilka wspólnych reprezentacji brakującego wartości cluding -999, sznur NA (w górnym lub niższym przypadku), pojedyncza kropka lub po prostu czysty celi. Czyste komórki powinny oczywiście właściwie zostać wytyczony, np. 120.6, 5.38, wewnątrz, które średnia wartość jest przypuszczona brakujący.
Jeśli chodzi o sprawowanie się gubienia wartości w trakcie statystycznej analizy, gretl robi co następuje:
W obliczaniu opisowych danych (środek, odchylenie standardowe, itd..) pod streszczenie command, chybiające wartości po prostu są opuszczone i wielkość próbki dostosowała właściwie.
Wewnątrz bieżący regresje gretl pierwszy dostosowuje początek i koniec zasięgu próbki, trun-cating próbka jeżeli zajdzie taka potrzeba. Gubiąc wartości na początku próbki są wspólne w samą porę serie pracują z powodu wtrącenia opóźnień, najpierw różnice i tak dalej; gubiąc wartości na końcu zasięgu nie są niezwykłe z powodu zróżnicowanego uaktualniania serii i prawdopodobnie wtrącenie z prowadzi.
Jeżeli gretl wykrywa jakieś brakujące wartości “wewnątrz” (prawdopodobnie okrojonym) zasięgiem próbki dla regresji, skutek zależy od charakteru zestawu danych i kosztorysanta chosen. W wielu przypadkach, program jest, że automaticaily opuszcza brakujące obserwacje obliczając skutki regresji. W tej sytuacji wiadomość jest drukowana stwierdzając, jak wiele obserwacji zostało upuszczonych. Z drugiej strony skakanie gubienia obserwacji nie jest poparte dla wszystkich postępowań: wyjątki zawierają wszystkich autoregressive kosztorysantów, kosztorysantów systemu taki jak SUR i nieliniowy mały sąuares. W przypadku danych panelu, skakania gubienia obserwacji jest poparty tylko, jeżeli ich opuszczenie zostawia wyważony panel. Jeżeli chybiające obserwacje są znalezione w przypadkach, gdzie są oni nie poparci, gretl daje komunikat błędu i odmawia doprowadzić do ocen.
W przypadku chybiającym wartości w środku prezentu zestawu danych problem, misszero funkcja (użycie starannie!) jest dostarczony pod genr rozkazem. Przez robienie genr foo = misszero(bar) oprócz którego możesz doprowadzić do serie foo, który jest identyczny, by sprzeciwić się, że jakieś brakujące wartości zostają zera. Wtedy
Dzieli
na
rozdziały 4.. Dane rejestrują
27 możesz użyć ostrożnie został zbudowany zmienne smoczka, by, w rezultacie, upuścić brakującym obserwacjom od regresji kiedy zatrzymujący otaczający próbka rangę.4
4.7 Rozmiar maksymalny zbiorów danych
Zasadniczo, wielkość zbiorów danych (zarówno numer zmiennych, jak i numer obserwacji na zmiennym) jest ograniczony tylko przez cechy twojego komputera. Cretl wydziela wspomnienie dynami-cally i spytają obsługiwaniu systemu dla jak dużo wspomnienie jako twój dane reąuire. Oczywiście wtedy, ostatecznie jesteś ograniczony przez wielkość RAM.
Oprócz wielokrotna precyzja OLS opcji, gretl używa liczb zmiennopozycyjnych podwójnej precyzji całkowicie. Wielkość takich numerów w bajtach zależy od platformy komputera, ale jest typowo ośmiu. Aby dać szorstkie pojęcie wielkości, sądzimy my mają zbiór danych z 10,000 obserwacjami na 500 zmiennych. Thafs 5 milion liczba zmiennopozycyjna lub 40 milionów bajtów. Jeżeli definiujemy megabajt (MB) jako 1024 x 1024 bajtów, jako jest standardem w rozmawianiu o RAM, to jest nieznacznie ponad 38 MB. Program potrzebuje dodatkowego wspomnienia dla workspace, ale mimo to radzenie zbioru danych tej wielkości powinno być ąuite wykonalnym na aktualne PC, którym w czasie pisania jest prawdopodobny mieć co najmniej 256 MB RAM.
Jeżeli RAM nie jest zagadnieniem, jest dalsze ograniczenie na wielkości danych (chociaż to jest bardzo nieprawdopodobne być wiążącym ograniczeniem). To jest, zmienne i obserwacje są zaopatrzone w spis przez podpisane całości i na typowym PC ci będą wartościami 32-kawałka, kompetentnymi reprezentowania maksimum pozytywnej wartości
231 - 1 = 2,147,483,647.
Ograniczenia wspomniały powyższy odnieść się do “krajowiec” funkcjonalności gretl's. Są bardziej ściśnięte ograniczenia w odniesieniu do dwóch programów trójka partii, które są dostępne, jako rozszerzenia do gretl dla pewnych rodzajów analizy czas serii w tym sezonowe dostosowanie, mianowicie TRAMO / MIEJSCA i l X 2-ARIMA. Ci programs zajęcie przydział pamięci naprawiłeś-wielkości i nie może sprawować się serie z więcej niż 600 observa-tions.
4.8 zbiorów pliku Danych,
Jeżeli używasz gretl w kontekście nauczania, możesz interesować się dodawaniem zbioru plików danych i / lub scenariusze, które odnoszą specificaily do twojego kursu, w takiej drodze, że studenci mogą przeglądnąć i wejść ich łatwo.
Są trzema sposobami wejścia takich zbiorów plików:
• Ponieważ dane rejestrują: wybrać rzecz menu “Plik, Otwarte dane, Próbka plik”lub kliknąć na ikonę folderu
na gretl pasku narzędzi.
• Ponieważ scenariusz rejestruje: wybrać rzecz menu “Plik, Scenariusz pliki, Praktyka plik”.
Kiedy użytkownik wybiera jedną z rzeczy: danych lub plików scenariusza włączanych do gretl dystrybucji automatycznie jest pokazany (to plik włączalny odnoszący się do Wstępnego Econometrics Ramanathan's i Ekonometrycznej Analizy Greene's).
Program szuka pewnych znanych zbiorów plików danych dostępny jako opcjonalne dodatki, na przykład datafiles od różnych econometrics podręczników (Davidson i MacKinnon, Gujarati, Towar i Watson, Verbeek, Wooldridge) i Stół Świata Penn (PWT 5.6). (Zobacz, że dane przywołują < http://gretl.sourceforge.net/gretl_data.html > w gretl stronie internetowej dla informacji o tych zbiorach.) Jeżeli dodatkowe pliki są znalezione, oni są dodani do okien wyboru.
4genr również oferuje irwerse funkcję do misszero, mianowicie zeromiss, który zastępuje zera w danym seriach z brakującym kodem obserwacji.
Rozdział 4.. Dane włączają do dokumentacji
28
• Program wtedy szuka ważnych zbiorów pliku (nie koniecznie znanych z góry) w tych miejscach: katalog danych “systemu” , katalog scenariusza systemu, katalog użytkownika i wszystkie pierwszy równe subdirectories tych. Dla odniesienia, typowe wartości dla tych katalogów są pokazane w Stół 4.1. (Zauważ tak OSOBISTY jest znakiem - wypełniaczem, który jest rozszerzony około, Windows, odpowiedni do “Moich Dokumentów” dalej angielski język systemami.) PANI
Linuks Windows
system data dir / usr / udział / gretl / dane c:\ Program < plik:// c:/ Program > Pliki \ gretl \ scenariusz
systemu danych dir / usr / udział / gretl / scenariusze c:\ Program < plik:// c:/ Program > Pliki \ gretl \
użytkownik scenariuszy dir SHOME / gretl OSOBISTY \ gretl
Stół 4.1: Typowe miejsca, ponieważ włącz do dokumentacji zbiory
Trochę ważne zbiory będą dodane do okien wyboru. Tak co tworzy ważny plik collec-tion? To obejmuje jeden z dwóch zbiorów plików danych w gretl XML formatu (z .gdt przyrostek) lub zbiór plików scenariusza zawierających gretl rozkazy (z .inp przyrostek), w każdym przypadku w towarzystwie “pliku głównego” lub katalogu. gretl dystrybucja zawiera kilka plików katalogu przykładu, na przykład opisy pliku w misc łodzi podwodnej katalogu katalogu danych gretl i ps_descriptions w misc łodzi podwodnej katalogu katalogu scenariuszy.
Jeżeli dodajesz twój własny zbiór, katalogi danych powinny zostać nazwane opisami i katalogi scenariusza powinny zostać nazwane ps_descriptions. Wewnątrz każdy przypadek katalog powinien zostać umieszczony (wraz ze zrzeszonymi danymi lub plikami scenariusza) w jego własnym określonym podkierującym (np. / usr / udział / gretl / dane / mydata < plik:/// usr / udział / gretl / dane / mydata > lub c:\ userdata \ gretl \ dane \ mydata < plik:// c:/ userdata / gretl / dane / mydata >).
Składnia plików opisu (czystego tekstu) jest bezpośrednia. Tu, na przykład, są pierwszymi mało liniami katalogu danych “misc” gretl's:
# Gretl: różny obrazujący datafiles
"arma","sztuczne dane dla przykład scenariusza ARMA"
"ects_nls"", Nieliniowy najmniejszy przykład kwadratów"
"hamilton"", Wyceniają i tempo wymiany, USA i Włochy" pierwsza linia, która musi rozpocząć od znaku haszyszu, zawiera krótkie imię, tu “Gretl”, który wyda się jako etykieta dla tabulatora tego zbioru w oknie przeglądarki danych, mającym za sobą dwukropek, mającym za sobą opcjonalny krótki opis zbioru.
Subseąuent linie zawierają dwa elementy, oddzielne przez przecinek i zawinięte w podwójnych ąuotation znakach. Pierwszy jest datafile imieniem (odejść .gdt przyrostek tu) i drugi jest krótkim description zawartości tego datafile. Powinna być jedna taka linia dla każdego datafile w zbiorze.
Plik katalogu scenariusza wygląda bardzo podobny, oprócz tego tam są trzema polem w liniach pliku: nazwa zbioru (bez jego .inp przyrostek), krótki opis ekonometrycznego punktu zilustrował w scenariuszu i krótki znak natury danych użył. Co więcej tu jest pierwsze mało linii dostarczonego katalogu scenariusza “misc” :
# Gretl: różna próbka pisze scenariusz według
"arma","ARMA modelujący","sztuczne dane"
"ects_nls","Nieliniowe najmniejsze kwadraty (Davidson)","sztuczne dane" "dźwignięcie","Wpływowe obserwacje","sztuczne dane" "longley","Multicollinearity","USA zatrudnienie"
Jeżeli chcesz zrobić twoje własne gromadzenie danych dostępne dla użytkowników, ci są kroki:
1.. Złóż dane, w jakimkolwiek formacie jest dogodny.
Rozdział 4.. Dane pliki
29
Przerabia dane do gretl formatu i zaoszczędza jako gdt pliki. Jest prawdopodobnie najłatwiejsze przerobić dane przez importowanie ich do programu od czystego tekstu, CSV lub formatu arkusza kalkulacyjnego (PANI Excel lub Gnumeric) wtedy zaoszczędzająca ich. Możesz zechcieć dodać opisy indywidualnych zmiennych ( “Zmienna, Wydać cechy” rzecz menu)i dodać informację o źródle danych ( “Dane, Wydać informacja” rzecz menu).
Napisz, że opisy rejestrują dla zbioru używającego edytora tekstowego.
Połóż datafiles więcej opisy rejestrują w subdirectory katalogu danych gretl (lub katalog użytkownika).
Jeżeli zbiór ma zostać rozprowadzony do innych ludzi, paczki pliki danych i katalog wewnątrz trochę odpowiedni sposób, np. jako zipfile.
Jeżeli składasz taki zbiór i dane nie są własnościowe, zachęcilibyśmy cię do przedłożenia zbioru dla pakowania jako gretl opcjonalny dodatek.
Rozdział 5
Specjalny działa w genr
5.1. Wprowadzenie polecenia genr umożliwia generowanie nowych zmiennych. Zostaało to omówione w Odniesieniu Rozkazu Gretl.
5.2 Długo biegnie niezgodności
Jak dobrze wiadomo, niezgodność średnia T przypadkowe zmienne x \, X2 ..., xj z eąual ance a2 eąuals a2 TO, jeżeli dane być unzestawia. W tym przypadku, niezgodności próbki xt ponad wielkość próbki dostarcza stałego kosztorysanta.
Jeżeli, jakkolwiek, jest seryjna korelacja między xts, niezgodnością X = T ^ 1 Yl = ixt musi zostać oszacowany różnie. Jedne z najwięcej szeroko użytych danych w tym celu jest kosztorysantem jądra nonparametric z Bartlett jądrem zdefiniowanym jako
T-k
ćb2(k) = r-1 X
t = k
k
^ wt(xt - X)(xt-ja - X) ja =-k
(5.1)
gdzie jest całość k znany jako okno wielkość i wi okresy są tak zwanym Bartlett wagi, zdefiniowane jako w ja = 1 - ^ j. To może zostać pokazane tak, ponieważ k duży dość, ćb2(k)/ T produkcje stały kosztorysant niezgodności X.
Gretl wprowadza w życie tego kosztorysanta około znaczy funkcji 1 rvar(), które bierze dwie dyskusje: serie, których długo biegnie niezgodność muszą być estimated i skalara k., Jeżeli k jest przeczący, popularny wybór T1 / 3 jest użyty.
5.3 Czas serie filtrów
Jeden rodzaj z wyspecjalizował się funkcja w genr jest czas przesączaniem serii. Oprócz zwykłego stosowania opóźnień i różnic, gretl dostarcza nieznaczne odróżnianie i dwa filtry zwykle użyły wewnątrz macroeconomics dla rozkładu trend cyklu: Hodrick-Prescott filtr (Hodrick i Prescott, 1997) i Baxter Król bandpass filtr (Baxter i Król, 1999).
Nieznaczne odróżnianie pojęcie odróżniania serie czasu d czasami jest dość oczywiste kiedy d jest całością; to może wydać się nieparzysty kiedy jest d nieznaczny. Jakkolwiek ten pomysł ma dobrze zdefiniowaną matematyczną zawartość: rozważa funkcja
f(z) = (1 - z)~ d,
gdzie z i d jest prawdziwymi numerami. Przez branie Taylor rozwinięcia w szereg dookoła z = 0, widzimy, że
r d(d + 1) T
j (z) = 1 + dz H z + ■ ■ ■
30
Rozdziału 5.. Specjalne funkcje wewnątrz genr
31
lub, więcej zwięźle,
co f(z) = 1 + X * 12-1
z
Y \ ja = ja(d + l mnie) d + l
< Pk = n = < Pk-ja
k \ k tym samym ekspansja może zostać użyta z opóźnieniem operator, więc, że, jeżeli zdefiniowaliśmy
Yf = (1 - L)0SXt to mógłby zostać rozważony shorthand, ponieważ
Yt = Xt - 0.5Xt_i - 0.125Xt_2 - 0.0625Xt_3 - ■ ■ ■
Wewnątrz gretl to transformacja może być dokonana około składnia genr Y = fracdiff(X, 0.5) Hodrick-Prescott filtr
To przesączają jest wchodzony używając hpfiltO funkcję, która bierze jednemu dyskusję, imię zmiennej, by być przetworzona.
Seriami czasu yt może zostać rozłożony do trend lub wzrost składowego gt i cykliczny składowy
Ct-
yt = dt + Ct, t = l, 2..., T Hodrick-Prescott filtr powoduje taki rozkład około pomniejszając co następuje:
t r-ja
(yt - gt) + 2 ^ {(gt + ja - gt) - (gt - gt-ja))
t = l t = 2 pierwszy okres powyższy jest sumą sąuared cyklicznego komponenty ct = yt - gt- drugi okres jest wielokrotnością sumy sąuares trendu componenfs drugi różnice. To drugi okres karze odmiany wewnątrz wzrost tempo trendu składowego: większy wartość z, wyższy jest karą i odtąd przedmiot wygładzający trend serie.
Notatka tak hpfilt funkcja w gretl doprowadza do cyklicznego komponentu, ct, oryginalnych serii. Jeżeli chcesz wygładzony trend, możesz odjąć cykl według oryginału:
genr ct = hpfilt(yt) genr gt = yt - ct
Hodrick i Prescott (1997) sugerować tak wartość z = 1600 jest rozsądny, ponieważ ąuarterly dane. wartość domyślna wewnątrz gretl jest 100 razy sąuare danych freąuency (które, oczywiście, produkcje 1600, ponieważ ąuarterly dane). wartość może zostać dostosowana używając zbiór rozkaz, z parametrem hp_lambda. na przykład, zbiór hp_lambda 1200. Baxter i Król filtr
To przesączają jest wchodzony używając bkfilt() funkcja, która znów bierze imię zmiennej, by być przetworzona jako jego pojedyncze dyskusja.
Rozważyć upiorną reprezentację czasu serie yt \
rTT
yt = elwdZ(co)
-TT
Rozdział 5. Specjalny funkcje wewnątrz genr
32,
By ekstrahować część składowa yt tak kłamstwa pośrodku freąuencies co i co można, by stosować bandpass futer:
c * = F *(co)e"° dZ(co)
-TT,
gdzie F *(co) = 1, ponieważ co < | co | < co i 0, gdzie indziej. To sugerowałby, wewnątrz czas domena, stosowanie do serii filtr z nieskończony numerować współczynników, których jest niepożądany. Baxter i Król bandpass filtr odnosi się do yt ograniczony wielomian wewnątrz opóźnienie operator(L):
et =(L)yt,
gdzie jest(L) zdefiniowany jako
k(L) = ^ CLiL1 ja =-k współczynniki ai jest wybrany taki tak F( co) =(elw)(e ~ lw) jest thebest przybliżenie toF *(co) ponieważ podany k. Wyraźnie, wyższy k lepszy przybliżenie jest, ale odtąd 2k obserwacje muszą być niepotrzebne, kompromis zwykle jest szukany. Ponadto, filtr ma również inne błagalne teoretyczne własnościami, między które własność tak(l) = 0, więc serie z pojedynczą częścią korzeń jest zrobiony stacjonarny około stosowanie filtra.
w praktyce, filtr zwykle być używany z miesięcznym lub ąuarterly dane, by ekstrahować “cykl interesu” składowy, mianowicie komponent między 6 i 36 ąuarters. Zwykłe wybory, ponieważ k jest 8 lub 12 (być może wyższy dla miesięcznych serii). wartości domyślne, ponieważ freąuency granice są 8 i 32 i wartość domyślna dla przybliżenia porządek, k, jest 8. Możesz dostosować tych wartości używające zbiór rozkaz. słowo kluczowe dla ustawiania freąuency ograniczeń jest bkbp_limits i słowem kluczowym dla k jest bkbp_k. W ten sposób na przykład, jeżeli używałbyś miesięcznych danych i chciałbyś dostosować freąuency granice do 18 i 96 i k do 24, mógłbyś
ustawić bkbp_limits 18 96 zbiór bkbp_k 24
Ci, którzy wartości wtedy pozostałyby w mocy dla rozmów do bkfi 11 funkcja, aż zmieniony przez dalsze użycie zbioru.
5.4 Panel dane specyfiki Smoczek zmienne
Wewnątrz panel nauka, która możesz zechcieć zbudować smoczek zmienne jednego lub zarówno następnych rodzajów: () smoczki jako uniąue identyfikatory, ponieważ części lub grupuje i (b) smoczki jako uniąue identyfikatory, ponieważ czas okresy. były może zostać użyty, by pozwolić przejąć regresji, by poróżnić się przez części, ten drugi, by pozwolić przejąć, by poróżnić się przez okresy.
Dwa specjalny funkcje są dostępne, by utworzyć taki smoczki. Ci są znalezieni poniżej “Dodaj” menu wewnątrz GUI lub poniżej genr rozkaz wewnątrz napisać scenariusz według tryb lub gretlcli.
“smoczki części” (rozkaz scenariusza genr unitdum). To rozkaz tworzy zbiór smoczka zmienne identyfikujące rozgniewany przekrojowe części. zmienny du_l będzie mieć wartość 1 każdy rząd odpowiedni do części 1 obserwacja, 0 inaczej; du_2 będzie mieć wartość 1 każdy rząd odpowiedni do części 2 obserwacja, 0 inaczej; i tak dalej.
“smoczki czasu” { rozkaz scenariusza genr timedum). Ten rozkaz tworzy zbiór zmiennych smoczka identyfikujących okresy. Zmienny dt_l będzie mieć wartość 1 w każdym rząd corresponding do okresu 1 obserwacja, 0 inaczej; dt_2 będzie mieć wartość 1 w każdym rzędzie odpowiednim do okresu 2 obserwacja, 0 inaczej; i tak dalej.
1.. Rozdział 5.. Specjalne funkcje wewnątrz genr
33,
Jeżeli zbiór danych panelu ma ROK obserwacji wszedł do jako jedna ze zmiennych, możesz utworzyć okresowy smoczek, by wybrać szczególny rok, np. genr dum = (ROK = 1960). Możesz również utworzyć okresowe zmienne smoczka używające operatora modułu, %. Na przykład utworzyć smoczek z wartością 1 dla pierwszej obserwacji i każdej trzydziestej obserwacji od tego czasu, 0 inaczej,
genr zaopatruje w spis
genr dum = ((zaopatrujesz w spis l) % 30) = 0
Opóźnień, różnice, dąży,
Jeżeli okresy czasu równo są rozmieszczone, możesz zechcieć użyć zostały w tylu wartości zmiennych w regresji panelu (ale zobaczyć sekcję 15.2 poniżej); możesz również zechcieć zbudować najpierw różnice zmiennych zainteresowania.
Raz na zestaw danych jest zidentyfikowany jako panel, gretl będzie radzić pokolenie takich zmiennych poprawnie. Na przykład rozkaz genr xl_l = xl(-l) utworzy zmienną, która zawiera pierwsze opóźnienie xl, gdzie dostępnego i brakującego kodu wartości, gdzie jest opóźnienie nie dostępne, (np. na początku serii czasu dla każdej grupy). Kiedy przebiegniesz regresję używającą takie zmienne, program automatycznie opuści brakujące obserwacje.
Kiedy zbiór danych panelu ma dość konkretny wymiar czasu, możesz zechcieć zawrzeć trend w analizie. Rozkaz genr czas tworzy zmienną nazywaną czas, który biegnie od 1 do T dla każdej części, gdzie jest T długością wymiaru czas serii panelu. Jeżeli chcesz utworzyć indeks, który biegnie po kolei od 1 do m, × T, gdzie jest m numerem części w panelu, używa genr indeksu.
Podstawowe dane przez część funkcje pmean() i psd() może zostać użyty, by wygenerować basie opisowe dane (środek i odchylenie standardowe) dla danej zmiennej, na podstawie przez pośrednictwo -grupy.
Sądźmy, że mamy zbiór danych panelu obejmujący 8 obserwacji czas serii na każdej z N części lub grup. Wtedy rozkaz
genr pmx = pmean(x)
tworzy serie tej formy: pierwsze 8 wartości (odpowiednich do części 1) zawiera środek x dla części 1, następne 8 wartości zawiera środek dla części 2 i tak dalej. psd() zadziałaj pracuje w podobnym sposobie. Odchylenie standardowe próbki dla grupy ja jest policzone jako
11(X - Ksi)2
Si = .
V H - 1
gdzie Ti oznacza numer ważnych obserwacji na x dla danej części, Ksi oznacza środek grupy i streszczenie jest przez ważne obserwacje dla grupy. Jeżeli Tf < 2, jakkolwiek, odchylenie standardowe jest rejestrowane jako 0..
Jedno szczególne użycie psd() może być warta zauważając. Jeżeli chcesz utworzyć łódź podwodną próbkę panelu, który zawiera tylko te części, dla których zmienny x zmieniający się czasu, możesz zrobić
smpl (psd(x) > 0) --ogranicz
Specjalne funkcje dla manipulacja danych
Oprócz funkcji dyskutowała powyższy, są jakieś udogodnienia w genr zaprojektowanym szczególnie dla manipulowania danymi panelu - w szczególnym, dla przypadku, gdzie dane zostały przeczytane do programu z źródła trójka partii i oni nie są w poprawnej formie dla analizy panelu. Te udogodnienia są wyjaśnione w Rozdziale 4..
Rozdział 5.. Specjalne funkcje w genr
34
5.5 Ponownie pobierającym próbkę i ładowaniu początkowym
Inna wyspecjalizowała się funkcja jest ponownie pobieraniem próbki, z zastąpieniem, serii. Podany oryginalne serie danych x, rozkaz
genr xr = ponownie pobierz próbkę(x)
tworzy nowe serie, których każdy z czyich elementów jest narysowany na chybił trafił od elementów x., Jeżeli oryginalne serie ma 100 obserwacje, każdy element x jest wybrany z prawdopodobieństwem 1/100 w każdym rysunek. W ten sposób efekt jest do “shuffle” elementami x, ze zwrotem, że każdy element x może wydać się niejednokrotnie lub wcale nie, w xr.
Pierwszorzędowe użycie tej funkcji jest w konstrukcji przedziałów ufności ucha lub p-ceni. Tu jest prosty przykład. Sądźmy, że szacujemy prostą regresję y na x przez OLS i znajdujemy, że współczynnik zbocza ma doniesiony t stosunek 2.5 z 40 stopniami wolności. Ogoniasta dwa p wartość dla nuli hipotezy, że parametr zbocza eąuals zero jest wtedy 0.0166, używając t(40) dystrybucja. Zależąc od kontekstu, jakkolwiek, możemy zwątpić, czy stosunek współczynnika do błędu standardu naprawdę podąża t(40) dystrybucja. W tym przypadku moglibyśmy wyprowadzić p wartość ucha jako pokazany w Przykład 5.1.
Pod nuli hipotezą, że zbocze w odniesieniu do x jest zerem, y jest po prostu eąual do jego środka plus okres błędu. Symulujemy y przez ponownie pobieranie próbki reszty od początkowego OLS i odnośnie-szacujemy model. Powtarzamy to postępowanie bardzo dużo czasów i rejestrujemy numer przypadków, gdzie jest absolutna wartość t stosunku większa niż 2.5: proporcja takich przypadków jest naszą p wartością ucha. Dla dobrej dyskusji opartych na symulacji testów i ładowania początkowego, zobacz Davidson i MacKinnon (2004, rozdział 4).
Przykład 5.1: Obliczenie p wartość ucha
ols y 0 x,
chyba
że reszty genr ui = Suhat skalar ybar = znaczy(y)
numerują odpowiedzi, ponieważ skalar ucha replics = 10000
skalar tcount = 0 serie ysim = 0 pętla replics --spokój
# wygenerować udawany y około ponownie pobierający próbkę
ysim = ybar + ponownie pobrać próbkę(ui)
ols ysim 0 x
skalar tsim = abs($ coeff(x) / $ stderr(x))
tcount += (tsim > 2.5) endloop printf "proporcja przypadków z |t | > 2.5 = % g \ n", tcount / replics
5.6 Łączne gęstości i p wartości dwa funkcje cdf i pvalue dostarczają uzupełniające środki badania wartości od kilku dystrybucji prawdopodobieństwa: standard normalny, Studenfs t, x2, F, gamma i binominalny. Składnia tych funkcji jest określony w Odniesieniu Rozkazu Gretl; tu rozszerzamy na jakichś subtelnościach.
Łączna funkcja gęstości lub CDF, ponieważ przypadkowy zmienny jest całością gęstości zmiennej od jego granicy dolnej (typowo albo -oo lub 0) do trochę wyszczególnionej wartości x. p wartość (w
Rozdziale 5. Specjalny funkcje wewnątrz genr
35
najmniej ogoniasty tym, prawym p wartość jak wróciła około pvalue funkcję) jest uzupełniającym prawdopodobieństwem, całością od x do górnego ograniczenia dystrybucji, typowo + ∞.
W zasadzie dlatego, nie ma żadnej potrzeby dla dwóch odmiennych funkcji: podany CDF wartość po, który mógłbyś łatwo znaleźć odpowiednią p wartość jako 1 - po (lub vice versa). W praktyce z arytmetyką komputera ograniczonej precyzji, dwie funkcje nie są zbyteczne. Ten reąuires małe wytłumaczenie. W gretl, jako w najbardziej statystycznych programach, płynącym numery punktu jest reprezentowane jako “podwójne ilości” - wartości podwójnej precyzji, które typowo mają wielkość przechowywania ośmiu bajtów lub 64 kawałków. Od tam są tylko tyle kawałki dostępne, tylko tyle liczby zmiennopozycyjne mogą zostać reprezentowane: podwójne ilości nie modelują prawdziwej linii. Typowo podwójne ilości mogą reprezentować numery ponad zasięgiem (z grubszą) ± 1.7977 × 10308, ale tylko do około 15 cyfr precyzji.
Sądźmy, że interesujesz się lewym ogonem x2 dystrybucji z 50 stopniami wolności: chciałbyś znać CDF wartość dla x = 0.9. Spójrz na co następuje interakcyjną sesję
? genr pi = cdf(X, 50, 0.9)
Cenerated skalar pi (ID 2) = 8.94977e-35
? genr p2 = pvalue(X, 50, 0.9)
Cenerated skalar p2 (ID 3) = 1
? genr test = 1 - p2
Cenerated skalar test (ID 4) = 0 cdf funkcja doprowadziła do dokładnej wartości, ale pvalue funkcja udziela odpowiedzi 1, od którego to nie jest możliwe odzyskać odpowiedź na CDF ąuestion. To może wydać się surprising najpierw ale rozważa, jeżeli wartość pi powyżej jest poprawna, wtedy poprawna wartość, ponieważ p2 jest 1 -8.94977 × 10-35. Ale nie jest żadną drogą, jako która wartość może zostać reprezentowana podwójny: to zrobiłby reąuire ponad 30 cyframi precyzji to.
Oczywiście to jest ekstremalny przykład. Jeżeli x w ąuestion będzie nie zbyt daleko do jednego lub innego ogona dystrybucji, cdf i pvalue funkcje faktycznie doprowadzą do uzupełniających odpowiedzi, jako pokazany poniżej
? genr pi = cdf(X, 50, 30)
Cenerated skalar pi (ID 2) = 0.0111648
? genr p2 = pvalue(X, 50, 30)
Cenerated skalar p2 (ID 3) = 0.988835
? genr test = 1 - p2
Cenerated skalar test (ID 4) = 0.0111648
Ale moralny jest, że, jeżeli chcesz zbadać ekstremalne wartości, powinieneś uważać w wybieraniu funkcji potrzebujesz, w wiedzy, która ceni bardzo blisko, by wyzerować, może zostać reprezentowany jako podwójne ilości kiedy wartości bardzo blisko 1 nie może.
5.7 Obsługiwania chybiające wartości
Cztery specjalne funkcje są dostępne dla obsługiwania gubienia wartości. Boollowskie funkcja chybiająca() bierze imię zmiennej jako jego pojedyncza dyskusja; to powraca serie z wartością 1 dla każdej obserwacji, w której dana zmienna ma brakującą wartość i wartość 0 inaczej, (to jest, jeżeli dana zmienna ma ważną wartość w tej obserwacji). Funkcja ok() jest uzupełniający do chybiania; to jest tylko stenografia dla ona !chybiając (gdzie ! jest Boollowskie NIE operator). Na przykład to może policzyć brakujące wartości dla zmiennego x używającego
genr nmiss_x = suma(chybiająca(x)) funkcja zeromiss(), która znów bierze pojedyncze serie jako jego dyskusja, powraca serie, gdzie wszystkie wartości zera są zabierze się do brakującego kodu. To powinien zostać użyty z ostrożnością - to nie chce zdezorientować chybiających wartości i zer - ale to może być przydatne w jakichś kontekstach. Na przykład to może określić pierwszą ważną obserwację dla zmiennego x używającego
Rozdział 5.. Specjalne funkcje w genr
36
genr raz
genr xO = min(zeromiss(czas * ok(x))) funkcja misszero() robi przeciwieństwo zeromiss, to jest, to coiwerts wszystkie brakujące wartości, by wyzerować.
To może być warta komentując propagowanie gubienia wartości w genr formułkach. Ogólna reguła jest tak w arytmetycznych działaniach włączających dwie zmienne, jeżeli oba ze zmiennych ma brakującą wartość w obserwacja t wtedy wynikające serie również będą mieć brakującą wartość w t. Jeden wyjątek do tego reguła jest mnożeniem przez zerowy: zerowy razy brakująca wartość doprowadza do zera (odtąd to jest matematycznie ważny bez względu na nieznaną wartość).
5.8 Aportujących wewnętrznych zmiennych genr rozkaz dostarcza znaczy odzyskiwania różnych wartości obliczonych przez program w trakcie szacowania modeli lub testowanie hipotez. Zmienne, które mogą zostać odzyskane w ten sposób, są sporządzone listą w Odniesieniu Rozkazu Gretl; tu mówimy trochę więcej o specjalnych zmiennych $ test i $ pvalue.
Te zmienne trzymają się, odpowiednio, że wartość ostatnich danych testu obliczyła używające wyraźny rozkaz testowania i p wartość dla tych danych testu. Jeżeli żaden taki test nie został wykonany w czasie kiedy te zmienne są z bibliografią, oni doprowadzą do brakującego kodu wartości. “Wyraźne rozkazy testowania” ta praca w ten sposób są następująco: dodać (łączny test dla znaczenia koślawości ables dodał do modelu); adf (Powiększony Osioł Pełniejszy test, patrzcie poniżej); łuk (test dla ŁUKU); czau-czau (Czau-czau test dla strukturalnej przerwy); coeffsum (test dla sumy wyszczególnionych współczynników); cusum (Harvey Górnik t dane); kpss (KPSS stationarity test, żadna p wartość dostępna); lmtest (patrzcie poniżej); meantest (test dla różnicy środków); pomiń (łączny test dla znaczenia zmiennych pominął od modelu); zresetowane (KASOWANIE Ramsey's); ogranicz (ogólną linearną restrykcję); biegi (przebiega test dla losowości); testuhat (test dla normalności z końcowym); i vartest (test dla różnicy koślawości ances). W większości wypadków zarówno $ test i $ pvalue jest zgromadzony; wyjątek jest KPSS testem, dla którego p wartość jest nie aktualnie dostępna.
Ważny punkt, by zauważyć o tym mechanizmie jest, że wewnętrzne zmienne $ test i $ pvalue pisany, że za każdy razem jeden testów przechylił się powyższy jest wykonany. Jeżeli chcesz do odniesienia te wartości, musisz zrobić tak w poprawnym punkcie w seąuence gretl rozkazów.
Związany punkt jest, że kilka z rozkazów testu wygenerowują, domyślnie, więcej niż jedne dane testu i p-cenią; w tych przypadkach tylko ostatnie wartości są zgromadzone. Dostają właściwą kontrolę ponad odzyskaniem wartości przez $ test i $ pvalue, który powinieneś sformułować rozkaz testu w takiej drodze, że skutek jest jednoznaczny. Ten komentarz odnosi się w szczególnym do adf i lmtest rozkazów.
Domyślnie adf rozkaz wygenerowuje trzy warianty Osioł Pełniejszego testu: jeden bazował na regresji zawierającej stała, jedno używanie stały i linearny trend i jedne używające stała i ąuadratic trend. Kiedy życzysz do odniesienia $ test lub $ pvalue w związku z tym rozkazem, możesz skontrolować wariant, który jest rejestrowany przez używanie jedna z flag, --nc, --c, --et lub --ctt z adf.
Domyślnie lmtest rozkaz (które musi podążyć OLS regresję) wykonuje kilka diagnostycznych testów na regresji w ąuestion. Aby skontrolować co jest rejestrowany w $ test i $ pvalue powinieneś ograniczyć test używający jedną z flag -kloce, --autocorr, -kwadraty lub --biały.
Jako pomoc w pracowaniu z wartościami odzyskanymi używającymi $ test i $ pvalue, natura testu, do którego te wartości wykazują, jest napisana do opisowej etykiety dla generowanej zmiennej. Możesz przeczytać etykietę dla zmiennej używającej 1 Abel rozkaz (z tylko jedną dyskusją, imię zmiennej), sprawdzić, że odzyskałeś właściwą wartość. Co następuje interakcyjna sesja ilustruje ten punkt.
Rozdział 5.. Specjalne funkcje w genr
37
? adf 4 xl --c
Powiększył Osioł Pełniejsze testy, zamawia 4, dla wielkości
próbki xl 59
część korzeń nuli hipotezy: = 1
test ze stałym
modelem: (1 - L)y = bO + (l)* y(-l) + ... + e
oszacował wartość z ( - 1): -0.216889 danych
testu: t = -1.83491
asymptotycznej p wartości, którą 0.3638 P wartości bazowało na MacKinnon (JAE, 1996) ? genr pv = $ pvalue
Cenerated skalar pv (ID 13) = 0.363844 ? etykieta pv
pv = Osioł Pełniejszy pvalue (skalar)
5.9 Numeryczne postępowania
Dwa specjalne funkcje są dostępne, by pomóc w konstrukcji kosztorysantów specjalnego celu, mianowicie BFGSmax (BFGS maximizer, dyskutowany w Rozdziale 17) i fdjac, który doprowadza do przybliżenia przedniej różnicy do Jacobian.
BFGS maximizer który BFGSmax funkcja bierze dwóm dyskusjom: wektor trzymający się początkowe wartości zbioru z parame-ters i cali do funkcji, która oblicza (skalarowi) kryterium, by zostać zmaksymalizowana, podanej aktualny parametr wartości i trochę inne związane dane. Jeżeli przedmiot jest faktycznie pomniejszeniem, ta funkcja powinna powrócić przeczący kryterium. Dalej pomyślne zakończenie, BFGSmax wraca maxi-mized wartość kryterium i macierz podana przez pierwszy dyskusję trzyma parametr wartości, które doprowadzają do maksimum. Tu jest przykład:
macierz X = { zestaw danych }
macierz theta = { 1, 100 } '
skalar J = BFCSmax(theta, ObjFunc(& theta, & X))
To jest założone tu, że ObjFunc jest użytkownik dehned funkcją (widzą Rozdział 10) z co następuje ogólną organizacją:
funkcja ObjFunc (macierz * theta, macierz * X)
skalar val = ... # zrób jakiejś funkcji końca val skalar
powrotu obliczenia działanie BFGS maximizer może zostać dostosowany używające zmienne zbioru bfgs_maxiter i bfgs_toler (widzą Rozdział 17). Ponadto możesz sprowokować wielomówną produkcję od maximizer przez przydzielanie pozytywną wartość max_verbose, znów przez rozkaz zbioru.
Rosenbrock funkcja często jest użyta jako problem testu dla algorytmów optymalizacji. To jest również znane jako “Dolina Rosenbrock's” lub “Funkcja Banana Rosenbrock's”, z powodu faktu, że jego warstwice są ukształtowane przez banan. To jest zdefiniowane około:
f(x, y) = (1 - x)2 + 100(y - x2)2 funkcja ma globalne minimum w (x, y) = (1,1) gdzie f(x, y) = 0.. Przykład 5.2 pokazuje gretl scenariusz, który odkrywa minimum używające BFGSmax (dający wielomówny opis postępu).
Rozdział 5.. Specjalne funkcje w genr 38
Przykładu 5.2: Znajdując minimum
funkcji funkcji Rosenbrock Rosenbrock(macierz * param)
skalar x = param,[l,]
skalar y = param,[2,]
skalar f = -(x l)A2 - 100 * (y - xA2)funkcja końca f skalar
powrotu A2
nulldata 10
macierz theta ={ 0,0 }
zbiór max_verbose 1
M = BFCSmax(theta, Rosenbrock(& theta))
drukować theta
Liczący Jacobian
Cretl oferuje możliwość odróżniania numerycznie zdefiniowana na użytkowniku funkcja przez fdjac funkcję.
Ta funkcja znów bierze dwie dyskusje: n x 1 macierz trzymający początkowe wartości parametru i funkcja cali, który oblicza i powraca anmxl macierz, dane aktualne wartości parametru i jakieś inne związane dane. Na pomyślnym zakończeniu to powraca anmxn macierz trzymającą Jacobian. Na przykład
macierz Jac = fdjac(theta, SumOC(& theta, & X))
gdzie zakładamy, że SumOC jest zdefiniowaną na użytkowniku funkcją z następną strukturą:
funkcja SumOC (macierz * theta, macierz * X)
macierz V = ... # zrób jakiejś funkcji końca V macierz
powrotu obliczenia
To może wejść zręczny w kilku przypadkach: na przykład, jeżeli używasz BFGSmax, by oszacować model, możesz zechcieć obliczyć numeryczne przybliżenie do związanego Jacobian zbudować macierz kowariancji dla twoich ocen.
Inny przykład jest metodą delty: jeżeli masz stałego kosztorysanta wektora parametrów 6 i stałej oceny jego macierzy kowariancji 2, możesz musieć policzyć oceny dla nieliniowa ciągła transformacja ip = g(6). Wewnątrz ten przypadek, skutek standardu, którym wewnątrz asymptotyczna teoria jest tak
{
6- * d ja, [ (p = g(6)-> ip = g(6) |
VT, [6 - 6) -* N(0,2) J, [ vT (ip - ip)-* N(0, JI, J') J,
gdzie jest T próbką wielkość i J jest Jacobian v *
wół \ x = 6
Scenariusz 5.3 exemplihes taki przypadek: przykład jest wzięty od Greene (2003), sekcja 9.3.1. lekkie różnice pośrodku skutki zgłosiły w oryginalnym źródle i czym, że gretl powroty są z powodu faktu tak Jacobian jest policzony numerycznie, niż analitycznie jako wewnątrz książka.
Rozdział 5. Specjalny funkcje wewnątrz genr
39
5.10 dyskretny Fourier przekształca dyskretnego Fouriera przekształcać może najlepiej zostać przemyślany z jako linearny, iiwertible przekształca złożonego wektora. Odtąd, jeżeli x jest n wymiarowym wektorem fc-th element jest x ^ = ^ + Izabella ^, wtedy produkcja dyskretnego Fouriera przekształcają jest wektorem f = F(x) fc-th element jest l r _ V" „-ia)(J, fc)„.
gdzie co(j, k) = 2ni ^. Odtąd transformacja jest invertible, wektorem x może zostać wyzdrowieć z f przez tak zwany odwrotny przekształcić
, l „ _ _ V" piw(j, k) f.
£.-ja J
j = och Fourier przekształcają być używany w wielu rozmaitych sytuacjach dalej rozliczać się tego klucz własność: konwulsjami dwóch wektory mogą zostać wykonane skutecznie około mnożąc elementy ich, który Fourier przekształca i odwracając skutek. Jeżeli
n
j = l
wtedy
F(z) = F(x) och F(y).
To jest, J?(z)fc = F(x)fcF(y)fc.
Dla liczenia Fouriera przekształcają, gretl używa zewnętrznej biblioteki fftw3: zobaczyć Frigo i Johnson (2003). To gwarantuje ekstremalną szybkość i dokładność. faktycznie, CPU czas potrzebował zagrać przekształcić jest Och(nlogn) ponieważ trochę n. To jest, dlaczego wybór numerycznego techniąues zatrudnił wewnątrz fftw3 zwykle jest znany jako Szybki Fourier Przekształca.
Gretl dostarcza dwa macierz functions1 dla wykonywania Fouriera przekształcają i jego odwrotnego: fft i ffti. faktycznie, gretl's wprowadzenie Fouriera przekształcić jest nieco więcej wyspecjalizuje się: wejście do fft funkcja jest zrozumiana, by być prawdziwa. Odwrotnie, ffti bierze złożoną dyskusję i dostarcza prawdziwy skutek. na przykład:
xl = { 1 ; 2 ; 3 }
zagrać przekształcić f = fft()
wykonać irwerse przekształcać x2 = ffti(f)
# produkcje
X \ =
f =
6 0
1.5 0.866 1.5 -0.866
X2 =
gdzie pierwszy kolumna f trzyma prawdziwą część i drugi trzyma złożoną część. Ogólnie, jeżeli wejście do fft ma n kolumny, produkcja ma 2n kolumny, gdzie są prawdziwe części zgromadzone nieparzyste kolumny i złożone części wewnątrz nawet. Powinien to być konieczny, by policzyć Fouriera przekształcają dalej kilka wektory z tym samym numerują elementów, to jest numerycznie więcej skuteczne grupować ich do macierzy niż odwołując się do fft, ponieważ każdy wektor oddzielnie.
lSee rozdział 12.
Rozdział 5. Specjalny funkcje wewnątrz genr
40
Jak przykład, rozważyć mnożenie dwóch polynomals: (x) = 1 + 0.5x b(x) = 1 + 0.3x - 0.8x2 c(x) =(x) · b(x) = 1 + 0.8x - 0.65x2 - 0Ax3 współczynniki wielomianu c(x) jest coiwolution coefficents(x) i b(x); fragment kodu następnego gretl ilustruje jak policzyć współczynniki c(x):
# zdefiniować dwa wielomiany = { 1, 0.5, 0, 0 } '
b = { 1, 0.3, -0.8, 0 } '
# zagrać przekształca
fa = fft()
fb = fft(b) złożony-mnoży dwa przekształca fc = cmult(fa, fb)
liczy współczynniki c przez odwrotny przekształcić c = ffti(fc)
Maksimum wydajność byłaby osiągnięta około grupując i b do macierzy. computa-tional korzyść jest tak mało to przypadek tak ćwiczenie jest trochę głupim, ale co następuje alternatywny może być lepszy, ponieważ bardzo dużo rzędów / kolumny:
zdefiniować dwa wielomiany ={ l ; 0.5; 0 ; 0 } b ={ l ; 0.3 ; -0.8 ; 0 }
zagrać przekształca jointly f = fft( ~ b) złożony-mnożyć dwa przekształca fc = cmult { f,[, 1:2], f[, 3:4])
policz współczynniki c przez odwrotny przekształcają c = ffti(fc)
Tradycyjnie, Fourier tranform w econometrics głównie został użyty w analizie czas serii, periodogram będącym najlepszy znany przykład. Przykład scenariusz 5.4 pokazuje jak policzyć periodogram serii czasu przez fft funkcję.
Rozdział 5.. Specjalne funkcje wewnątrz genr
41
Przykładu 5.3: Metoda Delty
funkcja MPC(macierz * param, macierz * Y)
ocena
dobra = param,[2,]
gamma = param,[3,]
y = Y,[l,]
macierz ret = ocena dobra * gamma * yA funkcja końca ret macierz
powrotu(l gamma)
# William Creene, Ekonometryczna Analiza, 5e, Dziel na rozdziały 9 echa
zbioru wyłączony
zbiór posyła wiadomość wyłączony otwarty greene5_l.gdt
# Użycie OLS, by zainicjować parametry
ols realcons 0 realdpi --cichy
genr = $ coeff(0)
genr b = Scoeff(realdpi)
genr g = 1.0
# Bieg NLS z analitycznym pochodne
nls realcons = + b * (realdpiAg)
deriv = 1 deriv b = realdpiAg
deriv g = b * realdpiAg * kloc(realdpi) kończy nls
macierz Y = realdpi,[2000:4,] macierz theta = Scoeff macierz V = $ vcv
mpc = MPC(& theta, & Y)
macierz Jac = fdjac(theta, MPC(& theta, & Y))
Sigma = qform(Jac, V)
printf "\ nmpc < plik:/// nmpc > = % g, std.err = % g \ n", mpc, sqrt(Sigma) skalar teststat = (l)/ sqrt(Sigma) printf "\ nTest < plik:/// nTest > ponieważ MPC = 1: % g (p wartość = % g)\ n", \ teststat, pvalue(n, abs(teststat))
Rozdział 5.. Specjalne funkcje wewnątrz genr
42
Przykładu 5.4: Periodogram przez Fouriera przekształca
nulldata 50
# wygenerować Arkansas(1) przetwarzają
serie e = normalny()
serie x = 0
x = 0.9 * x(-l) + e
# policzyć periodogram
skalę = 2 * pi *$ nobs
X = { x }
F = fft(X)
S = sumr(F.A2)
S = S,[2:($ nobs / 2)+ l,]/
omega skali = seq(l,($ nobs / 2))' .* (2 * pi /$ nobs)
omega = omega ~ S
# porównaj wbudowany rozkaz
pergm x
drukować omega
Rozdział 6 próbujący
Łodzi
podwodnej zestaw danych
6.1 Wprowadzenia
Jakieś subtelne zagadnienia mogą powstać tu. Ten rozdział usiłuje wyjaśnić zagadnienia.
Łódź podwodna próbka może zostać zdefiniowana w odniesieniu do pełnego umieszczonego dane w dwóch innych drogach: będziemy odnosić jako “ustawianie” próbki i “ograniczanie” próbki odpowiednio.
6.2 Ustawianie próbki
Przez “ustawianie” próbki znaczymy definiujące łódź podwodną próbkę po prostu przy pomocach dostosowywania startu i / lub kończąc punkt aktualnego zasięgu próbki. To jest prawdopodobny być najbardziej związany dla danych czas serii. Na przykład to ma kwartalne dane od 1960:1 do 2003:4 i to chce przebiegnąć regresję używającą tylko dane od 1970s. Odpowiedni rozkaz jest wtedy
smpl 1970:1 197 9:4
Lub jeden chciałby odłożyć blok obserwacji na końcu okresu danych dla przewidywania poza-z-próbki. W tym przypadku można, by zrobić
smpl ; 2000:4
gdzie jest średnik shorthand dla “odejść, że obserwacja startu jest niezmieniona”. (Średnik może również zostać użyty zamiast drugiego parametru, znaczyć, że obserwacja zakończenia powinna być niezmieniona.) Około “niezmieniony” tu, znaczymy niezmieniony w stosunku do ostatniego smpl ustawienia lub względny do pełna zestaw danych, jeżeli żadna łódź podwodna próbka nie została zdefiniowana w górę do tym punkcie. Na przykład, po
smpl 1970:1 200 3:4 smpl ; 2000:4 zasięg próbki będzie 1970:1 do 2000:4..
Przyrostowa lub względna forma ustawiania zasięgu próbki również jest poparta. W tym przypadku względny offset powinien zostać dany, w formie podpisanej całości (lub średnik, by nie wskazać żadnej zmiany), dla zarówno start i kończąc punkt. Na przykład
smpl + 1 ;
posuną naprzód obserwację startu do jednej chwili zachowującej obserwację zakończenia i
smpl + 2 -1
chce zarówno postępowi obserwacja startu przez dwa, jak i opóźnieniu obserwacja zakończenia przez jeden.
Ważna cecha “ustawiania” próbki jako opisał powyżej jest, że to koniecznie doprowadza do wyboru podzespołu obserwacji, które są graniczące w pełnym zestawie danych. Struktura zestawu danych jest, dlatego nieporuszona (na przykład, jeżeli to jest kwartalne serie czasu przed ustawianiem próbki, to pozostaje kwartalnymi seriami czasu następnie).
43
Rozdziału 6.. Próbujący Łodzi podwodnej zestaw danych
44
6.3 Ograniczający próbkę
Przez “ograniczanie” próbki, którą znaczymy wybierające obserwacje na podstawie jakiegoś Boollowskie (logicznego) kryterium lub przy pomocach generatora liczb losowych. To jest prawdopodobny być najbardziej związany dla rozgniewany przekrojowego lub danych panelu.
Sądźmy, że mamy dane na temat rozgniewanej sekcji osób, rejestrując ich rodzaj, dochód i inne cechy. Chcielibyśmy wybrać dla analizy tylko kobiety. Jeżeli mamy zmienną smoczka rodzaju z wartością 1 dla mężczyzn i 0 dla kobiet, moglibyśmy zrobić
smpl rodzaj = 0 --ograniczyć
do tego efektu. Lub sądźmy, że chcemy ograniczyć próbkę do respondentów z dochodami ponad $50,000. Wtedy moglibyśmy użyć
smpl dochodu > 50000 --ograniczyć pytanie powstaje tu. Jeżeli wydajemy dwa rozkazy ponad kolejno, z czym, kończymy się w naszej łodzi podwodnej próbce: wszystkie przypadki z dochodem ponad 50000 lub tylko kobietami z dochodem ponad 50000? Domyślnie w gretl scenariuszu, odpowiedź jest tym drugim: kobiety z dochodem ponad 50000.. Druga restrykcja powiększa pierwszy lub innymi słowy końcowa restrykcja jest iloczynem logicznym nowej restrykcji i jakiejś restrykcji, która jest już na miejscu. Jeżeli chcesz, by nowa restrykcja zastąpiła trochę istniejące restrykcje, możesz najpierw rozerwać pełny zestaw danych używający
smpl --pełny
Alternatywnie, możesz dodać zastąpić opcję do smpl rozkazu:
smpl dochód > 50000 --ogranicza --zastąpić
Tę opcję ma efekt automatycznie odnośnie zakładającego pełny zestaw danych przed stosowaniem nowej restrykcji.
W przeciwieństwie do prostego “ustawiania” próbki, “ograniczając” próbka może doprowadzić do wyboru nieciągłych obserwacji od pełnego zbioru danych. To może również zmienić strukturę zbioru danych.
To jest zobaczony w przypadku danych panelu. Powiedz, że mamy panel pięciu firm (umieszczony w spisie przez zmienną firmę) przestrzeżonych w każdym z kilku lat (zidentyfikowanych do zmiennego roku). Wtedy restrykcja
smpl rok = 1995 --ogranicz
doprowadza do zestawu danych, który nie jest, panel, ale rozgniewana sekcja dla roku 1995.. Podobnie
smpl firma = 3 --ogranicz
doprowadza do zestawu danych czas serii dla numeru firmy 3..
Z tych powodów (możliwe bez --bezpośrednie sąsiedztwo w obserwacjach, możliwej zmianie w strukturze danych), gretl działa różnie kiedy “ograniczasz” próbkę w przeciwieństwie do po prostu “ustawiania” tego. W przypadku ustawienia, program zaledwie rejestruje start i kończąc obserwacje i używa tych jako parametry do różnych rozkazów wołających dla oszacowania modeli, obliczenia danych i tak dalej. W przypadku restrykcji, program robi zredukowaną kopię zestawu danych i domyślnie traktuje tę zredukowaną kopię jako proste, niedatowane rozgniewany section.1,
Jeśli odnośnie-narzucają czas serie lub panel interpretację zredukowanego zestawu danych ty możesz tak użycie setobs rozkazu lub rzeczy menu GUI “Dane, Zestaw danych struktura”chcesz.
1With jeden wyjątek: jeżeli rozpoczynasz od wyważonego zestawu danych panelu i restrykcja jest takim, że to zachowuje wyważony panel - na przykład, to doprowadza do usunięcia wszystkich obserwacji dla jednej rozgniewany przekrojowej części - wtedy zredukowany zestaw danych jest cichy, domyślnie, rozprawiało jako panel.
Rozdział 6.. Próbujący Łodzi podwodnej zestaw danych
45 fakt to “ograniczanie” skutków próbki w tworzeniu zredukowanej kopii oryginalnego zestawu danych może podnosić zagadnienie kiedy zestaw danych jest bardzo duży (powiedzieć, kilka tysięcy obserwacji). Z takim zestawem danych we wspomnieniu, tworzenie kopii może prowadzić do sytuacji, gdzie uruchomienie programu na komputerze niskie na wspomnieniu dla obliczania skutków regresji. Możesz pracować dookoła tego następująco:
Otworzyć pełny zbiór danych i narzucić restrykcję próbki.
Uratuj kopię zredukowanego zbioru danych do dysku.
Zamknij pełny zestaw danych i otwórz zredukowany jeden.
Kontynuuj twoją analizę.
6.4 Przypadku próbującego
Z bardzo dużymi zestawami danych (lub może studiować własności kosztorysanta) możesz zechcieć narysować przypadkową próbkę od pełnego zestawu danych. To może używać, na przykład,
smpl 100 --przypadkowy wybrać 100 przypadków. Jeżeli chcesz, by próbka była rewytwarzalna, powinieneś ustawić nasienie dla generatora liczb losowych pierwszemu, używając zbiór. Ten rodzaj próbowania spadków pod “restrykcja” kategorią: zredukowana kopia zestawu danych jest zrobiona.
6.5 rzeczy menu Próbki dyskusja powyższa skupił się na rozkaz scenariusza smpl. Możesz również użyć rzeczy pod Próbka menu w GUI program, by wybrać łódź podwodną próbkę.
Rzeczy menu pracują w tej sam drodze jak odpowiednich smpl wariantach. Kiedy używasz rzeczy “Próbka, Ograniczyć bazowany na kryterium”i zestaw danych już jest spróbowany na łodzi podwodnej, dano tobie opcję zachowywania lub zastępowania aktualnej restrykcji. Zastępując aktualne środki restrykcji, w rezultacie, odwołujące zastąpić opcję opisaną ponad (Sekcją 6.3).
Rozdział 7
Wykresów i wątki
7.1 Cnuplot wykresów, do których oddzielny program, gnuplot, jest nazwany wygenerowuje wykresy. Gnuplot jest bardzo w pełnych zaprezentowany powielanie programu z niezliczonymi opcjami. To jest dostępne od www.gnuplot.info < http://www.gnuplot.info/ > (ale notatka, że kopia gnuplot jest spakowana z PANIĄ Windowsem version gretl). gretl daje ci dostęp bezpośredni, przez graficzną powierzchnię międzyfazową, do podzespołu gnuplofs opcji i to próbuje wybrać rozsądne wartości dla ciebie; to również pozwala ci, by wziąć kompletną kontrolę, ponad jeśli chcesz szczegółów wykresu.
Z wykresem pokazanym, możesz kliknąć na okno wykresu dla menu podręcznego z następnymi opcjami.
Zaoszczędź jako PNC: Uratuj wykres w Przenośnym Grafika Sieci formacie.
Zaoszczędź jako postscriptum: Zaoszczędź w encapsulated postscriptum (EPS) formatują.
Zaoszczędź jako Windows metaplik: Zaoszczędź w Ulepszony Metaplik (EMF) formacie.
Zaoszczędź do sesji jako ikona: wykres wyda się w iconic formie, kiedy wybierzesz “Ikona widok” od Widok menu.
Zoomować: Pozwala ci wybrać obszar w wykresie dla bliższego zbadania (nie dostępny dla wszystkich wykresów).
Bądź w druku: (Gnom pulpit lub PANI Windows tylko) pozwala ci drukować wykres bezpośrednio.
Kopia do podręcznego notatnika: PANI Windows tylko, pozwala ci kleić wykres do Windows podań takiego jak PANI Word.1a
Redagować: Otwiera eontroller dla wątku, który pozwala ci dostosowują różne aspekty jego pojawienia się.
Blisko: Zamyka okno wykresu.
Wyświetlacz dane etykietują
W przypadek prostego X do y scatterplot (z lub na zewnątrz linia dobrze dopasowanego pokazany), trochę dalsze opcje są dostępne, jeżeli zestaw danych zawiera “markery przypadku” (to jest, etykiety identyfikujące każdy observa-tion).2 Z wątkiem niewielkiej ilości pokazał, kiedy przesuwasz wskaźnik myszy ponad punktem odniesienia, którym jego etykieta jest pokazana na wykresie. Domyślnie te etykiety są przejściowe: oni nie wydają się w drukowanej lub skopiowanej wersji wykresu. Oni mogą zostać usunięci przez wybieranie “Czystych etykiet danych” z menu podręcznego wykresu. Jeżeli chcesz, by etykiety zostały dodane trwale (więc oni ukażą się kiedy jest wykres drukowany lub jest skopiowany), masz dwie opcje.
• Aby dodać etykiety aktualnie pokazane na wykresie, wybrać “Zamrozić etykiety danych” od menu
podręcznego wykresu.
^ lub skuteczności klejenie wykresów do PANI Office'a applications, wybrać applicatiohs “Artykuł, Sklej Specjalny...” rzecz menu i wybierz opcja “Obraz (Ulepszony Metaplik)”.
2 Dla przykładu takiego zestawu danych, zobacz, że Ramanathan rejestruje data4-10: to zawiera dane na temat prywatna szkoła rejestracji dla 50 stany USA plus Waszyngton, DC; markery przypadku są kodami dwóch listu dla stanów.
46
Rozdziału 7.. Craphs i wątki
47
• Dodają etykiety dla wszystkich punktów w wykresie, wybrać “Redagować” od wykresu pop-up i sprawdzać pudło utytułowane “Pokazują wszystkie etykiety danych”. Ta opcja jest dostępna tylko, jeżeli są mniej niż 55 punktami odniesienia i to jest nieprawdopodobne doprowadzić do skuteczności, jeżeli punkty mocno są skupione od etykiety będą mieć skłonność do pokrycia się częściowo.
Aby usunąć etykiety, które zostały dodane w obu z tych dróg, wybrać “Redagować” od wykresu pop-up i unsprawdzać “Pokazują wszystkie etykiety danych”.
Wysunięte do przodu opcje,
Jeżeli znasz coś o gnuplot i chcesz dostać piękniejszą kontrolę ponad pojawieniem się wykresu niż jest dostępny przez graficznego kierownika (“Wydaj” opcję), tu jest co, by zrobić. W oknie pokazu wykresu, właściwych klikach i wolej “Zaoszczędzać do sesji jako ikona”. Wtedy otwórz okno widoku ikony - albo przez rzecz menu Widok / Ikona widok lub przez klikanie “widok ikony sesji” guzika na pasku narzędzi głównego okna. Powinieneś zobaczyć, jak ikona reprezentuje twój wykres. Właściwy kliknąć na to i wybierz “Wydawać rozkazy wątku” od menu podręcznego. To otwiera okno redagowania z faktycznymi gnuplot rozkazami pokazanymi. Możesz wydać te rozkazy i albo oszczędzić ich na przyszłe przetwarzanie lub wyślij im do gnuplot, używając Wykonać (koło zębate) guzik na pasku narzędzi w wątku dowodzi redagujące okno.
Dowiadują się bardziej o gnuplot wizyta www.gnuplot.info < http://www.gnuplot.info/ >. To miejsce ma dokumentację dla aktualnej wersji programu w różnych formatach.
Zobacz również wejściem dla gnuplot w Gretl CommandReference - i wykres i zaplanuj commands dla “ąuick i brudny” ASCII wykresy.
Cyfra 7.1: gretFs gnuplot kierownik
7.2 Boxplots
Boxplots nie jest wygenerowanego używanie gnuplot, ale raczej przez sam gretl.
Te wątki (po Tukey i Pokojach) pokazują dystrybucję zmiennej. Centralne pudło dołącza środek 50 procent danych, tzn. to jest ograniczone przez pierwszy i trzeci ąuartiles. “Włosy” rozciągają do minimum i wartości maksimum. Linia jest narysowana przez pudło w środkowej i “+” znak identyfikuje środek.
Rozdział 7.. Craphs i wątki
48
W przypadku naciętych pudeł, nacięcie pokazuje ograniczenia 90 przybliżonego procent conndence odstępu dla środkowej. To jest uzyskany przez metoda ucha, która może trwać chwilę, jeżeli serie danych jest bardzo długi.
Klikanie myszy w boxplots oknie wychowuje menu, które umożliwia ci zachowanie wątki jako encapsulated postscriptum (EPS) lub jako całostronnicowy plik postscriptum. Pod systemem okna x możesz również zachować okno jako XPM plik; pod PANIĄ Windowsem you może skopiować to do podręcznego notatnika jako bitmapa. Menu również daje ci opcję otwierania okna streszczenia, które pokazuje streszczenia sześciu numeru, (środek, minimum, najpierw ąuartile, środkowa, trzeci ąuartile, maksimum), plus conndence odstęp dla środkowej, jeżeli “nacięta” opcja została wybrana.
Jakimiś szczegółami gretFs boxplots może zostać skontrolowany przez (czysty tekst) rejestrować nazwany .boxplotrc (lub al ternatively pi otconfig.txt) które jest spojrzane dla, kolejno, w aktualnym katalogu bieżącym, katalogu macierzystym użytkownika (odpowiedni do zmiennej środowiska DO DOMU) i gretl użytkownik directory (które może pokazane i jest zmieniony pod “Narzędzia, Preferencje, Generał" menu). Opcje, które mogą zostać ustawione w ten sposób, są czcionką, aby użyć produkując produkcję postscriptum (musi być ważnym ogólnym imieniem czcionki postscriptum; zaniedbanie jest Helvetica), wielkość czcionki w punktach (również dla produkcji postscriptum; zaniedbanie jest 12), minimum i maksimum dla zasięgu y osi, szerokości i wzrostu wątku w piksele (zaniedbaniu, 560 x 448), czy numeryczne wartości powinny zostać drukowane dla ąuartiles i środkowej (zaniedbanie, nie drukować ich)i, czy ostańcami (punkty kłamiące poza 1.5 razów interąuartile zasięgiem od centralnym pudłem) nie powinny zostać wskazane oddzielnie (zaniedbania, żadnego). Tu jest przykład:
czcionka = Czasy rzymski fontsize = 16 maksimum = 4.0 min = 0 szerokości = 400 wzrostu = 448 numerów = % 3.2f ostańcy = prawdziwy
Na drugim do ostatniej linii, wartość związana z numerami jest sznurem formatu jako w printf rozkazie (widzą, że Gretl Dowodzi Odniesienie); jeżeli wyszczególniony, to układy sterowania druk środkowej i ąuartiles obok boxplot, jeżeli żadne wejście numerów nie jest dane, te wartości nie są drukowane. W przykładzie, wartości będą drukowane do szerokości 3 cyfr, z 2 cyframi precyzji podążającej dziesiętny punkt.
Nie wszyscy opcje potrzebują zostać wyszczególniony i porządek nie ma znaczenia. Linie pasujące wzoru “klucz = wartość” jest zignorowane, jako są liniami, które rozpoczynają od znaku haszyszu, #.
Gdy każda zmienna wyszczególniła w boxplot rozkazie, parenthesized Boollowskie wyrażenie może zostać dodane, by ograniczyć próbkę dla zmiennej w ąuestion. Przestrzeń musi zostać wstawiona między zmiennym imieniem lub numerem i wyrażeniem. Sądźmy, że masz cyfry pensji dla mężczyzn i kobiet i masz zmienna smoczka RODZAJ z wartością 1 dla mężczyzn i 0 dla kobiet. W tym przypadku mógłbyś narysować porównawczy boxplots z następną linią w boxplots dialogu:
wypłacić
wynagrodzenie (CENDER = 1) wypłaca wynagrodzenie (CENDER = 0)
Rozdział 8
Dyskretne zmienne
Kiedy zmienna może wziąć tylko ograniczony, typowo smali, numer wartości, wtedy mówi się, że zmienna jest dyskretna. Jakiś gretl dowodzi czyn w nieznacznie innym sposobie, kiedy jest odnieść się do dyskretnych zmiennych; ponadto gretl, pod że warunkiem, że kilka dowodzi to tylko odnosić się do dyskretnych zmiennych. Szczególnie dummify i xtab rozkazy (patrzcie poniżej) są dostępne tylko dla dyskretnych zmiennych, kiedy freq (freąuency dystrybucja) rozkaz doprowadza do innej produkcji dla dyskretnych zmiennych.
8.1 Deklarujących zmiennych, ponieważ dyskretny
Gretl używa prostej heurystyki, by osądzić, czy dana zmienna powinna zostać potraktowana jako dyskretny, ale również masz opcję jawnie oznaczania zmiennej jako dyskretny, w którym przypadku heurystyczna kontrola jest obchodzona.
Heurystyka jest następująco: pierwszy, są wszystkimi wartościami zmiennej “rozsądnie okrągłej”, gdzie to jest wzięty, by znaczyć, że oni są wszystkimi wielokrotnościami całości 0.25? Jeżeli to kryterium jest spotkane, wtedy pytamy, czy zmienna bierze “dość smali" ustawić odmiennych wartości, gdzie “dość smali" jest zdefiniowany jako mniej niż lub eąual do 8.. Jeżeli oba warunki są zadowolone, zmienna automatycznie jest rozważona dyskretny.
Aby oznaczyć zmienną jako dyskretny masz dwie opcje.
Z graficznej powierzchni międzyfazowej, wybierz “Zmienna, Wydaj Cechy” od menu. Okienko dialogowe wyda się i, jeżeli zmienna wydaje się odpowiedni, będziesz widzieć, jak tyknięcie będzie boksować się etykietowany “Traktować tę zmienną jako dyskretny”. To okienko dialogowe może również zostać odwołane przez kontekstowe menu (właściwy kliknąć na zmienną) lub przez naciskanie F2 klucza.
Z powierzchni międzyfazowej rozkaz linii, przez dyskretny rozkaz. Rozkaz bierze jeden lub więcej dyskusji, które mogą być jeden z dwóch zmiennych lub przechylić się zmiennych. Na przykład:
lista xlist = xl x2 x3 dyskretny zl xlist z2, który
Ta składnia umożliwia zadeklarowanie jako dyskretne dużo zmienne natychmiast, który może niebawem nie być zrobiony przez graficzną powierzchnię międzyfazową. Witka -odwróć się odwraca deklarację zmiennej jako dyskretny lub innymi słowy oznacza to jak ciągłe. Na przykład
dyskretny foo
teraz foo jest dyskretnym dyskretnym foo --odwrócić się
teraz foo jest ciągły, że wariant rozkaz linii jest bardziej potężny, w że możesz oznaczyć zmienną jak dyskretną nawet jeśli to nie wydaje się nadawać się do tego traktowania.
Zanotuj to oznaczanie zmiennej jako dyskretny nie wpływają na jego zawartość. To jest odpowiedzialność użytkownika, by upewnić się to oznaczanie zmiennej, ponieważ dyskretna jest rozsądna rzecz, by zrobić. Zauważ, że, jeżeli chcesz przekodować ciągłą zmienną do klas, możesz użyć genr rozkazu i jego arytmetycznych funkcji, jako w następnym przykładzie:
49
Rozdziału 8.. Dyskretne zmienne, które
50
nuli danych 100
wygenerowuje zmienną z środek 2 i niezgodność 1 genr x = normalny() + 2
pęknięcie do 4 klasy
genr z = (x > 0) + (x > 2) + (x > 4)
# teraz oznajmij z jako dyskretny
dyskretny z
Raz na zmienna jest oznaczona jako dyskretny, to ustawienie jest zapamiętane kiedy ratujesz plik.
8.2 Rozkazów dla dyskretnych zmiennych dummify rozkaz, któremu dummify rozkaz bierze jako dyskusja serie x i tworzy zmienne smoczka dla każdego odmiennego prezentu wartości w x, który musiał już zostać oznajmione jako dyskretny. Przykład:
otwórz greene22_2
dyskretny Z5 # znak Z5 jako dyskretny
dummify Z5, którym efekt powyższego rozkazu jest, by wygenerować 5 nowych zmiennych smoczka, etykietowany DZ5_1 przez DZ5_5, który odpowiada innym wartościom w Z5. Odtąd zmienny DZ5_4 jest 1, jeżeli Z5 eąuals 4 i 0 inaczej. Ta funkcjonalność jest również dostępna przez graficzną powierzchnię międzyfazową przez wybieranie rzeczy menu “Dodać, Smoczki dla wybranych dyskretnych zmiennych”.
dummify rozkaz może również zostać użyty z następną składnią:
lista dlist = dummify(x)
To nie tylko tworzy zmienne smoczka, ale również nazywana lista (widzą sekcję 11.1) to może zostać użyty następnie. Następny przykład liczy dane streszczenia dla zmiennych Y dla każdej wartości Z5:
otwarty greene22_2
dyskretny Z5 # znak Z5 jako dyskretny
lista foo = dummify(Z5)
robi
pętlę foreach ja foo
smpl $ --ograniczam --zastąpić
streszczenie Y koniec pętla smpl fuli
Od dummify wygenerowuje listę, to może zostać używany bezpośrednio w rozkazach, że cali dla listy jako wejście, taki jak ols. Na przykład
otwórz greene22_2
dyskretny Z5 # znak Z5 jako dyskretny
ols Y 0 dummify(Z5) freq rozkaz freq rozkaz pokazuje absolutny i względny freąuencies dla danej zmiennej. Droga fre-ąuencies jest policzone liczy dalej, czy zmienna jest ciągła lub dyskretna. Ten rozkaz jest również dostępny przez graficzną powierzchnię międzyfazową przez wybieranie “Zmiennej, Freąuency dystrybucji” wejście menu.
Rozdział 8.. Dyskretne zmienne
51
Dla dyskretnych zmiennych, freąuencies jest policzony dla każdej odmiennej wartości, którą zmienna bierze. Dla ciągłych zmiennych, wartości są grupowane do “koszów” i wtedy freąuencies jest policzony dla każdego kosza. Numer koszów, domyślnie, jest policzony jako funkcja numeru ważnych obserwacji w aktualnie wybranej próbce przez regułę pokazaną w Stół 8.1. Jakkolwiek, kiedy rozkaz jest odwołany przez rzecz menu “Zmienna, Freąuency Wątek”, to zaniedbanie może zostać przekroczone przez użytkownika.
Kosze obserwacji
8 < n < 16 5
16 < n < 50 7
50 < n < 850 \* fn,]
n > 850 29
Stołu 8.1: bardziej Zdrętwiały koszów dla różna próbka ocenia na przykład, następny kod
otwarty greenel9_l
freq TUCE
dyskretny TUCE # znak TUCE jako dyskretny
freq TUCE
wydaje
Lektura datafile / usr / lokal / udział / gretl / dane / greene / greenel9_l.gdt okresowość: 1, maxobs: 32, obsen / ations zasięg: 1-32
Sporządzając
listę 5 zmienne:
0) const 1) CPA 2) TUCE 3) PSI 4) CRADE
? freq TUCE
Częstość dystrybucja dla TUCE, obs 1-32 numeruj koszów = 7, znaczyć = 21.9375, sd = 3.90151
odstęp
midpt freguency
rei.
z.
< 13.417 12.000 1
13.417 - 16.250 14.833 1
16.250 - 19.083 17.667 6
19.083 - 21.917 20.500 6
21.917 - 24.750 23.333 9
24.750 - 27.583 26.167 7
>= 27.583 29.000 2
3.12 % 3.12 % *
3.12 % 6.25 % *
18.75 % 25.00 % ******
18.75 % 43.75 % ******
28.12 % 71.88 % **********
21.88 % 93.75 % *******
6.25 % 100.00 % **
Test dla nuli hipotezy normalnej dystrybucji: Chi kwadrat(2) = 1.872 z p-ceń 0.39211 ? dyskretny TUCE # znak TUCE jako dyskretny ? freq TUCE
Częstość dystrybucja dla TUCE, obs 1-32 częstość rei. z.
12 1 3.12 % 3.12 % *
14 1 3.12 % 6.25 % *
Rozdział 8.. Dyskretne zmienne
52
17 3
19 3
20 2
21 4
22 2
23 4
24 3
25 4
26 2
27 1
28 1
29 1
9.38 % 15.62 % ***
9.38 % 25.00 % ***
6.25 % 31.25 % **
12.50 % 43.75 % ****
6.25 % 50.00 % **
12.50 % 62.50 % ****
9.38 % 71.88 % ***
12.50 % 84.38 % ****
6.25 % 90.62 % **
3.12 % 93.75 % *
3.12 % 96.88 % *
3.12 % 100.00 % *
Test dla nuli hipotezy normalnej dystrybucji: Chi kwadrat(2) = 1.872 z p wartością 0.39211
Jak jest zobaczony od produkcji próbki, Doornik-Hansen test dla normalności jest policzony samochodowym matically. Ten test jest zniesiony dla dyskretnych zmiennych, gdzie jest numer odmiennych wartości mniej niż 10..
Ten rozkaz akceptuje dwie opcje: --cichy, uniknąć pokolenia histogramu kiedy iiwoked od wiersza zlecenia i --gamma, dla zastępowania testu normalności z nonparametric testem Locke's, którego nuli hipoteza jest, że dane podążają Gamma dystrybucję.
Jeżeli odmienne wartości dyskretnej zmiennej potrzeby zostania uratowanego, wartości() construct macierzy może zostać użyty (widzieć rozdział 12).
xtab rozkaz taksówka rozkazu xtab być odwołany w obu z następnych dróg. Pierwszy,
xtab ylist ; xlist
gdzie ylist i xlist jest wykazami dyskretnych zmiennych. To doprowadza do rozgniewane zestawienia tabelaryczne (dwukierunkowego freąuencies) każdej ze zmiennych w ylist (przez rząd) przeciw każdej ze zmiennych w xlist (przez kolumnę). Lub drugi,
xtab xlist
W drugim przypadku fuli ustawiony rozgniewanych zestawień tabelarycznych jest wygenerowany; to jest, każda zmienna w xlist jest tabu-lated przeciw sobie zmienny w liście. W graficznej powierzchni międzyfazowej, ten rozkaz jest reprezentowany przez “Skrzyżować Zestawienie tabelaryczne” rzeczą pod Widok menu, które działa, jeżeli co najmniej dwie zmienne są wybrane.
Tu jest przykład użycia:
otworzyć greene22_2
dyskretny Z * # znak Z1-Z8 jako dyskretny
xtab Zl Z4 ; Z5 Z6
który produkuje,
Rozgniewane Zestawienie tabelaryczne Zl (rzędów) przeciw Z5 (kolumny)
[ 1,][ 2,][ 3,][ 4,][ 5,] KROPELKA.
[ 0] 20 91 75 93 36 315 [ 1] 28 73 54 97 34 286
Rozdział 8.. Dyskretne zmienne
53
CAŁKOWITY 48 164 12 9 190 70 60 1
Pearson chi kwadratowy test = 5.48233 (4 df, p wartość = 0.241287)
Rozgniewane Zestawienie tabelaryczne Zl (rzędów) przeciw Z6 (kolumny)
[ 9,][ 12,][ 14,][ 16,][ 17,][ 18,][ 20,] KROPELKA.
[0] 4 36 106 70 52 45 2 315 [1] 3 8 48 45 37 67 78 286
SUMUJE 7 44 154 11 5 89 112 80 601
Pearson chi kwadratowy test = 123.177 (6 df, p wartość = 3.50375e-24)
Rozgniewane Zestawienie tabelaryczne Z4 (rzędy) przeciw Z5 (kolumny)
[ 1,][ 2,][ 3,][ 4,][ 5,] KROPELKA.
[ 0] 17 60 35 45 14 171
[ 1] 31 104 94 145 56 43 0
CAŁKOWITY 48 164 12 9 190 70 60 1
Pearson chi kwadratowy test = 11.1615 (4 df, p wartość = 0.0248074)
Rozgniewane Zestawienie tabelaryczne Z4 (rzędów) przeciw Z6 (kolumny)
[ 9,][ 12,][ 14,][ 16,][ 17,][ 18,][ 20,] KROPELKA.
[0] 1 8 39 47 30 32 14 171 [1] 6 36 115 68 59 80 66 430 7
CAŁKOWITY 44 154 11 5 89 112 80 601
Pearson chi kwadratowy test = 18.3426 (6 df, p wartość = 0.0054306) x2 test
Pearson's dla niepodległości automatycznie jest pokazany, pod warunkiem tak zupełnie komórki oczekiwały freąuencies poniżej niepodległość większa niż 10-7. Jakkolwiek wspólne stany praktycznej reguły, że te dane są ważne tylko, jeżeli oczekiwany freąuency jest 5 lub większy dla co najmniej 80 procent komórek. Jeżeli ten warunek nie jest spotkany, ostrzeżenie jest drukowane.
Dodatkowo --rząd lub -opcje kolumny mogą zostać dane: w tym przypadku, produkcja pokazuje rząd lub procenty kolumny, odpowiednio.
Jeżeli chcesz do wytnij i wklej produkcja xtab do sonie inny program, np. arkusz kalkulacyjny, możesz zechcieć użyć --opcja zer; ta opcja powoduje komórki z zero freąuency pokazać numer 0 zamiast bycia pusty.
Dziel na rozdziały 9
Pętli buduje
9.1 Wprowadzenia pętla rozkazu otwiera specjalny tryb, w którym gretl akceptuje, blok rozkazów, by być peated jednym lub więcej razów. Ta cecha może być przydatna, ponieważ, między innymi rzeczami, Monte Karolem simu-lations, ładowanie początkowe testu dane i wielokrotne oszacowanie postępowania. Ogólna forma pętli jest: kontrola wyrażenie
pętli, [ --stopniowy | --wielomówny | --spokój, ] treść
pętli endloop
Pięć form kontrola wyrażenia jest dostępne, jak wyjaśniony w sekcja 9.2.
Nie wszystkie gretl rozkazy są dostępne w pętlach. Rozkazy, które niebawem nie są zaakceptowane w tym kontekście, są pokazane w Stół 9.1.
Stół 9.1: Rozkazy nie użyteczny w pętle
boxplot corrgm cusum dane skreślają eąnprint funkcja gnuplot
zalesiony
pagórek zawierać dźwignięcie modeltab nulldata otwierają niewielkie ilości
biegu rmplot ąlrtest setmiss setobs tabprint vif xcorrgm
domyślnie, genr rozkaz obsługuje ąuietly wewnątrz kontekst pętli (na zewnątrz będąc w druku informa-tion na zmienny generowany). Zmuszają druk reakcji od genr możesz wyszczególnić --wielomówna opcja, by zrobić pętlę. --Cicha opcja znosi zwykłe wydrukowanie numeru powtarzania wykonanych, które może być pożądane kiedy pętle są zagnieździ się.
--Stopniowa opcja, by zrobić pętlę modyfikuje zachowanie rozkazów są w druku i gromadzą i pewnych rozkazów oszacowania, w sposobie, który może być przydatny z Monte Karol analizami (widzą Sekcję 9.3).
Następne sekcje wyjaśniają różne formy sterowanie pętlą wyrażenia i dostarczają jakieś przykłady użycia pętli.
«• Jeżeli przeprowadzasz konkretną Monte Karol analizę z wielu tysiącami powtórzeń, pojemności wspomnienia i przetwarzania, czas może być zagadnieniem. Aby pomniejszyć użycie zasobów komputera, przebiegnąć twój scenariusz używający program rozkaz linii, gretlcli, z produkcją przeadresowany do pliku.
9.2 Sterowanie pętlą wariantów Liczy pętlę, która najprostsza forma sterowania pętlą jest bezpośrednią specyfikacją numeru czasów pętla powinna zostać powtórzona. Odnosimy. Numer powtórzeń może być numeryczną stała, jako w 1 oop 1000 lub może zostać przeczytany od zmiennej, jako w 1 oop repli es.
54
Rozdziału 9.. Pętla constructs
55
W przypadku, gdzie jest rachunek pętli dany przez zmienną, mówi replics, w pojęciu replics jest skalarem całości. Jeżeli to są faktycznie serie, jego pierwsza wartość jest przeczytana. Jeżeli wartość nie jest całością, to jest przerobione do całości przez obcięcie. Zauważ, że replics jest oceniony tylko raz, kiedy pętla początkowo będzie zestawiona.
Kiedy pętla, którą drugi rodzaj kontroli wyrażenie bierze formie słowo kluczowe whi, który 1 e mający za sobą ineąuality: lewy okres powinien być imieniem uprzednio zdefiniowanej zmiennej; prawa strona może być albo numeryczną stała albo imieniem innej uprzednio zdefiniowanej zmiennej. Na przykład,
pętla kiedy essdiff > .00001
Wykonania rozkazów w pętli będzie kontynuować o ile () wyszczególniony warunek ocenia jak precyzyjnie i (b) który numer powtarzania nie przewyższa wartości wewnętrznego koślawości zdolnego loop_maxiter. Domyślnie ten eąuals 250, ale możesz wyszczególnić inną wartość przez rozkaz zbioru (widzą, że Gretl Dowodzi Odniesienie).
Jeżeli prawy okres ineąuality jest zmienną, to jest ocenione na szczycie pętli w każdym powtarzaniu.
Indeks pętla trzecia forma sterowania pętlą używa specjalnego wewnętrznego indeksu zmiennego i. Wewnątrz to przypadek wyszczególniasz start i wartości zakończenia dla ja, który jest wzrośnięty przez jeden za każdym razem okrągłym pętla. Składnia wygląda jak to: 1 oop ja = 1..20..
Zmienna indeksu może zostać użyta w treści pętli w jednym lub obu z dwóch dróg: możesz wejść wartość z (widzę Przykład 9.4) lub możesz użyć jego reprezentacji sznura, $ (widzę Przykład 9.5).
Start i kończąc wartości dla indeks może zostać oddany numeryczną formę lub przez odniesienie do uprzednio zdefiniowanych zmiennych. W ten ostatnim przypadku zmienne są ocenione raz, kiedy pętla jest ustawiona. Ponadto, z danymi serii czasu możesz dać start i kończąc wartości w formie dat, jako inloop ja = 1950:1..1999:4..
Ta forma pętli jest szczególnie przydatna w połączeniu z wartościami() funkcja macierzy kiedy jakieś działanie będzie musieć zostać niesione dla każdej wartości jakiejś dyskretnej zmiennej, (zobaczyć rozdział 8). Oszustwo sider następny przykład:
otwórz greene22_2 otwierają greene22_2 dyskretny Z8 v8 = wartości(Z8) n = rzędy(v8) n = rzędy(v8) robi pętlę dla ja = l..ksi
skalar n = v8,[$ ja,]
smpl (Z8 = ksi) --ogranicz --zastąpić
printf "znaczą(Y | Z8 = % g) = % 8.5f, sd(Y | Z8 = % g) = % g \ n", \ ksi, znaczą(Y), ksi, sd(Y) koniec pętla
W tym przypadku, oceniamy warunkowy środek i odchylenie standardowe zmiennych Y dla każdej wartości Z8.
Foreach pętla czwarta forma sterowania pętlą również używa wewnętrznej zmiennej ja, ale w tym przypadku zmienne zasięgi ponad wyszczególnionym wykazem sznurów. Pętla jest wykonana raz dla każdego sznura w liście. To może być
Rozdziałem 9.. Pętla buduje
56
przydatnego dla grających powtarzających się działań na wykazie zmiennych. Tu jest przykład składni:
pętla foreach donoszę śliwkę gruszki
jest
w
druku "$ ja" endloop
Ta pętla wykona trzy razy, druk z “owocem brzoskwini”, “gruszką” i “śliwką” na poszczególnych itera-tions.
Jeśli zrobić pętlę przez wykaz zmiennych, które są graniczące w zestawie danych chcesz, możesz dać imiona pierwszego i ostatnich zmiennych w liście, oddzielnej około “..”, niż musząc pisząc wszystkie imiona. Na przykład mówimy my mają 50 zmiennych Alaskę, AL ..., WY, zawierając poziomy dochodu dla stanów USA. Przebiegają regresję dochodu punktualnie dla każdego ze stanów, które moglibyśmy zrobić:
pętla czasu
genr foreach ja AL..WY
ols $ ja const czas endloop
Ten wariant pętli może również zostać użyty dla robienia pętli przez elementy w nazywanej liście (widzę rozdział 11). Na przykład:
lista ylist = yl y2 y3 pętla foreach ja ylist ols $ ja const xl x2 endloop
Forloop, który końcowa forma pętli eontroi używa uproszczona wersja z dla stwierdzenia w języku programowania C. Wyrażenie składa się z trzech części, oddzielnych przez średniki. Pierwsza część wyszczególnia początkowy warunek, wyrażony pod względem zmiennej sterująca; druga część daje warunek kontynuacji (pod względem tej sam zmiennej sterująca); i trzecia część wyszczególnia inerement (lub zmniejszyć się) dla zmiennej sterująca, być stosowany za każdym razem dookoła pętli. Całe wyrażenie jest dołączone w nawiasach. Na przykład
pętla dla (r = 0.01; r <.991; r +=.01)
W tym przykładzie zmienny r przyjmie wartości 0.01, 0.02 ..., 0.99 przez 99 powtarzania. Zanotuj to z powodu ograniczonej precyzji płynięcia arytmetyki punktu na komputerach to może być konieczne, by użyć warunku kontynuacji takiego jak powyższego, r <.991, niż bardziej “naturalny” r <=.99. (Używająca podwójna precyzja numeruje na x86 procesorze, w punkcie, gdzie oczekiwałbyś r do eąual 0.99 to może faktycznie mieć wartość 0.990000000000001.) rozszerzyć na regułach dla trzech komponentów wyrażenia kontroli: początkowy warunek musi wziąć formę LHS1 = RHS1. RHS1 musi być numeryczną stała lub uprzednio zdefiniowaną zmienną. Jeżeli LHS1 zmienna nie egzystuje już, to automatycznie jest utworzone.
Warunek kontynuacji musi być formy LHS1 op RHS2, gdzie op może być <, >, <= lub >= i RHS2 jest numeryczną stała lub uprzednio zdefiniowaną zmienną. Jeżeli RHS2 jest zmienną, to jest ocenione za każdym razem dookoła pętli.
inerement lub zmniejsz się wyrażenie musi być formy LHS1 += DELTA lub LHS1 -= DELTA, gdzie jest DELTA numeryczną stała lub uprzednio zdefiniowaną zmienną. Jeżeli DELTA jest zmienną, to jest ocenione tylko raz, kiedy pętla jest ustawiona.
1.. Rozdział 9.. Pętla buduje
57
9.3 Stopniowego trybu,
Jeżeli --stopniowa opcja jest dana dla pętli rozkazu, specjalne zachowanie jest iiwoked, ponieważ pewne rozkazy, mianowicie, są w druku, sklep i proste rozkazy oszacowania. Około “prosty” tu znaczymy rozkazami, które () oszacować pojedynczy eąuation (w przeciwieństwie do systemu eąuations) i (b) robi tak przy pomocach pojedynczego stwierdzenia rozkazu (w przeciwieństwie do bloku stwierdzeń, tak , jak w przypadku ni s i mle). Paradygmat jest ols; inne możliwości zawierają tsls, wls, 1 ogit i tak dalej.
Specjalne zachowanie jest następująco.
Kosztorysanci: skutki od każdego indywidualnego powtarzania kosztorysanta nie są drukowane. Zamiast tego, gdy pętla jest uzupełniona, dostajesz wydrukowanie z () wartości średnie każdego estimated współczynnika przez wszystkie powtórzenia, (b) odchylenie standardowe tych ocen współczynnika, (c) wartości średnie estimated błędu standardu dla każdego współczynnika i (d) odchylenie standardowe estimated błędów standardu. To ma sens tylko, jeżeli jest jakieś przypadkowe wejście w każdym kroku.
bądź w druku: Kiedy ten rozkaz jest użyty, by drukować wartość zmiennej, nie dostajesz się bądź w druku za każdym razem dookoła pętli. Zamiast tego, kiedy pętla jest rozwiązana, dostajesz wydrukowanie środka i odchylenia standardowego zmiennej, przez powtórzenia pętli. Ten tryb być przeznaczony dla użycia ze zmiennymi, które mają pojedynczą wartość w każdym powtarzaniu, na przykład suma błędu sąuares od regresji.
sklep: Ten rozkaz wypisuje wartości wyszczególnionych zmiennych, od za każdego razem dookoła pętli, do wyszczególnionego pliku. W ten sposób to trzyma kompletny zapis zmiennych przez powtarzanie. Na przykład oceny współczynnika mogłyby zostać uratowane w ten sposób, aby pozwolić subseąuent egzaminowi ich freąuency dystrybucji. Tylko jeden taki sklep może zostać użyty w danym pętli.
9.4 Pętla przykłady
Monte Karol przykładu, którym prosty przykład Monte Karol pętli w “stopniowym” trybie jest pokazany w Przykład 9.1.
Przykład 9.1: Prosty Monte Karol pętla
nulldata 50 nasienia 547
genr x = 100 * jednolity()
# otwarty "stopniowa" pętla, do zostać powtórzony 100 razy zrobić pętlę 100 --stopniowy genr u = 10 * normalny()
construct zależny zmienny genr y = 10 * x + y const x
chwyt ols OLS regresja
biegu u współczynnik szacuje i jest zgodzony przez R genr = Scoeff(const)
genr b = $ coeff(x) genr r2 = $ rsq
planuje dla druku statystyk dalej ci są w druku b r2
i uratować współczynnikom, by włączyć do dokumentacji sklep coeffs.gdt b
endloop
Ta pętla będzie drukować dane streszczenia dla `a' i `b' ocen i R2 przez 100 rypsu-
Rozdziału 9.. Pętla buduje
58
etitions. Po przebiegnięciu pętli, coeffs.gdt, który zawiera indywidualnymi ocenami współczynnika od wszystkimi biegami, może zostać otworzony w gretl, by zbadać freąuency dystrybucję ocen szczegółowo.
Rozkaz nuli dane są przydatne dla Monte Karol pracy. Zamiast otwierania “prawdziwego” zbioru danych, nuli dane 50 (na przykład) otwiera zbiór danych smoczka, zawierając tylko stała i zmienną indeksu, z długością serii 50.. Zbudowane zmienne mogą wtedy zostać dodane używając genr com mand.See rozkaz zbioru dla informacji o wygenerowywaniu powtarzalnych rzekomy przypadkowych serii.
Powtórzony najmniej sąuares
Przykład 9.2 użycia “kiedy” zrób pętlę, by powielić oszacowanie nieliniowej funkcji konsumpcji formy
C = + { 3Yy + e
jak wystąpił wewnątrz Greene (2000, Przykład 11.3). Ten scenariusz jest włączony do gretl dystrybucji poniżej imię greenell_3.inp; możesz znaleźć to w gretl poniżej menu podobnie “Plik, Scenariusz pliki, Praktyka plik, Greene”.... opcja -drukujesz-końcowy dla ols rozkaz planuje sprawy więc, że skutki regresji nie będą drukowane za każdym razem okrągłym pętla, ale skutki od regresji na ostatnim powtarzaniu będą drukowane kiedy pętla zakańcza.
Przykład 9.2: Nieliniowa funkcja konsumpcji
otwarty greenell_3.gdt
# bieg początkowy OLS
ols C 0 Y
genr essbak = $ ess genr essdiff = 1 genr ocena dobra = $ coeff(Y) genr gamma = 1
# powtórzyć OLS, aż suma błędu kwadratów zbiega się
pętla kiedy essdiff > .00001
# forma linearized zmienne
genr CO = C + gamma * ocena dobra * YAgamma * kloc(Y)
genr xl = YAgamma
genr x2 = ocena dobra * YAgamma * kloc(Y)
# bieg OLS
ols CO 0 xl x2 --odcisk finał --corr --vcv genr ocena dobra = $ coeff(xl) genr gamma = $ coeff(x2) genr ess = $ ess
genr essdiff = abs(ess - essbak)/ essbak genr essbak = ess endloop
# być w druku parametr szacuje używając ich "nazwy własne"
noecho
printf "alfa = % g \ n", $ coeff(0) printf "ocena dobra = % g \ n", ocena dobra printf "gamma = % g \ n", gamma
Przykład 9.3 pokazów jak pętla może zostać używany, by oszacować ARMA model, wykorzystując “zewnętrzny produkt nachylenia” (OPG) regresja dyskutowała około Davidson i MacKinnon wewnątrz ich
Rozdział Oszacowania 9. Pętla buduje
59
i Wniosek wewnątrz Econometrics.
Umieszczony
w
spisie przykłady pętli
Przykład 9.4 pokazów umieszczona w spisie pętla wewnątrz, które smpl jest wpisany do indeksu zmiennego i. Sądzić mamy panel zestaw danych z obserwacjami dalej kilka szpitali, ponieważ lata 1991 do 2000 (gdzie jest rok obserwacji wskazany do zmiennego nazywanego roku). Ograniczamy próbka do każdego z tych lata kolejno i być w druku rozgniewany przekrojowe streszczenie dane dla zmiennych 1 4.
Przykład 9.5 ilustruje substytucja sznura w umieszczonej w spisie pętli. pierwszy czas dookoła to robią pętlę zmienny V będzie zabierze się do eąual COMP1987 i zależna zmienna, ponieważ ols będzie PBT1987. następny razem okrągły V będzie przedefiniowany jako eąual do COMP1988 i zależnej zmiennej wewnątrz regresja będzie PBT1988. I tak dalej.
Rozdział 9. Pętla buduje
60
Przykład 9.3: ARMA 1, 1
otwarty armaloop.gdt
genr c = 0 genr = 0.1 genr m = 0.1
serie e = 1.0 genr de_c = e genr de_a = e genr de_m = e
genr crit = 1
pętla kiedy crit > 1.0e-9
# błędy jeden wkraczać do przewidywania
genr e = y - c - * y(-l) - m * e(-l)
# kloc prawdopodobieństwo
genr loglik = -0.5 * suma(eA2) drukuje loglik
# partials przewidywania błędy wrt c, i m
genr de_c = -1 - m * de_c(-l)
genr de_a = -y(-l) -m * de_a(-l) genr de_m = -e(-l) -m * de_m(-l)
# partials 1 wrt c i m
genr sc_c = -de_c * e
genr sc_a = -de_a * e genr sc_m = -de_m * e
# OPC regresja
ols const sc_c sc_a sc_m --odcisk finał --corr --vcv
# Uaktualnienie parametry
genr dc = $ coeff(sc_c)
genr c = c + dc
genr trans = $ coeff(sc_a) genr = + trans genr dm = Scoeff(sc_m) genr m = m + dm
printf " stały = %.8g (nachylenie = %#.6g)\ n", c, dc printf " arl współczynnik = %.8g (nachylenie = %#.6g)\ n", trans printf " mai współczynnik = %.8g (nachylenie = %#.6g)\ n", m, dm
genr crit = $ T - $ ess drukuje crit endloop
genr se_c = $ stderr(sc_c) genr se_a = $ stderr(sc_a) genr se_m = $ stderr(sc_m)
noecho
drukuje "
printf "stały = %.8g (se = %#.6g, t = %.4f)\ n", c, se_c, c / se_c
printf "arl okres = %.8g (se = %#.6g, t = %.4f)\ n", se_a, / se_a
printf "mai okres = %.8g (se = %#.6g, t = %.4f)\ n", m, se_m, m / se_m
Rozdział 9.. Pętla buduje
61
Przykładu 9.4: Panel dane
otwarta hospitals.gdt pętla ja = 1991..2000
smpl (rok = ja) --ogranicz --zastąpić
streszczenie 12 3 4 endloop
Przykład 9.5: Sznur substytucja
otwarta bea.dat pętla ja = 1987..2001
genr V = COMPSi
genr TC = GOCSi - PBTSi
genr C = TC - V
ols PBTSi const TC V endloop
Rozdział 1 Och zdefiniowany na
Użytkowniku funkcje
10.1 Definiujące funkcję
Od wersja 1.3.3, gretl zawarł mechanizm dla definiowania funkcji w kontekście scenariusza. Ta funkcjonalność była przez sonie zmienia się w poszukiwaniu stajni i rozszerzalnej struktury. Wierzymy, że prezent wersji w gretl 1.6.1 powinien dostarczyć dobrą podstawę dla przyszłego rozwoju.
Funkcje muszą zostać zdefiniowane zanim oni są nazwani. Składnia dla definiowania funkcji wygląda jak funkcja końca ciała(parametry)
funkcji tego funkcja imienia
funkcji
funkcja imię jest uniąue identyfikatorem dla funkcji. Imiona muszą rozpocząć od listu. Oni mają długość maksimum 31 charakterów; jeżeli napiszesz dłuższe imię, to będzie skrócone. Funkcja imiona nie mogą zawrzeć przestrzeni. Dostaniesz błąd, jeżeli spróbujesz zdefiniować funkcję mającą to sam imię jak istniejący gretl rozkaz.
Parametry dla funkcji są dane w formie rozdzielonej przez przecinek listy. Parametry mogą jakiegokolwiek z typów zostać pokazane poniżej.
Zmienna skalara
bool Opis typu służąca jako Boollowskie zmienna skalara
int witka służąca jako
lista serii danych
serii zmiennej skalara
skalara całości nazwała wykaz serii
macierz nazwała macierz lub
sznur wektora nazwał sznur lub literał sznur
Każdy element w wykazie parametrów musi zawrzeć dwa okresy: typ specifier i imię, przez które parametr będzie znany w funkcji. Przykład następuje:
funkcją myfunc(seriami y, listą xvars, bool wielomównym)
Każdym z typem specifiers, z wyjątkiem 1 ist i sznura, może zostać zmodyfikowany przez prepending gwiazdka do zrzeszonego imienia parametru, jako w
funkcja myfunc(serie * y, skalar * b) znaczenie tej modyfikacji jest wyjaśnione poniżej (widzieć sekcję 10.4); to być odnoszone się do użycia dyskusji wskazówki w języku programowania C. Ponadto, parametry mogą zostać zmodyfikowane przez etykietka const (znów, zobacz 10.4).
62
Rozdziału 10.. Zdefiniowane na Użytkowniku funkcje
63
Funkcja parametrów: opcjonalne rafinowanie
Oprócz reąuired elementów wspomniały powyższy, specyfikacja parametru funkcji może zawrzeć sonie dodatkowe pole.
Dla parametru skalara typu lub int, minimum, maksimum i wartość domyślna może zostać wyszczególnione. Te wartości powinny bezpośrednio podążyć imię parametru, enclosed w sąuare nawiasach i z indywidualnymi elementami oddzielnymi przez dwukropki. Na przykład sądzimy my mają całość parameter porządek, dla którego chcielibyśmy, wyszczególnić minimum 1, maksimum 12 i zaniedbania 4.. Możemy napisać
int porządek,[l:12:4,]
Jeśli pominąć jakiś z trzech specifiers chcesz, odejść, że odpowiednie pole jest puste. Na przykład [1:4] wyszczególniliby minimum 1 i zaniedbania 4 chwili odchodzącej maksimum nieograniczone.
Dla parametru typ bool, możesz wyszczególnić zaniedbanie 1 (prawdziwego) lub 0 (fałszywego), jako w
bool wielomównym,[0,]
W
końcu, dla parametru jakiegoś typu możesz dodać krótki opisowy sznur. To ukaże się jako pomoc do użytkownika, jeżeli funkcja będzie spakowana (zobacz sekcję 10.5 poniżej) i będzie nazwana przez graficzną powierzchnię międzyfazową gretl's. Sznur powinien zostać dołączony w podwójnym ąuotes i jest wstawiony przed przecinkiem, który poprzedza następny parametr, (lub nawias prawa zamknięcia definicji funkcji, w przypadku ostatniego parametru), jako zilustrowany w następnym przykładzie.
funkcja myfun (serie y "zależna zmienna",
serie x "niezależna zmienna")
Unieważnia działa Możesz zdefiniować funkcję, która nie ma żadnych parametrów (ci nazywają się “procedury” w jakichś językach programowania). W tym przypadku, użyj słowa kluczowego unieważniają zamiast wykazu parametrów:
funkcja myfunc2(unieważnia) ciało funkcji, które ciało funkcji składa się z gretl rozkazów lub nazywa do zdefiniowanych na użytkowniku funkcji (to jest, rozmowy funkcji mogą zostać zagnieździć się). Funkcja może cali siebie (to jest, funkcje mogą być rekursywne). Kiedy ciało funkcji może zawrzeć rozmowy funkcji, to nie może zawrzeć definicji funkcji. To jest, nie możesz zdefiniować funkcji wewnątrz innej funkcji. Dla dalszych szczegółów, zobacz sekcja 10.4.
10.2 Nazywanie funkcji, którą funkcja użytkownika jest nazwana przez pisanie jego imienia mającego za sobą zero lub więcej dyskusje załączyły w nawiasach. Jeżeli są dwa lub więcej dyskusji, ci powinni zostać rozdzielony przez przecinki.
Są automatyczne kontrole na miejscu, by zapewnić, że numer dyskusji oddawanych funkcja cali dopasowuje numer parametrów i, że typy danych dyskusji dopasowują typy, wyszczególniło w definicji funkcji. Błąd jest wybrukowany, jeżeli oba z tych warunków jest naruszone. Jeden ąualification: dodatek być udać się do pomijania dyskusji na końcu listy, pod warunkiem, że wartości domyślne są wyszczególnione w definicji funkcji. Aby być dokładny, kontrola jest, że numer dyskusji jest w najmniej eąual do numeru reąuired parametrów i jest nie większy niż całkowita liczba parametrów.
Rozdział 10.. Zdefiniowane na Użytkowniku funkcje
64, którymi skalar, serie lub dyskusja macierzy do funkcji może zostać dany albo jako imię wstępnie istniejącej zmiennej lub jako wyrażenie, które ocenia do zmiennej odpowiedniego typu. Skalarem dyskusje mogą również zostać dane jako numeryczne wartości. Listą dyskusje muszą zostać wyszczególnione z nazwiska.
Co następuje trywialny przykład ilustruje funkcja cali tak poprawnie mecze funkcja defini-tion.
#
funkcja definicji funkcji ols_ess(serie y, lista xvars)
ols y 0 xvars --cichy
skalar myess = $ ess
printf "ESS = % g \ n", funkcja końca myess skalar
powrotu myess
# główny scenariusz
otwarty l
lista xlist = 2 3 4
# funkcja cali (wartość powrotu jest zignorowana tu)
ols_ess(ceną, xlist) funkcja cali daje dwie dyskusje: pierwszy jest seriami danych wyszczególnionymi z nazwiska i drugi jest nazywanym wykazem regressors. Zanotuj tej chwili, którą funkcja oferuje zmiennemu myess jako wartość powrotu, to jest zignorowane przez telefonujący w tym wypadku. (Jak notatka strony tu, jeżeli chcesz, by funkcja obliczyła trochę wartość musianą zrobić z regresją, ale nie jest zainteresowany w fuli skutkach regresji, możesz zechcieć używane --cicha flaga z rozkazem oszacowania jako pokazany powyżej.) drugie pokazy przykładu jak napisać funkcja cali, który przydziela wartość powrotu zmiennej w telefonującym:
#
funkcja definicji funkcji get_uhat(serie y, lista xvars)
ols y 0 xvars --cichy
serie uh = funkcja końca uh serie
powrotu Suhat
# główny scenariusz
otwarty l
lista xlist = 2 3 4
# funkcja cali
serie resid = get_uhat(cena, xlist)
10.3 Skreślający funkcję,
Jeżeli zdefiniowałeś funkcję i subseąuently życzenie do elear to z wspomnienia, ciebie może tak użycie słów kluczowych, usunąć lub czysty, jak wewnątrz
funkcja myfunc skreśla funkcja get_uhat elear
Notatkę, jakkolwiek, tak, jeżeli myfunc jest już zdefiniowaną funkcją, jeśli nowa definicja automatycznie nadpisuje poprzedni jeden, więc to powinno rzadko być konieczne, by skreślić funkcje jawnie.
10.4 Funkcja programowania wyszczególnia
Zmienne przeciw wskazówki
Seriom, skalarowi i dyskusje macierzy do funkcjami mogą zostać minięte w dwóch drogach: “jako oni są”lub jako wskazówki. Na przykład rozważ co następuje:
ChapterlO. Zdefiniowane na Użytkowniku funkcje 65
funkcja triplel(serie x)
serie ret = 3 *
funkcja funkcji końca ret serie
powrotu x triple2(serie * x)
serie ret = 3 * funkcja końca ret serie
powrotu x
Te dwie funkcje są prawie identyczne (i wydaj ten sam skutek); jedyna różnica jest, że musisz nakarmić serie do triplel, jako w triplel(myseries), kiedy triple2 musi zostać dostarczony wskazówką do serii, jako w triple2(& myseries).
Dlaczego zrobić rozróżnienie, wtedy? Są dwa główne powody dla robienia tak: modułowy ity i performance.
Około modułowy ity znaczymy izolację funkcji od reszty scenariusza, który dzwoni do tego. Jedna z wielu korzyści tego podejścia jest, że twoje funkcje są łatwo do wielokrotnego użycia w innych kontekstach. Osiągają modułowy ity, zmienne utworzone w funkcji są miejscowe do tej funkcji i są zniszczone kiedy wyjścia funkcji, chyba że oni są zrobieni dostępny jako wartości powrotu i te wartości są “wyselekcjonowane” lub wyznaczają przez telefonujący.
Ponadto, funkcje nie mają dostępu do zmiennych w “zewnętrznym zakresie” (to jest, zmienne, które egzystują w scenariuszu, od którego funkcja jest nazywana,) oprócz o ile, ponieważ ci jawnie są minięci do funkcji jako dyskusje.
Domyślnie kiedy zmienna jest minięta do funkcji jako dyskusja, to, co funkcja właściwie “dostaje się” , jest kopia zewnętrznej zmiennej, której znaczy, że wartość zewnętrznej zmiennej nie jest zmodyfikowana przez cokolwiek idzie dalej wewnątrz funkcję. Ale użycie wskazówek pozwala funkcji i jego telefonującemu, by “współpracować” taki, że zewnętrzna zmienna może zostać zmodyfikowana przez funkcję. W rezultacie to pozwala funkcji, by “wrócić” więcej niż jedną wartość (chociaż tylko jedna zmienna może zostać powrócona bezpośrednio - patrzcie poniżej). Parametr w ąuestion jest oznaczony z prefiksem z * w definicji funkcji i odpowiednia dyskusja jest oznaczona z uzupełniającym prefiksem & w telefonującym. Na przykład
funkcja get_uhat_and_ess(serie y, lista xvars, skalar * ess)
ols y 0 xvars --cichy
ess = $ ess
serie uh = funkcja końca uh serie
powrotu Suhat
# główny scenariusz
otwarty l
lista xlist = 2 3 4
# funkcja cali
skalar SSR
serie resid = get_uhat_and_ess(cena, xlist, & SSR)
W powyższych, możemy powiedzieć, że funkcji dano adres zmiennej skalara SSR i to przydziela wartość tej zmiennej (pod miejscowym imię ess). (Ponieważ ktoś użył do programowania w C: zauważyć, że to jest nie konieczne lub nawet możliwe, do “usunięcia pośredniości” zmienna w ąuestion w funkcji używającej * operator. Nieozdobione użycie imienia zmiennej jest dostateczne, by wejść zmienną w zewnętrznym zakresie.) “zwrócić się do” parametr tego rodzaju może zostać użyty jako znaczy oferowania opcjonalnej informacji do telefonującego. (To jest, odpowiednia dyskusja jest nie ściśle potrzebna, ale zostawana użyta, jeżeli teraźniejszość). W tym przypadku powinien parametrowi dano wartość domyślną nul 1 i funkcja powinna przeprowadzić badania, by zobaczyć, czy telefonujący dostarczył odpowiednią dyskusję lub nie, używając wbudowany funkcja isnuli (). Na przykład tu jest prosta funkcja jest pokazana powyższy, zmodyfikowany, by sprawiać, że plomba wydala ess wartości opcjonalnej.
Rozdział 10.. Zdefiniowane na Użytkowniku funkcje
66
funkcja get_uhat_and_ess(serie y, lista xvars, skalar * ess,[pusty,])
ols y 0 xvars --cichy,
jeżeli Msnull(ess) ess = $ ess
endif
serie uh = funkcja końca uh serie
powrotu Suhat,
Jeżeli nie obchodzi telefonującego to dostać ess wartości, to powinno użyć nul 1 zamiast prawdziwej dyskusji:
serie resid = get_uhat_and_ess(cena, xlist, nuli)
Używająca wskazówki może również być przydatna dla optymalizowania występu: nawet jeśli zmienna nie jest zmodyfikowana wewnątrz funkcją, to może być dobrym pomysłem, by minąć to jako wskazówka, jeżeli to zajmuje wiele wspomnienia. Inaczej czas gretl spędza przepisywanie wartości zmiennej do miejscowej kopii może być bez --bez znaczenia, w porównaniu z czasem funkcja spędza robienie pracy, dla której to zostało napisane.
Przykład 10.1 bierze to do skrajności. Definiujemy dwie funkcje, które powracają numer rzędów macierz (ładnego szybkiego działania). Jedna funkcja da macierzy jako dyskusja, ten druga wskazówkę do macierzy. Dwie funkcje są ocenione na macierzy z 2000 rzędami i 2000 kolumnami; na typowym systemie, liczby zmiennopozycyjne biorą 8 bajtów wspomnienia, więc przestrzeń zajęta przez macierz jest z grubszą 32 megabajtami.
Przebieganie kodu w przykładzie 10.1 doprowadzą do produkcji podobnej do co następuje (faktyczne numery zależą od maszyny, którą przebiegasz przykład): Czas
upływania:
bez wskazówki (kopii) = 3.66 sekund, z wskazówki (żadną kopią) = 0.01 sekund.
Lista dyskusje użycie nazywanej listy, ponieważ dyskusja do funkcji daje znaczy dostarczania funkcji zbiór zmiennych, których numer są nieznane, kiedy jest funkcja napisana - na przykład, zbiory regressors lub narzędzi. W funkcji, lista może zostać minięta do rozkazów takiego jak ols lub to może “zostać rozpakowane” używając construct pętli foreach. Na przykład sądzisz ty mają lista x i chcą obliczyć odchylenie standardowe każdej zmiennej w liście:
pętla foreach ja x
skalar sd_ $ ja = sd($ ja) pętla końca
Kiedy nazywany wykaz zmiennych jest minięty do funkcji, funkcja jest dostarczona z kopią listy. Zmienne z bibliografią w liście, jakkolwiek, są zrobione bezpośrednio dostępne do funkcji, w podobnym sposobie do przypadku, gdzie skalar lub dyskusja serii jest minięta w “wskazówka” formie, jako dyskutowany powyżej. Mijanie listy jest, dlatego innymi środkami pozwalania funkcji, by zrobić więcej w drodze modyfikowania danych w poziomie telefonującego niż po prostu oferowanie wartości powrotu. Jeżeli zmienne nie będą zmodyfikowane wewnątrz funkcją, to jest dobry pomysł, by wybrukować ten fakt używający const modyfikator w wykazie parametrów:
funkcja myfunc (skalar y, const lista X)
Kiedy lista jest oznaczona const, jakąś próbą, by przemianować, usunąć lub nadpisać oryginalne wartości zmiennych w liście wygenerują błąd.
Jeżeli dyskusja listy do funkcji jest opcjonalna, to powinien zostać wskazany przez dodawanie wartości domyślnej nuli, jako w
ChapterlO. Został zdefiniowany na Użytkowniku funkcjami 67
Przykładu 10.1: Występ porównanie: wartości przeciw
funkcji wskazówki(macierz X)
r =
funkcja funkcji końca r skalar(X)
powrotu rzędów b(macierz * X)
r = funkcja końca r skalar(X)
powrotu rzędów
nulldata 10 echa
zbioru wyłączony
zbiór posyła wiadomość wyłączony
X = zera(2000,2000)
r = 0 pętli stopera
zbioru 100
r = pętla końca(X) fa = pętla stopera
zbioru Sstopwatch 100
r = b(& X) pętla końca fb = Sstopwatch
printf "Czas upływania:\ n \
\ twithout < plik:/// twithout > wskazówki (kopia) = % g sekundy, \ n \
\ twith < plik:/// twith > wskazówki (żadna kopia) = % g sekundy.\ n", fa, fb
funkcja myfunc (skalar y, lista X,[pusty,])
W tym przypadku, jeżeli telefonujący da nul 1 jako dyskusja listy wtedy nazywanej liście x wewnątrz, funkcja będzie pusta. Ta możliwość może zostać wykryta używając nelem() funkcja, która powraca 0 dla pustej listy. (Ten mechanizm może również zostać używany, by sprawdzić, czy nazywany, ale pusty, lista została dostarczona jako dyskusja.)
Zawiązać dyskusje
Sznur dyskusje może zostać użyty, na przykład, by dostarczyć elastyczność w nazywaniu zmiennych utworzonych w funkcji. W następnym przykładzie funkcja movavg powraca listę zawierającą, którą dwa średni krocząca zbudowali od serii wejścia, z imionami niedawno utworzonych zmiennych rządzonych przez dyskusję sznura.
funkcja movavg (serie y, sznur vname)
serie @ vname_2 = (y + y(-l)) / 2
serie @ vname_4 = (y + y(-l)+ y(-2)+ y(-3)) / 4
lista retlist = @ vname_2 @ funkcja końca retlist lista
powrotu vname_4
Rozdział 10.. Zdefiniowane na Użytkowniku funkcje
68
otwarte data9-9
lista malist = movavg(nocars, "nocars")
drukuje malist --byobs ostatnia linia scenariusza będzie drukować dwa zmienne nazwały nocars_2 i nocars_4. Dla szczegółów na obsługiwaniu nazwanych sznurów, zobacz rozdział 11..
Odzyskując imiona dyskusji zmienne podane, ponieważ dyskusje do funkcji są znane wewnątrz funkcja przez imiona odpowiednich parametrów. Na przykład w funkcji, której podpis jest
funkcja somefun (serie y) , mamy serie znane jako y. W może być przydatny, jakkolwiek, by być w stanie zdecydować się imiona zmiennych dostarczyły jako dyskusje. To może używać funkcja argname, który bierze imię parametru funkcji jako jego pojedyncza dyskusja i powraca sznur. Tu jest prosta ilustracja:
funkcja namefun (serie y)
printf "serie podane, ponieważ 'y' był nazywany % s \ n", argname(y) koniec funkcja
otwarta data9-7 namefun(QNC)
To doprowadza do produkcji serie podane jako 'y' został nazwany QNC
To powinno było być znany tak to będzie nie zawsze pracuje: dyskusje podane do funkcji mogą być anony-mous zmienne, utworzony w lot, jako wewnątrz somefun(kloc(QNC)) lub somefun(CPI / 100). W tym przypadku argname funkcja powraca pusty sznur. Funkcja pisarze, którzy chcieliby wykorzystać to fa-cility powinien sprawdzić powrót od argname używającego isstring() funkcja, która powraca 1, ponieważ bez --pusty sznur, 0 inaczej.
Powrót ceni
Funkcje może nie powrócić niczego (tylko drukując skutek, może)lub oni mogą powrócić pojedynczą zmienną - skalar, serie, lista, macierz lub zawiązać. Wartość powrotu, jeżeli jakiś, jest wyszczególniony przez stwierdzenie w ciele funkcji rozpoczynającym od powrotu słowa kluczowego, mającego za sobą typ specifier i imię zmiennej (jako w wykazie parametrów). Może być tylko jedno takie stwierdzenie. Przykład ważnego stwierdzenia powrotu jest pokazany poniżej: skalar
powrotu SSR
Mający powrót funkcji, którym lista jest jedną drogą pozwalania “wrócić” z więcej niż jedna zmienna. To jest, możesz zdefiniować kilka zmiennej wewnątrz funkcję i paczkę ich jako lista; w tym przypadku oni nie są zniszczeni kiedy wyjścia funkcji. Tu jest prosty przykład, który również ilustruje możliwość ustawiania opisowych etykiet dla zmienne wygenerowały w funkcji.
funkcja make_cubes (lista xlist) przechyla się podnosi do sześcianu = nuli pętla foreach ja xlist --ciche serie $ i3 = $ iA3
Rozdział 10.. Zdefiniowane na Użytkowniku funkcje
69
setinfo $ i3 -d "sześcian z $ ja" sześciany listy += $ lista
powrotu pętli końca i3 podnosi do sześcianu funkcja końca
otwarty l
lista xlist = cena sqft
lista cubelist = make_cubes(xlist)
drukuje xlist cubelist --byobs
etykiety
Zauważają, że stwierdzenie powrotu nie nakłania funkcji do powrócenia (wyjścia) w punkcie, gdzie to wydaje się w ciele funkcji. Raczej to wyszczególnia, która zmienna jest dostępna dla przypisanie ment kiedy wyjścia funkcji i wyjścia funkcji tylko kiedy () koniec kodu funkcji jest osiągnięty, (b) gretl błąd występuje lub (c) którym funcerr stwierdzenie jest osiągnięte.
funcerr słowo kluczowe, które może być śledzonym przez sznur enclosed w podwójnym ąuotes, nakłania funkcję do wyjścia z błędem osłabł. Jeżeli sznur jest dostarczony, to jest drukowany na wyjściu, inaczej ogólny komunikat błędu jest drukowany. Ten mechanizm umożliwia autorowi funkcji uprzedzenie zwykłego błędu wykonania i / lub zaoferować bardziej określony i pomocny komunikat błędu. Na przykład
jeżeli nelem(xlist) = 0
funcerr "xlist nie powinien wypróżnić się" koniec, jeżeli
Błąd sprawdzający
Kiedy gretl najpierw czyta i “zestawia” definicję funkcji, jest minimalny sprawdzający błędu: jedyne kontrole są, że imię funkcji jest zadowalające i, dotychczas jako ciało jest zaniepokojonym, że nie próbujesz zdefiniować funkcję wewnątrz funkcji (widzą Sekcję 10.1). Inaczej, jeżeli ciało funkcji zawrze nieważne rozkazy, to stanie się oczywisty tylko kiedy funkcja jest nazwana i jego rozkazy są wykonane.
Zdebagować zwykły mechanizm zgodnie, z którym gretl rozbrzmiewa rozkazy i zgłasza na tworzeniu nowych zmiennych domyślnie jest zniesiony kiedy jest funkcja wykonywana. Jeżeli chcesz bardziej wielomówną produkcję od szczególnej funkcji, możesz użyć albo lub oba z następnych rozkazów w funkcji:
ustawione echo na wiadomości podjudzać
Alternatywnie, możesz osiągnąć ten efekt dla wszystkich funkcji przez rozkaz ustawiony zdebagować 1.. Zwykle kiedy ustawiłeś wartość zmiennej stanu używającej rozkaz zbioru, efekt odnosi się tylko do aktualnego poziomu wykonania funkcji. Na przykład, jeżeli naprawdę podjudzasz wiadomości w funkcja fi, którym kolejno nazywa funkcja f2, wtedy wiadomości będą drukowane dla fi ale nie f2. Zdebagować zmienna, jakkolwiek, działa globalnie; wszystkie funkcje stają się wielomówne bez względu na ich poziom.
Dalej możesz ustawić zdebagować 2: ponadto, by dowieść echo i druk wiadomości, to jest równoważny ustawianiu max_verbose (które doprowadza do wielomównej produkcji od BFGS maximizer) we wszystkich poziomach wykonania funkcji.
10.5 Funkcja paczek gretl 1.6.0, jest mechanizm do funkcji paczki i robi oni dostępni dla innych użytkowników gretl. To jest aktualnie doświadczalny, ale tu jest procesu.
Rozdział 10.. Zdefiniowane na Użytkowniku funkcje
70
Ładunku funkcja we wspomnieniu
Tam są kilku sposobami władowania funkcji:
Jeżeli masz plik scenariusza zawierający definicje funkcji, otworzyć ten plik i przebiegnąć to.
Utwórz plik scenariusza od rysy. Zawrzyj co najmniej jedną definicję funkcji i przebiegnij scenariusz.
Otwórz GUI konsolę i napisz definicję funkcji interaktywnie. Ta metoda nie jest partic-ularly polecony; jesteś prawdopodobnie lepiej komponowaniem funkcja bez --interaktywnie.
Na przykład sądzisz ty decydują do paczki funkcję, która powraca zmianę procentu serii czasu. Otwórz plik scenariusza i napisz PC
funkcji(serie y "Serie, by rozpocząć proces")
serie foo = 100 * diff(y)/ y(-1)
powraca funkcję końca foo serie
W tym przypadku, dodaliśmy sznur do dyskusji funkcji, jak wyjaśnionej w przekroju 10.1, tak uczynić naszą powierzchnię międzyfazową bardziej informacyjnym. To nie jest obowiązkowy: jeżeli pominiesz opisowy sznur, gretl dostarczy uprzednio zdefiniowany jeden.
Cyfra 10.1: Produkcja kontroli funkcji
Teraz przebiegają twoją funkcję. Możesz zechcieć upewnić się twoimi pracami funkcji właściwie przez przebieganie kilku przeprowadza badania. Na przykład możesz otworzyć konsolę i napisać
genr x = jednolity() genr dpcx = PC(x) drukują x dpcx --byobs Powinieneś zobaczyć coś podobnego, by wyobrazić 10.1. Funkcja wydaje się pracować ok. Gdy tylko twoja funkcja być zdebagować, możesz przejść do następnej sceny.
Rozdział 10.. Zdefiniowane na Użytkowniku funkcje
71
Tworzy paczkę
Zaczynają GUI program i spoglądają na “Plik, Funkcja pliki” menu. To menu zawiera cztery rzeczy: “Na miejscowej maszynie”, “Na serwującym”, “Wydać paczkę”, “Nowa paczka”.
Wybierz “Nową paczkę” (rozkaz powróci komunikat błędu, chyba że co najmniej zdefiniowany na użytkowniku funkcję aktualnie jest władowany we wspomnieniu - widzą poprzedni punkt); w pierwszym dialogu dostajesz się wybrać: publiczna funkcja do paczki.
Zero lub więcej “szeregowiec” pomocnik działa.
Publiczne funkcje są dla użytkowników bezpośrednio dostępne; prywatne funkcje są częścią z “za scenami” mechanizm w paczce funkcji.
Cyfra 10.2: okno edytora paczki
Na klikaniu “ok” drugiego dialogu powinno wydać się (widzieć cyfrę 10.2), gdzie dostajesz się stawać do informacji paczki (aktualnie, autor, wersja, data i krótki opis). Również dostajesz się stawać do tekstu pomocy dla publicznej powierzchni międzyfazowej. Masz dalszą szansę, by wydać kod funkcji, by zostać spakowany, przez wybieranie ich od rozwijanego selekcjonera i klikanie dalej “Wydają kod funkcji”. W końcu, możesz woleć władować paczkę na serwującym gretl's, gdy tylko to jest uratowane, przez sprawdzanie związanego checkbox.
Klikanie “ok” w tym dialogu prowadzi cię do Pliku Ratują dialog. Wszystko bycie zdrowy, to powinien wskazywać do katalogu nazywanego funkcje, albo pod katalogiem systemu gretl (jeżeli piszesz pozwolenie na tym) lub katalog użytkownika gretl. To jest zalecane miejsce, by uratować pliki paczki funkcji, od właśnie tam program będzie spoglądać w specjalnej procedurze dla otwierając takie pliki (patrzcie poniżej).
Niepotrzebny powiedzieć, rozkaz menu “Plik, Funkcja pliki, Wydać paczkę” pozwala ci, by zredagować znów miejscową paczkę funkcji.
Słowo na pliku tylko zaoszczędziłeś. Domyślnie to będzie mieć .gfn rozszerzenie. To jest “paczka funkcji” rejestrują: w przeciwieństwie do zwykłego pliku scenariusza gretl, to jest XML pliku zawierającego oba kod funkcji
Rozdział 10.. Zdefiniowane na Użytkowniku funkcje
72
i dodatkowa informacja weszło do w pakującym. Hakerzy mogliby zechcieć napisać taki plik od rysy niż używającej GUI pakujący, ale większość ludzi jest najprawdopodobniejsza uważać to za niezgrabne. Zanotuj tak XML SPECJALNE charaktery wewnątrz kod funkcji musi być zbiegły, np. & musi zostać reprezentowany jako & amper;. Ponadto jakieś elementy składni funkcji różnią się od reprezentacji scenariusza standardu: parametry i powrócić wartości (jeżeli jakiś) jest reprezentowany w XML. Zasadniczo funkcja wstępnie parsowana i przygotowany do szybkiego ładowania używającego libxml.
Czy ładujesz się paczka
Powód paczka działa w ten sposób? Widzą whafs na ofercie dotychczas, spróbować następną fazą zchodzisz-.
Zamknięty gretl, wtedy odnośnie-otwarty to. Teraz pójdź do “Plik, Funkcja pliki, Na miejscowej maszynie". Jeżeli poprzednia scena powyższa poszła ok, powinieneś zobaczyć plik, który spakowałeś i zaoszczędzasz, z jego krótkim opisem. Jeżeli klikasz na, “Informacja” której dostajesz okno z cały informacja gretl zebrała od paczki funkcji. Jeżeli klikasz na “Widok kod” ikonę w pasku narzędzi tego nowego okna, dostajesz okno widoku scenariusza pokazujące faktyczny kod funkcji. Teraz z powrotem do “Funkcja paczki” okna, jeżeli klikasz na imię paczki, funkcje są władowane do gretl, gotowego, by zostać nazwane przez klikanie na “Cali” guziku.
Po władowaniu funkcji(s) od paczki, otwórz GUI konsolę. Spróbuj pisanie na maszynie pomocy foo, replac-ing foo z imieniem publicznej powierzchni międzyfazowej od załadowanej funkcji paczka: jeżeli trochę pomocy tekst był zaopatrzony, ponieważ funkcja, to powinno zostać przedstawione.
W podobnym sposobie, możesz przeglądnąć i władować paczki funkcji dostępne na gretl serwującym, przez wybieranie “Plik, Funkcja pliki, Na serwującym”.
Gdy tylko twoja paczka jest zainstalowana na twojej miejscowej maszynie, możesz użyć funkcja, jako która to zawiera przez graficzną powierzchnię międzyfazową opisała powyżej lub przez używanie CLI, mianowicie w scenariuszu lub przez konsolę. W ten ostatnim przypadku, ładujesz funkcję przez zawrzyj rozkaz, wyszczególniając plik paczki jako dyskusja, kompletna z .gfn rozszerzenie.
Cyfra 10.3: Używając twoją paczkę,
By kontynuować z naszym przykładem, władować plik np.gdt (dostarczony z gretl między zestawami danych próbki). Sądźmy, że chcesz policzyć tempo zmiany dla zmiennego iprod przez twoją nową funkcję i gromadzisz skutek w seriach nazywanych foo.
Pójdź do “Plik, Funkcja pliki, Na miejscowej maszynie”. Będziesz pokazany wykazem zainstalowanych paczek, zawierając ten, który tylko utworzyłeś. Jeżeli wybierasz to i klikasz dalej, “Wykonać” (lub podwójne kliknięcie na imieniu paczki funkcji), okno podobne do tego pokazanego w cyfrze 10.3 wyda się.
Rozdział 10.. Zdefiniowane na Użytkowniku funkcje
73
Zawiadomienia to sznur opisu “Serie, by rozpocząć proces”, dostarczył z definicją funkcji, wydaje się w lewie najlepszego wybierającego serii.
Klik “Ok” i serie foo będzie wygenerowany (widzieć cyfrę 10.4). Możesz musieć iść do “Dane, Odświeżyć dane” aby mieć twoja nowa zmienna ukazuje się w głównej liście zmiennej okna (lub tylko nacisnąć “r” klucz).
Cyfra 10.4: Procent zmiana w przemysłowej produkcji
Alternatywnie, to sam mogłoby dokonany przez scenariusz
zawiera pc.gfn
otwarty np
foo = PC(iprod)
Dzieli
na
rozdziały 11
Nazywanych list i sznury
11.1 Nazywane listy
Wiele gretl rozkazuje brać jeden lub więcej wykazów serii jako dyskusje. Robią to łatwy, by sprawować się w kontekście scenariuszy rozkazu i w szczególnym w zdefiniowanych na użytkowniku funkcjach, gretl oferuje możliwość nazwanych list.
Tworząc i modyfikując nazwane listy nazywana lista jest utworzona używając listę słowa kluczowego, mającą za sobą imię listy, eąuals znaku i wyrażenia, które tworzy listę. Najwięcej basie rodzaju wyrażenia, które pracuje w tym kontekście, jest rozdzielonym przez przestrzeń wykazem zmiennych, podanych albo z nazwiska lub przez ID numeru. Na przykład
lista xlist = 1 2 3 4
lista reglist = cena dochodu
Notatka, że zmienne w ąuestion muszą być typu serii: nie możesz zawrzeć skalarów w nazywanej liście.
Dwie specjalne formy są dostępne:
Jeżeli używasz słowo kluczowe nul 1 na prawej stronie, dostajesz pustą listę.
Jeżeli używasz zestawu danych słowa kluczowego po prawej stronie, dostajesz listę zawierającą wszystkie serie w aktualnym zestawie danych (oprócz wstępnie zdefiniowanego const).
Imię listy musi rozpocząć od listu i musi zostać skomponowane całkowicie listów, numerów lub podkreślić charakter. Długość maksimum imienia jest 15 charakterami; imiona listy nie mogą zawrzeć przestrzeni.
Raz na nazywana lista została utworzona, to “może zapamiętane” dla trwania gretl sesji i jest użyte w kontekście jakiegoś gretl rozkazu, gdzie jest wykaz zmiennych oczekiwany. Jeden prosty przykład jest specyfikacją wykazu regressors:
lista xlist = xl x2 x3 x4 ols y 0 xlist,
By pozbyć się listy, możesz użyć następnej składni:
lista xlist usuwa
Uważać: skreślić xlist skreślą zmienne zawarte w liście, więc to sugeruje utratę danych (które nie może być tym, co chcesz). Z drugiej strony lista xlist usuwa po prostu “unzdefiniujesz” xlist identyfikator i sami zmienne nie będą dotknięci.
Listy mogą zostać zmodyfikowane w dwóch drogach. Przedefiniowują istniejącą listę zupełnie, użyć tej sam składni, jeśli chodzi o tworzenie listy. Na przykład
lista xlist = 1 2 3 xlist = 4 5 6
74
Rozdziału 11.. Nazwane listy i sznury
75
Po drugim zadaniu, xlist zawiera tylko zmienne 4, 5 i 6..
Aby dodać lub prepend zmienne do istniejącej listy, możemy wykorzystać fakt, że nazywane stojaki listy w dla “pismo ręczne” listy. Na przykład możemy
sporządzić
listę xlist = xlist 5 6 7 xlist = 9 10 xlist 11 12
Inna opcja dla dodawania okresu (lub lista) do istniejącej listy ma użyć +=, jako w
xlist += cpi,
By upuścić zmienną od listy, użyć -=:
xlist -= cpi
W większości kontekstów, gdzie są listy użyte w gretl, oczekuje, aby oni nie zawarli jakichś podwojonych elementów. Jeżeli tworzysz nową listę przez prosty konkatenacja, jako w liście L3 = LI L2 (gdzie LI i L2 istnieje listy), to możliwe, żeby skutek mógł zawrzeć duplikaty. Aby schronić przeciw temu ciebie może utworzyć nową listę jako związek dwóch egzystowania:
lista L3 = LI || L2 skutkiem jest lista, która zawiera wszystkich członków LI, plus jacyś członkowie L2 tego są nie już w LI.
W tej sam żyle, możesz zbudować nową listę jako przecięcie dwóch egzystowania:
lista L3 = LI && L2 Tu L3 zawiera wszystkie elementy, które są obecne zarówno w LI, jak i w L2.
listy i macierze
Inna droga tworzenia listy jest przez zadanie od macierzy. Macierz w ąuestion musi być wytłumaczalna jako wektor zawierający ID numerów (serie) zmiennych. To może być albo rzędem albo wektorem kolumny i każdy z jego elementów musi mieć część całości, która jest nie większa niż numer zmiennych w zbiorze danych. Na przykład:
macierz m = { 1,2, 3,4 } lista L = m powyższy ok być pod warunkiem, że zbiór danych zawiera co najmniej 4 zmienne.
Ouerying lista Możesz zdecydować się, czy nieznana zmienna właściwie reprezentuje listę używającą funkcja islist().
serie xli = wpisz(xl) serie xl2 = wpisać(x2) sporządzają listę xlogs = xli xl2 genr isl = islist(xlogs) genr is2 = islist(xll) pierwszy genr rozkaz powyższy przydzieli wartość 1 isl od xlogs jest faktycznie nazywaną listą. Drugi genr przydzieli 0 is2 od xl1 jest seriami danych, nie lista.
Możesz również określić numer zmiennych lub elementów w liście używającej funkcja nelem().
Rozdział 11.. Nazwane listy i sznury
76
lista xlist = 1 2 3 ni = nelem(xlist) który (skalar) zmienny ni będzie wyznaczony wartość 3 odkąd xlist zawiera 3 członków.
Możesz pokazać członkostwo nazywanej listy tylko przez dawanie jego imienia, jako zilustrowany w tej interakcyjnej sesji
? lista xlist = xl x2 x3 Dodał lista 'xlist' ? xlist xl x2 x3
Notuje to drukować xlist zrobią coś innego, mianowicie drukować wartości wszystkich zmiennych w xlist (jako powinien zostać oczekiwany).
Wygenerowując wykazy przekształconych zmiennych
Podanych nazywany wykaz zmiennych, jesteś w stanie wygenerować wykazy transformacji tych zmiennych używających kloc funkcji, opóźnienia, diff, ldiff, sdiff lub dummify. Na przykład
lista xlist = xl x2 x3 lista lxlist = wpisz(xlist) sporządzają listę difflist = diff(xlist) wygenerowywanie wykazu opóźnień w ten sposób, wyszczególniasz opóźnienie maksimum porządek wewnątrz parenthe ses, przed imieniem listy i rozszedł się przez przecinek. Na przykład
lista xlist = xl x2 x3
lista laglist = opóźnienia(2, xlist)
lub porządek
skalara = 4
lista laglist = opóźnienia(porządek, xlist) który
Te rozkazy zaludnią 1 agi ist z wyszczególnionym numerem opóźnień zmiennych w xlist. Możesz dać imię pojedynczych serii zamiast listy jako druga dyskusja 1 srebrom: to jest równoważny dawaniu listy z tylko jednym członkiem.
dummify funkcja tworzy zbiór zmiennych smoczka kodujących dla wszystkich z wyjątkiem jednej z odmiennych wartości wziętych przez oryginalną zmienną, która powinna być dyskretna. (Najmniejsza wartość jest wzięta jako pominięty catgory.) Jak opóźnienia, ta funkcja powraca listę nawet jeśli wejście jest pojedynczymi seriami.
Wygenerowując serie od list
Raz na lista jest zdefiniowana, gretl oferuje kilka funkcji, które odnoszą się do listy i powracają serie. W większości wypadków te funkcje również odnoszą się do pojedynczych serii i zachowują się jako naturalne rozszerzenia, kiedy być odnieść się do listy, ale to jest nie zawsze przypadek.
Dla uznawania i radzenia chybiających wartości, Gretl oferuje kilka funkcji (widzą, że Gretl Dowodzi Odniesienie dla szczegółów). W tym kontekście, to jest warta, zauważyć, że ok() funkcja może zostać użyta z dyskusją listy. Na przykład
lista xlist = xl x2 x3 serie xok = ok(xlist)
Dzieli
na
rozdziały 11.. Nazwane listy i sznury
77
YpcFR YpcGE YpcIT NFR NGE GNIDY
114.9 124.6 119.3 59830.635 82034.771 56890.372
115.3 122.7 120.0 60046.709 82047.195 56906.744
115.0 122.4 117.8 60348.255 82100.243 56916.317
115.6 118.8 117.2 60750.876 82211.508 56942.108
116.0 116.9 118.1 61181.560 82349.925 56977.217
116.3 115.5 112.2 61615.562 82488.495 57157.406
112.1 116.9 111.0 62041.798 82534.176 57604.658
110.3 116.6 106.9 62444.707 82516.260 58175.310
112.4 115.1 105.1 62818.185 82469.422 58607.043
111.9 114.2 103.3 63195.457 82376.451 58941.499
Stołu 11.1: GDP na osobę i populacja w 3 Eur opean kraje (Źródło: Eurostat)
Potem te rozkazy, serie xok będzie mieć wartość 1 dla obserwacji, gdzie żaden z xl, x2 lub x3 ma brakującą wartość i wartość 0 dla trochę obserwacje, gdzie jest ten warunek nie spotkany.
Maksimum funkcji, min, znacz, sd, suma i var zachowuje się poziomo niż pionowo kiedy jest ich dyskusja listą. Na przykład następna
lista rozkazów Xlist = xl x2 x3 serie m = znaczy(Xlist)
doprowadzić do serie m, którego mną th element jest, średnia x \ tu * 2, ja i x $ ti; gubiąc wartości, jeżeli jakiś, domyślnie jest zrzucony.
Ponadto, gretl dostarcza trzy funkcje dla obciążonych działań: wmean, wsd i wvar. Rozważ jako ilustracja Stół 11.1: pierwsze trzy kolumny są GDP na osobę dla Francji, Niemiec i Włoch; kolumny 4 do 6 zawierają populację dla każdego kraju. Jeżeli chcemy policzyć łącznym wskaźnikiem z na osobę GDP, wszystko, co musimy zrobić jest
listą Ypc = YpcFR YpcGE YpcIT lista N = y GNIDY NGE NFR = wmean(Ypc, N)
tak na przykład
114.9 X 59830.635 + 124.6 X 82034.771 + 119.3 X 56890.372
^ 1996 = dalej „ = 120.163
59830.635 + 82034.771 + 56890.372 Widzi, że Gretl Dowodzi Odniesienie dla więcej szczegółów.
11.2 Nazywanych sznurów
Dla jakichś celów to może być przydatne, by uratować sznur (to jest, seąuence charakterów) jako nazywana zmienna, która może zostać ponownie użyty. Wersje gretl wyżej niż 1.6.0 oferuje to udogodnienie, ale kilka z rafinowania zauważyli poniżej są dostępne tylko w gretl 1.7.2 i wyższy.
Aby zdefiniować zmienną sznura, możesz użyć albo dwóch rozkazów, sznura lub sprintf. Rozkaz sznura jest prostszy: możesz napisać, na przykład,
sznur sl = "trochę rzeczy, którą chcę uratować" sznur s2 = getenv("H0ME") sznur s3 = sl + 11
Rozdziału 11.. Nazwane listy i sznury
78 pierwsze pole, gdy sznur jest imieniem, pod którym sznur powinien zostać uratowany, wtedy przychodzi eąuals znak, wtedy przychodzi specyfikacja sznura, by zostać uratowana. To może być słowo kluczowe nuli, doprowadzić do pustego sznura lub może wziąć jakąkolwiek z następnych form: sznur dosłowny (załączył w podwójnym ąuotes); lub imię istniejącej zmiennej sznura; lub funkcja, która powraca sznur, (patrzcie poniżej); lub
jakiś z powyższy podążony około + i całość wyrównała.
Rola całości wyrównanej ma użyć podciągu poprzedzającego elementu, zaczynanie się w danym charakterze wyrównało. Pusty sznur jest powrócony, jeżeli offset jest większy niż długość sznura w ąuestion.
Aby dodać do końca istniejącego sznura możesz użyć operatora +=, jako w
sznur sl = "trochę rzeczy, którą chcę do " sznur sl " += zaoszczędzić"
lub możesz użyć ~ operator, by dołączyć się do drugiej lub więcej sznura, jako w
sznur sl = "słodki"
sznur s2 = "Dom " , ~ sl ~ " dom" .sprintf rozkaz jest bardziej elastyczny. To pracuje dokładnie jako printf rozkaz gretl's, oprócz że “formatem” sznur musi zostać poprzedzony przez imię zmiennej sznura. Na przykład
skalar x = 8
sprintf foo "var % d", x,
By użyć wartości zmiennej sznura w rozkazie, daj imię zmiennej poprzedzonej przez “w” znak, @. Ta notacja jest potraktowana jako “makropolecenie”. To jest, jeżeli seąuence charakterów w gretl rozkazie podążającym symbol @ jest rozpoznany jako imię zmiennej sznura, wartość tej zmiennej jest sustituted dosłownie do wiersza zlecenia zanim regularne parsowanie rozkazu jest niesione. To jest zilustrowany w co następuje interakcyjnej sesji
? skalar x = 8
skalara x = 8 Cenerated skalar x (ID 2) = 8 ? sprintf foo "var % d", x Zachował sznur jako 'foo' ? bądź w druku "@ foo" var8
Notuje efekt ąuotation znaków w linii są w druku "@ foo". Linia
? bądź w druku @ foo nie drukowałby literał “var8” jako powyżej. Po przetwarzaniu wstępnym linia przeczytałaby
drukować var8
To, dlatego drukowałoby wartość(s) zmiennego var8, jeżeli taka zmienna egzystowałaby lub wygenerowywałaby błąd inaczej.
W jakichś kontekstach, jakkolwiek, to chce potraktować zmienne sznura jako zmienne w ich własnym dobrze: aby zrobić to, dać imię zmiennej nie prowadząc @ symbol. To jest sposobem radzenia takich zmiennych w następnych kontekstach:
Rozdział 11.. Nazwane listy i sznury
79
Kiedy oni wydają się między dyskusjami do rozkazy printf i sprintf.
Na prawej stronie zadania sznura.
Kiedy oni wydają się jako dyskusja do funkcji biorącej dyskusję sznura.
Tu jest ilustracja użycia nazwanych dyskusji sznura z printf:
sznur vstr = "niezgodność" Cenerated sznur vstr printf "vstr: % 12s \ n", vstr vstr: niezgodność
Notatka, że vstr nie powinien zostać położony w ąuotes w tym kontekście. Podobnie z
? sznur vstr_copy = vstr
Wbudowane sznury
Oprócz jakichś sznurów, które użytkownik może zdefiniować, jakieś zmienne sznura są zdefiniowane przez sam gretl. Ci mogą być przydatni dla ludzi piszących funkcje, które zawierają rozkazy muszli. Wbudowane sznury jak są pokazane w Stół 11.2.
gretldir aktualny gretl katalog bieżący
dotdir gretl instalacja kierującego
workdir użytkownika kierujące gretl użycie dla pliki robocze
gnuplot ścieżki do można lub imię z, gnuplot wykonywalna
tramo ścieżka do lub imię z, tramo wykonywalna
xl2a ścieżka do lub imię z, l x 2-arima wykonywalny
tramodir tramo dane kierujące
xl2adir l x 2-arima dane kierujące
Stół 11.2: Wbudowany sznur zmienne
Czytające sznury od środowiska
Ponadto, przeczytać do gretl's nazywanych sznurów, wartości, które są zdefiniowane w zewnętrznym środowisku. Aby zrobić temu ciebie używają funkcja geterw, który bierze imię zmiennej środowiska jako jego dyskusja. Na przykład
? użytkownik sznura = getenv("UŻYTKOWNIK")
Zachował sznur jako 'user'
? sznur do domu = getenv("DOM")
Zachował sznur jako 'home'
? bądź w druku "@ katalog macierzysty użytkownika jest @ dom" katalog macierzysty
cottrell's jest / dom / cottrell sprawdzić, czy dostałeś bez --pustą wartość od danego cali do geterw, możesz użyć funkcja strlen, którego odzyskuje długość sznura, jako w
? czasowy pracownik sznura = getenv("CZASOWY PRACOWNIK") Zachował pusty sznur jako 'temp' ? skalar x = strlen(czasowy pracownik) Cenerated skalar x (ID 2) = 0
Rozdziału 11.. Nazwane listy i sznury
80 funkcja isstring powroty 1, jeżeli jego dyskusja jest imieniem zmiennej sznura, 0 inaczej. Jakkolwiek, jeżeli powrót jest 1, sznur może nadal być pusty.
Obecnie geterw funkcja może tylko zostać użyta na prawej stronie zadania sznura, jako w powyższych ilustracjach.
Chwytając sznury przez muszlę,
Jeżeli rozkazy muszli są umożliwione w gretl, możesz schwytać produkcję od takich rozkazów używających
sznur składni stringname = $(shellcommand) który
To jest, dołączasz rozkaz muszli w nawiasach, poprzedzony przez znak dolara.
Czytając od pliku do sznura, któremu Możesz przeczytać zawartością pliku do zmiennej sznura używającej sznur składni stringname = readfi 1 e(nazwa zbioru) pole nazwy zbioru może zawrzeć komponenty, które są, zmienne sznura. Na przykład sznur foo = readfile(xl2adir / QNC.rts) który strstr funkcja
Inwokacja tej funkcji bierze
sznur formy stringname = strstr(sl, s2 ~) efekt ma przeszukać sl dla pierwszego zdarzenia s2. Jeżeli żadne takie zdarzenie nie jest znalezione, pusty sznur jest powrócony; inaczej porcja sl rozpoczynającego od s2 jest powrócona. Na przykład
? sznur hw = "cześć świat"
Zachowany sznur jako 'hw'
? sznur w = strstr(hw, "och")
Zachowany sznur jako 'w'
? bądź w druku "@ w"
och świat
Rozdział 12
Macierz manipulacji
Razem z innym dwoma basie pisze dane (serii i skalarów), gretl oferuje ąuite compre-hensive wybór macierzy metody. Ten rozdział ilustruje właściwości składni macierzy i dyskutuje krótko kilka z bardziej złożonych funkcji macierzy. Dla fuli wykazu funkcji macierzy i wszechstronnego opisu ich składni, proszę odnoś.
12.1 Tworzących macierzami
Macierzy może zostać utworzony używając jakąkolwiek z tych metod:
Przez bezpośrednią specyfikację wartości skalara, które komponują macierz, - w numerycznej formie, przez odniesienie do wstępnie istniejących zmiennych skalara lub używając policzone wartości.
Przez dostarczanie wykazu serii danych.
Przez dostarczanie nazywanego wykazu serii.
Używając formułkę tego sam ogólnego typu, który jest użyty z genr rozkazem, zgodnie, z którym nowa macierz jest zdefiniowana pod względem egzystujących macierzy i / lub skalary lub przez jakieś specjalne funkcje.
Wyszczególniają macierz bezpośrednio pod względem skalarów, składnia jest na przykład
macierz = { 1, 2, 3 ; 4, 5, 6 } macierz jest zdefiniowana przez rzędy; elementy na każdym rzędzie są rozdzielone przez przecinki i rzędy są rozdzielone przez pół dwukropków. Wyrażenie całości musi zostać zawinięte w klamerkach. Przestrzenie w klamerkach nie są znaczne. Powyższe wyrażenie definiuje 2 x 3 macierz. Każdy element powinien być numeryczną wartością, imieniem zmiennej skalara lub wyrażenia, które ocenia do skalara. Bezpośrednio po klamerce zamknięcia możesz dodać pojedynczy ąuote (') by panować przestawić.
Wyszczególniają macierz pod względem serii danych składnia jest, na przykład,
macierzą = { xl, x2, x3 }
gdzie są imiona zmiennych rozdzielone przez przecinki. Oprócz imion egzystujących zmiennych, możesz użyć wyrażeń, które oceniają do serii. Na przykład podany serie x mógłbyś zrobić
macierz = { x, xA2 }
Każdy zmienny oceupies kolumna (i może tylko być jedna zmienna na kolumnie). Nie możesz użyć pół dwukropka jako separator rzędu w tym przypadku: jeżeli chcesz, serie zaplanowały w rzędach, dodać przestawić symbol. Zasięg danych wartości włączane do macierzy zależy od aktualnego ustawienia zasięgu próbki.
«• Kiedy wbudowane statystyczne funkcje gretl's dla danych serie są kompetentne obsługiwania gubiącego wartości, funkcje arytmetyki macierzy nie są. Kiedy budujesz macierz od serii, które zawierają chybiające wartości, obsen / ations forwhich co najmniej, jedne serie ma brakującą wartość jest opuszczony.
Zamiast dawania wyraźnego wykazu zmiennych, możesz zamiast tego dostarczyć imię uratowanej listy (widzą Rozdział 11), jako w
81
Chapterl2. Macierz manipulacja
82
lista xlist = xl x2 x3 macierz = { xlist }
Kiedy dostarczasz nazywaną listę, serie danych domyślnie są umieszczone w kolumnach, jako jest naturalny w ekonometrycznym kontekście: jeżeli chcesz ich w rzędach, dodać przestawić symbol.
Jako specjalna okoliczność budowania macierzy od wykazu zmiennych, możesz powiedzieć
macierz = { zestaw danych }
To buduje macierz używającą wszystkie serie w aktualnym zestawie danych, oprócz stała (zmiennej 0). Kiedy ta lista smoczka jest użyta, to musi być jedynym elementem w definicji macierzy {...}. Możesz, jakkolwiek, utworzyć macierz, która zawiera stała wraz z wszystkimi innymi zmiennymi używającymi poziomy konkatenacja, (patrzcie poniżej), jako w
macierzy = { const }~{ zestaw danych }
macierz składni = {}
tworzy pustą macierz - macierz z rzędami zera i kolumnami zera. Zobacz sekcję 12.2 dla dyskusji tego przedmiotu.
«• Imiona macierzy muszą zadowolić te sam żądania jak imiona gretl zmiennych ogólnie: imię może być nie dłużej niż 15 charakterów, musi rozpocząć od listu i nie musi składać się z niczego tylko listy, numery i podkreślić charakter.
12.2 Pustych macierzy głównym celem pojęcia pustej macierzy jest umożliwienie użytkownikowi zdefiniowanie punktu początkowego dla działań konkatenacja subseąuent. Na przykład, jeżeli x jest już zdefiniowaną macierzą jakiejś wielkości,
macierz rozkazów = {} macierz B = ~ X
skutek w macierz B identycznym do X.
Od algebraicznego punktu widzenia, to może mieć sens pomysłu pustej macierzy pod względem przestrzeni wektora: jeżeli macierz jest zamówionym zbiorem wektorów, wtedy ={} jest pustym zbiorem. Jako conseąuence, działania włączające dodatek i mnożenia nie mają jakiegoś elear znaczenia (prawdopodobnie, oni nie mają żadnego w ogóle), ale działania włączające moc zbioru tego zbioru (to jest, wymiar przestrzeni rozciągnął się przez) są znaczące.
Prawne działania na puste macierze są sporządzone listą w Stół 12.1. (Zupełnie inne działania macierzy gener-zjadły błąd kiedy pusta macierz jest dana jako dyskusja.) Zgodnie z powyższymi interpreta-tion, trochę funkcje macierzy powracają pustą macierz poniżej pewne warunki: funkcje linia ukośna, vec, vech, urwech kiedy dyskusje jest pustą macierzą; funkcje ja, zera, mnormal, muniform kiedy jeden lub więcej dyskusji jest 0; i funkcja nuli przestrzeń kiedy jego dyskusja ma szereg kolumny fuli.
12.3 Selekcja łodzi podwodnej macierzy, która Możesz wybrać łódź podwodną macierze danej macierzy używające składnię,[rzędy, przełęcze,] gdzie rzędy mogą wziąć jakąkolwiek z tych form:
Chapterl2. Macierz manipulacja
83 Powrót
Funkcji wartość
A', transp()
wiosłuje() 0
przełęczy() 0
szeregu() 0
det() NA
ldet() NA
tr() NA
onenorm() NA
infnorm() NA
rcond() NA
Stół 12.1: Ważne funkcje na pustej macierzy,
pusty wybiera wszystkie rzędy pojedyncza całość wybiera singiel wyszczególniony rząd
dwie całości oddzielne przez dwukropek wybiera zasięg rzędów, które imię macierzy wybiera wyszczególnione rzędy
W odniesieniu do opcji 2, wartość całości może zostać dana numerycznie, jako imię istniejącej zmiennej skalara lub jako wyrażenie, które ocenia do skalara. Z opcją 4, macierz indeksu oddawana pole rzędów musi być albo p x 1 albo 1 x p i powinna zawrzeć całość ceni w zasięgu 1 do n, gdzie jest n numerem rzędów w macierzy, od której wybór ma zostać zrobiony.
Specyfikacja przełęczy pracuje w tej sam drodze, mutatis mutandis. Tu są jakieś przykłady.
macierz B =[l,]
macierz B =[2:3,3:5,]
macierz B =[2,2,]
macierz idx = { 1, 2, 6 }
macierz B =[idx,] pierwszy przykład wybiera rząd 1 od macierzy; drugi wybiera 2 x 3 podmatryca; trzeci wybiera skalara; i czwarty wybiera rzędy 1,2 i 6 od macierzy A.
Ponadto jest wstępnie zdefiniowany indeks specyfikacja, linia ukośna, która wybiera główną przekątną sąuare macierz, jako wewnątrz B,[linia ukośna,], gdzie jest B sąuare.
Możesz użyć wyborów tego rodzaju na albo prawej stronie wygenerowującej macierzy formułki albo lewych. Tu jest przykład użycia wyboru po prawej stronie, ekstrahować 2 x 2 podmatryca B od 3x3 macierzy:
macierz = { 1, 2, 3; 4, 5, 6; 7, 8, 9 } macierz B =[l:2,2:3,]
I tu są przykłady wyboru na lewo. Druga linia poniżej pisze 2 x 2 macierz tożsamości do kąta prawa dna 3x3 macierzy A. The, który czwarta linia zastępuje przekątna z z ls.
macierz = { 1, 2, 3; 4, 5, 6; 7, 8, 9 } macierz,[2:3,2:3,] = 1(2) macierz d = { 1, 1, 1 } macierz,[linia ukośna,] = d
Chapterl2. Macierz manipulacja
84
12.4 Macierz operatorów
Co następują dwójkowi operatorzy są dostępni dla macierzy:
+ dodatek
- odejmowanie
"r \ zwykłe mnożenie macierzy
' wstępnie-mnożenie około przestaw
/ macierz “podział” (patrzcie poniżej)
/ ■ * ■ / według kolumn konkatenacja
| wiosłujesz-mądry konkatenacja
"r "\ r \ Kronecker produkt
= test dla eąuality
Ponadto, następni operatorzy (“kropka” operatorzy) odnoszą się na podstawie przez-elementu elementu
.+ .- .* ./ ..= .> .<
Tu są wytłumaczenia mniej oczywistych przypadków.
Dla dodatku macierzy i odejmowania, ogólnie dwie macierze muszą być tych sam wymiarów ale wyjątek do tej reguły jest przyznany, jeżeli jeden z argumentów jest 1 x 1 macierz lub skalar. Skalar domyślnie jest wypromowany do stanu macierzy poprawnych wymiarów, wszystkich czyje elementy eąual jest do danej wartości skalara. Na przykład, jeżeli jest m x n macierzą i k skalar, wtedy
macierz rozkazów C = + k macierz D = - k
zarówno produkcja m x n macierze, z elementy cy = zawsze + k i c £ y = tak - k odpowiednio. Około “wstępnie-mnożenie około przestaw” znaczymy, na przykład, że
macierz C = X'Y
produkuje produkt z X-przestawić i Y. In efekt, wyrażenie X'Y jest shorthand dla X' * Y (które jest również ważne).
W macierz “podziale”,
macierzy stwierdzenia C = / B jest zinterpretowany jako reąuest, by znaleźć macierz C, który rozwiązuje BC, = A. If B jest sąuare macierzą, to jest potraktowany jako ekwiwalent do B ~ 1A, który zawodzi, jeżeli B jest pojedynczy; numeryczna metoda zatrudniona tu jest LU rozkładem. Jeżeli B jest T x k macierzą z T > k, wtedy C jest najmniejszy sąuares rozwiązaniem, C = (B'B)~ 1B'A, który zawodzi, jeżeli B'B jest pojedynczy; numeryczna metoda zatrudniona tu jest QR rozkładem. Inaczej działanie koniecznie zawodzi.
W “kropka” działaniach dwójkowe działanie jest stosowane elementem przez element; skutek tego działania jest oczywisty, jeżeli macierze są tej sam wielkości. Jakkolwiek jest kilka innych przypadków, gdzie tacy operatorzy mogą zostać stosowany. Na przykład jeżeli piszemy
macierzy C = .- B
wtedy skutek C zależy od wymiarów z i B. Let być m x n macierzą i pozwolić B być p x; skutkiem jest następująco:
Chapterl2. Macierz manipulacja, którą
85
Wymiarów Skutku
Przypadku dopasowuje (m = p i n =) cij = tak - bij jest wektorem kolumny; rzędy pasują (m = p; n = 1) cy = w - bij
B jest wektorem kolumny; rzędy pasują (m = p; = 1) cy = tak - bi jest wektorem rzędu; kolumny pasują (m = 1; n =) cij = aj - bij
B jest wektorem rzędu; kolumny pasują (m = p; = 1) cij = aij ~ bj jest wektorem kolumny; B jest wektorem rzędu (n = 1; p = 1) cy = w - bj jest wektorem rzędu; B jest wektorem kolumny (m = 1; = 1) cy = aj - fcj jest skalarem (m = 1 i n = 1) cy = - ł > y
B jest skalarem (p = 1 i q = 1) cy = tak - b,
Jeżeli żaden z powyższych warunków są satished skutek jest nieokreślony i błąd jest wybrukowany.
Zauważ, że ta konwencja robi to niepotrzebne, w większości wypadków, by użyć przekątnych macierzy, by wykonać transformacje przy pomocach zwykłego mnożenia macierzy: jeżeli Y = XV, gdzie jest V przekątny, to jest computationally dużo bardziej dogodny, by uzyskać Y przez
macierz instrukcji Y = X .* v
gdzie jest v wektorem rzędu zawierającym przekątną V.
W według kolumn konkatenacja mxn macierzy i mxp matrixB, skutkiem jest mx (n + p) macierz. To jest,
macierz C = ~ B
doprowadza do C = \ B \.
Wiosłujesz-mądry konkatenacja m x n macierzy i p x n macierz B produkuje (m + p) x n macierz. To jest,
macierz C = | B B
doprowadza do C =
B
12.5 Macierz skalar operatorów
Dla macierzy i skalar k, operatorzy pokazani w Stole 12.2 są dostępni. (Dodatek i subtrac-tion był dyskutowany w przekroju 12.4 ale zawieramy ich stół dla pełni.) Ponadto, dla sąuare i całość k > 0, B = AAk doprowadza do macierzy B, który jest podniesionym do władzy, k. (Zauważyć tak operatora ** nie może zostać używany na miejscu z w tym celu, ponieważ wewnątrz macierz kontekstowa, która to jest zarezerwowany, ponieważ Kronecker produkt.)
12.6 Macierz działa
Większość gretl funkcje dostępne dla skalarów i serie również odnosi się do macierzy wewnątrz przez-element element modę i jako taki ich zachowanie powinno być dość oczywisty. To przedstawia się tak dla funkcji takiego jak kloca, exp, grzechu, itd.. Te funkcje mają efekty udokumentowane w odniesieniu do genr rozkazu. Na przykład, jeżeli macierz już jest zdefiniowany, wtedy
macierz B = sqrt()
Chapterl2. Macierz manipulacja
86 Efekt
Wyrażenia
macierz B = * k bij = kaij
macierz B = / k bij = aij / k
macierz B = k / bij = k / aij
macierz B = + k bij = aij + k
macierz B = - k bij = aij - k
macierz B = k - bij = k - aij
macierz B = % k bij = aij modulo k
Stół 12.2: Macierz skalar operatorzy
wygenerowuje macierz taki tak bij = ^/ aij. Ali taki funkcje reąuire pojedyncza macierz jako dyskusja lub wyrażenie, które ocenia do pojedynczego matrix.1
W tej sekcji, która przeglądamy sonie aspekty genr funkcji, który odnosi się szczególnie do macierzy. fuli opis każdej funkcji jest dostępny w Odniesieniu Rozkazu Gretl.
Tworzenie i ja / Och
colnames linia ukośna ja niższy makemask mnormal
mread muniform mwrite seq unvech
górny vec vech wyzerowuje
przełęcze dsort mshape msortby beszta selifc
selifr rodzaj trimr
cdiv cholesky cmult det eigengen eigensym
fft ffti ginv infnorm inv invpd
ldet mexp nullspace onenorm polroots qform
qrdecomp zaszeregowują rcond svd tr transp
cdemean z imaxc imaxr iminc iminr
maxc maxr mcorr mcov meanc meanr
minc minr mlag mole mxtab princomp
quantile < http:// quantile > ponownie pobrać próbkę sdc sumc sumr ceni
BFGSmax fdjac
Transformacje
lincomb
Stół 12.3: Macierz funkcje około kategoria
Macierz odkształcająca
Oprócz metody dyskutowały w przekrojach 12.1 i 12.3, macierz może również zostać utworzona około odnośnie planujący elementy wstępnie istniejącej macierzy. To jest skończony przez mshape funkcję. To bierze trzy dyskusje: macierz wejścia, i rzędy i kolumny docelowej macierzy, r
1Note to znaleźć “macierz sąuare korzeń” potrzebujesz cholesky funkcja (patrzcie poniżej); ponadto exp funkcja liczy wykładniczy element przez element i, dlatego naprawdę nie powraca macierzy wykładniczej, chyba że macierz byłaby przekątną - aby dostać macierz wykładniczą, użyć mexp.
Chapterl2. Macierz manipulacja
87
i c odpowiednio. Elementy są przeczytane od i napisany do celu w kolumna głównym porządku. Jeżeli zawiera mniej elementów niż n = r x c, oni są powtórzeni cylkicznie; jeżeli ma więcej elementów, tylko pierwszy n jest użyty.
Na przykład
macierz = mnormal(2,3)
macierz b = mshape(, 3,1)
b
macierz b = mshape(, 5,2)
b
produkuje
? 1.2323 0.99714 -0.39078 0.54363 0.43928 -0.48467
? macierz b = mshape(, 3,1) Cenerated macierz b ? b b
1.2323 0.54363 0.99714
? macierz b = mshape(, 5,2) Zastąpiony macierz b ? b b
1.2323 -0.48467
0.54363 1.2323
0.99714 0.54363
0.43928 0.99714
-0.39078 0.43928
Złożone mnożenie i dhdsion, który
Cretl nie ma żadnego ojczystego zaopatrzenia dla złożonych numerów. Jakkolwiek basie działania mogą zostać wykonane na wektorach złożonych numerów przez używanie konwencji, że wektor n złożonych numerów jest reprezentowany jako n x 2 macierz, gdzie pierwsza kolumna zawiera prawdziwą część i sekundę wymyślona część.
Dodatek i odejmowanie są trywialne; funkcje emult i cdiv liczą złożony produkt i podział, odpowiednio, dwóch macierzy wejścia i B, reprezentując złożone numery. Te macierze muszą mieć ten sam numer rzędów, n i albo lub dwóch kolumny. Pierwsza kolumna zawiera prawdziwą część i drugi (jeżeli obecny) wymyślona część. Wartość powrotu jest n x 2 macierz lub, jeżeli skutek nie ma żadnej wymyślonej części, n wektor.
Na przykład sądzisz ty mają z \ = [1 + 2i, 3 + 4i,]' i Z2 = [1, ja,]'
? zl = { 1,2;3,4 }
zl = { 1,2;3,4 } Cenerated macierz zl
Chapterl2. Macierz manipulacja
88
? z2 = 1(2)
z2 = 1(2) Cenerated macierz z2 ? conj_zl = zl .* { 1,-1 }
conj_zl = zl .* { 1,-1 } Cenerated macierz conj_zl ? eval cmult(zl, z2)
eval cmult(zl, z2) 1 2 -4 3
? eval cmult(zl, conj_zl) eval cmult(zl, conj_zl) 5 25
Wielokrotny wraca i nul 1 słowo kluczowe
Jakieś funkcje biorą jeden lub więcej macierzy jako dyskusje i policzyć jeden lub więcej macierzy; ci są:
eigensym Eigen analiza symetryczna macierz
eigengen Eigen analiza ogólny
mole macierzy Macierz OLS
qrdecomp QR rozkład
svd Pojedynczego rozkładu wartości (SVD) którym ogólna reguła jest: “główny” skutek funkcji zawsze jest powrócony jako skutek właściwy. Pomocnicze powroty, jeżeli potrzebował, jest odzyskany używającymi wstępnie istniejącymi macierzami, które są minięte do funkcji jako wskazówki (zobacz 10.4). Jeżeli takie wartości nie są potrzebowane, wskazówka może zostać zastąpiona ze słowo kluczowe nuli.
Składnia dla qrdecomp, eigensym i eigengen jest
macierzy formy B = func(, & C) pierwsza dyskusja, reprezentują dane wejścia, to jest, macierz rozkład lub analiza jest reąuired. Druga dyskusja musi być jeden z dwóch imiona istniejącej macierzy poprzedziły około & (wskazywać “zwrócić się do” macierzy w ąuestion), w którym przypadku pomocniczy skutek jest napisany do tej macierzy lub słowie kluczowym nul 1, w którego przypadek do pomocniczego skutku doprowadzony lub jest zrzucony.
W przypadku bez --pusta druga dyskusja jest dana, wyszczególniona macierz pisana z pomocniczym skutkiem. (To nie jest reąuired, że dotychczasowy macierz być właściwych wymiarów, by otrzymać skutek.) funkcja eigensym liczy eigenvalues i opcjonalnie właściwy eigenvectors, symmetric n x n macierzy. eigenvalues jest powrócony bezpośrednio w wektorze kolumny długość n; jeżeli eigenvectors jest reąuired, oni są powróceni w n x n macierzy. Na przykład
macierz V
macierz E = eigensym(M, & V)
macierz E = eigensym, który(M, nuli)
W pierwszym przypadek E trzyma eigenvalues M i V trzyma eigenvectors. W drugim, E trzyma eigenvalues ale eigenvectors nie jest policzony.
Funkcja eigengen liczy eigenvalues i opcjonalnie eigenvectors, ogólnej nxn macierzy. eigenvalues jest powrócony bezpośrednio w nx 2 macierz, pierwsza kolumna trzymająca prawdziwe komponenty i drugą kolumnę wymyślone komponenty.
Chapterl2. Macierz manipulacja
89,
Jeżeli eigeiwectors jest reąuired, (to jest, jeżeli druga dyskusja do eigengen nie jest nuli), oni są powróceni w n x n macierzy. Przygotowanie kolumny tej macierzy jest nieco bez --trywialne: eigenvectors jest zgromadzony w tym sam porządku jak eigenvalues, ale prawdziwy eigenvectors zajmuje jedną kolumnę, podczas gdy złożony eigenvectors bierze dwa (prawdziwa część jest pierwszym); suma num-ber kolumien jest cichy n, ponieważ koniuguj eigenvector jest opuszczony. Przykład 12.1 dostarcza (jak dobrze pójdzie) rozjaśniający się przykład (zobacz również subsekcja 12.6).
Przykład 12.1: Złożony eigenvalues i eigeiwectors
ustawiło nasieniu 34756
macierz v = mnormal(3,3)
/* zrobić eigen analizę */
1 = eigengen(, & v)
/* eigerwalue 1 jest prawdziwy, 2 i 3 jest kompleksem koniuguje */
drukować 1
drukują v
/*
kolumna 1 zawiera pierwszy eigenvector (prawdziwy)
*/
B = * v,[, l,]
c = 1,[1,1,] * v,[, l,]
/* B powinien równać się c */
drukować B
drukują c
/*
kolumny 2:3 zawiera prawdziwe i wymyślone części eigenvector 2 */
B = * v,[, 2:3,]
c = cmult((3,1)*(1,[2,]), v,[, 2:3,])
/* B powinien równać się c */
drukować B
drukować c, który qrdecomp funkcja liczy QR rozkład m x n macierzy: = QR, gdzie jest Q m x n prostokątną macierzą i R jest n x n górną trójkątną macierzą. Macierz Q jest powrócony bezpośrednio, kiedy R może zostać odzyskany przez drugą dyskusję. Tu są dwa przykłady:
macierz R
macierz Q = qrdecomp(M, & R)
macierz Q = qrdecomp(M, nuli)
W pierwszym przykładzie, trójkątny R jest uratowany jako R; w drugim, R jest zrzucony. Pierwsza linia ponad pokazami przykład “prostej deklaracji” macierzy: R oznajmiony, by być zmienną macierzy ale nie jest dany jakąś wyraźną wartością. W tym przypadku zmienna jest zainicjowana jako 1 x 1 macierzą pojedynczym element eąuals zerem.
Chapterl2. Macierz manipulacja
90 składnia dla svd jest
macierzą B = func(, & C, & D) funkcja svd liczy wszystko lub część pojedynczego rozkładu wartości prawdziwego mxn macierz A. Let k = min(łn, n). Rozkład jest,
gdzie jest U m x k prostokątną macierzą, 2 jest k x k przekątną macierzą i V jest k x n prostokątnym matrix.2, który przekątne elementy 2 są pojedyncze wartości z; oni są prawdziwi i nieujemni i są wróceni w porządku malejącym. Pierwsze k kolumny U i V są lewymi i właściwymi pojedynczymi wektorami z A. svd funkcja powraca pojedyncze wartości, wewnątrz wektor długości k. lewi i / lub właściwym singular wektory mogą zostać uzyskane około dostarczając bzy --puste wartości, ponieważ drugi i / lub trzeci dyskusje odpowiednio. Na przykład
macierz s = svd(, & U, & V) macierz s = svd(, nuli, nuli) macierz s = svd(, nuli, & V)
W pierwszym przypadku oba zbiory pojedynczych wektorów są uzyskane, w drugim przypadku tylko pojedyncze wartości są uzyskane; i w trzecim, właściwe pojedyncze wektory są uzyskane ale U nie jest policzony. Proszę zauważ: kiedy trzecia dyskusja jest bez --pusta, to jest właściwie V, który jest dostarczony. Przywrócić oryginalną macierz od jego SVD, to może zrobić:
macierz s = svd(, & U, & V) macierz B = (U. * s)* V
W
końcu, składnia dla moli jest
macierzą B = mole(Y, X, & U)
To funkcja powraca OLS oceny panowały około regressing T x n macierz Y T x k macierz X, to jest, udziały macierzy n k x (X'X)~ 1X'Y. Cholesky rozkład jest użyty. Macierz U, jeżeli nie nul 1, jest użyty, by zgromadzić reszty.
Czytanie i macierze pisania od / do tekstu rejestruje dwa funkcje mread i mwrite może zostać użyty dla wejścia macierzy basie / produkcji. To może być przydatny, by umożliwić gretl wymienienie danych z innymi programami.
mread funkcja akceptuje jeden parametr sznura: imię (czysty tekst) pliku, od którego macierz jest, by zostać przeczytana. Plik w ąuestion musi spełniać następne reguły: kolumny muszą zostać rozdzielone przez przestrzenie lub charaktery tabulatora.
Dziesiętny separator musi być kropką“.” charakter.
Pierwsza linia w pliku musi zawrzeć dwie całości, oddzielne przez przestrzeń lub tabulator, wskazując numer rzędów i kolumien, odpowiednio.
Powinien błąd oceur (taki jak plik źle sformatowany lub niedostępny), pusta macierz (widzą sekcję 12.2) jest powrócona.
2 To nie jest jedyna definicja SVD: jacyś pisarze definiują U jako m x m, 2 jako m x n (z k bez --wyzerują przekątne elementy) i V jako n x n.
Chapterl2. Macierz manipulacja
91 uzupełniający funkcja mwrite doprowadza do plików tekstu sformatowało jako opisany powyżej. Separator kolumny jest charakterem tabulatora, tak import do arkuszy kalkulacyjnych powinien być bezpośredni. Użytkowanie jest zilustrowane w przykład 12.2. Macierze zgromadziły przez mwrite rozkaz może łatwo zostać przeczytany przez inne programy; następny stół streszcza odpowiednie rozkazy dla czytania macierzy od pliku nazywanego a.mat w jakimś szeroko używanym Próbka
Programu programs.3 kod
GAUS tmp,[] = ładunek a.mat;
= Odkształć(tmp,[3:rzędy(tmp)], tmp,[l,], tmp,[2,]); Oktawa fd = fopen("a.mat");
[r, c] = fscanf(fd, "% d % d", "C"); = Odkształć(fscanf(fd, "% g", r * c), c, r)'; fclose(fd); Wół decl = loadmat("a.mat"); R <- as.matrix(read.table("a.mat", skocz = l))
Przykład 12.2: Macierz wejście / produkcja przez tekst włącza do dokumentacji
nulldata 64 skalar n = 3 sznur fi = "a.csv" sznur f2 = "b.csv"
macierz = mnormal(n, n) macierz b = inv()
zbłądzić = mwrite(, fi)
jeżeli zbłądzić != 0
fprintf "Zawiedziony napisać % s \ n", fi jeszcze
błądzi = mwrite(b, f2) endif,
jeżeli zbłądzić != 0
fprintf "Zawiedziony napisać % s \ n", f2 jeszcze
c = mread(fl)
d = mread(f2) = c * d
printf "następna macierz powinna być macierzą tożsamości \ n"
drukuj endif, ponad którym
12.7 Macierz accessors
Oprócz funkcji macierzy dyskutował, różne “accessor” sznury pozwalają ci, by utworzyć kopie wewnętrznych macierzy związanych z modelami poprzednio estimated. Ci jest określony w Stół 12.4.
3Matlab użytkownicy mogą uważać Oktawa przykład za pomocny, odkąd dwa programy są głównie zgodne z siebie.
Rozdział 12..
Macierz manipulacja
92
$ coeff wektor oszacowanej współczynniki
Scompan towarzysz macierzy (po VAR lub VECM oszacowaniu)
$ jalpha macierz (ładowanie) od postępowania Johansen's
$ jbeta macierz j8 (cointegration wektory) od postępowania Johansen's
$ macierz kowariancji jvbeta dla swobodnych elementów j8 od postępowania Johansen's
$ rho autoregressive współczynniki dla procesu błędu
$ sigma końcowy macierz kowariancji
Sstderr wektor estimated błędów standardu
$ uhat macierz reszt
$ macierz kowariancji vcv ocen parametru
$ yhat macierz dopasowanego wartości
Stołu 12.4: Macierz accessors dla danych modelu
Dużo accessors w Stole 12.4 zachowują się nieco różnie zależenie od rodzaju modelu, który jest z bibliografią, następująco:
Pojedynczy eąuation modele: $ sigma dostaje skalar (błąd standardu reszt); $ uhat i $ yhat dostaje serie.
Kosztorysanci systemu Ali: $ sigma dostaje rozgniewany eąuation końcową macierz kowariancji, $ uhat dostaje macierz reszt, jednej kolumny na eąuation.
VARs i VECMs: Sstderr i $ yhat nie jest dostępny; $ coeff dostaje macierz współczynników, jednej kolumny na eąuation.
Jeżeli accessors jest dany bez jakiegoś prefiksu, oni odzyskują skutki od ostatniego modelu estimated, jeżeli jakiś. Alternatywnie oni mogą zostać dodany prefiksem z imieniem uratowanego modelu plus okres (.), w którym przypadku oni odzyskują skutki od wyszczególnionego modelu. Tu są jakieś przykłady:
macierz u = Suhat
macierz b = ml.Scoeff
macierz v2 = ml.$ vcv[1:2,1:2] pierwszy rozkaz chwyta reszty od ostatniego modelu; drugie chwyty wektor współczynnika od ml modelu; i trzeci (które używa mechanizmu łódź podwodna macierzy, którą wybór opisał powyżej) chwyta porcję macierzy kowariancji od ml modelu.
Jeżeli model w ąuestion VAR lub VECM (tylko) Scompan powraca macierz towarzysza.
Gdy model skorygowania błędu wektora jest oszacowany przez postępowanie Johansen's, macierze $ jalpha i $ jbeta jest również dostępny. Ci mają kilka kolumny eąual do wybranego cointegration szeregu; dlatego
macierz produktu Pi = Sjalpha * Sjbeta'
powraca zredukowany zjełczałą ocenę(l). Odkąd j8 jest automatycznie identihed przez Filip malization (widzi sekcję 21.5), jego swobodne elementy naprawdę mają właściwa macierz kowariancji, która może zostać odzyskany przez $ jvbeta accessor.
12.8 Namespace zagadnienia
Macierzy dzieli wspólny namespace z seriami danych i zmiennymi skalara. Innymi słowy nr dwa przedmioty jakiegokolwiek z tych typów nie mogą mieć tego sam imienia. To jest błąd, by usiłować zmienić typ istniejącej zmiennej na przykład
Chapterl2. Macierz manipulacja
93
skalar x = 3
macierz x =(2,2) # zło!
Jest możliwe, jakkolwiek, usunąć lub przemianować istniejącą zmienną wtedy ponownie używać imienia dla zmiennej innego typu:
skalar x = 3
skreśla x
macierz x =(2,2) # ok
12.9 Tworzenia serii danych od macierz
Sekcji 12.1 powyżej opisuje jak utworzyć macierz od serii danych lub ustawić serii. Możesz czasami zechcieć pójść w przeciwnym kierunku, to jest, skopiować wartości od macierzy do regularnych serii danych. Składnia dla tego działania jest
serie sname = mspec,
gdzie jest sname imieniem serii, by utworzyć i mspec jest imieniem macierzy, by skopiować od, prawdopodobnie mający za sobą wyrażenie wyboru macierzy. Tu są dwa przykłady.
serie s = x serie ul = U,[, l,]
To jest założone, że x i U wstępnie egzystujący macierze. W drugim przykładzie serie ul jest utworzony od pierwszej kolumny macierzy U.
Dla tego działanie do pracy, macierzy (lub wybór macierzy) musi być wektorem z długością eąual do jednych z dwóch fuli długości aktualnego zestawu danych, n lub długości aktualnej próbki zasięg, n'. Jeżeli n' < n wtedy tylko n' elementy są narysowane od macierzy; jeżeli macierz lub wybór obejmuje n elementy, n' wartości zaczynające się w element t \ jest użyty, gdzie t \ reprezentuje obserwacja startu zasięgu próbki. Jakieś wartości w seriach, które nie są wyznaczone od macierzy, są zabierze się do brakującego kodu.
12.10 Macierzy i przechyla się,
By ułatwić manipulację nazwanych wykazów zmiennych (widzą Rozdział 11), można zmienić się między macierzami i listami. W przekroju 12.1 ponad wspomnieliśmy udogodnienie dla tworzenia macierzy od wykazu zmiennych, jako w
macierzy M = { listname }
To sformułowanie, z imieniem listy enclosed w klamerkach, buduje macierz kolumny trzymają zmienne z bibliografią w liście. To, co teraz opisujemy, jest inna sprawa: jeżeli mówimy
macierz M = listname
(bez klamerek), dostajemy wektor rzędu, którego elementy jest ID numerami zmiennych w liście. Tę specjalną okolicznością macierzy pokolenie nie może zostać wbite w złożonym wyrażeniu. Składnia musi jak zostać pokazana powyższy, mianowicie proste zadanie listy do macierzy.
Idą w innym kierunku, możesz zawrzeć macierz na prawej stronie wyrażenia, które definiuje listę, jako w
liście Xl = M
Chapterl2. Macierz manipulacja
94,
gdzie jest M macierzą. Macierz musi nadać się do coiwersion; to jest, to musi być rzędem lub wektorem kolumny zawierającym nieujemne wartości całość numeru, żaden, z który nie przewyższa ID najwyższego numeru zmienna (serii lub skalara) w aktualnym zestawie danych.
Przykład 12.3 ilustruje użycie tego rodzaju przekształcenia, by “znormalizować” listę, przesuwając stała (zmienną 0) do pierwszej pozycji.
Przykład 12.3: Manipulując
funkcja listy normalize_list (macierz * x)
Jeżeli macierz (reprezentująca listę) zawiera var 0,
ale nie wewnątrz pierwsza pozycja, przesunąć to do pierwszej pozycji,
jeżeli (x,[l,] != 0)
skalar k = przełęcze(x) pętla dla (ja = 2; ja <= k; ja ++) --cichy, jeżeli (x,[ja,] = 0) x,[ja,] = x,[l,] x,[l,] = 0 końca pętli końca endif przerwa, jeżeli funkcja końca
otwarta data9-7 lista Xl = 2 3 0 4 macierz x = Xl normalize_list(& x) lista Xl = x
12.11 Usuwający macierz,
By skreślić macierz, tylko napisać
skreślać M,
gdzie jest M imieniem macierzy, by zostać skreślony.
12.12 Drukowanie macierzy,
By drukować macierz, najłatwiejsza droga ma dać imię macierzy w ąuestion na linii sam, który jest równoważny używaniu drukować rozkaz:
macierz M = mnormal(100,2)
M
drukuje M, który Możesz dostać piękniejszą kontrolę formatowanie produkcji przez używanie printf rozkazu na przykład następna
macierz kodu Dowód tożsamości = 1(2) printf "% 10.3f", Dowód tożsamości
Chapterl2. Macierz manipulacja
95
produkuje
? czy drukujesz Dowód tożsamości
drukują Dowód tożsamości Dowód tożsamości (2 x 2)
1 0 0 1
? printf "% 10.3f", Dowód tożsamości 1.000 0.000 0.000 1.000
Dla prezentacji zamierza możesz zechcieć dać tytułom do kolumien macierzy. Dla tego możesz użyć colnames funkcji: pierwsza dyskusja jest macierzą i drugi jest jeden z dwóch nazywanych wykazów zmienne, imiona będzieć używany jako nagłówki lub sznur, który zawiera, jako wiele rozdzielonych przez przestrzeń podciągów, ponieważ macierz ma kolumny. Na przykład
? macierz M = mnormal(3,3) ? colnames(M, "foo bar baz") ? drukuj M M (3 x 3)
foo bar baz
1.7102 -0.76072 0.089406
-0.99780 -1.9003 -0.25123
-0.91762 -0.39237 -1.6114
12.13 Przykładu: OLS używający macierze
Przykład 12.4 pokazuje, jak metody macierzy mogą zostać użyte, by powielić gretFs wbudowaną OLS funkcjonalność.
Przykład 12.4: OLS przez metody macierzy
otwarta l
macierz X = { const, sqft }
macierz y = { cena }
macierz b = invpd(X'X) * X'y
drukuje "estimated wektor współczynnika"
b
macierz u = y - X * b
skalar SSR = u'u
skalar s2 = SSR / (rzędy(X) - rzędy(b))
macierz V = s2 * inv(X'X)
V
macierz se = sqrt(linia ukośna(V))
drukować "estimated błędy standardu"
se
# porównać z wbudowanym funkcja
ols cena const sqft --vcv
Rozdział 13
Oszukują arkusz
To dzielić na rozdziały wyjaśnia jak zagrać trochę wspólny - i trochę nie tak wspólny - zadania wewnątrz gretl's pisze scenariusz według język. Kilku ale nie wszyscy techniąues sporządzony listę tu są również dostępni przez graficzną powierzchnię międzyfazową. Chociaż graficzna powierzchnia międzyfazowa może być bardziej intuicyjna i mniej onieśmiela najpierw, zachęcamy użytkowników do skorzystania z władzy pisania scenariusza języka gretl's, gdy tylko oni czują się dobrze z programem.
13.1 Zestaw danych obsługiwania “Dziwny” okresowości
Problem: Masz dane spróbowane każdych 3 minut od począwszy od 9am; prawdopodobnie będziesz chcieć wyszczególnić godzinę jako 20 okresów.
Rozwiązanie:
setobs 20 9:1 --specjalny
Komentarz: Teraz działa jak sdiff() (“sezonowy” odróżnij) lub metody oszacowania jak sezonowy ARIMA obsłużą zgodnie z oczekiwaniem.
Pomóż, moje dane są wstecz!
Problem: Gretl oczekuje dane serii czasu, by być w chronologicznym porządku (najnowszą obserwacją ostatni), ale importowałeś dane trójka partii te są w kolejności odwrotnej (najnowszy pierwszy).
Rozwiązanie:
setobs 1 1 --rozgniewana sekcja genr sortkey = -obs zestaw danych sortby sortkey setobs 1 195 0 --czas serie
Komentują: pierwsza linia jest reąuired tylko, jeżeli dane aktualnie mają interpretację serii czasu: to usuwa tę interpretację, ponieważ (z dość oczywistych powodów) zestaw danych sortby działanie nie być uwzględnione danych serii czasu. Co następuje dwie linie odwrotne dane, używając przeczący wbudowanej zmiennej indeksu obs. ostatnia linia jest tylko obrazująca: to zakłada dane jako roczne serie czasu, start w 1950..
Jeżeli masz zestaw danych, który jest głównie właściwą drogą okrągły, ale szczególny zmienny jest zły, możesz odwrócić tak zmienny następująco:
genr x = sortby(-obs, x)
Upuszczanie chybiających obserwacji wybiórczo
Problemowi: Masz zestaw danych z wielu zmiennymi i chcesz ograniczyć próbkę do tych observa-tions, dla którego tam nie są żadnymi obserwacjami, ponieważ zmienne xl, x2 i x3.
96
Rozdziału 13.. Oszukaj arkusz
97
Rozwiązania:
lista X = xl x2 x3 genr sel = ok(X) smpl sel --ogranicz
Komentarz: Możesz teraz uratować plik przez sklep rozkazują, by zachować subsampled wersję zestawu danych.
“Około” działania
Problem: Masz dyskretny zmienny d i chcesz przebiegnąć sonie rozkazy (na przykład, oszacuj model) około ostry próbka zgodnie z wartościami z d.
Rozwiązanie:
macierz vd = wartości(d) m = rzędy(vd) robi pętlę dla ja = l..m
skalar sel = vd,[ja,]
smpl (d = sel) --ogranicz --zastąpić y const x koniec
ols pętla smpl fuli
Komentarz: główny składnik tu jest pętlą. Możesz mieć, że gretl gra jako wiele instrukcji, ponieważ chcesz dla każdej wartości d, o ile oni są pozwoleni wewnątrz pętlą.
13.2 Tworzenie / modyfikując zmienne
Wygenerowujące zmienną smoczka dla określonego obserwacja
Problemu: Wygenerować dt = 0 dla cały obserwacji ale, dla którego dt = 1.. Rozwiązanie:
genr d = (t ="1984:2")
Skomentuj: wewnętrzny zmienny t jest użyty, by odnosić w formie sznura, tak, jeżeli masz próbkę rozgniewanej sekcji, możesz tylko użyć d = (t ="123"); oczywiście, jeżeli zestaw danych ma etykiety danych, użyć odpowiedniej etykiety. Na przykład, jeżeli otwierasz zestaw danych mrw.gdt, dostarczona z gretl między przykładami, zmienna smoczka dla Włochami mogłaby zostać wygenerowana przez
genr Dlta = (t ="Włochy")
Zauważyć, że ta metoda nie robi reąuire piszącego scenariusz w ogóle. Faktycznie mógłbyś jak dobrze użyć GUI Menu “Dodać / Zdefiniować nową zmienną” dla tego sam celu, z tę sam składnią.
Wygenerowując ARMA(1,1)
Problem: Wygenerować yt = 0.9yt-ja + £ t - 0.5ft_i, z et ~ MZD(0,1). Rozwiązanie:
alfa = 0.9
theta =-0.5
serie e = normalny()
serie y = 0
serii y = alfa * y(-l) + e + theta * e(-l)
Rozdział 13.. Oszukaj arkusz
98
Komentarza: serie stwierdzenia y = Och jest konieczny, ponieważ następne stwierdzenie ocenia y cursively, tak y,[l,] mustbe zbiór. Zauważ, że musisz użyć serii słowa kluczowego tu zamiast pisania genr y = 0 lub po prostu y = 0, zapewnić, że y jest seriami i nie skalarem.
Warunkowy zadanie
Problem: Wygeneruj yt przez następną regułę:
dla dt = 1 dla dt = 0
C Xt
yt =
zt
Rozwiązanie:
serie y = d ? x : z
Komentarz: są kilka alternatyw do tego wystąpiło powyżej. To jest zwierzęce rozwiązanie siły używające pętle. Inny jeden, bardziej skuteczny ale cichy suboptimal, byłby y = d * x + (l d)* z. trójskładnikowy warunkowe zadanie operator jest nie tylko najwięcej numerycznie emcient droga do accom-plish to, co chcemy, jest również znacząco przezroczyste przeczytać kiedy to przyzwyczaja się do tego. Jacyś czytelnicy mogą uważać to za pomocne, by zauważyć, że warunkowe prace operatora zadania dokładnie ta sam droga jako = JEŻELI() funkcja w arkuszach kalkulacyjnych.
13.3 Schludnych sztuczki Interakcja smoczków
Problem: Chcesz oszacować model yi = Xfj6i + Zf /^ + difo + (di ■ Zf)/^ + et, gdzie jest di zmienną smoczka kiedy Xf i Zf jest wektorami objaśniających zmiennych.
Rozwiązanie:
lista X = xl x2 x3 lista Z = zl z2 lista dZ = nuli pętla foreach ja Z
serie d $ ja = d * $
sporządzam
listę dZ = dZ d $ kończę pętla
ols y X Z d dZ
Komentarz: To jest zdumiewające, która substytucja sznura może zrobić dla ciebie, nieprawdaż?
Zrozumiany wybuchowość
Problem: Podane dane przez minutę, chcesz policzyć “zrozumiany wybuchowość” dla godziny jako RVt = ^ ul. = ja yi-T- Wyobrazić sobie twój próbka zacznie się o razie 1:1..
Rozwiązanie:
smpl fuli
genr czas
genr minuta = int(czas / 60) + 1
genr drugi = czas % 60
setobs minuta drugi --wpraw płycizny
genr rv = psd(y)A2
setobs 1 1
smpl drugi = l --ograniczyć
sklep foo rv
Rozdział 13.. Oszukaj arkusz
99
Komentarza: Tu naciągamy gretl na myślenie, że nasz zestaw danych jest zestawem danych panelu, gdzie są protokoły “częściami” i sekundy są “czasem”; ta droga, możemy skorzystać z specjalnego funkcja psd(), odchylenie standardowe panelu. Wtedy po prostu upuszczamy wszystkie obserwacje ale jeden na minucie i uratować wynikające dane (sklep foo rv przetłumaczy jako “wprowadzać gretl datafile foo.gdt serie rv do pamięci”).
Robiąc pętlę ponad dwoma dobranym listy
Problemem: Sądzisz ty mają dwie listy z tym sam numerem elementów i chcesz stosować jakiś rozkaz do nadających się elementów ponad pętlą.
Rozwiązanie:
sporządź
listę LI = b c lista L2 = x y z
ki = 1
pętla foreach ja LI --cichy k2 = 1
pętla foreach j L2 --cichy, jeżeli kl = k2
ols $ ja 0 $ j endif k2 ++ pętla końca kl ++ pętla końca
Komentarz: najprostszy sposób osiągnięcia skutku ma zrobić pętlę ponad wszystkimi możliwymi połączeniami i futer z unpotrzebne, przez jeżeli warunek, jako powyżej. To powiedział, w jakichś przypadkach zmienne imiona mogą pomóc. Na przykład jeżeli
lista Lx = xl x2 x3 lista Ly = yl y2 y3
robiący
pętlę tu całości jest ąuite intuicyjnym i na pewno bardziej eleganckim:
pętla dla ja = l..3
ols y $ ja const x $ kończę pętla
Część II
Ekonometryczne metody
100
Rozdziału 14
Krzepkie oszacowanie macierzy kowariancji
14.1 Wprowadzenia
Rozważyć (jeszcze raz) linearny model regresji
y = X { 3 + u (14.1)
gdzie y i u jest T wektorami, X jest T x k macierzą regressors i j8 jest fc wektorem parametrów. Jak dobrze jest znany, kosztorysant j8 podany około Zwykły Mały Sąuares (OLS) jest
j6 = (X'X)~ 1X'y (14.2)
Jeżeli warunek E(u \ X) = 0 jest satished, to jest bezstronny kosztorysant; poniżej nieco słabsze warunki kosztorysant jest uprzedzony ale stały. To jest bezpośredni pokazać tak kiedy OLS kosztorysant jest bezstronny (to jest, kiedy £(/? - j8) = 0), jego niezgodność jest
Var(j6) = E ((p - f >)(p - f >)') = (X'X)~ 1X'QX(X'X)-1 (14.3)
gdzie D. = E(uu') jest macierz kowariancji okresów błędu.
Poniżej założenie tak okresy błędu niezależnie i identycznie są rozprowadzone (iid) możemy napisać D. = a21, gdzie jest a2 (wspólną) niezgodnością błędów (i kowariancje są zerowym). Wewnątrz tak przypadek (14.3) upraszcza do “klasycznej” formułki,
Var(j6) = { i2 { X'XYx (14.4)
Jeżeli iid założenie nie jest satished, dwie rzeczy następują. pierwszy, to jest w zasadzie zbudować bardziej skuteczny kosztorysant niż OLS na przykład trochę uporządkować z Wykonalny Uogólniony Least Sąuares (FGLS). drugi, prosta “klasyczna” formułka dla niezgodności najmniejszego sąuares kosztorysanta jest nie dłużej poprawny i odtąd konwencjonalne błędy standardu OLS - które są tylko sąuare korzenie przekątnych elementów macierzy zdefiniowane około (14.4) - nie dostarczać ważnych środków statystycznego wniosku.
W niedawnej historii econometrics tam są zasadniczo dwa podejścia do problemu bez -iid błędów. “tradycyjne” podejście ma użyć FGLS kosztorysant na przykład, jeżeli odejście od iid warunku bierze formie zależności czas serii i, jeżeli to wierzy tak, to mógłby zostać umodelowany jako przypadek z first-order autokorelacja, można, by zatrudnić Arkansas(1) metoda oszacowania taki jak Cochrane-Orcutt, Hildreth-Lu lub Prais-Winsten. Jeżeli problem jest tak, błąd niezgodność jest bez --stały przez obserwacje, można, by oszacować niezgodność jako funkcja niezależnych zmiennych i wtedy zagrać obciążony najmniej sąuares, używanie jako obciąża odwrotności estimated niezgodności.
Kiedy ci metody są w użyciu, alternatywne podejście znalazło wzrastającą przysługę: to jest, użycie OLS ale policzyć błędy standardu (lub więcej ogólnie, macierze kowariancji) to są krzepki w odniesieniu do odchyleń od iid założenie. To typowo jest łączony z naciskiem dalej używając duże zestawy danych - wystarczająco duży tak pracownik naukowy może umieścić trochę zaufanie dalej (asymptotyczna) konsekwencja własność OLS. To podejście zostało umożliwione około dostępność taniej mocy obliczeniowej komputera. obliczenie krzepkiego standardu błędy i obsługiwanie bardzo dużych zestawów danych były onieśmielające zadania w jednym czas, ale teraz oni są nieproblematyczny. inne punkt sprzyjający nowszy
101
Rozdział 14. Krzepki kowariancja macierz oszacowanie
102
metodologia jest tak kiedy FGLS oferty wydajność w zasadzie, to często włącza robienie dodatkowe statystyczne założenia, które mogą lub nie mogą zostać uzasadnione, które nie mogą być łatwy przeprowadzić badania rygorystycznie i, które może grozić konsekwencja kosztorysanta na przykład, “wspólny czynnik restrykcja” która jest sugerowana około, tradycyjna FGLS “skorygowanie” ponieważ autocorrelated błędy.
Jamesa Towar i Marka Watson's Wprowadzenie do Econometrics ilustruje to podejście w poziomie studenta instrukcja: dużo zestawów danych oni używają obejmować tysiące lub dziesiątek tysiące obserwacji; FGLS jest zbagatelizowany; i krzepki standard błędy są doniesione jako oczywiście sprawa faktycznie. , dyskusja klasycznego standardu błędy (etykietowały “homoskedasticity-tylko”) jest ograniczony do Aneksu.
Przeciw temu tło to może być przydatny wyruszyć i dyskutować zupełnie różne opcje zaoferowały około gretl w oszacowanie macierzy odniesienia do krzepkiej kowariancji. pierwszy wskazuje, by zauważyć jest tak gretl produkuje “klasyczny” domyślnie błędy (w zupełnie przypadki oprócz GMM oszacowanie). Wewnątrz napisać scenariusz tryb możesz dostać się krzepki standard błędy około dodające --krzepka flaga do oszacowania rozkazy. Wewnątrz dialog specyfikacji GUI programu model zwykle zawiera “Krzepki standard błędy” pole wyboru, dalej z “skonfiguruj” zapnij się to jest przyśpieszany kiedy pudło będzie sprawdzone. skonfigurować guzik bierze cię do konfiguracji dialog { które może również zostać osiągnięte od głównego menu bar: Narzędzia -> • Preferencje -> • Ogólny -> • HCCME). Tam możesz wybrać od zbioru możliwych krzepkich wariantów oszacowania i możesz również woleć zrobić krzepkie oszacowanie zaniedbanie.
Specyfiki dostępnych opcji zależą od natury danych pod rozważaniem - rozgniewany przekrojowy, serie czasu lub wprawić płycizny - jak również do jakiegoś stopnia wybór kosztorysanta. (Chociaż wprowadziliśmy krzepkie błędy standardu w kontekście OLS powyższego, oni mogą zostać użyty w połączeniu z innymi kosztorysantami także.) co następuje, które trzy sekcje tej umowy rozdziału ze sprawami, które są określone do trzech rodzajów danych, tylko wspomniały. Zauważ, że dodatkowe szczegóły odnośnie oszacowania macierzy kowariancji w kontekście GMM być oddane rozdział 18..
Zamykamy to wprowadzenie z krótkiego stwierdzenia to, czego “krzepkie błędy standardu” mogą i nie mogą osiągnąć. Oni mogą dostarczyć dla asymptotically ważnego statystycznego wniosku w modelach, które zasadniczo poprawnie są wyszczególnione, ale, w którym błędy nie są iid. “Asymptotyczna” część znaczy, że oni mogą być mało użycia w smali próbkach. “Poprawna specyfikacja” część znaczy, że oni nie są magie kulą: jeżeli okres błędu jest zestawiony z regressors, żeby sami oceny parametru zostali uprzedzeni i niezgodne, krzepkie błędy standardu nie zaoszczędzą dzień.
14.2 Rozgniewany przekrojowych danych i HCCME
Z rozgniewany przekrojowymi danymi, najbardziej prawdopodobne odejście od iid błędów jest heteroskedasticity (bzem--stałym yariance).1 W jakichś przypadkach można, bym być w stanie przybyć do orzeczenia odnośnie prawdopodobnej formy heteroskedasticity i odtąd stosować określone skorygowanie. Bardziej wspólny przypadek, jakkolwiek, jest, gdzie jest heteroskedasticity nieznanej formy. Szukamy kosztorysanta z ance macierz parametru szacuje, że to zatrzymuje jego ważność, w najmniej asymptotically, w twarzy niewyszczególnionego heteroskedasticity. To jest nie oczywisty, a priori, tak to powinien być możliwy, ale Biały (1980) pokazał tak
Varh(j6) = { X' X)~ XX' Q, X { X' X)~ x (14.5)
robi sztuczce. (Jak zwykle w danych potrzebujemy, by powiedzieć “poniżej pewne warunki”, ale warunki są nie bardzo restrykcyjny.) D. jest wewnątrz tym kontekstem przekątna macierz, elementy bez --zerowy mogą zostać oszacowane używającymi sąuared OLS resztami. Biały odnoszony.
Davidson i MacKinnon (2004, rozdział 5) oferta przydatna dyskusja kilku wariantów dalej HCCME temat Bieli. Oni odnoszą - wewnątrz, które przekątne elementy D. są oszacowane bezpośrednio około sąuared OLS resztami, -uĄ - jako HCo. (zrzeszone błędy standardu często są nazwane “błędami standardu Bieli”.) różne rafinowanie propozycji Bieli dzielą się
iln trochę wyspecjalizował się konteksty przestrzenna autokorelacja może być zagadnieniem. Gretl nie ma trochę wbudowane metody sprawować się to i nie będziemy dyskutować to tu.
Rozdział 14. Krzepkie oszacowanie macierzy kowariancji
103
wspólny punkt odejścia, mianowicie pomysł tak sąuared OLS reszty są prawdopodobny być “zbyt smali" średnio. Ten punkt jest ąuite intuicyjnym. oceny parametru OLS, j8, zadowalają około projektować kryterium tak suma sąuared reszt,
yt - Xtp) jest pomniejszony, ponieważ podane x i y. Sądzą ten j6 =/= { 3. To jest prawie podaje, by przedstawić się tak: równy jest OLS nie jest uprzedzony, to byłoby cud, jeżeli j6 obliczył od trochę ograniczonej próbki byli dokładnie eąual do j6. Ale wewnątrz tak przypadek suma sąuares prawdziwych, nieobserwowanych błędów, Xwt = T, { yt - Xt(3)2 jest zobowiązanym, by być większy niż X"U2. wypracowane warianty dalej HCo bierze temu wskazywać na następująco pokładu:
HCi: Stosuje skorygowanie z-wolności stopni, mnożąc HCo macierz około T /(T - k).
HC2: Zamiast używanie u2 dla przekątnych elementów Cl, użycie u2 /(l - ht), gdzie ht = Xt(X'X)~ 1X't, tth przekątny element macierzy rzutu, P, którego ma własność tak P ■ y = y. związek ht jest, że, jeżeli niezgodność z zupełnie ut jest er2, oczekiwanie u2 jest cr2(innymi słowy - ht)lub, stosunek u2 /(l - ht) ma oczekiwanie er2. Jak Davidson i MacKinnon pokaz, 0 < ht < 1, ponieważ zupełnie t, tak to dostosowanie nie może zostać zredukowanym przekątne elementy Cl i ogólnie przegląda ich w górę.
HC3: Użycie u2 /(1 - ht)2. dodatkowy czynnik (1 - ht) wewnątrz mianownik, w stosunkiem do HC2, może zostać uzasadniony dalej ziemie tak obserwacje z dużymi niezgodnościami mają skłonności do wysilania się dużo wpływ dalej OLS oceny, więc, że odpowiednie reszty mają skłonności do poniżej szacowanego. Zobaczyć Davidson i MacKinnon dla pełniejszego wytłumaczenia. względne wartości tych wariantów zbadanych około znaczy zarówno symulacje, jak i oretical analizy. Niestety nie jest elear zgoda dalej, które jest “najlepszy”. Davidson i MacKinnon dowodzi , że oryginalny HCo jest prawdopodobny zagrać gorzej niż inni; niemniej jednak, “błędy standardu Bieli” są doniesione więcej często niż bardziej wyszukane warianty i tam przedni, z powodów porównywalności, HCo jest domyślny HCCME wewnątrz gretl.
Jeśli użyć HCi, HC2 lub HC3, który możesz zaplanować chcesz, ponieważ to wewnątrz albo dwóch dróg. na przykład napisz scenariusz według tryb, możesz zrobić,
zbiór hc_version 2
Wewnątrz GUI program możesz pójść do dialogu konfiguracji HCCME, jak zauważony powyższy i woleć trochę tych wariantów, by być zaniedbaniem.
14.3 danych serii Razu i macierze kowariancji HAC
Heteroskedasticity może być zagadnienie z danymi serii czasu także, ale to jest nieprawdopodobny być jedynym lub równym warunkiem zasadniczym, zainteresowaniem.
Jedna forma heteroskedasticity jest wspólny w makroekonomiczny seriach czasu, ale dość łatwo jest dotyczony z. To jest, w przypadku silnie dążących serii taki jak Poważnego Produktu krajowego, łącznej konsumpcji, łącznego inwestowania i tak dalej, wyższe poziomy zmiennej w ąuestion są prawdopodobny być związany z wyższą zmiennością w absolutnych okresach. oczywisty “sposób”, zatrudniony w wielu macroeconometric naukach, niż użyć kloców takich serii surowe poziomy. Dostarczony proporcjonalna zmienność takiej resztki serii z grubszą stałej ponad czasem, transformacja kloca skutkuje.
Inne formy heteroskedasticity mogą oprzeć się transformacji kloca, ale mogą wymagać specjalne traktowanie odmienne od obliczenie krzepkich błędów standardu. Mamy pilnować tu autore-gressive warunkowy heteroskedasticity, na przykład wewnątrz zachowanie zalety ceny, gdzie duże zakłócenia do rynku mogą zapoczątkować okresy inereased wybuchowość. Taki zjawiska cali dla określonych strategii oszacowania, takiego jak GARCH (widzi rozdział 20).
Rozdział 14.. Krzepkie oszacowanie macierzy kowariancji
104
Wbrew punktom zrobiło powyższy, jakiś końcowy stopień heteroskedasticity może być obecny w samą porę dane serii: punkt kluczowy jest tym w większości wypadków to jest prawdopodobnie być łączone z seryjna korelacja (autokorelacją), odtąd wymagając specjalne traktowanie. W podejściu Bieli, Cl, estimated macierz kowariancji ut, pozostaje dogodnie przekątny: niezgodności, E(u ^), może poróżnić się przez t ale kowariancje, E(utus), są cały zerem. Autokorelacja w samą porę dane serii znaczą, że co najmniej kilka z wyłączony przekątnych elementów Cl powinni być bzem --zerem. To wprowadza konkretną komplikację i reąuires inna część terminologii; oceny macierzy kowariancji to są asymptotically ważny w twarzy zarówno heteroskedasticity, jak i autokorelacji procesu błędu jest określony HAC (heteroskedasticity i autokorelacją stałą).
Zagadnienie HAC oszacowanie jest potraktowane w więcej technicznych okresach w rozdziale 18.. Tu próbujemy przekazywać trochę intuicji w bardziej basie poziom. Rozpoczynamy od ogólnego komentarza: końcowa autokorelacja jest nie tyle własnością danych, jako symptom inadeąuate modelu. Dane mogą być uporczywe, chociaż czas i, jeżeli pasujemy model, który nie bierze tego aspektu do konta właściwie, kończymy się z modelem z autocorrelated zakłóceniami. Odwrotnie to jest często możliwe złagodzić lub nawet wyeliminować problem autokorelacji przez zawieranie związanych zostały w tylu zmiennych w modelu serii czasu lub innymi słowy, przez wyszczególnianie dynamiki modelu więcej w pełnych. HAC oszacowanie nie powinno zostać zobaczone jako pierwszy resort w zajmowaniu się procesem błędu autocorrelated.
To powiedział, “oczywiste” rozszerzenie HCCME Bieli do przypadku autocorrelated błędy wydawałyby się być tym: szacują wyłączony przekątne elementy Cl (to jest, autokowariancja, E(utus)) używając, jeszcze raz, odpowiednie OLS reszty: ćbts = utus. To jest zasadniczo dobrze, ale żądania ważna zmiana. Szukamy stałego kosztorysanta, jeden to zbiega się do prawdziwego Cl, ponieważ wielkość próbki skłania się do bezkresu. To nie może pracować, jeżeli pozwalamy bezgraniczny seryjny depen-dence. Większe próbki umożliwią nam oszacowanie więcej z prawdziwych elementów łóżeczek (to jest, dla t i 5 więcej szeroko rozszedł się w samą porę) ale nie pokryją kiedykolwiek wzrastającej informacji odnośnie maksymalnie rozdzielonych par łóżeczek, od maksymalne sam oddzielenie rośnie z wielkością próbki. Aby zapewnić konsekwencji, musimy ograniczyć naszą uwagą do procesy wystawiający temporally ograniczonej zależności lub innymi słowy odciąć obliczenie ćbts ceni w jakiejś wartości maksimum p = t - s (gdzie jest p potraktowany jako inereasing funkcja wielkości próbki, T, chociaż to nie może inerease w proporcji do T).
Najprostszy wariant tego pomysłu ma skrócić obliczenie w jakimś ograniczonym porządek opóźnienia p, gdzie p rośnie jako, powiedzieć, T1 / 4.. Problem z tym jest, że wynikający Cl nie może być pozytywną określoną macierzą. W praktycznych okresach, możemy skończyć się z przeczącymi estimated niezgodnościami. Jednemu rozwiązaniu tego problemu zaoferowano przez Newey Zachodniego kosztorysanta (Newey i Zachód, 1987), który przydziela zmniejszające się wagi autokowariancja próbka jako czasowy oddzielenie inereases.
Aby zrozumieć ten punkt to jest pomocne wyglądać więcej dokładnie na macierz kowariancji oddawany (14.5), mianowicie,
(X'X)-1(X'ClX)(X'X)-1
To jest znany jako “kanapka” kosztorysant. Chleb, który wydaje się na obu stronach, jest (X'X)~ 1.. To jest k x k macierz i jest również składnikiem klucza w obliczeniu klasycznej macierzy kowariancji. Plomba w kanapce jest
s = x' Ci x
(fcxfc) (kxT) (TxT) (Txk)
Od Cl = E(uu'), istota macierzy estimated tu może również zostać napisana jako
2 = E(X'uu'X) który wyraża 2 jako długo biegnie kowariancja przypadkowego fc wektora, X'u.
Od obliczeniowego punktu widzenia, to jest nie konieczne lub pożądane zgromadzić (potencjalnie bardzo dużą) T xT macierz Cl jako taki. Raczej to liczy kanapkę napełniającą przez streszczenie jako
p
£ = f (och) + ^ Wj (t(j) + f'(j))
Rozdział 14.. Krzepkie oszacowanie macierzy kowariancji
105,
gdzie macierz autokowariancja próbka x k k t(j), ponieważ j > 0, jest dany około
- 1 ^ - - Y' Y
uj) = ^ Utut-jji.fji.t-j < http://Utut-jji.fji.t-j >
t = j + ja
i Wj jest wagę podaną do autokowariancja w opóźnieniu j > 0..
To zostawia dwa ąuestions. Jak dokładnie określamy długość opóźnienia maksimum lub “szerokość pasma”, p, HAC kosztorysanta? I jak dokładnie są wagi Wj, by zostać określone? Wrócimy do (trudnego) ąuestion szerokości pasma niedługo. Jako szacunki wagi, Cretl oferuje trzy warianty. Zaniedbanie jest Bartlett jądrem, jako używany przez Newey i Zachód. Ten zbiory
W j =
1 -
och j > p
tak wagi zmniejszają się linearnie jako j wzrosty. Inne dwie opcje są Parzen jądrem i Kwadratowym Upiornym (QS) jądrem. Dla Parzen jądra,
w j =
1 - 6a.y + 6a.y 0 < aj < 0.5 2(1 - aj)3 0.5 < aj < 1
aj > 1,
gdzie aj = j /(p + 1)i dla QS jądra,
W j =
25 12TT2dj
sinmj
mj
- COSłWj,
gdzie dj = j / p i rtij = 6ndi / 5..
Cyfra 14.1 pokazuje, że wagi wygenerowały przez te jądra, dla p = 4 i j = 1 do 9..
Cyfra 14.1: Trzy HAC jądra
Bartlett
Parzeń
QS
W gretl wybierasz jądro używające rozkaz zbioru z hac_kernel parametrem:
ustawiony hac_kernel parzeń
ustawił hac_kernel qs
ustawić hac_kernel bartlett
Wybierający HAC szerokość pasma, którą asymptotyczna teoria rozwinęła się przez Newey, Zachodni i inni mówi nam w ogólnych okresach, jak HAC szerokość pasma, p, powinna urosnąć z wielkością próbki, T - to jest, p powinien urosnąć w proporcji do sonie nieznacznej władzy T. Unfortunately to jest mało pomocy do stosowanego econometrician, pracując z danym zestawem danych naprawionej wielkości. Różne praktyczne reguły zostały sugerowane i gretl wprowadza w życie dwa taki. Zaniedbanie jest p = 0.75T1 / 3, jako zalecany przez Towar i Watson (2003). Alternatywa jest p = 4(T / 100)2/9, jako w Wooldridge (2002b). W każdym przypadku jednym bierze część całości skutku. Te warianty są etykietowane nwl i nw2 odpowiednio, w kontekście rozkazu zbioru z hac_lag parametrem. To jest, możesz przełączyć do wersję podanej przez Wooldridge z
Rozdziałem 14.. Krzepkie oszacowanie macierzy kowariancji
106
zbiór hac_lag nw2 Jako pokazany w Stole 14.1 wybór między nw1 i nw2 nie robi dużo różnicy.
T p (nwl) V (n
50 2 3
100 3 4
150 3 4
200 4 4
300 5 5
400 5 5
Stołu 14.1: HAC szerokość pasma: dwa, który Również masz opcja wyszczególniania ustalonej numerycznej wartości dla p praktyczne reguły, jak wewnątrz
ustawił hac_lag 6
Ponadto, któremu możesz ustawić odmienną szerokość pasma dla użycia z Kwadratowym Upiornym jądrem (odtąd to nie potrzebuje być całością). na przykład,
zbiór qs_bandwidth 3.5
Prewhitening i oparty na danych wybór szerokości pasma, którym alternatywne podejście jest, by zająć się końcową autokorelacją około atakującą problem z dwóch stron. intuicja z tyłu techniąue znany jako VAR prewhitening (Andrew i Monahan, 1992) może zostać zilustrowany przez prosty przykład. Pozwolić xt być seąuence z first-order autocorrelated przypadkowe zmienne
Xt = l + Mt, który długo biegnie niezgodność xt może zostać pokazana, by być
, Viij(t * t)
VLR \ Xt) = Z ^ T
(1 - P)
w większości wypadków, ut jest prawdopodobny być mniej autocorrelated niż xt, więc mniejsza szerokość pasma powinna sumce. Oszacowanie ViR(xt) może, dlatego przejść w trzech kroki: (1) szacuje p; (2) uzyskuje HAC ocenę ut = xt - pxt- \\ i (3) dzieli skutek około (1 - p)2..
Stosowanie powyższego pojęcia do naszego problemu sugeruje szacowanie ograniczony porządek Wektor Au toregression (VAR) na zmiennych wektora Ct = Xtut. Ogólnie, VAR może być jakiegoś porządku, ale w większości wypadków 1 jest dostateczny; cel nie jest zbudować wodoszczelny model dla Ct, ale tylko po to, by “wycierać mopem” konkretną część autokorelacji. Odtąd następny VAR jest oszacowany
Ct = DZIAŁASZ-ja + £ t
Wtedy ocena macierzy X'QX może zostać odzyskany przez
(ja - )-1!;^! - A'yl
gdzie Ż £ jest jakimś HAC kosztorysantem, odnieść się do VAR reszt. Możesz poprosić o prewhitening w gretl używającym
ustawiony hac_prewhiten na
Rozdziale 14.. Krzepkie oszacowanie macierzy kowariancji
107, które jest obecnie żaden mechanizm dla wyszczególniania porządku inny niż 1 dla początkowego VAR.
Dalsze rafinowanie jest dostępne w tym kontekście, mianowicie opartym na danych wybór szerokości pasma. To robi intuicyjny zmysł, że HAC szerokość pasmem nie powinna po prostu zostać oparta na wielkości próbki, ale powinna jakoś wziąć pod uwagę własności czas serii danych (jak również jądro chosen). nonparametric metoda dla robienia to była proponowana przez Newey i Zachodni (1994); dobry zwięzły opis metody być oddany Sala (2005). Ta opcja może zostać odwołana w gretl przez
zbiór hac_lag nw3
Ta opcja jest zaniedbaniem, kiedy prewhitening jest wybrany, ale możesz przekroczyć to przez dawanie określonej numerycznej wartości dla hac_lag.
Nawet Newey Zachód oparty na danych metodę w pełnych nie przyciska szerokości pasma dla jakiejś szczególnej próbki. Pierwszy krok włącza obliczanie serii końcowych kowariancji. Długość tego serie jest dany jako funkcja wielkości próbki, ale tylko w górę do wielokrotności skalara - na przykład, to jest dane jako 0(T2 / 9) dla Bartlett jądra. Gretl używa implikowanej wielokrotności 1.
14.4 Specjalnych zagadnień z danymi panelu
Od panelu, który dane mają zarówno czas serie, jak i rozgniewany przekrojowy wymiar można, by oczekiwać, że, ogólnie, krzepkie oszacowanie macierzy kowariancji zrobiłby to reąuire radzący zarówno heteroskedasticity, jak i autokorelacja (HAC podejście). Ponadto, jakieś specjalne cechy dane panelu reąuire uwagi.
Niezgodność okresu błędu może poróżnić się przez rozgniewany przekrojowe części.
Kowariancja błędów przez części może być bzem --zerem w każdym okresie razu.
Jeżeli “pośrodku” odmiana nie jest usunięta, błędy mogą wystawić autokorelację, nie w zwykłych czas seriach wyczuwają ale wewnątrz zmysł tak błąd środka dla części mogę poróżnić się od tamten z części j. (To jest szczególnie związany kiedy oszacowanie około jest złożone OLS.)
Gretl aktualnie kosztorysanci macierzy kowariancji ofert dwóch krzepkich szczególnie dla panelu dane. Ci są dostępni dla modele oszacowały przez naprawione efekty, złożyły OLS i złożyły two-stage mały sąuares. Zaniedbanie krzepki kosztorysant tak jest sugerowany przez Arellano (2003), który jest HAC pod warunkiem, że panel jest z “duży n, smali T” różnorodność (która jest, wiele części jest przestrzeżonych w stosunkowo mało okresów). Arellano kosztorysant jest
V ja V' Y \~^ ja \" V'-T. < Ci'V 1 t V'V \~^
< Ła - ) \ / AjTIiTIjAi ja, [)
gdzie jest x macierzą regressors (z środkami grupy odjętymi, w przypadku ustalonych efektów) Ui oznacza wektor reszt dla części ja i n jest numerem rozgniewany przekrojowych części. Cameron i Trivedi (2005) robi silny przypadek dla używania ten kosztorysant; oni zauważają tak zwykły Biały HCCME może wyprodukować misleadingly błędy standardu smali wewnątrz panel kontekstowy, ponieważ to zawodzi, by wziąć autokorelacji do konta.
Wewnątrz przypadki, gdzie jest autokorelacja nie zagadnieniem, jakkolwiek, kosztorysant proponował około Skinienie i Katz (1995) i dyskutowany około Greene (2003, rozdział 13) może być odpowiedni. Ten kosztorysant, który bierze pod uwagę jednoczesną korelację przez części i heteroskedasticity około część, jest
{
n n \
\" \" £ r Y' Y ja ja Y' Y \~^ > > (Tu Aj Aj, [) t = lj = l, przez który kowariancje oy jest oszacowany
{ T
iJ
U:U
T
Rozdział 14. Krzepkie oszacowanie macierzy kowariancji
108,
gdzie jest T długość serii czasu dla każdej części. Skinienie i Katz nazywać zrzeszone błędy standardu “Poprawione Panel Błędy Standardu” (PCSE). Ten kosztorysant może zostać odwołany wewnątrz gretl przez
zbiór rozkazu pcse dalej Arellano domyślny może odnośnie założony przez
zbiór pcse wyłączony
(Notatka tak bez względu na pcse ustawienie, krzepki kosztorysant nie być używany, chyba że --krzepka flaga jest dana lub “Krzepkie” pudło jest sprawdzone w GUI programie.)
Rozdział 15
Panel danych
15.1 Oszacowania panelu modele Złożyły się Zwykły Najmniejszy Sąuares najprostszy kosztorysant dla panelu dane są złożone w większości wypadków. to jest nieprawdopodobny, aby być adeąuate, ale to dostarcza punkt odniesienia dla porównania z więcej złożonymi kosztorysantami.
Jeżeli szacujesz model dalej wprawić płycizny używanie danych OLS dodatkowy test podobnie staje się dostępny. Wewnątrz okno modelu GUI to jest podobnie “diagnostyki panelu” poniżej Testy menu; odpowiednik scenariusza jest hausman rozkazem. skorzystać z tego testu, powinieneś wyszczególnić model na zewnątrz trochę zmienne smoczka ing rozgniewany przekrojowe części. test porównuje zostawany złożony OLS przeciw głównym alternatywom, ustalonym efektom i przypadkowym modelom efektów. Te alternatywy są wyjaśnione w następnej sekcji. ustalone i przypadkowe efekty modeluje
Wewnątrz gretl wersja 1.6.0 i wyższy, ustalone i przypadkowe efekty modeluje, ponieważ wpraw płycizny dane mogą być es-timated w ich własnym prawo. W graficznej powierzchni międzyfazowej ci opcje są znalezione poniżej menu podobnie “Model / Panel / Ustalone i przypadkowe efekty”. Wewnątrz rozkaz linia powierzchnia międzyfazowa jedna używa panel rozkazu, z lub na zewnątrz --opcja przypadkowych efektów.
To sekcja wyjaśnia natura tych modele i komentuje ich oszacowanie przez gretl. złożonym OLS specyfikacja może zostać napisana jako
yu = Xitfi + Uit (15.1)
gdzie jest yu obserwacja na zależnej zmiennej, ponieważ rozgniewany przekrojowa część ja w okresie t, Xu jest 1 x k wektor niezależnych zmiennych spostrzegł dla części ja w okresie t, { 3 jest k x 1 wektorem parametrów i uu jest błąd lub zakłócenie okres określony do części ja w okresie t. modele efektów ustalonych i przypadkowych mają wspólnie tak oni rozkładają jednostkowy złożony okres błędu, %. Ponieważ ustalony powoduje model piszemy uu = «t + £ u, uległy
yu = Xup + «ja + £ u (15.2)
To jest, rozkładamy uu do część określonego i czas niezmiennego składowego, «f i obserwacja określony błąd, £ u.1 «fS wtedy jest potraktowany jak szprycować w rezultacie (, część określony y-przejmuje), które są zostać oszacowany. To może zostać zrobiony przez w tym smoczek zmienny dla każdego rozgniewany przekrojowego część (i znosząc globalną stała). To czasami jest nazwany Najmniejszy Sąuares Smoczek Koślawości ables (LSDV) metoda. Alternatywnie, to może odjąć grupa znaczą od każdej ze zmiennych i szacują model na zewnątrz stała. W ten ostatnim przypadku zależny zmienny może zostać napisany jako
yu = yu - yi “środek grupy”, yu jest zdefiniowany jako
1 v-
yt = - > yu
1 t = ja
llt jest możliwy złamać się trzeci składowy uu, mianowicie wt, szok, który jest, czas określony ale wspólny do zupełnie części w danym okresie. Wewnątrz zainteresowanie prostoty nie ścigamy tak opcja tu.
109
Rozdział 15. Panel dane
11 Och,
gdzie jest Ti numer obserwacji dla części i. dokładnie analogiczne sformułowanie odnosi się do niezależnych zmiennych. Podany parametr oceny, j8, uzyskany używanie taki de znaczony dane możemy wyzdrowieć oceny z «fS używanie
{ Ksi = - > yu - Xup 1 t = ja
Ci dwa metody (LSDV i używanie de znaczone dane) są numerycznie równoważny. Cretl bierze podejście de znaczącego dane. Jeżeli masz smali numer rozgniewany przekrojowych części, dużego number obserwacji czas serii na części i bardzo dużo regressors, to jest bardziej ekonomiczne pod względem wspomnienia komputera, by użyć LSDV. Jeżeli zajdzie taka potrzeba możesz łatwo wprowadzić w życie to ręcznie. Na przykład
genr unitdum ols y x du_ *
(Zobacz Rozdział 5 dla szczegółów na unitdum).
«f oceny nie są drukowane jako część produkcji modelu standardu w gretl (może być bardzo dużo tych i typowo oni nie są wielu wrodzonego zainteresowania). Jakkolwiek możesz odzyskać ich po oszacowaniu ustalonych efektów modelują, jeśli chcesz. W graficznej powierzchni międzyfazowej, pójdź do “Zaoszczędź” menu w oknie modelu i wybierz “stała przez pośrednictwo -części”. W trybie rozkaz linii, możesz zrobić genr newname = $ ahat, gdzie jest newname imieniem, które chcesz dać seriom.
Ponieważ przypadek powoduje model, piszemy uu = Vi + £ u, więc model zostaje
yu = Xit { 3 + Vi + £ u (15.3)
W przeciwieństwie do ustalonego modelu efektów, Siły nie jest potraktowany jak naprawiony parametry, ale jak przypadkowe rysunki od danej dystrybucji prawdopodobieństwa. obchodzone Gaus Markov twierdzenie, zgodnie, z którym OLS jest najlepszy linearny bezstronny esti-mator (BŁĘKIT), zależy od założenia tak błąd okres jest niezależnie i identycznie rozprowadzony (IID). Wewnątrz środki założenia panelu kontekstowego, IID tak E(ujt), wewnątrz relacja do equa-tion 15.1, eąuals stała, cr ^, dla zupełnie ja i t, kiedy kowariancja E(uiSuu) eąuals zerowy dla zupełnie s =/= t i kowariancja E(ujtuu) eąuals zerowy dla zupełnie j =/= i.,
Jeżeli ci założenia nie są spotkane - i oni są nieprawdopodobni, by zostać spotkany wewnątrz kontekst panelu danymi - OLS jest nie najbardziej skuteczny kosztorysant. Większa wydajność może zostać zyskana używanie uogólniło least sąuares (GLS), biorący do konta kowariancja struktura błędu okres.
Rozważyć obserwacje na podanej część ja w dwóch innym razy 5 i t. Od hipotez powyżej to może zostać ułożyć się tak Var(uiS) = Var(%) = { iy + }, kiedy kowariancja pośrodku UiS i dano uu około E(uiSuu) = { Ty.
W zapisie macierzowym, możemy grupować zupełnie Ti obserwacje dla części ja do wektora yf i napisać to jako
Yi = Xfj8 + Uf (15.4) wektor Uf, który zawiera zupełnie zakłócenia dla indMdual ja, ma niezgodność kowariancję macierz podana około
Var(iif) = £ f = cr | j + ^ J (15.5)
gdzie jest J sąuare macierz z zupełnie elementy eąual do 1. To może zostać pokazane tak macierz
9 Ki = ja - -J,
/ < rł,
gdzie 6 = 1-777 ^ 77, ma własność
Rozdział 15. Panel dane
111
To następuje tak przekształcony system
KiYi = KiXi { 3 + KiUi (15.6)
zadowala Gaus Markov warunki i OLS oszacowanie (15.6) dostarcza skuteczny wniosek. Ale odtąd
KiYi = Yi - 6Yi
GLS oszacowanie jest równoważne OLS używanie “poniżył się przez ąuasi” zmienne; to jest, zmienne, od których odejmujemy ułamek 6 ich, średnia. Zawiadomienie tak dla u } -> ■ 0, 6 -> ■ 1, kiedy, ponieważ % -> ■ 0, 6 -> ■ 0. To środki tak, jeżeli zupełnie niezgodność jest możliwa do przypisania do indMdual efekty, wtedy ustalone efekty kosztorysant jest optymalny; jeżeli, z drugiej strony indMdual efekty są bez znaczenia, wtedy złożony OLS obraca się, unzaskakująco, by być optymalnym kosztorysantem. wprowadzić w życie GLS podejście, które musimy obliczyć 6, który kolejno reąuires oceny niezgodności u } i %. (Ci często są odesłani do jako “w” i “pośrodku” niezgodności re specyfikacja tively, odtąd były odnosi w każdym rozgniewany przekrojowym część i ten drugi do odmiany pośrodku części). Kilka środki szacowania ci wielkości zostały sugerowane wewnątrz literaturę (zobacz Baltagi, 1995); gretl użycie metoda Swamy i Arora (1972): < r | jest estimated przez końcową niezgodność od ustalonych efektów model i suma < r | + Tfcr ^ jest oszacowany jako Ti razy końcowa niezgodność od “pośrodku” kosztorysant,
yi = Ksi { 3 + et ten ostatnia regresja jest wprowadzona około budujący dane zbiór składający się z grupy środki z zupełnie związane zmienne.
Wybór kosztorysanta,
Którego metoda panelu powinien jeden używają, naprawiony efekty lub przypadkowe efekty?
Jeden droga odpowiadania to, które ąuestion jest w odniesieniu do natury danych zbiór. Jeżeli panel obejmuje obserwacje na ustalonym i stosunkowo smali ustawił części zainteresowania (powiedzieć, państwa członkowskie Unii Europejskiej), jest założenie za ustalonymi efektami. Jeżeli to obejmuje obserwacje na bardzo dużo z losowo wybrany osoby (jak wewnątrz dużo epidemiologiczny i inne południkowe nauki), jest założenie za przypadkowymi efektami.
Poza
tym to ogólny heurystyczny, jakkolwiek, różne statystyczne zagadnienia muszą zostać wzięte do konta.
Trochę zbiory danych panelu zawierają zmienne wartości są określone do rozgniewany przekrojowej części ale, które nie zmienia się tu czasu. Jeżeli chcesz zawrzeć taki zmienne, model, ustalone efekty opcja nie jest po prostu dostępna. Kiedy ustalone efekty podejście jest wprowadzone w życie zmienne smoczka używania, problem jest tak czas niezmienne zmienne są doskonale współliniowe z przez pośrednictwo -częścią smoczki. używając podejście odejmowania grupa środków, zagadnienie jest tak potem de znaczący tych zmienne są nic tylko zera. nieco analogiczna prohibicja odnosi się do przypadkowego kosztorysanta efektów. Ten kosztorysant jest w rezultacie obciążoną na macierzy średnią złożonego OLS i “pośrodku” kosztorysant. Sądźmy, że mamy obserwacje na n częściach lub osobach i są k niezależne zmienne zainteresowania. Jeżeli k > n, “pośrodku” kosztorysant jest nieokreślony - od mamy tylko n efektywne obserwacje - i odtąd tak jest przypadkowym kosztorysantem efektów.
Jeżeli to nie robi, fali fauluje jednego lub innego z prohibicji wspomnianych powyżej, wybór między naprawionymi efektami i przypadkowe efekty mogą zostać wyrażony pod względem dwóch ekonometrycznych dezyderatów, wydajności i konsekwencji.
Od czysto statystycznego punktu widzenia, moglibyśmy powiedzieć, że jest tradeoff między mocną budową i wydajnością. W ustalonym podejściu efektów, nie robimy jakichś hipotez na “efektach grupy” (to jest, czas niezmienne różnice w środku między grupami) poza faktem, że oni istnieją
Rozdział 15.. Panel dane
112
- i to może zostać testowany; patrzcie poniżej. Jako conseąuence, gdy tylko te efekty są zamiecione przez branie odchyleń od środków grupy, pozostałe parametry mogą zostać oszacowane.
Z drugiej strony przypadkowe podejście efektów usiłuje umodelować efekty grupy jako rysunki od dystrybucji prawdopodobieństwa zamiast usuwania ich. Ten reąuires, którym indMdual efekty są repodlegającym orzecznictwu sądowemu jako prawowita część okresu zakłócenia, to jest, zerowy-znaczą przypadkowe zmienne, unkorelował z regressors.
Jako conseąuence, kosztorysant naprawiłeś-efektów “zawsze prace”, ale za cenę nie bycia w stanie oszacować efekt czas niezmiennego regressors. Bogatszy zbiór hipotezy kosztorysanta przypadkowych efektów zapewnia tak parametry, ponieważ czas niezmienny regressors może być estimated i tak esti-mation parametrów dla zmieniający się czasu regressors jest niesiony więcej skutecznie. Jednak ci advan-tages jest związane do ważności dodatkowych hipotez. Jeżeli, na przykład wnioskują, by pomyśleć, że indMdual efekty mogą zostać zestawione z kilku z objaśniających zmiennych, wtedy kosztorysant przypadkowych efektów byłby niezgodny, kiedy naprawiłeś-powoduje oceny nadal byłby ważny. To jest dokładnie na tej zasadzie, że Hausman test jest zbudowany (patrzcie poniżej): jeżeli ustaleni- i przypadkowy-powoduje oceny zgadzać się, z dokładnością do zwykłej statystycznej granicy błędu, nie ma żadnego powodu, by przemyśleć dodatkowego inwalidę hipotez i jako conseąuence, żaden powód nie użyć bardziej skuteczny ODNOŚNIE kosztorysant.
Modele panelu testowania,
Jeżeli szacujesz, ustalony powoduje lub przypadkowe efekty modelują w graficznej powierzchni międzyfazowej, możesz zauważyć, że numer rzeczy dostępnych pod “Testy” menu w oknie modelu stosunkowo jest ograniczony. Panel modele niosą pewne komplikacje, które robią to trudne, by wprowadzić w życie wszystkich testy, które to oczekuje widzieć dla modele oszacowały na prostych czas seriach lub rozgniewany przekrojowych danych.
Niemniej jednak, różne wprawiają płycizny -określone testy są drukowane wraz z ocenami parametru jako sprawa oczywiście, następująco.
Kiedy szacujesz model używający ustalone efekty, automatycznie dostajesz F test dla nuli hypothesis, że rozgniewany przekrojowe części wszystko ma wspólny przejąć. To znaczy że wszystko «fS jest eąual, w którym przypadek złożony model (15.1), z kolumną ls włączany do x macierzy, jest adeąuate.
Kiedy szacujesz, używające przypadkowe efekty, Breusch Poganin i Hausman testy są przedstawione automatycznie.
Breusch Pogański test jest odpowiednik do F testu wspomniał powyżej. nuli hipoteza jest, że niezgodność vi w eąuation (15.3) eąuals zero; jeżeli ta hipoteza nie jest odrzucona, wtedy znów konkludujemy, że prosty złożony model jest adeąuate.
Hausman test sonduje konsekwencję GLS ocen. nuli hipoteza jest, że te oceny są stałe - to jest, że reąuirement prostokątności vi i Ksi jest zadowolony. Test jest oparty na mierze, H, “odległości” między naprawiłeś-efektami i ocenami przypadkowych efektów, zbudował taki, że pod nuli to podąża x2 dystrybucję ze stopniami wolność eąual do numeru zmieniającego się czasu regressors w macierzy X. If wartość H jest “duża” że to sugeruje, że przypadkowy kosztorysant efektów nie jest stały i model naprawiłeś-efektów jest lepszy.
Jest dwoma drogami obliczania H, metoda macierz różnicy i metoda regresji. Postępowanie dla metody macierz różnicy jest tym:
Zebrać naprawiłeś-efekty szacuje w wektor j6 i odpowiedni przypadkowy-powoduje estimates w j6, wtedy tworzy się wektor różnicy (j8 - j8).
Utwórz macierz kowariancji wektora różnicy jako Var(j6 - j8) = Var(j6) - Var(j6) = Y, gdzie jest Var(j6) i Var(j6) oszacowany przez macierze niezgodności próbki ustalonych- i przypadkowy-powoduje modele respectively.2
2Hausman (1978) pokazany, które kowariancja różnicy bierze tej prostej formie, kiedy fi jest skutecznym kosztorysantem
Rozdział 15.. Panel dane
113
• Policz H = p - p Y 1 p - s.
Podane względne wydajności fi i j8, macierzy Y “powinien być” pozytywny, że określony, wewnątrz, który przypadek H jest pozytywny, ale w ograniczonych próbkach to nie jest gwarantowany i oczywiście przecząca x2 wartość nie jest dopuszczalna. Metoda regresji unika tego potencjalnego problemu. Postępowanie jest:
Potraktować przypadkowe efekty modelować jako ograniczony model i rejestrować jego sumę sąuared resid-uals jako SSRr.
Ocena przez OLS swobodny model wewnątrz, które zależny zmienny jest poniży się przez ąuasi y i regressors zawiera zarówno poniżył się przez ąuasi X (jako wewnątrz ODNOŚNIE model) i de znaczone warianty z cały czasu zmieniające się zmienne (tzn. naprawiłeś-efekty regressors); rejestruj sumę sąuared reszt od tego modelu jako SSRM.
Policz H = n (SSRr - SSRM) / SSRM, gdzie jest n całkowitą liczbą obserwacji, użyło. Na tym wariant H nie może być przeczący, od dodawania dodatkowego regressors do ODNOŚNIE model nie może podnosić SSR.
Domyślnie gretl liczy Hausman test przez metodę macierz różnicy (głównie, ponieważ compara-bility z innym oprogramowanie), ale to używa regresji metoda, jeżeli youpass opcja --hausman-reg do panelu rozkaz.
Krzepkie błędy standardu
Dla większości kosztorysantów, gretl oferuje opcję liczenia oceny macierzy kowariancji, która jest krzepka w odniesieniu do heteroskedasticity i / lub autokorelacja (i odtąd również krzepkie błędy standardu). W przypadku danych panelu, krzepcy kosztorysanci macierzy kowariancji są dostępni dla złożonego i naprawionego modelu efektów ale nie aktualnie dla przypadkowych efektów. Proszę zobacz sekcję 14.4 dla szczegółów.
15.2 modeli panelu Dynamie
Specjalne problemy powstają kiedy opóźnienie zależnej zmiennej jest zawarte między regressors w modelu panelu. Rozważ dynamie wariant złożonego model (15.1):
yu = Xit { 3 + pyu-ja + uu (15.7)
pierwszy, jeżeli błąd uu zawiera efekt grupy, vu wtedy yu-ja jest zobowiązanym, by zostać zestawiony z błędem, odtąd wartość vi wpływa na yi w ogóle t. Tak środki tak OLS stosowany do (15.7) będzie niezgodny jak również nieskuteczny. naprawiłeś-efekty model zamiata grupa powoduje i tak pokonuje to szczególny problem, ale subtelniejsze zagadnienie resztka, która odnosi się do zarówno ustalone i przypadkowe efekty oszacowanie. Rozważ de znaczoną reprezentację ustalonych efektów, jak odnosić się do dynamie model,
yu = Xup + pyi, t-ja + £ u,
gdzie yu = yu-yi i UE = uu-Ui (lub uu - «ja, używając notację eąuation 15.2). problem jest tak j > ja, t-będę zestawiony z UE przez grupę środek, yi. zakłócenie UE wpływa na yu bezpośrednio, które wpływa na yu, który, około konstrukcja, wpływa na wartość yu dla zupełnie t. to sam zagadnienie powstaje w odniesieniu do poniżających się ąuasi używane dla przypadkowych efektów. Kosztorysanci, którzy ignorują, to korelacja będzie stały tylko jako T -> ■ oo (wewnątrz, które przypadek marginalny efekt UE grupa znaczą y ma skłonności do zniknięcia).
Jeden strategia dla obsługiwania to problem i produkując stałe oceny j8 i p, za udawany około Anderson i Hsiao (1981). Zamiast de znaczącego dane, oni sugerują wziąć pierwszy różnica (15.7), alternatywnej taktyki dla zamiatania grupa efekty:
Ayu = AXuP + pAyttt-ja + Hu (15.8)
i /? jest nieskuteczny.
Chapterl5. Panel dane 114,
gdzie r / u = Auu =(vt + £ u) = £ u - ff, t-ja- Jesteśmy nie wewnątrz elear jeszcze, podana strukturę błędu rnt: zakłócenie £ ttt-ja jest wpływ dalej zarówno r / u, jak i Ayttt-ja = yu - yt, t-ja- następny krok jest wtedy, by znaleźć narzędzie dla “zanieczyszczony” Ayiit-ja- Anderson i Hsiao sugerują używanie albo yitt-2 lub Ayttt-2, zarówno, które będzieć unbędziesz zestawiać z r / u zaopatrzony tak podleganie błędy, £ u, są nie siebie kolejno skorelował. Anderson Hsiao kosztorysant nie jest dostarczony jako wbudowana funkcja wewnątrz gretl, odtąd gretl's rozsądnego obsługiwanie opóźnień i różnice dla wprawić płycizny dane robią to proste stosowanie regresji z instrumentalnymi zmiennymi - zobacz Przykład 15.1, który bazował dalej, nauka kraju wzrost być zaliczanym do około Nerlove (1999).3
Przykład 15.1: Anderson Hsiao kosztorysant dla dynamie panel model
Penn Świat Stół dane jak używany około Nerlove otwarty penngrow.gdt
Ustalony efekty (dla porównania) panel Y 0 Y(-l) X
Przypadkowy efekty (dla porównania) panel Y 0 Y(-l) X --przypadkowe efekty
biorą różnice z zupełnie zmienne diff Y X
Anderson Hsiao, używanie Y(-2) jako narzędzie tsls d_Y d_Y(-l) d_X ; 0 d_X Y(-2)
Anderson Hsiao, używanie d_Y(-2) jako narzędzie tsls d_Y d_Y(-l) d_X ; 0 d_X d_Y(-2)
Chociaż Anderson Hsiao kosztorysant jest, stały, to jest nie najwięcej skuteczny: to nie robi najpełniejsze użycie dostępnych narzędzi, ponieważ ^ t-ja, ani robi to biorą pod uwagę odróżnioną strukturę błędu r / u. To jest ulepszone na około metody Arellano i Więź (1991) i Blundell i Więź (1998).
Gretl wprowadza tubylczo Arellano Więź kosztorysanta. racja z tyłu to jest, ściśle mówiąc, tamten z GMM kosztorysant, ale to może zostać zilustrowane krótko następująco (zobacz Arellano (2003) ponieważ com prehensive naświetlenie). Rozważ znów eąuation (15.8): jeżeli, ponieważ każdy indMdual mamy obserwacje datowały się od 1 do T, możemy napisać następny system:
Ayi } 3 = AXf, 3j6 + pAyi } 2 + Cześć, 3 (15.9)
AyiĄ = AXt, 4j8 + pAyiĄ + x,]ią (15.10)
Ayij = AXij { 3 + pAytj + Hij (15.11)
Następując to sam logie, jeśli chodzi o Anderson Hsiao kosztorysanta, widzimy tak jedyny możliwy instrument, ponieważ Aytt2 wewnątrz eąuation (15.9) jest ytj, gdyby nie eąuation (15.10) możemy użyć zarówno ytj, jak i 3 /^ 2 jako narzędzia, ponieważ Ayt ^, tym samym zyskując wydajność. Podobnie, ponieważ końcowy okres T, który możemy użyć jako narzędzia zupełnie ceni yttt w górze do t = T - 2. Arellano Więź techniąue szacuje powyższy system, z inereasing numerują narzędzi, ponieważ każdy eąuation.
Oszacowanie typowo jest niesione w dwóch kroki: wewnątrz wkrocz do 1 parametry są oszacowane na
3Also widzą Clint Cummins' testów sprawności strona, < http://www.stanford.edu/ ~ clint /ławka />
Rozdział 15.. Panel dane
115
założenia tak macierz kowariancji rntt okresów jest proporcjonalny do
2-1 0 ■ ■ ■ 0
-1 2-1 ■ ■ ■ 0
0-1 2 ■ ■ ■ 0
0 0 0 ■ ■ ■ 2
jak powinien przedstawiać się tak, czy zakłócenia w oryginalny model uttt byli homoskedastic i związany un okrzyk zdziwienia. To wydaje stały, ale niekoniecznie skuteczny, kosztorysanta.
Krok 2 używa parametrów estimated w takcie 1, by policzyć ocenę kowariancji rnit i odnośnie-szacują, że parametry bazowały na tym. To postępowanie ma podwójny efekt radzenia heteroskedasticity i / lub seryjna korelacja, plus produkując kosztorysantów, którzy są asymptotically efficient.
Jeden wkraczać do kosztorysantów czasami byli preferowane na ziemiach, że oni są bardziej krzepcy. Ponadto liczenie macierzy kowariancji 2-wkraczać do kosztorysanta przez standard GMM formułki zostało pokazane, by doprowadzić do rażąco uprzedzonych skutków w hnite próbkach. Cretl, jakkolwiek, wprowadza w życie skorygowanie hnite próbki wymyślone przez Windmeijer (2005), tak błędy standardu, ponieważ 2-wkraczać do kosztorysanta może zostać rozważony stosunkowo dokładny.
Domyślnie arbond rozkaz gretl's szacuje parametry w(L)yttt = Xiitp + Vi + uttt
przez 1-wkraczać do postępowania. Zależna zmienna automatycznie jest odróżniona (ale notatka, że prawe zmienne strony automatycznie nie są odróżnione)i wszystkie dostępne narzędzia są użyte. Jakkolwiek te wybory (plus jacyś inni) może zostać przekroczony: proszę zobacz dokumentację dla arbond rozkazu w Odniesieniu Rozkazu Gretl i plik przykładu arbond91 dostarczył z gretl.
15.3 Panel ilustracji: Stół Świata Penn Stół Świata Penn (strona główna w pwt.econ.upenn.edu < http://pwt.econ.upenn.edu/ >) jest bogatym makroekonomiczny zestawem danych panelu, rozciągając się 152 krajów tu lata 1950-1992. Dane są dostępne w gretl formacie; proszę zobacz gretl dane miejsce < http://gretl.sourceforge.net/gretl_data.html > (to jest wolne pobieranie, chociaż to nie jest włączone do głównej gretl paczki).
Przykład 15.2 otwiera pwt56_60_89.gdt, podzespół PWT zawierającego dane na temat 120 krajów, 1960-89, ponieważ 20 zmienne, z żadnym gubienie obserwacji (zbiór danych fuli, który również jest dostarczony wewnątrz pwt paczka dla gretl, ma wiele brakujące obserwacji). Całkowity wzrost prawdziwego GDP, 1960-89, jest obliczony, ponieważ każdy kraj i regressed przeciw 1960 poziom prawdziwego GDP, do zobacz, czy jest dowód na “zbieżność” (tzn. szybszy wzrost ze strony krajów zaczynających się od Iow bazę).
Rozdział 15.. Panel dane
116
Przykładu 15.2: Użycie Stół Świata Penn
otwartego pwt56_60_89.gdt
dla 1989 (ostatniego obs), zaaresztuj 29 daje 1960, pierwszemu obs genr gdp60 = RGDPL(-29)
znajduje całkowity wzrost prawdziwego GDP ponad 30 lat genr gdpgro = (RGDPL - gdp60)/ gdp60
ogranicza próbkę do 1989 rozgniewana sekcja smpl --ograniczyć ROK = 1989
zbieżności: kraje z niższą bazą urosły szybciej? ols gdpgro const gdp60
skutek: Nie! Czy próbujesz odwrotną relację? genr gdp60inv = 1 / gdp60
ols gdpgro const gdp60inv
# żaden znów. Czy próbujesz traktować Afrykę jako specjalny?
genr afdum = (CCODE = 1)
genr afslope = afdum * gdp60
ols gdpgro const afdum gdp60 afslope
Rozdział 16
Nieliniowy najmniejszy zgadza
16.1 Wprowadzenia i przykłady
Cretl popiera nieliniowy najmniejszy sąuares (NLS) używający wariant z Levenberg-Marquandt algorytm. Użytkownik musi dostarczyć specyfikację funkcji regresji; przed dawaniem tej specyfikacji zostać oszacowany parametrom musi “zostać oznajmiony” i podane początkowe wartości. Opcjonalnie użytkownik może dostarczyć analitycznym pochodnym funkcji regresji poważanie do każdego z parametrów. Tolerancja (kryterium dla rozwiązywania wielokrotnego postępowania oszacowania) może zostać dostosowany używając rozkaz zbioru.
Składnia dla wyszczególniania funkcja zostać oszacowany jest tym samym, jeśli chodzi o genr rozkaz. Tu są dwa przykłady, z towarzyszeniem pochodnych.
Przykład 16.1: Konsumpcja funkcja od Greene
nls C = alfa + ocena dobra * YAgamma
deriv alfa = 1
deriv ocena dobra = YAgamma
deriv gamma = ocena dobra * YAgamma * wpisz(Y)
koniec nls
Przykład 16.2: Nieliniowa funkcja od Russell Davidson
nls y = alfa + ocena dobra * xl + (l / ocena dobra) * x2
deriv alfa = 1
deriv ocena dobra = xl - x2 /(ocena dobra * ocena dobra)
koniec nls
Notuje słowa rozkazu ni s (które wprowadza funkcję regresji), deriv (które wprowadza specyfikację pochodnej)i koniec nls, który rozwiązuje specyfikację i wzywa do oszacowania. Jeżeli --vcv flaga jest dodana do ostatniej linii macierz kowariancji ocen parametru jest drukowana.
16.2 Inicjowanie parametrów musi da początkowe wartości przed parametrom funkcji regresji nls rozkazem. To może używać genr rozkazu (lub, w GUI programie, przez rzecz menu “Zmienna, Zdefiniować nową zmienną”).
W jakichś przypadkach, gdzie jest nieliniowa funkcja generalizacją z (lub ograniczona forma z) linearny model, to może być dogodne, by przebiegnąć ols i zainicjować parametry od OLS współczynnika
117
Chapterl6. Nieliniowe najmniejsze kwadraty
118
ocen. W odniesieniu do pierwszego przykładu powyższego, można, by zrobić:
ols C 0 Y
genr alfy = $ coeff(0) genr ocena dobra = $ coeff(Y) genr gamma = 1
I w odniesieniu do drugiego przykładu można, by zrobić:
ols y 0 xl x2
genr alfy = $ coeff(0)
genr ocena dobra = $ coeff(xl)
16.3 okno dialogu NLS
To jest prawdopodobnie najbardziej dogodne skomponować rozkazy dla NLS oszacowania w formie gretl scenariusza ale możesz również zrobić tak interaktywnie, przez wybieranie rzeczy “Nieliniowy Najmniejszy Sąuares” pod “Modelem, Nieliniowymi modelami” menu. To otwiera okienko dialogowe, gdzie możesz napisać specyfikację funkcji (prawdopodobnie opatrzony przedmową przez genr kreśli linie, by ustawić początkowe wartości parametru) i pochodne, jeżeli dostępny. Przykład tego jest pokazany w Cyfra 16.1. Zauważ, że w tym kontekście nie musisz dostarczyć ni s i kończysz ni s etykietek.
Cyfra 16.1: NLS okienko dialogowe
16.4 Analityczne i numeryczne pochodne,
Jeżeli jesteś w stanie zrozumieć pochodne funkcji regresji w odniesieniu do para liczników, to jest wskazane dostarczyć te pochodne jako pokazany w przykładach powyżej. Jeżeli to nie będzie możliwy, gretl policzy przybliżone numeryczne pochodne. Własności NLS algo-rithm nie może być tak dobry wewnątrz tego przypadek (zobacz Sekcję 16.7).
Jeżeli analityczne pochodne są dostarczone, oni są sprawdzeni dla konsekwencji z daną nieliniową funkcją. Jeżeli pochodne są, wyraźnie niepoprawne oszacowanie jest usunięte z komunikatem błędu. Jeżeli pochodne są “podejrzliwe” , komunikat ostrzegawczy jest wydany ale przychód oszacowania. To ostrzeżenie może czasami zostać wywołane przez niepoprawne pochodne, ale to może również zostać wywołane przez wysoki stopień z współliniowym ity między pochodnymi.
Chapterl6. Nieliniowe najmniejsze kwadraty
119
Notatki, której nie możesz zmieszać analitycznym i numerycznym pochodnym: powinieneś dostarczyć wyrażenia dla wszystkich pochodne lub żaden.
16.5 Kontrolującego końca postępowanie oszacowania NLS jest wielokrotnym procesem. Powtarzanie jest rozwiązane kiedy kryterium dla zbieżności jest spotkane lub kiedy numer maksimum powtarzania jest osiągnięty, którykolwiek jest pierwszym.
Pozwól, że k oznacza numer parametrów estimated. Numer maksimum powtarzania jest 100 x (fe + 1) kiedy analityczne pochodne są dane i 200 x (fc + 1) kiedy numeryczne pochodne są użyte.
Pozwól, że e oznacza smali numer. Powtarzanie jest uważane, by zbiec się, jeżeli co najmniej jeden z następnych warunków jest zadowolony:
Zarówno faktyczne i przewidziane względne redukcje wewnątrz suma błędu sąuares są w najlepszym razie e. względny błąd między dwoma kolejnym powtarza jest w najlepszym razie e.
To wartość domyślna e jest maszyna precyzja do władzy 3/4, 1 ale to może zostać dostosowane używanie zbiór rozkaz z parametrem ni s_toler. Na przykład
ustawił nls_toler .0001 zrelaksuje wartość e do 0.0001.
16.6 Szczegółów na kodzie podlegający silnik dla NLS oszacowanie jest oparte na minpack orszaku funkcji, dostępnych od netlib.org < http://www.netlib.org/minpack/ >. Szczególnie następne minpack funkcje są nazywane:
1 mder Levenberg-Marquandt algorytm z analitycznymi pochodnymi
chkder Kontrola dostarczone analityczne pochodne
1 mdif Levenberg-Marquandt algorytm z numerycznymi pochodnymi
fdjac2 Liczy końcowy przybliżony Jacobian używanie numerycznych pochodnych
dpmpar Określa maszynę precyzja
Dalej pomyślnymi zakończenie z Levenberg-Marquandt powtarzanie, Newton Gaus regresja jest użyta, by obliczyć kowariancja macierz dla parametr ocen. Jeżeli --krzepkiej fladze dano krzepki wariant jest policzony. Dokumentacja dla rozkazu zbioru wyjaśnia określone opcje dostępne w związku z tym.
Od NLS skutki są asymptotyczne, jest pokój dla debaty, ponad czy lub nie skorygowanie, ponieważ stopnie wolności powinny zostać stosowane kiedy obliczając błąd standardu regresji (i błędy standardu ocen parametru). Dla porównywalności z OLS i w świetle rozumowania oddawanego Davidson i MacKinnon (1993), oceny pokazane w gretl naprawdę używają stopni skorygowania wolności.
16.7 Numerycznego dokładność
Stołu 16.1 pokazuje skutki przebiegania gretl NLS postępowania na 27 Statystycznych Zestawach danych Odniesienia zrobionych dostępny przez USA Narodowy Instytut Standardy i Technologia (NIST) dla test ing nieliniowego regresja software.2 Dla każdego zestawu danych, dwóch zbiorów zaczynania wartości dla parametry
lOn 32-kawałka Intel Pentium maszyna prawdopodobna wartość dla ten parametr jest 1.82 x 10 ~ 12. 2For dyskusja dokładności gretl's w oszacowaniu linearnych modeli, zobaczyć Aneks D.
Chapterl6. Nieliniowe najmniejsze kwadraty
120 być oddane pliki testu, więc fuli test obejmuje 54 biegów. Dwa fuli testy zostały wykonane, jedno używanie wszystkie analityczne pochodne i jedno używanie wszystkich numerycznych przybliżeń. W każdym przypadku domyślna tolerancja była used.3
Z 54 biegów, gretl zawiódł doprowadzić do rozwiązania w 4 przypadki używając analityczne pochodne i w 5 przypadki kiedy używając numeryczne przybliżenie. Czterech niepowodzeń w analitycznym trybie pochodnych, dwa byli z powodu bzu --zbieżność z Levenberg-Marquandt algorytm potem maxi-cisza numerować powtarzania (dalej MGH09 i Bennett5, zarówno opisany około NIST jako z “Wyżej diffi-culty”) i dwa byli z powodu pokolenia zasięgu błędy (poza-z-granice płynące punkt wartości) kiedy liczył Jacobian (dalej BoxB0D i MGH17, opisany “Wyższej trudności” i “Przeciętnej trudności” odpowiednio). Dodatkowe niepowodzenie w numerycznym trybie przybliżenia było na MGH10 (“Wyższa trudność”, numer maksimum powtarzania wyciągnął rękę).
Stół udziela informacji o kilku aspektach testów: numer całkowitych niepowodzeń, przeciętnego numeru powtarzania wziętych, by doprowadzić do rozwiązania i dwóch rodzajów miary dokładności ocen dla zarówno parametrów, jak i błędów standardu parametrów.
Dla każdego z 54 biegów w każdym trybie, jeżeli bieg doprowadziłby do rozwiązania, oceny parametru uzyskane przez gretl byłyby w porównaniu z NIST potwierdzonymi wartościami. My denne “minimum poprawne cyfry” dla danego biegu jako numer znacznych cyfr, do których najmniej dokładny gretl esti kolega zgodził się z potwierdzoną wartością, dla tego biegu. Stół pokazuje zarówno średnią, jak i worst wartość przypadku tej zmiennej przez wszystkie biegi, które doprowadziły do rozwiązania. Ta sam informacja jest pokazana dla estimated standard errors.4 drugą miarą dokładności pokazanej jest procentem przypadków, biorąc pod uwagę wszystek parameters od wszystkich pomyślnych biegach, w których gretl ocena zgodziła się z potwierdzoną wartością do co najmniej 6 znacznych cyfr, które są drukowane domyślnie w produkcji regresji gretl.
Stół 16.1: Nieliniowa regresja: NIST przeprowadza badania
Analityczne pochodne Numeryczne pochodne
Niepowodzenia w 54 testy
Przeciętne powtarzanie
Znaczą min. poprawne cyfry,
parametry
Najgorzej min. poprawne cyfry,
parametry
Znaczą min. poprawne cyfry, błędy
standardu
Najgorzej min. poprawne cyfry, błędy
standardu
Procent poprawny do co najmniej 6 cyfr,
parametry
Procent poprawny do co najmniej 6 cyfr, błędy
standardu
4
32
8.120
4
8.000
5
96.5
97.7
5
127
6.980
3
5.673
2
91.9
77.3
Używające analityczne pochodne, worst wartości przypadku dla zarówno parametrów, jak i standardu błędy były
3The dane pokazanymi w stole był zgromadzany od wstępnie-wypuszczenia budują gretl wersja 1.0.9, zestawia z gcc 3.3, łączy się przeciw glibc 2.3.2 i biegną pod Linuks na i686 PC (IBM ThinkPad A21m).
4For błędy standardu, wykluczyłem jednego ostańca od dane pokazanych w stole, mianowicie Lanczos1. To jest nieparzysty przypadek, używanie generowanych danych z prawie-dokładnym pasowało: błędy standardu są 9 lub 10 porządkami wielkości mniejszej niż współczynnikami. W tym wypadku gretl mógłby powielić potwierdzone błędy standardu do tylko 3 cyfry (analityczne pochodne) i 2 cyfry (numerycznych pochodnych).
Chapterl6. Nieliniowe najmniejsze kwadraty
121
poprawiło do 6 poprawnych cyfr dalej maszyną testu kiedy tolerancja została zaciśnięta do 1.0e-14. Używając numeryczne pochodne, to sam zaciskanie tolerancji podnosiło najgorsze wartości do 5 poprawnych cyfr dla parametrów i 3 cyfr dla błędów standardu, w koszcie jednego dodatkowego niepowodzenia zbieżności.
Zanotuj ogólną wyższość analitycznych pochodnych: na przeciętnych rozwiązaniach problemów testu został uzyskany z znacznie mniej powtarzania i skutki były bardziej dokładne (najwięcej szczególnie dla estimated błędów standardu). Zauważ również, że skutki six-digit były w druku przez gretl nie są 100 procent godny zaufania dla trudnych nieliniowych problemów (w szczególnym kiedy używając numeryczne pochodne). Rejestrowawszy ten sprzeciw, procent przypadków, gdzie skutkami było dobre do sześć cyfr lub lepszy wydaje się wystarczająco wysoki, by uzasadnić ich druk w tej formie.
Dziel na rozdziały 17 oszacowania prawdopodobieństwa
Maksimum
17.1 Ceneric ML oszacowania z gretl
Maksimum prawdopodobieństwem oszacowanie jest kamieniem węgielnym nowoczesnych dedukcyjnych postępowań. Gretl dostarcza sposobem wprowadzenia w życie tę metodę dla szerokiego zasięgu problemów oszacowania, przez użycie mle com mand. Daję tu kilka przykładów.
Dają założenie dla przykładów, które następują, zaczynamy się od krótkiej pamiątki na podstawie ML oszacowania. Podana próbkę wielkości T, to jest możliwe do denne gęstość function1 dla próbki całości, mianowicie łączna dystrybucja wszystkich obserwacji /(Y; 6), gdzie Y = { y \..., yj }. Jego kształt jest określony przez fc wektor nieznanych parametrów 6, których zakładamy jest zawarty w zbiorze 0 i, które może zostać użyte, by ocenić prawdopodobieństwo przestrzegania próbki z jakimiś danymi cechami.
Po przestrzeżeniu danych, wartości, którymi Y są dane i ta funkcja może zostać oceniona dla jakiejś wartości legiti kolegi 6.. W tym przypadku, wolimy do cali to funkcja prawdopodobieństwa; potrzeba dla innego imienia pochodzi od faktu, że to prace funkcji jako gęstość kiedy używamy yts jako dyskusje i 6 jako parametry, podczas gdy w tym kontekście 6 jest wzięty jako dyskusja funkcji i dane, które Y tylko mają rola określania jego kształtu.
W przypadkach standardu, ta funkcja ma uniąue maksimum. Miejsce maksimum jest nieporuszone, jeżeli rozważamy logarytm prawdopodobieństwa (lub kloc prawdopodobieństwo dla krótkiego): ta funkcja będzie oznaczona jako
£{ 6) = kloc /(Y; 6) funkcje kloc prawdopodobieństwa, że gretl może sprawować się są tymi, gdzie £{ 6) może zostać napisany jako
T
£{ 6) = ^ $ t(9) t =\
które jest prawdziwe w większości wypadków zainteresowania. Funkcje £ t(@) nazywają się kloc prawdopodobieństwo contribu-tions.
Ponadto miejsce maksimum oczywiście jest określone około danymi Y. This znaczy tak wartość
6(Y) = Argmax ^((9) (17.1)
jest jakąś funkcją przestrzeżone dane (danych), które mają własność, poniżej łagodne warunki, bycia stały, asymptotically normalny i asymptotically skuteczny kosztorysant 6.
Czasami można obniżyć wartość jawnie, funkcja 6(Y); ogólnie, to nie potrzebuje być tak. Wewnątrz te okoliczności, maksimum można znaleźć około znaczy numerycznego techniąues. To częsty polegają na fakcie tak kloc prawdopodobieństwo jest gładką funkcją 6 i, dlatego dalej maksimum jego częściowe pochodne powinny zupełnie być 0. wektor nachylenia lub zdobyć wektor, jest funkcją, która lubi, wiele interesujące statystyczne własności w jego własnym prawie; to będzie wskazane tu jako g(6). To jest
1We sądzi tu tak, że nasze dane są realizacją ciągłych przypadkowych zmiennych. Dla dyskretnych przypadkowych zmiennych, wszystko kontynuuje stosować około odnoszenie zamiast gęstości. Wewnątrz zarówno przypadki, dystrybucja może być uzależniona na trochę exogenous zmiennych.
122
Rozdziału 17. oszacowanie prawdopodobieństwa Maksimum
123
fc wektora z typowym elementem
och € { u) v- och * t(y)
9i { v) = ^ 7.- = / -^ 7i bazował na
Nachyleniu metody może niedługo zostać zilustrowany następująco:
wybrać punktowi fteB;
ocenić g(6o);
jeżeli g(6o) jest “smali", zatrzymaniem. Inaczej, policz kierunek wektor d(g(6o));
ocenić 6 \ = 6o + d(g(6o));
substytut robią z d \\
wznowienie od 2.
Wielu algorytmy tego uprzejmego egzystują; oni zasadniczo różnią się od siebie w drodze oni liczą kierunek wektor d(g(6o)), do zapewnić tak £{ 6 \) > £(6o) (więc, że w końcu kończymy się dalej maksimum). metoda gretl używany, by zmaksymalizować kloc prawdopodobieństwo jest oparty na nachylenie algorytm znanym jako BFGS (Broyden, Wytwórca strzał i łuków, Goldfarb i Shanno) metoda. To techniąue być używany w najbardziej ekonometrycznym i statystycznym paczki, jako to jest zdrowy założone i znacząco potężne. Wyraźnie, wewnątrz zamów, by uczynić z tego techniąue sprawny, to musi być możliwe, by policzyć wektor g(6) ponieważ jakiś wartość 6. Wewnątrz trochę przypadkami tym wektor może zostać napisany jawnie jako funkcja Y. If, że to jest nie możliwy lub zbyt trudny nachylenie może zostać ocenione numerycznie. wybór startu wartość, zrób, jest decydująca w trochę konteksty i inconseąuential wewnątrz inni. Ogólnie, jakkolwiek, to jest wskazane zacząć algorytm od “rozsądnych” wartości kiedykolwiek możliwych. Jeżeli stały kosztorysant jest dostępny, to jest zwykle bezpieczny i skuteczny wybór: to zapewnia tak w dużych próbkach, że punkt początkowy będzie prawdopodobny blisko 6 i zbieżność może zostać osiągnięta w mało powtarzanie. maxmimum numeruje powtarzania uwzględnianych BFGS postępowanie i względną tolerancję dla oceniania zbieżności, może zostać dostosowany używając zbiór rozkaz: związane zmienne są bfgs_maxiter (wartość domyślna 500) i bfgs_toler (wartość domyślna, maszyna precyzja do władzy 3/4).
Kowariancja macierz i standard błędy
domyślnie kowariancja macierz parametru oceny jest oparty na Zewnętrznym Produkcie Nachylenia. To jest,
-ja
Varopo(c') - [G { Och)G { 0)
gdzie jest G(6) T x k macierz wkładów do nachylenia. Dwa inne opcje są dostępne. Jeżeli --flaga juty jest dana, kowariancja macierz jest policzona od numerycznego przybliżenia do heski w zbieżności. Jeżeli -krzepka opcja jest wybrana, quasi ML “kanapka” kosztorysant być używany:
VarQML(0) = H { 6)-lG' { 6)G { 6)H { 6)-1,
gdzie H oznacza numeryczne przybliżenie do heski. oszacowanie prawdopodobieństwa Maksimum
Rozdziału 17.
124
17.2 Gamma oszacowanie
Sądzą, że mamy próbkę T niezależnego i identycznie rozprowadzamy obserwacje od Gamma dystrybucja. gęstość funkcja dla każdego obserwacja xt jest
)\ Xt) =-Xt exp(-«XH (17.2)
T(p) klocem prawdopodobieństwem dla całą próbką może zostać napisany jako logarytm łącznej gęstości z zupełnie obserwacje. Odtąd ci są niezależni i identyczni, łączna gęstość jest produktem indywidualnych gęstości i odtąd jego kloc jest
n, V ^ [ < XP l , 1 v- „
€ {, p) = > kloc Xf exp {-axt) = > * t (17.3)
t = ja r(P) t = ja,
gdzie
■ £ t = V ■ kloc(«xt) - y(p) - kloc % t - axt
i y (■) jest klocem funkcji gamma. Aby oszacować parametry i p przez ML, musimy zmaksymalizować (17.3) w odniesieniu do nich. Odpowiedni skrawek kodu gretl jest alfą
skalara = 1 skalar p = 1
mle logi = p * ln(alfa * x) - lngamma(p) - ln(x) - alfa * x koniec mle dwie
alfa stwierdzeń = 1 p = 1
jest konieczny, by zapewnić, że zmienne p i alfa egzystują zanim obliczenie logi jest usiłowane. Wartości tych zmiennych będą zmienione przez wykonanie mle rozkazu; na pomyślnym zakończeniu, oni będą zastąpieni przez ML ocen. Wartość startu jest 1 dla obu; to jest arbitralny i naprawdę nie ma znaczenia dużo w tym przykładzie (więcej na tym później).
Powyższy kod może zostać zrobiony bardziej czytelny i marginalnie bardziej skuteczny, przez definiowanie zmiennej, by trzymać się ■ xt. Ten rozkaz może zostać wbity do następująco bloku mle: alfa
skalara = 1 skalar p = 1
mle logi = p * ln(topór) - lngamma(p) - ln(x) - topór
serii topora = alfa * x
params alfa p
koniec mle
W tym przypadku, to jest konieczne zawrzeć linia params alfa p, by odróżnić symbole p i alfę od topora, który jest chwilowo wygenerowaną zmienną i nie parametrem, by zostać oszacowany.
W prostym przykładzie w ten sposób, wybór wartości startu jest prawie inconseąuential; algo-rithm jest prawdopodobny zbiec się obojętnie co start wartości są. Jakkolwiek stali kosztorysanci z-momentów metody p i puszki po prostu wyzdrowiała z próbki znaczą m i niezgodność V: odkąd to może zostać pokazany, że
E(xt) = p / V(xt) = p / a2
Rozdział 17.. Oszacowanie prawdopodobieństwa maksimum
125
to następuje, że następni kosztorysanci
« = m / V p = m ■
są stałe i, dlatego odpowiednie, by zostać użyty jako punkt początkowy dla algorytmu. Kod scenariusza gretl wtedy zostaje
skalar m = znaczyć alfę skalara(x) = m / var(x) skalar p = m * alfa
mle logi = p * ln(topór) - lngamma(p) - ln(x) - topór
serii topora = alfa * x
params alfa p
koniec mle
Inna rzecz, by zauważyć jest tak czasami parametry są ograniczone w pewnych granicach: w tym przypadku na przykład zarówno i p musi być pozytywnymi numerami. Gretl nie sprawdza dla tego: to jest odpowiedzialność użytkownika, by zapewnić, że funkcja zawsze jest oceniona w dopuszczalnym punkcie w przestrzeni parametru podczas wielokrotnego poszukiwania dla maksimum. Efektywny techniąue jest do denne zmienną dla sprawdzania, że parametry są dopuszczalne i ustawia kloc prawdopodobieństwo jako undehned, jeżeli kontrola zawodzi. Przykład, który używa warunkowego operatora zadania, następuje:
skalar m = znaczyć alfę skalara(x) = m / var(x) skalar p = m * alfa
mle logi = kontrola ? p * ln(topór) - lngamma(p) - ln(x) - topór : topór
serii NA = alfa * kontrola
skalara x = (alfa > 0) & (p > 0) params alfa p koniec mle
17.3 Stochastyczna graniczna funkcja kosztu modelowanie funkcji kosztu, to jest czasami wartościowe do zarejestrowany jawnie do sta-tistical model pojęcie tak firmy może być nieskuteczny, tak tak przestrzegał koszt odchyla się od teoretyczny cyfra nie tylko, ponieważ z nieobserwowany różnorodność pośrodku umocni, ale również, ponieważ dwa firmy mógł być obsługiwanie w inny wydajność równy, pomimo istota identyczny pod zupełnie inny poważanie. W tym przypadku możemy napisać
Ci = C * + Ui + Vi,
gdzie jest Q jakimś zmiennym wskaźnikiem kosztu, C * jest jego “teoretyczną” wartością, ui jest okresem zakłócenia zero środka i vi jest okres nieskuteczności, który ma być nonnegative przez jego bardzo natura.
Linearna specyfikacja dla C * często jest wybrany. Na przykład Cobb-Douglas kosztowany funkcję powstaje kiedy C * jest linearną funkcją logarytmów cen wejścia i produkcja ąuantities.
Stochastyczny graniczny model jest linearnym modelem forma yi = Ksi { 3 + Ei wewnątrz, które okres błędu, który Ei jest sumą ui i vu wspólne założenie jest tak ui ~ N(0, cr ^) i vi ~ | JV(0, %) \. Jeżeli niepodległość pośrodku ui i vi również jest założony, wtedy można pokazać tak funkcja gęstości ei ma formę:
r, / 2 Ł {\ Ei \ 1 . (£ ja \
j {£ ja) = , /-< P -< p - (17.4)
V TT Och" { 7 { T,
gdzie <!>(■) i </>(■) są, odpowiednio, dystrybucją i funkcją gęstości standardu normalnego,
och" = (Tu + och ~ v i = ^-.
Rozdział 17. oszacowanie prawdopodobieństwa Maksimum
126
Jak conseąuence, kloc prawdopodobieństwo dla jednej obserwacji bierze formę (na bok utworzyć się nieistotny stały)
ja) ! M ^ r n £ f ja
* t = kloc < P - kloc(cr) H -^
Och" dlatego też 2crz, Cobb-Douglas kosztował funkcję z stochastyczny graniczny jest modelem opisanym przez następny eąuations:
kloc Ci = kloc C * + £
wpisuję C * = c + ^ j6j kloc yy + ^ «j kloc py
f f = Wf + Vi
Ui ~ JV(0, cr„) Vi ~ JV(0, cr ^)
w większości wypadków, to chce zapewnić tak homogeniczność funkcji kosztu w odniesieniu do cen obstaje przy konstrukcji. Odtąd ten reąuirement jest równoważny Xj = ja «/ = 1, powyższy eąuation, ponieważ C * może zostać przepisany jako
m n
kloc Ci - kloc Szpilka = C + ^ jSjlogyij + ^ < Xj(logPij - kloc Szpilka) + fi (17.5)
j = l j = 2 powyższy eąuation mógłby zostać oszacowany około OLS, ale to cierpiałoby na dwa niedociągnięcia: pierwszy, OLS kosztorysant dla przejąć c jest niezgodny, ponieważ okres zakłócenia ma oczekiwaną wartość bez --zerowy; drugi, OLS kosztorysanci dla innych parametrów są stali, ale nieskuteczni wobec bzu --normalność z £ u Zarówno zagadnienia mogą zostać zaadresowane około szacując (17.5) około prawdopodobieństwo maksimum. Niemniej jednak, OLS oszacowanie jest ąuick i dogodny sposób dostarczenia zaczynających się wartości dla MLE algorytmu.
Przykład 17.1 pokazów jak wprowadzić w życie model, opisało dotychczas. banks91 plik zawiera część danych używanych wewnątrz Lucchetti, Papi i Zazzaro (2001).
17.4 CARCH modeluje
GARCH modele jest poradzony około gretl przez ojczystą funkcję. Jakkolwiek, to jest pouczające widzieć, jak oni mogą być estimated przez mle rozkaz. następny eąuations dostarcza najprostszy przykład GARCH(1,1) model:
yt = p + £ t
£ t = Uf crt
ut ~ JV(0,1)
ht = co + «f,[_! + pht-ja.
Odtąd niezgodność yt liczy dalej minione wartości, pisanie na dół funkcja kloc prawdopodobieństwa jest nie po prostu sprawa dodawania gęstości kloca dla indywidualnych obserwacji. Jak jest wspólny w samą porę modele serii, yt nie może zostać rozważony niezależny innych obserwacji w naszej próbce i conseąuently funkcja gęstości dla próbki całości (łączna gęstość dla zupełnie obserwacje) nie jest tylko produktem marginalnych gęstości. oszacowanie prawdopodobieństwa
Maksimum, w tych przypadkach, jest osiągnięte około zważywszy warunkowymi gęstościami, tak to, co maksymalizujemy, jest warunkowa funkcja prawdopodobieństwa. Jeżeli definiujemy, informacje ustawiły w czas t jako
Stopa = yt, yt-ja, ■ ■ ■,
Rozdział 17. oszacowanie prawdopodobieństwa Maksimum 127
Przykładu 17.1: Oszacowanie stochastyczna graniczna funkcja kosztu
otwartego banks91 Cobb-Douglas kosztował funkcja ols koszt const y pi p2 p3, który Cobb-Douglas kosztował funkcję z restrykcje homogeniczności
genr rcost = koszt - p3 genr rpl = pi - p3 genr rp2 = p2 - p3
ols rcost const y rpl rp2, który Cobb-Douglas kosztował funkcję z restrykcjami homogeniczności
i
skalar nieskuteczności bO = Scoeff(const) skalar bl = $ coeff(y) skalar b2 = Scoeff(rpl) skalar b3 = $ coeff(rp2)
skalar su = 0.1 skalar sv = 0.1
mle logi = ln(cnorm(e * lambda / ss)) - (ln(ss) + 0.5 *(e / ss)A2)
skalar ss = sqrt(suA2 + svA2)
skalar lambda = su / sv
serie e = rcost - b0 * const - bl * y - b2 * rpl - b3 * rp2
params bO bl b2 b3 su sv koniec mle
wtedy gęstość yt warunkowego dalej Ja Stopy jest normalny:
yt \ Ja Stopy ~ N, [n, ht,].
Około znaczy własności warunkowych dystrybucji, łączna gęstość może być factorized następująco
T
Y \ f(yt \ Ja Stopy) ■ f(yo)
f(yt, yt-ja, ■ ■ ■) =
Jeżeli traktujemy jq jako ustalony, wtedy okres f(yo) nie zależy od nieznanych parametrów i tam przodu, który warunkowe klocem prawdopodobieństwo może wtedy zostać napisane jako suma indywidualnych wkładów jako
T
£(/, co, j6) = ^ £ t (17.6)
gdzie
n r ja . (yt - nW ja T, (yt - m)21
* t = kloc -f =< P 7 = = ~- kloc(flt) H :
V ^ t yht, który ł odpowiedni następny scenariusz pokazuje prostemu podaniu z tę techniką, który używa plik danych djclose;
Rozdział 17. oszacowanie prawdopodobieństwa Maksimum
128
to jest jeden z zestawu danych przykładu dostarczył z gretl i zawierał codzienne dane od Dow Jones wskaźnika giełdowego.
otwarte djclose
serie y = 100 * 1 diff(djclose)
skalar mu = 0.0 omegi
skalara = 1 alfa
skalara = 0.4 oceny dobra
skalara = 0.0
mle 11 = -0.5 *(kloc(h) + (eA2)/ h)
serie e = y - mu
serie h = var(y)
serie h = omega + alfa *(e(-l))A2 + ocena dobra * h(koniec oceny dobra alfy omegi mu
params-l) mle
17.5 Analityczne pochodne
Obliczenie wektora wyniku jest istotne dla działania BFGS metody. W zupełnie poprzednie przykłady, żadna wyraźna formułka dla obliczenia wyniku nie została dana, więc algorytm był nakarmiony numerycznie oceniony nachylenie. Numeryczne obliczenie wyniku dla ja th parametru jest wykonane przez ograniczone przybliżenie pochodnej, mianowicie
d £(6 \..., 9n) £(6i ..., 9i + h..., 9n) - £(9 \. .., 9i-h..., 9n)
d9i 2h,
gdzie jest h smali numeruje.
W wielu sytuacjach, to jest raczej skuteczny i dokładny. Jakkolwiek, można, by zechcieć uniknąć przybliżenia i wyszczególnić dokładną funkcję dla pochodnych. Jak przykład, rozważyć następny scenariusz:
nuli dane 1000
genr xl = normalny() genr x2 = normalny() genr x3 = normalny()
genr ystar = xl + x2 + x3 + normalny() genr y = (ystar > 0)
skalar bO = 0
skalar bl = 0
skalar b2 = 0
skalar b3 = 0
mle logi = y * ln(P) + (y l)* ln(l P)
serie ndx = bO + bl * xl + b2 * x2 + b3 * x3
serie P = cnorm(ndx)
params bO bl b2 b3 koniec mle --wielomówny
Tu, 1000 punkty odniesienia sztucznie są wygenerowane, ponieważ zwykły probit model:2 yt jest dwójkowa zmienna, która bierze wartość 1, jeżeli y * = fiixu + & 2X2t + /?3 * 3t + £ t > 0 i 0 inaczej. Dlatego,
2Again, gretl naprawdę dostarcza ojczysty probit rozkaz (zobacz sekcję 22.1), ale probit model udaje się do miłego przykładu tu. oszacowanie prawdopodobieństwa Maksimum
Rozdziału 17.
129
yt = 1 z prawdopodobieństwem $(f > iXit + /^-^ t + Pi ^^ t) = TTt- prawdopodobieństwo funkcja dla jednego obserwacja może zostać napisana jako
P(yt) = Tr ^ E(l - TTt)1_yt
Odtąd obserwacje są niezależne i identycznie rozprowadzają, kloc prawdopodobieństwo jest po prostu sumą indywidualnych wkładów. Odtąd
T ^ = X yt ^ Si ^ t) + (1 - 3 / t)zaloguj się(l - TTt)
t =\ -wielomówna witka na końcu końca mle stwierdzenie doprowadza do szczegółowego opisu powtarzania zrobionych około BFGS algorytm.
W tym przypadku, numeryczne różnicowanie pracuje raczej dobrze; niemniej jednak, obliczenie analitycznego wyniku jest bezpośrednie, od pochodnej g-g- może zostać napisany jako
d £ _ d £ dnt dpi dnt dpi
przez łańcuch reguła i to jest łatwo widzieć tak
3 ^ _ yt ja - yt
dnt nt 1 - TTt
dTTt
- = (p { piXit + P2 ^ 2t + P3 % 3t) ■ Xu Opi mle blok w powyższym scenariuszu może, dlatego być zmodyfikowany następująco:
mle logi = y * ln(P) + (y l)* ln(l P)
serie ndx = bO + bl * xl + b2 * x2 + b3 * x3
serie P = cnorm(ndx)
serie tmp = dnorm(ndx)*(y / P - (y l)/(l P))
deriv bO = tmp
deriv bl = tmp * xl
deriv b2 = tmp * x2
deriv b3 = tmp * x3 koniec mle --wielomówna
Notatka tak params stwierdzenie zostało zastąpione około serie deriv stwierdzeniami; ci mają podwójną funkcję identyfikowania parametrów, ponad którymi zoptymalizować i, jeśli analityczne wyrażenie dla ich poszczególnego wynik elementy.
17.6 Zdebagować ML scenariusze, które Dyskutowaliśmy powyższe główne rodzaje stwierdzeń, które są dozwolone w mle blok, mianowicie
pomocniczy, rozkazuje, by wygenerować pomocnika zmienne;
deriv stwierdzenia, by wyszczególnić nachylenie w odniesieniu do każdego parametrów; i params stwierdzenie, by zidentyfikować parametry w przypadku analitycznym pochodne nie są dane.
W celu zdebagować ML kosztorysanci jeden dodatkowi porządkują stwierdzenia, jest dozwolone: możesz drukować wartość związanej zmiennej w każdym krok powtarzania. To udogodnienie jest więcej ograniczone wtedy regularny drukować rozkaz. rozkazem słowo są w drukiem powinno zostać mające za sobą imię tylko jednego zmiennego (skalar, serie lub macierz). oszacowanie prawdopodobieństwa Maksimum
Rozdziału 17.
130
W ostatnim przykładzie powyższym klucz zmienny nazywany tmp został wygenerowany, tworząc podstawę dla analitycznych pochodnych. śledzić postęp tego zmiennego można, by dodać drukować stwierdzenie w ML blok, jak w
seriach tmp = dnorm(ndx)*(y / P - (y l)/(l P)) drukować tmp
11.1 Używanie działa mle rozkaz pozwala ci, by oszacować modele tak gretl nie dostarcza tubylczo: w sonie przypadki, to może być dobrym pomysłem, by zawinąć mle blok wewnątrz zdefiniowaną na użytkowniku funkcję (zobacz Rozdział 10), aby rozciągnąć gretl's jest zdolnościami w modułowym i elastycznym drogą.
Jak przykład, weźmiemy prosty przypadek modelu tak gretl robi jeszcze nie dostarczać tubylczo: zawyżony zero Poisson model lub PRZELEĆ dla short.3 Wewnątrz to model, zakładamy tak, że przestrzegamy mieszaną populację: dla trochę osoby, zmienny yt jest (warunkowo dalej wektor exogenous covariates xt) rozprowadzony jako Poisson przypadkowy variate; dla trochę inni, yt jest identycznie 0. problem jest, nie znamy, którego kategoria, która podana osoba należy do.
na przykład sądźmy, że mamy próbkę kobiet i zmienny yt reprezentuje numer dzieci tak kobieta t ma. może być pewna proporcja, kobiet dla yt = 0 z pewnością (być może z osobistego wyboru lub z powodu fizycznej niemożliwości). Ale może być innym kobiet dla yt = 0 tylko jako sprawa szansy - oni nie zdarzyli się, by mieć trochę dzieci w czasie obserwacji.
W formułkach:
uyt Ut rt
yt,]-
yt,]-
[xt = exp(xtj6)
1, ponieważ yt = 0 0, ponieważ yt > 0
dt
P(yt = k \ xt) = adt + (!-«) e ~^ E
Piszący mle blok dla tego model nie jest trudny:
mle 11 = logprob
serie xb = exp(b0 + bl * x)
serie d = (y = 0)
serie poiprób = exp(-xb) * xbAy / gamma(y + l)
serie logprob = (alfa > 0) && (alfa < l) ? \ kloc(alfa * d + (l alfa)* poiprób) : NA
params alfa bO bl koniec mle -v
Jakkolwiek, kod powyższy musi być zmodyfikowany każdy czas zmieniamy nasz specihcation około, powiedzieć, dodając objaśniającą zmienną. Używanie funkcje, możemy uprościć to zadanie znacznie i w końcu być w stanie napisać trochę łatwa podobna
lista X = const x zapina(y, X)
Pokazać nam, jak to może zostać zrobiony. pierwszy musimy zdefiniować funkcję nazywaną przelatują() to weźmie dwóm dyskusje: zależna zmienna y i wykaz objaśniających zmiennych X. An przykład takiego funkcja jest zobaczona scenariusz 17.2. Około badając kod funkcji, widzisz tak faktyczne oszacowanie nie zdarza się tu: raczej, przeleć() funkcja zaledwie formaty i drukować skutki pochodzące z innej pisanej przez użytkownika funkcji, mianowicie zip_estimatę ().
3The faktyczny ZAPINA model jest faktycznie trochę więcej generała niż ten wystąpił tu. Wyspecjalizowała się wersja dyskutowana w tej sekcji została wybrana w imię prostoty. Dla futher szczegółów, zobacz Greene (2003).
Rozdział 17.. Oszacowanie prawdopodobieństwa maksimum 131
Przykładu 17.2: pompowany na Zerze Poisson Model - użytkownik równa funkcja
/*
użytkownik równa funkcja: oszacuj model i drukuj skutki
*/
funkcja zapinają(serie y, listę X)
macierz ret = zip_estimate(y, X)
macierz coef = ret,[, l,]
macierz vcv = ret,[, 2:przełęcze(ret)]
printf "\ nZero-ja < plik:/// nZero-ja > nflated Poisson model:\ n \ n"
skalar c = coef,[l,]
skalar se = sqrt(vcv,[l, 1,])
skalar zs = c / se
skalar pv = 2 * pvalue(n, zs)
printf " alfa % 9.4f % 9.4f % 8.3f % 8.3f \ n", c, se, zs, pv
k = 2
pętla foreach ja X -q
sprintf s "$ ja"
skalar c = coef,[k,]
skalar se = sqrt(vcv,[k, k,])
skalar zs = c / se
skalar pv = 2 * pvalue(n, zs)
printf "% 10s % 9.4f % 9.4f % 8.3f % 8.3f \ n", s, c, se, zs, pv
k ++ funkcja końca pętli końca funkcja zip_estimate() nie jest znaczony, by zostać wykonany bezpośrednio; to tylko zawiera bardziej zdrętwiały chrupanie część pracy, której skutki wtedy jest wybrana przez funkcję końca przelatują,(). Kolejno, zip_estimate() nazywa inne pisane przez użytkownika funkcje, by wykonać inne zadania. Zbiór całości “ternal” działa jest pokazany w panel 17.3.
Wszystkie funkcje pokazane w 17.2 i 17.3 mogą zostać zgromadzone w oddzielnym inp pliku i są wykonane raz, na początku naszej pracy, przez środki z zawrzeć rozkaz. Zakładając, że imię tego pliku scenariusza jest zip_est.inp, co następuje jest scenariuszem przykładu, który
zawiera plik scenariusza;
wygenerowuje udawany zestaw danych;
gra oszacowanie z ZAPNIJ model na sztucznych danych.
echo zbioru poza ustawionymi wiadomościami
zawrzyj pisane przez użytkownika funkcje zawierać zip_est.inp
wygenerować sztuczny dane nulldata 1000 ustawił nasieniu 732237 skalar truep = 0.2
# Rozdział 17.. Oszacowanie prawdopodobieństwa maksimum
132
skalar bO = 0.2
skalar bl = 0.5
serii x = normalny()
serie y = (uniform()< truep) ? 0 : genpois(exp(b0 + bl * x))
lista X = const x
# oszacuj zawyżony zero Poisson model zapinać(y, X) skutkami jest następująco: pompowany na
Zerze Poisson model:
alfa 0.2031 0.0238 8.531 0.000
const 0.2570 0.0417 6.162 0.000
x 0.4667 0.0321 14.527 0.000 dalej pójść może wtedy tworzyć paczkę funkcji dla wchodzenie twój nowy przelatują() funkcja przez graficzną powierzchnię międzyfazową gretl's. Dla szczegółów dalej jak, aby zrobić to, zobaczyć sekcja 10.5.
Rozdział 17.. Oszacowanie prawdopodobieństwa maksimum
133
Przykładu 17.3: pompowany na Zerze Poisson Model - wewnętrzne funkcje
/*
policz prawdopodobieństwa kloca dla prostego Poisson modelu
*/
funkcja ln_poi_prob(serie y, lista X, ocena dobra macierzy)
serie xb = lincomb(X, ocena dobra)
serie ret = -exp(xb) + y * xb - Ingamma(y + 1)
powrócić funkcję końca ret serie
/*
policzyć prawdopodobieństwa kloca dla zawyżonego zero Poisson modelu
*/
funkcja ln_zip_prob(serie y, lista X, ocena dobra macierzy, skalar pO)
# sprawdzić, czy prawdopodobieństwo jest, w [0,1]; inaczej, powrót NA,
jeżeli (p0 > l) || (p0 < 0)
serie ret = NA
inny
serie ret = ln_poi_prob(y, X, ocena dobra) + ln(l pO) serie ret = (y = 0) ? Wewnątrz(p0 + exp(ret)) : funkcja końca ret serie
powrotu
endif ret
/*
zrób faktyczne oszacowanie (cicho)
*/
funkcja zip_estimate(serie y, lista X)
inicjuje alfę do "rozsądnej" wartości: połowa częstość zer wewnątrz alfa skalara próbki = znaczyć(y = 0)/ 2
inicjuje coeffs (zakładamy pierwszy objaśniający
zmienny jest stała tu) macierz coef = zera(nelem(X), 1) coef,[l,] = znaczy(y) / (1-alfa)
robią ML faktycznego oszacowanie
mle 11 = ln_zip_prob(y, X, coef, alfa)
params alfa coef koniec mle --juta --cichy macierz ret = Scoeff ~ $ funkcja końca ret macierz powrotu vcv
Rozdział 18
GMM oszacowania
18.1 Wprowadzenia i terminologia Uogólniona Metoda Momentów (GMM) jest bardzo potężną i ogólną metodą oszacowania, która okrąża praktycznie cały parametryczny oszacowanie techniąues użył wewnątrz econometrics. To zostało wprowadzone w Hansen (1982) i Hansen i Przypadku wyjątkowym (1982); doskonałe i gruntowne traktowanie być oddane Davidson i MacKinnon (1993), rozdział 17..
basie zasada, na której GMM jest zbudowany, jest raczej bezpośrednia. Sądźmy, że chcielibyśmy oszacować parametr skalara 6 bazowało na próbce x \, X2..., xj. Pozwól, że 6o wskazuje “prawdziwą” wartość 6.. Teo retical rozważania (albo statystycznej lub ekonomicznej natury) może sugerować, że relacja jak co następuje trzyma się:
E, [xt - g(6)] = 0 <=> 6 = 6o, (18.1)
z g (■) ciągły i invertible funkcja. To znaczy, tam egzystuje funkcja danych i parametru, z własnością, że to ma zero oczekiwania wtedy i tylko wtedy to jest ocenione w prawdziwej wartości parametru. Na przykład ekonomiczne modele z racjonalnymi oczekiwaniem prowadzą do wyrażeń jak (18.1) ąuite naturalnie.
Jeżeli próbujący model dla xts jest takim tak, jakaś wersja Prawa Dużych Numerów trzyma się, wtedy
lv- P , r.
X = - > xt -► g { oo); t = ja
odtąd, odtąd g(-) jest invertible, danymi
6 = g ~ l { X) -► zrób,
tak 6 jest stałym kosztorysantem 6. innym sposobem uzyskania tego samego outeome jest woleć, jako kosztorysant 6, wartość, która pomniejsza obiektywną funkcję
F(6) , =
lv-, m
- > { xt - g { 0)) t ja
= [X - g { 0)\ ; (18.2) które minimum trywialnie jest osiągnięte o 6 = g l (X), odtąd wyrażenie w sąuare nawiasy eąuals 0., którym powyższe rozumowanie może być uogólnionym następująco: sądźmy, że 6 jest n wektorem i mamy m relacje podobne
E, [fi(xt, 6)] = 0 fori = l...m, (18.3)
gdzie £[■] jest warunkowym oczekiwaniem dalej zbiór p zmienne zt, nazywanym narzędzia. W powyższym prostym przykładzie, m = 1 i f(xt, 6) = xt - g(6)i jedyne narzędzie używane jest zt = 1. Wtedy, to musi również być prawdziwe tak
E \ fi(xt, 9) ■ Zjtt \= E / ij, t(0) = 0 fori = l...m i j = l...p; (18.4)
eąuation (18.4) jest znany jako prostokątność warunek lub moment warunek. GMM kosztorysant jest zdefiniowany jako minimum ąuadratic forma
F(6, W) = f'Wf, (18.5)
134
Chapterl8. CMM oszacowanie
135,
gdzie jest f (1 x m ■ p) wektor trzymający się średnia prostokątności warunki i W jest trochę symetryczny, pozytywna określona macierz, znana jako wagi macierz. konieczny warunek dla minimum egzystować jest porządkiem warunek n < m ■ s. dane
6 = ArgminF {(9, W) (18.6)
e
jest stałym kosztorysantem 6 cokolwiek wybór W. However, do osiągnąć maksimum asymp-totic wydajność W musi być proporcjonalny do odwrotnego długo biegnie kowariancji macierz prostokątności warunki; jeżeli W nie jest znany, stały kosztorysant chce sumce.
Ci rozważania ołowiane do czego następuje empirycznej strategii:
Wybrać pozytywny określony W i policzyć ten wkraczać do GMM kosztorysant 6 \. Przyjęte wybory, ponieważ W jest Im.p lub Im ® { Z' ZY1.
Użyć 6 \ oszacować V(fijit(0)) i użyć jego odwrotnego jako wagi macierz. wynikanie estimator 62 nazywa się dwa wkraczać do kosztorysanta. Odnośnie-ocena V(fijit(0)) przez znaczy 62 i uzyskać Ś3; powtórzyć, aż zbieżność. Asymp-totically, ci dodatkowi kroki są niepotrzebne, odtąd dwa wkraczać do kosztorysanta jest stały i skuteczny; jakkolwiek powtórzony kosztorysant częsty ma lepszą małą próbkę własności i powinien być niezależny wyboru W zrobionego we wkraczać do 1.
W specjalnej okoliczności kiedy numer parametrów n jest eąual do całkowity liczby prostokątności warunki m ■ p, GMM kosztorysant 6 jest tym samym dla trochę wybór wag macierz W, więc pierwszy krok jest dostateczny; wewnątrz to przypadek, obiektywna funkcja jest 0 przynajmniej.
Jeżeli, przeciwnie, n < m ■ p, drugi krok (lub kolejne powtarzanie) jest potrzebowany, by osiągnąć wydajność i kosztorysanta tak panowany może być bardzo inny, w ograniczonych próbkach, od tego wkraczać do kosztorysanta. Ponadto, wartość obiektywnej funkcji przynajmniej, odpowiednio zważony około numer obserwacji, produkcji Hanseris J statystyczny; to statystyczny może zostać zinterpretowany jako test statystyczny, który ma, x2 dystrybucja z m ■ p - n stopnie wolności poniżej nuli hipoteza poprawnej specyfikacji. Zobacz Davidson i MacKinnon (1993), dziel 17.6 dla wyszczególnia.
W następnych sekcjach pokażemy jak ci pomysły są wprowadzone wewnątrz gretl trochę przykłady.
18.2 OLS jako CMM
To jest pouczające rozpocząć od nieco wymyślonego przykładu: rozważyć linearny model yt = xt { 3 + ut. Chociaż większość nas być używany, by przeczytać, to jako suma na ślepo zdefiniowanego “systematyczną część” plus eąually zamglony “zakłócenie”, bardziej surowa interpretacja tego znajomego wyrażenia pochodzi z hipotezy tak warunkowy znaczyć E(yt \ xt) jest linearny i definicja ut jako yt -E(y11xt).
Od definicji ut, to następuje tak E(ut \ xt) = 0. następna prostokątność warunek jest, dlatego dostępny:
E, [/(j8)] = 0, (18.7)
gdzie /(j8) = (yt - xtfi)xt. Dlatego też definicje oddawane poprzednią sekcję specjalizują się tu, by:
6? jest /?;
narzędzie jest xt \
fi, j, t(6) jest (yt ~ XtP)xt = utxt; warunek prostokątności jest wytłumaczalny jako reąuirement, że regressors powinien zostać unzestawiać z zakłóceniami;
• Chapterl8. CMM oszacowania
136
• W może być jakąś symetryczną pozytywną określoną macierzą, od numeru parametry eąuals numer warunków prostokątności. Powiedzmy, że wybieramy I.
• Funkcja F(6, W) jest wewnątrz tym przypadkiem
1 T
1 v- -- >(utxt)
t = 1
2
W / l
F { U, W) =
i to jest łatwy widzieć, dlaczego OLS i GMM zbiega się tu: GMM obiektywny funkcja ma to sam minimizer jako obiektywna funkcja OLS, końcowej sumy sąuares. Notatka, jakkolwiek, to dwa funkcje są nie eąual do siebie: przynajmniej, F(6, W) = 0 kiedy pomniejszona suma sąuared reszty jest zerowy tylko w specjalnej okoliczności z doskonały linearny pasować. kod skrawek zawarł u Przykładu 18.1 użycie gretl's, który gmm rozkazuje, by zrobić powyższemu opera tional.
Przykład 18.1: OLS przez GMM
/* zainicjować rzecz */ serie e = 0 skalar ocena dobra = 0 macierz V = 1(1)
/* kontynuować oszacowanie */ gmm
serie e = y - x * ocena dobra
orthog e ; koniec oceny dobra
params x
wagi V gmm Nakarmimy gretl konieczne składniki, ponieważ GMM oszacowanie wewnątrz rozkaz blok, rozpoczynając od gmm i kończąc się z końcem gmm. Potem końcem gmm stwierdzeniem dwoma wzajemnie wyłącznym opcje mogą zostać wyszczególnione: -dwa krok lub --powtórzyć, czyj znaczenie powinno być oczywisty.
Trzy elementy są obowiązkowy w gmm blok:
jeden lub bardziej orthog stwierdzenia
to obciąża stwierdzeniem
jednym params stwierdzeniem trzema elementy powinny zostać oddane określony porządek. orthog stwierdzenia są użyte, by wyszczególnić prostokątność warunki. Oni muszą podążyć składnia
orthog x ; Z,
gdzie x może być seriami, macierzą lub wykaz serii i Z może również być seriami, macierzą lub listą. Wewnątrz przykład 18.1, serie e trzyma “reszty” i serie x trzyma regressor. Jeżeli x byłby listą (macierz), orthog, stwierdzenie wygenerowałoby jeden prostokątność warunek dla każdego element (kolumna) z x. Zanotować struktura prostokątności warunek: to jest założone tak okres w lewie średnika reprezentuje ąuantity, który zależy od estimated parametrów, (i tak musi zostać uaktualniony wewnątrz proces wielokrotnego oszacowania), kiedy po prawej stronie jest stałą funkcją danych.
Chapterl8. CMM oszacowanie
137 wagi, które stwierdzenie jest użyte, by wyszczególnić początkowy dodatek pieniężny macierz i jego składnia jest straightfor salą. Notatka, jakkolwiek, tak kiedy więcej niż jeden krok jest reąuired tak macierz zawrze końcowa waga macierz, który najbardziej prawdopodobny będzie inny niż jego początkowe wartość. params stwierdzenie wyszczególnia parametry w odniesienia, do którym GMM kryterium powinno zostać pomniejszone; to następuje to sam logie i rządzi jako wewnątrz mle i ni s rozkazy. minimum jest znalezione numeryczne pomniejszenie przez BFGS (zobacz sekcję 5.9 i rozdział 17). postępem optymalizacji postępowanie może zostać przestrzeżone około dodając --wielomówna witka do końca gmm linia. (Wewnątrz to przykład GMM oszacowanie jest wyraźnie raczej głupią rzeczą, by zrobić, od zamkniętej formy rozwiązanie łatwo jest podane około OLS.)
18.3 TSLS jako CMM
Poruszający blisko właściwej domeny GMM, nas teraz rozważyć two-stage mały sąuares (TSLS) jako przypadek GMM.
TSLS jest zatrudniony w przypadku, gdzie to życzy, by oszacować linearny model formy yt = Xtfi + ut, ale, gdzie jeden lub więcej zmiennych w macierzy x są potencjalnie endogeniczny - skorelowany z błędem okres, u. Przechodzimy około identyfikując zbiór narzędzi, Zt, którego są objaśniający, ponieważ endogeniczny zmienne wewnątrz x ale, które plausibly być unzestawia z u. klasyczne two-stage postępowanie jest (1) regres endogeniczny elementy x Z; wtedy (2) ocena eąuation zainteresowania, z endogeniczny elementami x zastąpionego przez ich dopasowany wartości od (1). alternatywna perspektywa jest dana przez GMM. Definiujemy końcowy ut jako yt - Xt { 3, jak zwykle. Ale zamiast polegania na E(u \ X) = 0 jako wewnątrz OLS, opieramy oszacowanie na warunku E(u \ Z) = 0. Wewnątrz to przypadek to jest naturalny do niegodziwej początkowy dodatek pieniężny macierzy dalej kowariancja macierz narzędzi. Przykładu 18.2 prezenty model od Towaru i Watson's Wprowadzenie do Econometrics. popyt na papierosy jest umodelowany jako linearna funkcja kloców ceny i napłynąć; dochód jest potraktowany jako exogenous kiedy cena jest wzięta, by być endogeniczny i dwa miary podatku jest użyty jako narzędzia. Odtąd mamy dwa narzędzia i jeden endogeniczny zmienna model zidentyfikowany i tam przednia wagi macierz wpłynie na rozwiązanie. Częściowa produkcja od tego scenariusz jest pokazany wewnątrz 18.3. estimated standard błędy od GMM domyślnie krzepkiego; jeżeli dostarczamy --krzepka opcja do tsls rozkaz dostajemy opcje macierzy Kowariancji identycznego results.1
18.4 kowariancja macierz estimated parametrów zależy od wyboru W
£ = (j'wj)~ 1j'wciwj(j'wj)~ 1 (18.8)
gdzie jest J Jacobian okresem
00 j
i Q jest długo biegnie macierzą kowariancji warunków prostokątności.
Cretl liczy J przez numeryczne różnicowanie (nie ma żadnego zaopatrzenia dla wyszczególniania dostarczonego na użytkowniku analitycznego wyrażenia dla J w tej chwili). Jeśli chodzi o Cl, stała ocena jest potrzebowana. Najprostszy wybór jest macierzą kowariancji próbki z / ts:
Clo { 0) = - > jt { 0)Jt { 0) (18.9)
t = 1
Ten kosztorysant jest krzepki w odniesieniu do heteroskedasticity, ale nie z poważaniem do autocorrela-tion. heteroskedasticity- i autokorelacją stałym (HAC) wariant może zostać uzyskany używając plik danych
lThe używany wewnątrz to przykład jest dostępny w Towarze i Watson paczka dla gretl. Zobaczyć http:// gretl. sourceforge.net / gret!_data.html. < http://gretl.sourceforge.net/gretl_data.html >
Chapterl8. CMM oszacowanie
138
Przykład 18.2: TSLS przez GMM
otwarty cig_chl0.gdt
prawdziwy avg cena w tym podatek sprzedaży genr ravgprs = avgprs / cpi
prawdziwy avg cig określony podatek genr rtax = podatek / cpi
prawdziwy średnia całkowita podatek genr rtaxs = podatek sprzedaży średniej taxs / cpi
prawdziwego genr rtaxso = rtaxs - rtax
kloce konsumpcji, ceny, dochodu genr lpackpc = kloc(packpc)
genr lravgprs = kloc(ravgprs) genr perinc = dochód / (z hukiem * cpi) genr lperinc = kloc(perinc)
ogranicza próbka do 1995 obsen / ations smpl --ograniczyć rok = 1995
Wyrównanie (10.16) około tsls
lista xlist = const lravgprs lperinc lista zlist = const rtaxso rtax lperinc tsls lpackpc xlist ; zlist --krzepki
# struktura dla gmm
macierz Z = { zlist }
macierz W = inv(Z'Z)
serie e = 0
skalar bO = 1
skalar bl = 1
skalar b2 = 1
gmm e = lpackpc - bO - bl * lravgprs - b2 * lperinc
orthog e ; Z
wagi W
params bO bl b2 koniec gmm
Bartlett jądro lub podobny. univariate wersja tego jest użyta w kontekście 1 rvar() funkcja - widzą eąuation (5.1). o wielu odmianach wersja jest określony w eąuation (18.10).
n T-k
T fi t = k
k
X WiM9)ja stopy { 9Y ja =-k
(18.10)
Cretl liczy macierz kowariancji HAC domyślnie kiedy GMM model jest oszacowany punktualnie danymi serii. Możesz skontrolować jądro i szerokość pasma (to jest, wartość k w 18.10) używając zbiór rozkaz. Zobaczyć rozdział 14 dla dalszej dyskusji HAC oszacowanie. Możesz również spytać gretl nie użyć HAC wersja około mówiąca
zbiór force_hc dalej
Chapterl8. CMM oszacowanie
139
Przykład 18.3: TSLS przez GMM: częściowy przetworzyć
Model 1: TSLS szacuje używając 48 obsen / ations 1-48
Zależny zmienny: lpackpc
Narzędzia: błędy standardu rtaxso rtax
Heteroskedasticity krzepkiego, wariant HCO
ZMIENNY
WSPÓŁCZYNNIK
STDERROR
T BEZZWŁOCZNIE P WARTOŚĆ
const 9.89496 0.928758 10.654 < 0.00001 ***
1ravgprs -1.27742 0.241684 -5.286 < 0.00001 ***
lperinc 0.280405 0.245828 1.141 0.25401
Model 2: 1-wkraczać do CMM oceny używające 48 obserwacje 1-48 e = lpackpc - bO - bl * lravgprs - b2 *
OCENA
PARAMETRU lperinc
STDERROR
T BEZZWŁOCZNIE P WARTOŚĆ
bO bl b2
9.89496 0.928758 10.654 < 0.00001 1C 1C 1C
-1.27742 0.241684 -5.286 < 0.00001 1C 1C 1C
0.280405 0.245828 1.141 0.25401
CMM kryterium = 0.0110046
18.5 prawdziwy przykład: Konsumpcja Oparła Cennik Zalety Modelują,
By zilustrować gretl's wprowadzenie GMM, powielimy przykład oddawany rozdział 3 Sali (2005). model, by oszacować jest klasycznym stosowaniem GMM i dostarcza przykład przypadku kiedy warunki prostokątności nie pochodzą od statystycznych rozważań, ale raczej od teorii ekonomiczne. racjonalny indywidualny kto musi wydzielić jego dochód pośrodku konsumpcja i inwestowanie w finansowej zalecie faktycznie wybierz konsumpcja ścieżka jego całość dożywotnią, odtąd inwestowanie przetłumaczy do przyszłej konsumpcji. To może zostać pokazane tak optymalna konsumpcja ścieżka powinna zadowolić następny warunek:
pU'(ct) = 5kE, [rt + kU'(ct + k)\ Tt,]
(18.11)
gdzie jest p zaleta ceną, U(-) jest osoby pożytek funkcja, 5 jest osoba jest subiektywną stopą dyskontową i n + fc jest assefs stopa zwrotu pośrodku czas t i czas t + k. Jt jest infor-mation zbiór w czasie t; eąuation (18.11) głosy tak pożytek “zagubiony” w czasie t około nabywający zaleta zamiast konsumpcji dobra muszą iść w parze z odpowiedni wzrost wewnątrz (dyskontowy) przyszły pożytek konsumpcji sfinansował około zalety powrót. Odkąd przyszłość jest niepewny, osoba rozważa jego oczekiwanie, warunkowe dalej co jest znane w czasie kiedy wybór jest zrobiony. Powiedzieliśmy wcale nie około naturę zalety, więc eąuation (18.11) powinien trzymać cokolwiek zaleta rozważamy; odtąd, można zbudować system eąuations podobnego (18.11) ponieważ każdy zaleta cena spostrzegamy.
Jeżeli jesteśmy skłonny uwierzyć tak
• gospodarka jako całość może zostać reprezentowana jako pojedynczy olbrzymi i nieśmiertelny reprezentatywny indywidualny i l
• funkcja U(x) = -- jest wiernej reprezentacji osoby preferencje,
Chapterl8. CMM oszacowanie
140
wtedy ustawienie k = 1, eąuation (18.11) sugeruje co następuje dla trochę zaleta j:
[T ■ / C \ ~^
5 h + ja + ) stopa
= 1,
(18.12)
gdzie jest Ct łączna konsumpcja i i 5 jest niechęcią ryzyka i stopą dyskontową reprezentatywnej osoby. Wewnątrz ten przypadek, to jest łatwy widzieć tak “głębokie” parametry i 5 może zostać oszacowany przez GMM około używany
(/- \ «-1 t-t + 1 \ ct
Pj, t
- 1
et = 5
jako moment warunek, kiedy trochę zmienny znany w czasie t może służyć jako narzędzie.
Przykład 18.4: Oszacowanie Konsumpcji Opierało Model Cennika Zalety
otwarty Henryk 1.gdt zbiór force_hc na alfie
skalara = 0.5 skalar delta = 0.5 serie e = 0
lista inst = const consrat(-l) consrat(-2) ewr(-l) ewr(-2)
macierz V0 = 100000 * 1(nelem(inst)) macierz Z = { inst } macierz VI = $ nobs * inv(Z'Z)
gmm e = delta * ewr * consratA(l alfy) - 1
orthog e ; koniec delty alfy
params inst
wagi V0 gmm
gmm e = delta * ewr * consratA(l alfy) - 1
orthog e ; koniec delty alfy
params inst
wagi VI gmm
gmm e = delta * ewr * consratA(l alfy) - 1
orthog e ; koniec delty alfy
params inst
wagi V0 gmm --powtórzyć
gmm e = delta * ewr * consratA(l alfy)
orthog e ; koniec delty alfy
params inst
wagi VI gmm --powtórzyć
1
Wewnątrz przykład kod oddawany 18.4, powielamy wybrany porcje stołu 3.7 wewnątrz Sala (2005). zmienny consrat jest zdefiniowany jako stosunek z miesięczny kolejny prawdziwy na osobę konsumpcja (ser wady i nondurables) ponieważ USA i ewr jest powrót cena stosunek zmyślonej zalety zbudował
Chapterl8. CMM oszacowanie
141
około wahający się zupełnie towary w Nowojorskiej Giełdzie Papierów Wartościowych. narzędzie zbiór zawiera stała i dwa opóźnienia każdego zmienną. rozkaz podjudzać force_hc na drugim linia scenariusza ma jedyny cel powielania podanego przykład: jak wspomniane powyżej, to zmusza gretl do policzenia długo biegnięcie niezgodność prostokątności warunków zgodnie z eąuation (18.9) niż (18.10). Biegniemy gmm cztery razy: macierze wag jeden wkraczać do oszacowania dla każdego z dwóch początkowego, wtedy wielokrotne oszacowanie zaczynające się od każdego zbiór początkowych wag. Odtąd numer prostokątności warunki (5) jest większy niż numer estimated parametrów (2), wybór intial wagi powinny zrobić różnicę i naprawdę widzimy dość konkretne różnice pośrodku ten wkraczać do ocen (Modele 1 i 2). z drugiej strony, powtarzanie zostaje zredukowanym ci różnice prawie do niknącego punktu (Modele 3 i 4).
Część produkcji być oddana 18.5. To powinno być znany tak J test prowadzi do odrzucenia hipotezy poprawnej specyfikacji. To jest może nie surprising podanego bohaterskie założenia reąuired, by ruszyć się od microeconomic zasada wewnątrz eąuation (18.11) do system, który właściwie jest oszacowany.
18.6 Sprzeciwy, które kilka formułuje ostrzegania jest w porządku: wbrew jego pomysłowość, GMM jest prawdopodobnie najbardziej kruchy estimation metoda wewnątrz econometrics. numer bzów --oczywistych wyborów, którym trzeba zrobić używanie GMM jest wysokich i w ograniczonych próbkach każdy z tych może mieć dramatyczny conseąuences ostateczna produkcja. Trochę czynników, które mogą wpłynąć, na skutki są:
Prostokątność układa się może zostać napisany wewnątrz więcej niż jeden droga: na przykład, jeżeli E(xt - n) = 0, wtedy E { xtln - 1) = 0 trzyma się także. To jest możliwy tak inna specyfikacja momentu układa się prowadzi do innych skutków.
Jako z zupełnie inne numeryczne optymalizacja algorytmy, dziwne rzeczy mogą zdarzyć się kiedy ob-jective funkcja jest prawie fiat w trochę kierunki lub ma wielokrotny minima. BFGS jest zwykle ąuite dobrem, ale jest żaden nie gwarantuje tak to zawsze dostarcza rozsądne rozwiązanie, jeżeli jeden w ogóle. 1-krok i, do mniejszego obszaru, 2-wkraczać do kosztorysantów może być wrażliwy do najwidoczniej trywialnych szczegółów, podobnych odnośnie ważący narzędzi. Inne wybory, ponieważ początkowe wagi macierz może również mieć widoczny conseąuences.
Z czas seriami dane, jest żaden twardy reguła na odpowiedni numeruj opóźnień, by użyć licząc długo biegnie kowariancja macierz (zobacz sekcję 18.4). Nasz rada jest pójść przez próbę i błędy, odtąd skutki mogą znacznie zostać wpłynięte przez biedny wybór. Przyszłe wersje gretl zawrą więcej opcje dalej oszacowanie macierzy kowariancji.
Jeden z conseąuences tego stan rzeczy tak powiela różny dobrze znany opublikowany nauki mogą być niezmiernie trudny. Trochę bez --trywialny skutek jest faktycznie niemożliwy rozmnożyć, chyba że zupełnie wyszczególnia z postępowanie oszacowania ostrożnie jest rejestrowane.
Chapterl8. CMM oszacowania
142
Przykładu 18.5: Oszacowanie Konsumpcji Oparło Model Cennika Zalety - przetworzyć
Model 1: 1-wkraczać do CMM ocen używających 465 obserwacji 1959:04-1997:12
e = d * ewr * consratA(l alfy) - 1
PARAMETR OCENA STDERROR T BEZZWŁOCZNIE P-CENI
alfę -3.14475 6.84439 -0.459 0.64590
d 0.999215 0.0121044 82.549 < 0.00001 ***
GMM kryterium = 2778.08
Model 2: 1-wkraczać do CMM oceny używające 465 obserwacje 1959:04-1997:12
e = d * ewr * consratA(l alfy) - 1
PARAMETR OCENA STDERROR T BEZZWŁOCZNIE P-CENI
alfę 0.398194 2.26359 0.176 0.86036
d 0.993180 0.00439367 226.048 < 0.00001 ***
GMM kryterium = 14.247
Model 3: Powtórzony CMM oceny używające 465 obsen / ations 1959:04-1997:12 e = d * ewr * consratA(l alfy) - 1
PARAMETR OCENA STDERROR T BEZZWŁOCZNIE P-CENI
alfę -0.344325 2.21458 -0.155 0.87644
d 0.991566 0.00423620 234.070 < 0.00001 ***
GMM kryterium = 5491.78,
] test: Chi kwadrat(3) = 11.8103 (p wartość 0.0081)
Model 4: Powtórzony CMM oceny używające 465 obsen / ations 1959:04-1997:12 e = d * ewr * consratA(l alfy) - 1
PARAMETR OCENA STDERROR T BEZZWŁOCZNIE P-CENI
alfę -0.344315 2.21359 -0.156 0.87639
d 0.991566 0.00423469 234.153 < 0.00001 ***
GMM kryterium = 5491.78,
] test: Chi kwadrat(3) = 11.8103 (p wartość 0.0081)
Rozdział 19
Model wybór kryteria
19.1 Wprowadzenie
Wewnątrz trochę konteksty econometrician woli pośrodku alternatywne modele bazowały na formalnym hy-pothesis test. Na przykład można, by wybrać bardziej ogólny model ponad więcej ograniczonym, jeżeli restrykcja w ąuestion może zostać sformułowana jako test zdolny nuli hipoteza i nuli jest odrzucony na odpowiednim teście.
W innych kontekstach to czasami szuka kryterium dla wyboru modelu, który jakoś mierzy bilans między dobrocią, z pasować lub prawdopodobieństwo z jednej strony i skąpstwo na innym. Rozważanie jest konieczne, ponieważ dodanie dodatkowych zmiennych do modelu nie może zostać zredukowanym stopień z pasować lub prawdopodobieństwo i jest bardzo prawdopodobnie, by zwiększać to nieco nawet jeśli dodatkowe zmienne nie są naprawdę związane z wygenerowującym danych procesem.
Najlepszy znany takie kryterium, ponieważ linearne modele oszacowały przez najmniej sąuares, jest dostosowanym R2,
ft2 SSR /(n-k)
TSS /(n - 1)
gdzie jest n numerem obserwacji wewnątrz próbka, k oznacza numer parametrów estimated i SSR i TSS oznacza sumę sąuared reszty i suma całkowita sąuares, ponieważ zależny zmienny, odpowiednio. W porównaniu ze zwykłym współczynnikiem determinacji lub nieuregulowanego R2
? SSR
R = 1
TSS który “dostosowane” obliczenie karze wtrącenie dodatkowych parametrów, inny rzeczy eąual.
19.2 Informacja kryteriów bardziej ogólne kryterium w podobnym duchu jest (1974) Akaike's “Kryterium Informacji” (AIC). Oryginalne sformułowanie tej miary jest
AIC = -2-2(9) + 2k (19.1)
gdzie £(6) reprezentuje maksimum loglikelihood jako funkcja wektora parametru esti koledzy, 6 i k (jak powyższy) oznacza numer z “niezależnie dostosowany parametry w modelu.” W tym sformułowaniu, z AIC przecząco odnoszonym się do prawdopodobieństwa i pozytywnie odnoszonym się do numeru parametrów, pracownik naukowy szuka minimum AIC.
AIC może być zagmatwany, w że kilka wariantów obliczenia jest “w krążeniu.” Dla egzamin ple, Davidson i MacKinnon (2004) przedstawia uproszczoną wersję,
AIC = £(6) - k,
który jest tylko, -2 razy oryginał: w tym przypadku, oczywiście, to chce zmaksymalizować AIC. W przypadku modeli estimated około najmniej sąuares, loglikelihood może zostać napisany jako
„, x n n
£(U) = - -(1 + log2TT - logn) - -logSSR (19.2)
2 2
143
Rozdziału 19.. Kryteria wyboru modelu
1 44
Zastępujące (19.2) do (19.1) które damy
AIC = n(l + log2TT - logn) + nlogSSR + 2k, który może również zostać napisany jako
AIC, = n kloc + 2fe + n(l + logZTr) (19.3)
n
Trochę autorzy upraszczają formułkę dla przypadek modeli oszacował przez najmniej sąuares. Na przykład
William Greene pisze
/ SSR \ 2k
AIC = wpisać H (19.4)
n n
Ten wariant może zostać wywieść się z (19.3) przez rozwidlanie się przez przez n i odejmowanie stała 1 + wpisać 2tt. To jest, pisząc AICg dla wersję podanej przez Greene, mamy
AICg = -AIC - (1 + log2TT) n
W
końcu, Ramanathan daje dalszy wariant:
AICR = (-) e2kln n,
który jest wykładniczym tego podany przez Greene.
Cretl zaczął się przez używanie Ramanathan wariantu, ale od wersja 1.3.1 program użył oryginalna Akaike formułka (19.1)i bardziej specificaUy (19.3) ponieważ modele oszacowały przez najmniej sąuares.
Chociaż Akaike kryterium jest zaprojektowane, by sprzyjać skąpstwo, prawdopodobnie to nie idzie daleko wystarczająco w tym kierunku. Na przykład jeżeli mamy dwa nested modele z k - 1 i k parametry re specyfikacja tively i, jeżeli nuli hipoteza, że parametr k eąuals 0 jest prawdziwy, w dużych próbkach AIC niemniej jednak będzie mieć skłonnością do wybrania mniej oszczędnego modelu około 16 procent czasu (zobacz Davidson i MacKinnon, 2004, rozdział 15).
Alternatywa dla AIC, który unika tego problemu, jest Schwarz (1978) “kryterium informacji Bayesian” (BIC). BIC może zostać napisany (zgodnie z sformułowaniem Akaike's AIC) jako
BIC = -2-2(9) + / dogn mnożenie k około logn w BIC znaczy to kara dla dodawania dodatkowego parametry rośnie z próbką wielkość. To zapewnia, że, asymptotically, to nie wybierze większego modelu ponad poprawnie wyszczególnionym oszczędnym modelem.
Dalszy alternatywa dla AIC, który znów skłania się do wybranych bardziej oszczędnych modeli, niż AIC, jest Hannan-Quinn kryterium lub HQC (Hannan i Quinn, 1979). Napisany konsekwentnie z sformułowania powyżej to jest
HQC = -2-2(9) + 2 / doglogn Hannan-Quinn obliczenie jest oparte dalej prawem powtórzonego logarytmu (notatka tak ostatni okres jest klocem kloca próbki wielkość). Autorzy dowodzą, że ich postępowanie dostarcza “silnie stałe postępowanie oszacowania dla porządku autoagresji”i to “w porównaniu z innymi silnie stałymi postępowaniami to postępowanie nie doceniać porządku do mniejszego stopnia.”
Cretl donosi AIC, BIC i HQC (obliczony jako wyjaśniony powyżej) dla większości rodzajów modeli. Punkt kluczowy w interpretowaniu tych wartości ma wiedzieć, czy oni są obliczeni takim, że mniejsze wartości są lepsze lub takim, że większe wartości są lepsze. W gretl, mniejsze wartości są lepsze: to chce pomniejszyć wybrane kryterium.
Rozdział 20
Raz serii modeluje
20.1 modeli serii
Razu Wprowadzenia jest dyskutowanych w tym rozdziale i następnym. W tym rozdziale koncentrujemy się na ARIMA modelach, testach korzenia części i GARCH. Następny rozdział zajmuje się cointegration i skorygowaniem błędu.
20.2 ARIMA modele
Reprezentacji i składnia, która arma rozkaz wykonuje oszacowanie AutoRegressive, Zintegrował, Średnia krocząca (ARIMA) modele. Ci są modele, które mogą zostać napisane w formie
4, >(L)yt = 6(L)et (20.1)
gdzie 4 >(L)i 6(L) jest wielomianami wewnątrz operator opóźnienia, ja, zdefiniował taki tak Lnxt = xt-n i et jest białym hałasem proces. Dokładna zawartość yt, Arkansas wielomianu 4 >()i MAMA wielomianu 6(), będzie wyjaśniony w co następuje.
Znacz okresy proces yt jako napisany w eąuation (20.1) ma, bez dalszego ąualifications, znaczyć zero. Jeżeli model ma być odnieść się do prawdziwych danych, to jest konieczne zawrzeć jakiś okres, by poradzić możliwość, że yt ma środek bzu --zera. Są dwoma możliwymi sposobami reprezentowania procesy z nonzero znaczą: to ma zdefiniować, [xt jako bezwarunkowy środek yt, mianowicie centralna wartość jego marginalnej dystrybucji. Dlatego, serie yt = yt - Ht znaczyć 0 i model (20.1) odnosi się do yt. w praktyce, arogancki tak, [xt jest linearną funkcją trochę dostrzegalnego zmienne xt, model zostaje
4 >(L){ yt - xt(3) = 6(L)et (20.2) jako które
To czasami jest wiedziany “model regresji z ARMA błędami”; jego struktura może być bardziej oczywisty, jeżeli reprezentujemy to używające dwa eąuations:
yt = xt(3 + ut 4 >(L)ut = 6(L)et model tylko przedstawiony również czasami być znany jako “ARMAX” (ARMA + eXogenous zmienne). To wydaje się do nas, jakkolwiek, tak ta etykieta więcej właściwie być odnieść się do innego modelu: inny sposób zawarcia okres środka wewnątrz (20.1) ma opierać reprezentację na warunkowym środku yt, to jest centralna wartość dystrybucji yt podanego jego własna przeszłość. Arogancki znów, tak to może zostać reprezentowany jako linearne połączenie trochę dostrzegalnego zmienne zt, model rozszerzałby do
4 >(L)yt = zty + 6(L)et (20.3) sformułowanie (20.3) ma korzyść tak y może natychmiast zostać zinterpretowany jako wektor marginalnych efektów zt zmiennych na warunkowym środku yt. I około dodające opóźnienia zt do
145
Rozdziału 20. Raz serie modeluje
146
ta specyfikacja to może oszacować Funkcja Transferu modele (które uogólnia ARMA około dodający efekty z exogenous zmienny rozprowadzony przez czas).
Cretl dostarcza sposobem oszacowania zarówno formy. Modele napisane jako wewnątrz (20.2) jest oszacowany około prawdopodobieństwem maksimum; modele napisane jako wewnątrz (20.3) jest oszacowany około warunkowym prawdopodobieństwem maksimum. (Ponieważ więcej dalej te opcje widzą sekcja dalej “Oszacowanie” poniżej.)
W specjalnej okoliczności kiedy xt = zt = 1 (to jest, modele zawierają stała ale żadne exogenous zmienne) dwie specyfikacje dyskutowane powyżej redukują do
4 >(L)(yt - n) = 6(L)et (20.4)
i
4 >(L)yt = + 6(L)et (20.5)
odpowiednio. Te sformułowania są zasadniczo równoważny, ale, jeżeli oni reprezentują jeden i ten sam proces ^ i są, dość oczywiście, nie numerycznie identyczny; raczej = (l - 4 > ja - ... - 4 > p) / j gretl składnia dla szacowania (20.4) jest po prostu
arma p q ; y Arkansas i porządki opóźnienia MAMY, p i q, może zostać dany albo jako numery lub jak wstępnie zdefiniowane skalary. parametr ^ może zostać upuszczony w raz konieczność około dodający opcja -nc (“żadna stała”) do rozkazu. Jeżeli oszacowanie (20.5) jest potrzebowany, witka --warunkowy musi zostać dodany do rozkazu, jako wewnątrz
arma p q ; y --warunkowe
Uogólnianie ta zasada do oszacowania (20.2) lub (20.3), dostajesz się tak
arma p q ; y const xl x2 szacowałby następny model:
yt - xtf > = 4 > ja (yt-ja - xt-jeżeli >) + ... + 4 > p iyt-p - pp) + et + Q \£ t- \ + ... +
dąet-gdzie w xt tym wypadku { 3 = /?och + -^ t, ijSi + -^ t, 2 /?2- Dodając --warunkowa witka, jako wewnątrz
arma p q ; y const xl x2 --warunkowy szacowaliby następny model:
yt = * ty + 4 > iyt-ja + ... + 4 > pyt-p + et + 6iet-ja + ■ ■ ■ +
Qąet-idealnie, zagadnienie obróciło statek powyższy mógłby zrobił naradę około piszącą bardziej ogólnej specyfikacji, która zagnieżdża się, alternatywy; to jest
4 >(L) { yt - xt(3) = zty + 6(L)et; (20.6) które lubilibyśmy, by uogólnić arma rozkaz więc, że użytkownik mógłby wyszczególnić, ponieważ trochę metoda oszacowania, czy pewne exogenous zmienne powinny zostać potraktowane jako xts lub zts, ale jesteśmy nie jeszcze w tak punkt (i żadni z dwóch nie są najwięcej innym moduły programowe). modele serii Razu
Rozdziału 20.
147
Sezonowe modele bardziej elastyczne opóźnienie struktura jest pożądany kiedy analizując serie czasu, które pokazują, silne sezonowe wzory. Modelem (20.1) może zostać rozszerzony do
4 >(L)$(Ls)yt = 6(L)&(Ls)et. (20.7)
Ponieważ taki przypadki, pełniejsza forma składni jest dostępny, mianowicie,
arma p q ; P Q ; y,
gdzie p i q reprezentuje bez --sezonowe Arkansas i MAMA zamawia i P i Q sezonowe porządki. Na przykład,
arma 1 1 ; 1 1 ; y byłby używany, by oszacować następny model:
(1 - 4 > L)(1 - $ Ls)(yt - n) = (1 + 6L)(1 + & Ls)et, Jeżeli yt jest ąuarterly seriami (i, dlatego 5 = 4), powyższy eąuation może zostać napisany więcej jawnie jako
yt - n = 4 >(yt-ja - <) + ®{ yt-4 - łO - (</> ■ ®)(yts - H) + £ t + 0 £ t-ja + ®£ t-4 + (6 ■ ®)£ t-5 Taki model jest znany jako “mnożący się sezonowy ARMA model”.
Szpary w strukturze opóźnienia sposób standard wyszczególnienia ARMA model w gretl bycie przez Arkansas i MAMA zamawia, p i re specyfikacja tively. W tym przypadku wszystkie opóźnienia od 1 do danego porządku są zawarte. W jakichś przypadkach można, bym zechciałby zawrzeć tylko pewne określone Arkansas i / lub MAMA zostaje w tylu. To może zostać zrobiony w obu z dwóch dróg.
To może zbudować macierz zawierającą pożądane opóźnienia (wartości liczby całkowitej dodatniej) i dostarcza imię tej macierzy zamiast p lub.
To może dać rozdzielony przez przestrzeń wykaz opóźnień, enclosed w klamerkach, zamiast p lub.
Następny kod ilustruje te opcje:
macierz pvec = { 1, 4 } arma pvec 1 ; y arma { 14 } 1 ; y
Zarówno formy powyższe wyszczególniają ARMA model, w którym Arkansas zostaje w tylu 1 i 4 jest użyty (ale nie 2 i 3). To udogodnienie jest dostępne tylko dla bzu --sezonowej części składowa ARMA specyfikacji.
Odróżniając i ARIMA powyższa dyskusja zakłada, że serie czasu yt już został poddany do wszystkich transformacji uważał konieczny dla zapewniania stationarity (zobacz również sekcję 20.3). Odróżnianie jest najbardziej popularnym tych transformacji i gretl dostarcza mechanizm, by zawrzeć ten krok do arma rozkazu: składnia
arma p d q ; y szacowaliby ARMA(p, ) model na Adyt. To jest funkcjonalnie równoważne
Rozdziałowi 20.. Czas serie modeluje
148
serie tmp = y pętla dla ja = l..d
tmp = diff(tmp) kończy pętla arma p q ; tmp
oprócz w odniesieniu do prognozowania po oszacowaniu (patrzcie poniżej).
Kiedy serie yt jest odróżniony przed wykonywaniem analizy, model być znany jako ARIMA (“ja” dla Zintegrowany); z tego powodu, gretl dostarcza arima rozkaz jako nazwa umowna dla arma.
Sezonowe odróżnianie jest poradzone podobnie, ze składnia
arma p d q ; P D Q ; y, gdzie jest D porządkiem dla sezonowego odróżniania. W ten sposób, rozkaz
arma 1 0 0 ; 1 1 1 ; y doprowadzaliby do tych sam ocen parametru jak
genr dsy = sdiff(y) arma 1 0 ; 1 1 ; dsy
gdzie używamy sdiff działa, by utworzyć sezonową różnicę (np. dla ąuarterly danych, yt - yt-ja)-
Oszacowanie domyślna metoda oszacowania dla ARMA modeli jest dokładnym oszacowaniem prawdopodobieństwa maksimum (poniżej założenie tak okres błędu zwykle jest rozprowadzony), używając Kalman filtr wewnątrz conjunc-tion z BFGS maksymalizacja algorytm. Nachylenie kloc prawdopodobieństwa w odniesieniu do ocen parametru jest zbliżone numerycznie. Ta metoda doprowadza do skutków, którymi jest bezpośrednio porównywalne z wiele innych moduły programowe. Stała i jakieś exogenous zmienne, są potraktowane jako w eąuation (20.2). Macierz kowariancji dla parametrów jest policzona używając nu-merical przybliżenie do heski w zbieżności.
Alternatywna metoda, odwołał z -warunkowa witka, jest uzależniony maksimum likelihood (CML), również znanym jako “warunkowa suma sąuares” - zobacz Hamilton (1994, s. 132). Ta metoda była exemplihed w scenariuszu 9.3 i tylko krótki opis będzie dany tu. Podana próbkę wielkości T, CML metody pomniejsza sumę sąuared jednoidzieszprzed sobą błędy przepowiadania wygenerowały przez model dla obserwacji do..., T. The punkt początkowy do zależy od porządków Arkansas wielomianów w modelu. Numeryczna metoda maksymalizacji używana jest BHHH i macierz kowariancji jest policzona używając Newton Gaus regresję.
CML metody jest prawie równoważny prawdopodobieństwu maksimum pod hipotezą normalności; różnica jest, że najpierw (do - 1) obserwacje są rozważone naprawiony i tylko stawane do likelihood funkcji jako uwarunkowywanie zmiennych. Jak conseąuence, dwie metody są asymptotically równoważnym poniżej warunkami standardu - z wyjątkiem faktu, dyskutowany powyżej, to nasz CML imple-mentation przyjemności stali i exogenous zmienne jako przez pośrednictwo eąuation (20.3).
Dwie metody mogą zostać porównane jako w następnym przykładzie
otwartym datalO-1
arma 1 1 ; r
arma 1 1 ; r --warunkowy,
które doprowadza do ocen pokazanych w Stół 20.1. Jak widać oceny 4 > i 6 jest ąuite podobnym. Doniesiona stała różnią się szeroko, zgodnie z oczekiwaniem - zobaczyć, jak dyskusja podąża eąuations (20.4) i (20.5). Jakkolwiek dzieląc CML stała przez 1 - 4 > dostajemy 7.38, które jest nie daleko od ML oceny 6.93.
Rozdział 20.. Czas serie modeluje
Stół 20.1: ML i CML oceny
Parametru ML CML
n 6.93042 (0.923882) 1.07322 (0.488661)
4 > 0.855360 (0.0511842) 0.852772 (0.0450252)
6 0.588056 (0.0986096) 0.591838 (0.0456662)
Zbieżność i inicjacja, która numeryczne metody maksymalizowały prawdopodobieństwo dla ARMA modele nie są gwarantowane do coiwerge. Czy zbieżność jest osiągnięta czy nie i czy prawdziwe maksimum funkcji prawdopodobieństwa jest osiągnięte czy nie, może zależeć od wartości startu dla parametrów. Cretl zatrudnia jeden z co następuje dwa mechanizmy inicjacji, zależąc od specyfikacji modelu i metody oszacowania chosen.
Oszacuj czysty Arkansas model około Najmniej Sąuares (nieliniowy najmniejszy sąuares, jeżeli model reąuires to, inaczej OLS). Ustawiony wartości parametru Arkansas oparte na tej regresji i ustawione MAMA parametry do smali pozytywna wartość (0.0001).
Hannan-Rissanen metoda: pierwsza ocena autoregressive model około OLS i uratuj reszty. Wtedy w drugim OLS przechodzą dodawać odpowiednie opóźnienia pierwszy okrągłych reszt do modelu, uzyskać oceny MAMA parametrów.
Aby zobaczyć szczegóły postępowania oszacowania ARMA, dodać --wielomówna opcja do rozkazu. To odciski zawiadomienie metody inicjacji użyło, jak również parametr ceni i kloc prawdopodobieństwo w każdym powtarzaniu.
Oprócz w budujesz-mechanizmach inicjacji, użytkownik ma opcję wyszczególniania zbiór zaczynania wartości ręcznie. To jest zrobiony przez rozkaz zbioru: pierwsza dyskusja powinna być słowo kluczowe initvals i drugi powinien być imieniem wstępnie wyszczególnionej macierzy zawierającej zaczynające się wartości. Na przykład początek
macierzy = { 0, 0.85, 0.34 } zbiór initvals zaczyna arma 1 1 ; y, które wyszczególniona macierz powinna mieć tylko jako wiele parametrów jako model: w przykładzie ponad tam są trzy parametry, odkąd model domyślnie zawiera stała. Stała, jeżeli obecny, zawsze jest dany najpierw; inaczej porządek, w którym parametry są oczekiwane, jest tym samym jako porządek specyfikacji w arma lub arima rozkazie. W przykładzie stała jest ustawiona, by wyzerować, 4 > ja do 0.85 i 6 \ do 0.34.
Możesz nakłonić gretl do wracania do automatycznej inicjacji przez rozkaz ustawił initvals auto.
Oszacowanie przez Xl 2-ARIMA
Jako alternatywa dla szacowania ARMA modeli używanie “krajowiec” kod, gretl oferuje opcję używania zewnętrznego programu l X 2-ARIMA. To jest sezonowe oprogramowanie dostosowania wyprodukowane i główny tained przez USA Spis Biuro; to jest użyte dla wszystkich oficjalnych sezonowych dostosowania w Biurze.
Cretl zawiera wzorcem, który powierzchnie międzyfazowe z l X 2-ARIMA: to przetłumaczy arma rozkazy używające składnię szkicowaną powyżej do formy rozpoznawanej około l X 2-ARIMA, wykonuje program i odzyskuje wyniki dla obejrzenia i dalszej analizy w gretl. Aby użyć tego udogodnienia, które musisz zainstalować l X 2-ARIMA oddzielnie. Paczki dla zarówno PANI Windowsa a, jak i GNU / Linuks są dostępne od gretl strony internetowej, < http://gretl.sourceforge.net/ >.
Rozdział 20.. Modele serii razu
150
Do iiwoke l X 2-ARIMA jako oszacowanie silnik, dodaj flagę --arima, jako wewnątrz
arma p q ; y --arima
Tak , jak w przypadku ojczystego oszacowania, zaniedbanie ma użyć dokładny ML ale jest opcja używania warunkowego MLwith --warunkowa flaga. Jakkolwiek, pleasenote l 2-ARIMAisusedin warunkowy ML tryb, komentarze powyższe odnośnie wariantu leczenia środka procesu, którego yt nie stosuje. To jest, kiedy używasz l X 2-ARIMA model, który jest estimated, jest (20.2), nie zważając, z czy oszacowanie jest około dokładne ML lub warunkowy ML.
Prognozujący
ARMA modeluje często jest użyty dla prognozujących celów. autoregressive komponent, w particu lar, oferuje możliwość prognozowania procesu “z próbki” ponad konkretnym horyzontem czasu.
Cretl popiera prognozowanie na podstawie ARMA modeli używających metodę wyruszaną przez Pudło i Jenkins (1976).1 Pudło i Jenkins algorytm doprowadza do zbioru łączonych Arkansas współczynników, które biorą pod uwagę jakieś odróżnianie zależnej zmiennej, (sezonowy i / lub bez --sezonowy) w ARIMA kontekście, w ten sposób umożliwiając wygenerowanie przewidywania dla poziomu oryginalnej zmiennej. Przeciwnie, jeżeli najpierw odróżniasz, serie ręcznie i wtedy stosują ARMA do odróżnionych serii, przewidywania będą dla odróżnionych serii, nie poziom. Ten punkt jest zilustrowany w Przykład 20.1. Oceny parametru są identyczne dla dwóch modeli. Przewidywania różnią się ale są wzajemnie stałe: zmienny fcdiff naśladuje ARMA przewidywanie (statyczny, jeden krok przed sobą w zasięgu próbki i dynamie z próbki).
20.3 Część korzenia testuje ADF test, który Podwyższony Osioł Pełniejszy (ADF) testuje jest, jako wprowadzony wewnątrz gretl, t dane dalej cp w
następnej regresji:
v
Ayt = Ht + < pyt-ja + X Yi ^ yt-ja + et- (20.8)
ja =\
To testują dane jest prawdopodobnie najlepiej wiedziani i najwięcej szeroko użyty część korzeń test. To jest jednostronny test, którego nuli hipoteza jest cp, = 0 przeciw alternatywnemu cp < 0.. Pod nuli, yt musi zostać odróżniony co najmniej, gdy tylko, by osiągnąć stationarity; pod alternatywą, yt jest już stacjonarny i żadne odróżnianie jest reąuired. Odtąd, duże przeczące wartości prowadzenia danych testu do odrzucenia nuli.
Jeden szczególny aspekt tego testu jest tak jego dystrybucja ograniczenia jest bzem --standardem poniżej nuli hypothesis ponadto kształt dystrybucji i conseąuently krytyczne wartości dla testu, zależy od formy, z [to okres. fuli analiza różnych przypadków jest niewłaściwa tu: Hamilton (1994) zawiera doskonałą dyskusję, ale trochę niedawne przykrycie podręcznika serii czasu ten topie. Dość powiedzieć , że gretl pozwala użytkownikowi wybrać specyfikację, dla [to między czterema innymi alternatywami:
\ opcja rozkazu xt
0 --nc,
[X0 --C
Hej + Uderzenie --et
Hej + [X \ t + [X \ t2 --ctt
1See wewnątrz szczególny ich “Zaprogramowuje 4” dalej s. 505ff.
Rozdział 20. modele serii Razu
151
Te opcje nie są wzajemnie wyłączne; kiedy oni będzieć używany razem, dane będą doniesione oddzielnie dla każdego przypadku. domyślnie, gretl używa domyślnie połączenie --c --et -ctt. Dla każdego przypadku, przybliżone p wartości są obliczone przy pomocach algorytmu rozwiniętego wewnątrz MacKinnon (1996). gretl rozkaz używany wykonać test jest adf; na przykład
adf 4 xl --c --et liczyłby test statystyczny jako t dane dla cp wewnątrz eąuation 20.8 z p = 4 w dwóch przypadkach, [xt = Hej i yut = / Jo + l ^ to. numer opóźnień (p wewnątrz eąuation 20.8) powinien zostać wybrany, ponieważ zapewnić tak (20.8) jest parame-trization wystarczająco elastyczny reprezentować adeąuately krótko biegnie upór Ayt. Ustawienie p zbyt Iow wynika w ocenić wypaczenia w teście, podczas gdy ustawienie p zbyt wysoki poziom prowadziłby do Iow władzę. Jak komfort do użytkownika, parametru p może automatycznie zostać określony. Ustawienie p do przeczący numerować przyczyny seąuential postępowanie, które rozpoczyna od p opóźnienia i zmniejsza się p, aż t dane dla parametru yp przewyższa 1.645 wewnątrz absolutnego wartość. KPSS test KPSS test (Kwiatkowski, Filip, Schmidt i Goleń, 1992) jest częścią korzeń test wewnątrz, który jest nuli hipoteza przeciwna, do tak wewnątrz ADF test: poniżej nuli, serie w ąuestion jest stacjonarny; alternatywa jest tak serie jest 1(1). basie intuicja z tyłu to test statystyczny jest bardzo prosty: jeżeli yt może zostać napisany jako yt = n + ut, gdzie jest ut trochę zerowy-znaczyć stacjonarny proces, wtedy nie tylko robi próbkę średnią yt's dostarcz stałego kosztorysanta n, ale długo biegnie niezgodność ut jest dobrze zdefiniowany, ograniczony numerować. Żaden z tych, którzy własności trzymają się poniżej alternatywa. sam test jest oparty na co następuje statystyczny:
H = ~ z ^-T- (20.9)
gdzie ul. = Zs = ja es i & 2 jest oceną długo biegnie niezgodności et = (yt - y). Poniżej nuli, to statystyczny ma dobrze zdefiniowaną (nonstandard) asymptotyczny dystrybucję, która jest wolna nieprzyjemności parametry i była umieszczona w tabeli około, symulacja. Pod alternatywą, dane rozbiegają się.
Jak conseąuence, można zbudować jednostronny test oparty dalej q, gdzie Hej jest odrzucony, jeżeli q jest większy niż odpowiednia krytyczna wartość; gretl dostarcza 90%, 95%, 97.5 % i 99% ąuantiles.
Użytkowanie przykład:
kpss m y,
gdzie jest m całością reprezentującą szerokość pasma lub okno wielkość używana wewnątrz formułka dla szacowania długiego biegu niezgodność:
/ 1 _ fi
iL- m + 1
m + \
ja =-m yt okresy oznaczają empiryczne autokowariancja et od porządku -m m., Ponieważ to kosztorysant, by być stały, m musi być wystarczająco duży, by wyświadczyć przysługę krótko biegnie upór et, ale nie zbyt duży w porównaniu z próbką wielkość T. In GUI powierzchnia międzyfazowa gretl, tego wartość zaniedbania
do całości część 4 { j ^ jj, którym powyższe pojęcie może być uogólnionym do przypadku, gdzie uważa się, że yt jest stacjonarny wokoło deterministic trend. Wewnątrz to przypadek, formułka (20.9) resztki niezmienionej, ale serie et jest zdefiniowany jako reszty od OLS regresja yt na stała i linearnym trendzie. To drugi forma testu jest uzyskany około dodając --opcja trendu do kpss rozkaz: modele serii Czasu
Rozdziału 20.
152
kpss n y --trend
Notatka tak wewnątrz to przypadek asymptotyczna dystrybucja testu jest inny i krytyczne wartości zgłosiły, około że gretl różni się odpowiednio.
Cointegration testy
FIXME dyskutuje Engle - Granger tu i odnieść przedni do potem rozdział dla Johansen testów.
20.4 FIGLARNY i CARCH
Heteroskedasticity znaczy bez --stałą niezgodność błędu okres wewnątrz regresja model. Autore-gressive Warunkowy Heteroskedasticity (FIGLARNY) jest zjawiskiem określonym do czasu serie modele, zgodnie, z którym niezgodność błędu pokazy autoregressive zachowanie; na przykład, czas serie były hibits kolejny okresy, gdzie jest niezgodność błędu stosunkowo duża i kolejne okresy, gdzie to jest stosunkowo smali. Ten rodzaj zachowania jest obliczony, by być ąuite wspólnym w rynkach zalety: chwiejąca część wiadomości może prowadzić do okresu wzrośniętej wybuchowości w rynku.
FIGLARNY proces błędu porządku puszka być reprezentowany jako
ja ut = crt £ t', crf = E(u2 \ D.t-ja) = «och + X aiu \-ja
ja =\
gdzie £ ts niezależnie i identycznie jest rozprowadzony (iid) z znacz zero i niezgodność 1 i, gdzie jest crt wzięty, by być pozytywnym sąuare korzeniem u }. Cłt-ja oznacza, że informacje ustawiły czasu t- \ i u } jest warunkową niezgodnością: to jest, niezgodność warunkowa dalej informacje datowały t - 1 i wcześniejszy.
Jest ważne zauważyć różnicę między ŁUKIEM i zwykłym procesem błędu autoregressive. Najprostszy (first-order) przypadek tego drugiego może zostać napisany jako
Ut = l + £ u "ja < P < 1,
gdzie £ ts niezależnie i identycznie jest rozprowadzony z znaczyć zero i niezgodność a2. Z Arkansas(1) błąd, jeżeli p będzie pozytywny wtedy, pozytywna wartość ut ma skłonnością do zostania podążona, z prawdopodobieństwem większym niż 0.5, przez pozytywny ut + i. Z FIGLARNYM błędem proces, zakłócenie ut dużej absolutnej wartości będą mieć skłonności do zostania podążone o wiele duże absolutne wartości, ale bez założenia tak kolejne wartości będą tym samym znakiem. ŁUK w cenach zalety jest “stylizowanym faktem” i jest zgodny z wydajnością rynku; z drugiej strony autoregressive zachowanie zalety ceny naruszyłyby wydajność rynku.
To może przeprowadzić badania dla ŁUKU porządku w następnej drodze:
Oszacować model zainteresowania przez OLS i uratować sąuared reszty, u2.
Wykonaj pomocniczą regresję, w której aktualny sąuared końcowy jest regressed na oszustwo stant i zostaje w tylu siebie.
Znajdź TR2 wartość (czasami wielkości próbki nieuregulowany R2) dla pomocniczej regresji.
Odeślij TR2 wartość do x2 dystrybucji ze stopniami wolności i, jeżeli p wartość jest “smali wystarczająco” odrzuć nuli hipotezę homoskedasticity za alternatywą ŁUK(q).
Ten test jest wprowadzony w gretl przez figlarny rozkaz. Ten rozkaz może zostać wydany podążając oszacowanie czas serii modelują przez OLS lub przez wybór od “Testy” menu w oknie modelu (znów, zwolennicy OLS oszacowanie). Skutek testu jest doniesiony i, jeżeli TR2 od
Rozdziału 20.. Modele serii razu
153
pomocnicza regresja ma p wartość mniej niż 0.10, ŁUK oceny również są doniesione. Te oceny biorą formę z Uogólnionym Najmniej Sąuares (GLS), szczególnie obciążony least sąuares, używając wagi, które są iiwersely proporcjonalnym do przewidzianych niezgodności zakłóceń, w, wywieść się z pomocniczej regresji.
Ponadto, FIGLARNY test jest dostępny po oszacowaniu autoagresji wektora (VAR). W tym przypadku, jakkolwiek, nie ma żadnego zaopatrzenia, by odnośnie-szacować model przez GLS.
GARCH który prosty ŁUK(q) przetwarza jest przydatny dla wprowadzania ogólnego pojęcia warunkowego heteroseksualista eroskedasticity w samą porę serie, ale odkryto, że. Dynamika niezgodności błędu pozwolonej przez ŁUK(q) nie są wystarczająco bogate, by reprezentować wzory znalazły w finansowych danych. Uogólniony ŁUK lub GARCH model teraz więcej szeroko jest użyty.
Reprezentacja niezgodności procesu w GARCH modelu jest nieco (ale nie dokładnie) analogiczny do ARMA reprezentacji poziomu serii czasu. Niezgodność w czasie t wolno policzyć dalej zarówno po wartościach niezgodności i minione wartości zrozumianego sąuared zakłócenia, jako pokazany w następnym systemie eąuations:
yt = Xt { 3 + ut (20.10)
ut = crt £ t (20.11) p
u } = «och + X aiMt-f + X ^ ja { 7t-j (20.12)
t = l j = l
Jak powyżej, et jest iid seąuence z częścią niezgodność. Xt jest macierzą regressors (lub wewnątrz najprostszy przypadek, tylko wektor ls uwzględniającego bez --zerowy środek yt). Notatka tak, jeżeli p = 0, GARCH zapada się do ŁUKU(q): generalizacja jest ucieleśniona wewnątrz 5t okresy, które mnożą, poprzednie wartości błędu niezgodnością.
w zasadzie podleganie innowacji, et, mógłby nastąpić trochę odpowiednie prawdopodobieństwo dystrybucję i oprócz oczywistego kandydata normalnego lub Gaussian dystrybucja t dystrybucja zostać używany wewnątrz tym kontekstowym. Aktualnie gretl tylko radzi przypadek, gdzie jest et założony, by być Gaussian. Jakkolwiek, kiedy --krzepka opcja do garch rozkaz jest dany, kosztorysanta gretl użycie, ponieważ kowariancją macierz może zostać rozważona Prawdopodobieństwo Quasi Maksimum równe z bzem --normalnym disturbances. Patrzcie poniżej dla więcej dalej macierz kowariancji opcji odnośnie GARCH.
Przykład:
garch p q ; y const x,
gdzie p > 0 i q > 0 oznacza poszczególne opóźnienie porządki jako pokazany eąuation (20.12). Ci wartości mogą zostać dostarczone w numerycznej formie lub jako imiona z wstępnie zdefiniowany skalara zmienne.
GARCH oszacowanie
Oszacowanie parametrów GARCH model jest w żaden sposób bezpośrednim zadaniem. (Oszustwo sider eąuation 20.12: warunkowa niezgodność w trochę wskazać w samą porę, crt2, zależy od warunkowej niezgodności we wcześniejszych okresach, ale crt2 nie musi przestrzeżony i jest wnioskowany około kilku rodzaj z Maxi-cisza Prawdopodobieństwo postępowanie.) Gretl użycie metoda proponowała około Fiorentini, Calzolari i Panattoni (1996), 2, które został zaadoptowane, jako test sprawności w nauce GARCH wynika około McCullough i Renfro (1998). To zatrudnia analityczny pierwszy i drugi pochodne kloc prawdopodobieństwa i używa mieszałeś-nachylenia algorytm, wykorzystując informacje macierz we wczesnych powtarzaniu i wtedy witka ing do heski w sąsiedztwie maksimum prawdopodobieństwo. (To postęp może zostać przestrzeżony, jeżeli dodajesz --wielomównej opcji do gretl's garch rozkaz.)
2 algorytm jest oparty dalej Fortran kod deponował wewnątrz archowum Dziennika ofApplied Econometrics około autorzy i być używany około uprzejmym pozwoleniem Profesora Fiorentini. modele serii Razu
Rozdziału 20.
154
Kilka opcje są dostępne dla liczenia kowariancji macierz parametru oceny w związku z gar eh rozkaz. W pierwszym równym, to może woleć pośrodku “standard” i “krzepkiego” kosztorysanta. domyślnie, heski jest użyty, chyba że -krzepka opcja jest dana, wewnątrz, które przypadek QML kosztorysant jest użyty. piękniejszy wybór jest dostępny przez zbiór rozkaz, jako pokazany Stół 20.2.
Stół 20.2: Opcje, ponieważ
zbiór efektu
rozkazu macierzy kowariancji GARCH garch_vcv juta Użycie heski
zbiór garch_vcv im Użycie Informacje Macierz
zbiór garch_vcv op Użycie Zewnętrzny Produkt Nachylenia
zbiór garch_vcv qml QML kosztorysant
ustawił garch_vcv bw Bollerslev-Wooldridge “kanapka” kosztorysant
To nie jest niezwykłe, kiedy to szacuje GARCH model dla arbitralnego czasu serie, by znaleźć tak wielokrotne obliczenie ocen zawodzi zbiec się. Ponieważ GARCH modeluje, by mieć sens, są silne restrykcje na dopuszczalnym parametrze wartości i to jest nie zawsze przypadek tak tam egzystuje zbiór z wartości wewnątrz dopuszczalny parametr przestrzeń, dla której prawdopodobieństwo jest zmaksymalizowane. restrykcje w ąuestion mogą zostać wyjaśnione około odniesienie do najprostszego (i dużo najbardziej popularni) przykład GARCH model, gdzie p = = 1. Wewnątrz GARCH(1, 1) model warunkowa niezgodność jest
er2 = «och + < X \ U ^_ 1 + < 5icrt2_1 (20.13)
Branie bezwarunkowego oczekiwania (20.13) dostajemy
er2 = «och + «icr2 + 8 \{ i2 więc, że
Och" =
1 - «ja - b ~\
Ponieważ to bezwarunkowy niezgodność, by egzystować, my reąuire tak «ja + 5 \ < 1 i dla tego być pozytywny my reąuire tak «och > 0. wspólny powód dla bzu --zbieżności GARCH oceny (to jest, wspólny powód dla non-existence z «f i 5t ceni to zadowalać powyższy reąuirements i równocześnie maksymalizują prawdopodobieństwo danych) jest misspecification modelu. To jest ważne spieniężyć tak GARCH, wewnątrz siebie, pozwala tylko dla zmieniającej się czasu wybuchowości w danych. Jeżeli środek serii w ąuestion nie jest stały lub, jeżeli błąd proces jest nie tylko heteroskedastic ale również autoregressive, to jest konieczne, by wziąć to do konta kiedy formułuje odpowiedni model. Na przykład to może być konieczne, by wziąć pierwszą różnicę zmiennej w ąuestion i / lub dodać odpowiedni regressors, Xt, jako w (20.10).
Rozdział 20.. Modele serii czasu
155
Przykładu 20.1: ARIMA prognozujący
otwarty greene18_2.gdt
kloc kwartalne USA nominalnego GNP, 1950:1 do 1983:4 genr y = wpisz(Y)
i jego pierwszy różnica genr dy = diff(y)
rezerwa 2 lata dla przewidywanie poza-z-próbki smpl ; 1981:4
Ocena używająca ARIMA arima 1 1 1 ; y
przewidywanie ponad pełnym okres smpl --pełny
fcast fc1
# Wróć, by łódź podwodna -spróbować i biegnie ARMA na pierwszej różnicy y
smpl ; 1981:4
arma 1 1 ; dy
smpl --pełny
fcast fc2
genr fcdiff = (t <= 1982:1)*(fc1 - y(-1)) + (t > 1982:1)*(fc1 - fc1(-1))
# porównaj przewidywania tu późniejszy okres
smpl 1981:1 198 3:4
drukuje y fc1 fc2 fcdiff --byobs produkcja od ostatniego rozkazu jest:
y fcl fc2 fcdiff
1981:1 7.964086 7.940930 0.02668 0.02668
1981:2 7.978654 7.997576 0.03349 0.03349
1981:3 8.009463 7.997503 0.01885 0.01885
1981:4 8.015625 8.033695 0.02423 0.02423
1982:1 8.014997 8.029698 0.01407 0.01407
1982:2 8.026562 8.046037 0.01634 0.01634
1982:3 8.032717 8.063636 0.01760 0.01760
1982:4 8.042249 8.081935 0.01830 0.01830
1983:1 8.062685 8.100623 0.01869 0.01869
1983:2 8.091627 8.119528 0.01891 0.01891
1983:3 8.115700 8.138554 0.01903 0.01903
1983:4 8.140811 8.157646 0.01909 0.01909
Rozdziału 21
Cointegration i Skorygowanie Błędu Wektora Modeluje
21.1 Wprowadzenia pojęcia bliźniaka cointegration i skorygowania błędu narysowały dużo uwagi wewnątrz macroeconometrics tu niedawne lata. Atrakcja Modelu Skorygowania Błędu Wektora (VECM) jest, że to pozwala pracownikowi naukowemu wbić reprezentację ekonomicznych eąuilibrium relacji w stosunkowo bogatej specyfikacji czas serii. To podejście pokonuje starą dychotomię być-pomiędzy () strukturalne modele tak wiernie reprezentowały makroekonomiczny teorię ale zawiodły pasować dane i (b) czas serie modeluje to dokładnie został uszyty do danych ale trudny, jeżeli nie impos-sible zinterpretować w ekonomicznych okresach.
basie pomysł cointegration wykazuje blisko pojęcia korzeni części (widzą sekcję 20.3). Sup poza, która mamy zbiór makroekonomiczny zmiennych zainteresowania i znajdujemy, że nie możemy odrzucić hypoth-esis tak trochę tych zmienne, rozważony indywidualnie, są bzy --stacjonarne. Szczególnie sądzimy osądzić, że podzespół zmiennych są indMdually zintegrowanym porządku 1 lub 1(1). To jest, kiedy oni są bzy --stacjonarni w ich poziomach, ich pierwsze różnice są stacjonarne. Podany statystyczne problemy związane z analizą bzów --stacjonarnych danych (na przykład, groźba podrobionej regresji)tradycyjne podejście w tym przypadku miało wziąć najpierw różnicami wszystkich zmiennych przed kontynuowaniem analizę.
Ale to może doprowadzić do straty ważnej informacji. To może być tę chwilą zmienne w ąuestion są 1(1) kiedy wzięty indMdually, tam egzystuje linearne połączenie zmiennych to jest stacjonarny nie odróżniając lub 1(0). (Mogłoby być więcej niż jednym takim linearnym combination.) To jest, kiedy zespół zmiennych może być “uwolnić, by powędrować” ponad czasem, niemniej jednak zmienne są “związane razem” w pewnych sposobach. I to może być możliwe, by zinterpretować te więzi lub cointegrating wektory, jako reprezentowanie eąuilibrium warunków.
Na przykład sądzimy my znajdują, że kilku lub wszyscy następne zmienne są 1(1): towar pieniędzy, M, poziom ceny, P, nominalna stopa procentowa, R i przetworzyć, Y. According do teorii standardu popytu na pieniądze, niemniej jednak oczekujemy tam być eąuilibrium relacją między prawdziwymi bilansami, stopą procentową i przetwarzamy; na przykład
m - p = Yo + Yiy + YiT y \ > 0, y2 < 0, gdzie imiona zmiennej niższego przypadku oznaczają kloce. Wewnątrz eąuilibrium, wtedy,
m- p - Yiy - yiv = yo
Realistycznie, nie powinniśmy oczekiwać tego układają się, by być zadowolony każdy okres. Musimy uwzględnić możliwość krótki bieg diseąuilibrium. Ale, jeżeli ruchy systemu tylne do eąuilibrium following zakłócenie, to następuje tak wektor x = (m, p, y, r)' jest związany cointegrating wektor j6' = { j8i, ($2, p3, J84), taki tak { 3'x jest stacjonarny (z środkiem yo). Ponadto, jeżeli eąuilibrium poprawnie jest scharakteryzowany przez prosty model powyżej, mamy {$ 2 = -j8i, J63 < 0 i /?4 > 0. Te rzeczy są testem zdolny w kontekście cointegration analizy. są typowo trzy kroki wewnątrz ten rodzaj analizy:
Przeprowadzić
badania, by określić numer cointegrating wektorów, cointegrating zjełczałego systemu.
Ocena VECM z odpowiedni zjełczały, ale zależny do nie dalsze restrykcje.
156
Rozdziału 21. Cointegration i Modele Skorygowania Błędu Yector
157
3. Sonda interpretacja cointegrating wektorów jako eąuilibrium układa się około znaczy restrykcji dalej elementy tych wektorów. następne sekcje rozszerzają dalej każdy z tych punktów, dawanie dalszych ekonometrycznych szczegółów i wyjaśniają jak wprowadzić w życie używanie analizy gretl.
21.2 Modeli Skorygowania Błędu Wektora jako reprezentacja cointegrated systemu
Rozważa VAR porządek p z deterministic część podaną, około [xt (typowo, wielomian w samą porę). To może napisać n-variate proces yt jako
yt = Ht + Aiyt-ja + A2yt-2 + ■ ■ ■ + Apyt-P + et (21.1)
Ale odtąd yt- \ = yt- Ayt i yt-ja = yt-ja - (Ayt-ja + Ayt-2 + ■ ■ ■ + Ayt-ja + ja), możemy odnośnie-pisać
powyższych jako
v- \
Ayt = Ht + nyt-ja + ^ TiAyt-ja + et, (21.2)
dokąd n = Zf = 1 M i Ifc = - Sf = k- ^ t- To jest VECM reprezentacja (21.1). interpretacja (21.2) liczy szczególnie r, szereg macierz n.,
Jeżeli r = 0, procesy są zupełnie 1(1) i nie cointegrated.
Jeżeli r = n, wtedy n jest invertible i procesy są zupełnie 1(0).
Cointegration występuje pośrodku, kiedy 0 < r < n i n może zostać napisany jako { 3'. Wewnątrz to przypadek, yt jest 1(1), ale połączenie zt = { 3'yt jest 1(0). Jeżeli, na przykład, r = 1 i pierwszy element j6 był -1, wtedy można, by napisać zt = -yi, t + & 2j2, t + ■ ■ ■ + pnyn, t, który jest równoważny mówieniu tak
Vii, = & 2j2, t + ■ ■ ■ + & njn, t ~ Zt
jest długo biegnie eąuilibrium relacja: odchylenia zt nie może być 0 ale oni są stacjonarni. Wewnątrz to przypadek, (21.2) może zostać napisany jako p-ja
Ayt = Ht + <* P'yt-ja + X TiAyt-ja + et. (21.3)
Jeżeli j6 byłby znany, wtedy zt byłby dostrzegalny i zupełnie pozostałe parametry mogłyby zostać oszacowane przez OLS. w praktyce, postępowanie oceny j8 pierwszy i wtedy reszta. szereg n jest zbadany około licząc eigenvalues blisko związanego macierzy zjełczały jest tym samym jako II: jakkolwiek, to macierz jest około konstrukcja symetryczna i pozytywna semidefinite. Jak conseąuence, zupełnie jego eigenvalues są prawdziwy i nieujemny i testy dalej szereg II może, dlatego zostać niesiony około przeprowadzając badania jak wiele eigenvalues jest 0.,
Jeżeli zupełnie eigenvalues jest znacząco inny niż 0, wtedy zupełnie procesy są stacjonarne. Jeżeli, przeciwnie, jest co najmniej jeden zerowy eigenvalue, wtedy yt proces jest zintegrowany, chociaż trochę linearne połączenie fł'yt mógłby być stacjonarny. W innym ekstremalnym, jeżeli żaden eigenvalues jest znacząco inny niż 0, wtedy nie tylko jest procesem yt bez --stacjonarny, ale to sam trzyma się, ponieważ trochę linearne połączenie fł'yt; innymi słowy, żaden cointegration występuje.
Oszacowanie typowo przychód w dwóch sceny: pierwszy, seąuence testów jest przebiegany, by określić r, cointegration zjełczały. Wtedy, ponieważ podany szereg parametry w eąuation (21.3) jest oszacowany. dwa rozkazy tak gretl oferty, ponieważ szacowanie ci systemy są coint2 i vecm, odpowiednio. składnia dla coint2 jest
coint2 p ylist, [ ; xlist, [ ; zlist, ] ] Modele Skorygowania Błędu
Rozdział 21. Cointegration i Yector
158,
gdzie jest p numerem opóźnień wewnątrz (21.1); ylist jest listą zawierającą yt zmienne; xlist jest opcjonalnym wykazem exogenous zmiennych; i zlist jest innym opcjonalnym wykaz exogenous zmiennych, który są efekty założone, by być ograniczone do cointegrating relacje. składnia dla vecm jest
vecm p r ylist, [ ; xlist, [ ; zlist, ] ]
gdzie jest p numerem opóźnień wewnątrz (21.1); r jest cointegration zjełczałym; i listy ylist, xlist i zlist ma tę sam interpretację jako w coint2.
Zarówno może rozkazom dano określone opcje, by poradzić leczenie deterministic konkurs nent, [xt- Ci są dyskutowani w następnej sekcji.
21.3 Interpretacja deterministic komponenty
Statystyczne wniosek wewnątrz kontekst cointegrated system zależy od hipotez to jest skłonny zrobić dalej deterministic okresy, które prowadzi do sławnych “pięć przypadki” .Wewnątrz eąuation (21.2), okres, [xt zwykle jest zrozumiany, by wziąć formę,
[xt = l ^ och + * ja ' t.
Wewnątrz zamówić, by mieć model mimie tak dokładnie jak możliwy cechy przestrzeżonych danych, jest wstępny ąuestion, by osiąść. Zrobić dane wydają się podążyć deterministic trend? Jeżeli tak, jest tym linearnym lub ąuadratic?
Gdy tylko to jest założony, należano narzucić restrykcje dalej /^ och i ^\ to są zgodny z tym ocena. na przykład, sądźmy tak dane nie wystawiają dostrzegalnego trendu. To środki tak Ayt jest średnio zerowy, więc to jest rozsądny założyć tak jego oczekiwało wartość jest również zerowym. Napisać eąuation (21.2) jako
T(L)Ayt = Hej + H \ ■ t + azt-ja + et, (21.4)
gdzie zt = { 3'yt jest założony, by być stacjonarny i, dlatego posiadać ograniczone momenty. Biorące bezwarunkowe oczekiwanie, dostajemy
0 = żaden + Cześć ■ t + amz.
Od lewa strona nie zależy od t, restrykcji ^\ = 0 jest bezpiecznym zakładem. Jak, ponieważ ^ q, są tylko dwa sposoby zrobienia powyższego wyrażenia prawdziwego: albo ^ q = 0 z mz = 0 lub ^ q eąuals -amz. ten ostatnia możliwość jest mniej restrykcyjny w tak wektor ^ q może być bzem --zerem, ale jest ograniczony, by być linearne połączenie kolumien z a. Wewnątrz tak przypadek, ^ q może zostać napisany jako ■ c i można, bym napisać (21.4) jako
Y(L)Ayt = [f >' c,]\ + et. dlatego też długo biegnie relacja zawiera przejąć. To typ restrykcji zwykle jest napisany
a'j_ £/ och = 0, gdzie ± jest lewy nuli przestrzenią macierzy a. intuicyjne zrozumienie zagadnienia może zostać zyskane przez znaczy prostego przykładu. Rozważyć serie xt, który zachowuje się, następująco
xt = m + xt-ja + £ t,
gdzie jest m naprawdę numeruj i et jest biały hałas procesem: xt jest wtedy przypadkowy spacer z prądem m. W specjalnej okoliczności m = 0, prąd znika i xt jest czystym przypadkowym spacerem.
Rozważyć teraz inny proces yt, zdefiniowany około
yt = k + xt + Skorygowanie Błędu ut
Rozdział 21. Cointegration i Yector Modeluje
159,
gdzie, znów, k jest naprawdę numeruj i ut jest biały hałas procesem. Odtąd ut jest stacjonarny przez definicję, xt i yt cointegrate: to jest, ich różnica
zt = yt - xt = k + ut
jest stacjonarnym procesem. Dla k = 0, zt jest prosty zerowy-znaczyć biały hałas, podczas gdy, ponieważ k = 0 proces zt jest biały hałas z bzem --zerowym środek.
Potem trochę prostymi substytucjami, dwoma eąuations powyższy może zostać reprezentowany jointly jako VAR(1) system,
[
yt ~\ [ k + m 1, [ 0 lir yt-ja 1 r ut + f t 1
= + +
lub wewnątrz VECM forma
xt łn ^ ja Xt ~ 1 £ t
ja" byt 1
Axt,
[
to + m ~ ja ja yt-ja ^ t + f 1
+ + =
m J |_ 0 0 xt-ja J £ t,
[
fc + łnl, [-lir -jeżeli 3 / t_i 1 f wt + £ t 1
+ 1 -1 +
m J ° xt-ja stopa
+ # 7t = > l / och + oczt-1 + rjt,
= żaden + «p
* t-ja,
gdzie jest p cointegration wektor i jest “ładowanie” lub “dostosowanie” wektorem. Jesteśmy teraz gotowy rozważyć trzy możliwy przypadki:
m ± 0: Wewnątrz to przypadek xt jest dążony, jako my tylko piła; to następuje tak yt również podążanie linearny trend, ponieważ średnio to pozostaje w ustalonej odległości k od xt. wektor ^ q jest swobodny.
m = 0 i k = 0: Wewnątrz to przypadek, xt nie jest dążony i jako conseąuence żaden z dwóch nie jest yt. Jakkolwiek, środek odległość pośrodku yt i xt jest bzem --zerowym. wektor / aq jest dany przez
1. ^ och =
[
k 1 0,
który jest, nie nuli i, dlatego VECM pokazany powyżej naprawdę ma stały okres. stała, jakkolwiek, zależy od restrykcji tak jego drugi element musi być 0. Więcej ogólnie, / aq jest wielokrotnością wektora a. Zauważyć tak VECM mógłby również zostać napisany jako
Ayt -Ir , 1 ut + £ t
= 1 -1 -fe xt-ja +
które łączy się przejąć do cointegration wektora. To jest znany jako “ograniczona stała” przypadek.
3. m = 0 i k = 0: Ten przypadek jest najbardziej restrykcyjnymi: oczywiście ani xt ani yt nie jest dążony i odległość środka między nimi jest zerem. Wektor ^ q jest również 0, który wyjaśnia, dlaczego ten przypadek jest odesłany do jako “żadna stała.”
W większości wypadków, wybór pośrodku te trzy możliwości jest oparty dalej mieszaniną z empirycznym obser-vation i ekonomiczne rozumowanie. Jeżeli zmienne pod rozważaniem wydają się podążyć linearny trend wtedy, nie powinniśmy umieścić jakiejś restrykcji na przejąć. Inaczej pytanie powstaje, z czy to ma sens, by wyszczególnić cointegration relację, która zawiera bez --zero przejmują. Jeden były duży, gdzie to jest odpowiedni jest relacją między dwoma stopami procentowymi: ogólnie ci nie są dążeni, ale VAR mógłby nadal mieć przejąć, ponieważ różnica między dwoma (Rozdział 21. Cointegration i Modele Skorygowania Błędu Yector
160
“stopa procentowa rozpostarła się”) mógłby być stacjonarny dookoła bzu --zera znaczą (na przykład, z powodu ryzyka lub liąuidity premii).
Poprzedni przykład może zostać uogólniony w trzech kierunki:
Jeżeli VAR porządku większego niż 1 jest rozważony, algebra dostaje się bardziej coiwoluted ale wnioski są identyczne.
Jeżeli VAR zawiera więcej niż dwie endogeniczny zmienne, cointegration szereg r może być większy niż 1.. Wewnątrz ten przypadek, jest macierzą z r kolumnami i przypadkiem z ograniczonymi stałymi majoratami restrykcja tak po powinien być trochę linearne połączenie kolumien z a.,
Jeżeli linearny trend jest włączony do modelu, deterministic części VAR zostaje po + [X \ t. rozumowanie jest praktycznie to sam jak powyższe, chyba że tak skupienie teraz scentrować dalej, [X \ niż, [Xq. odpowiednik do “ograniczonej stała” przypadek dyskutował powyższy jest “ograniczonym trend” przypadkiem, takim tak cointegration relacje zawierają trend ale pierwszy różnice zmiennych w ąuestion nie robi. W przypadku swobodnego trendu, trend wydaje się zarówno w cointegration relacjach, jak i w pierwszym różnice, które odpowiada obecności ąuadratic trend w samych zmiennych (w poziomach).
Wewnątrz zamów, by wyświadczyć przysługę pięć przypadki, gretl dostarcza następne opcje do coint2 i vecm rozkazów:
\ opis flagi opcji xt
0 --nc żaden stały
Po, '± po = 0 --rc ograniczony stała < och zaniedbanie swobodne stałe
Po + [X \ t, '± pi = 0 -crt stały + ograniczony trend
l ^ och + * ja t --et stały + swobodny trend
Notatka tak dla tego rozkazują, że powyższe opcje są wzajemnie wyłączne. Ponadto, masz opcję używania -sezonowe opcje, ponieważ powiększając pt z scentrować sezonowe smoczki. Wewnątrz każdy przypadek, p wartości są policzone przez przybliżenia około Doornik (1998).
21.4 Johansen cointegration testuje dwa Johansen testy, ponieważ cointegration jest użyty, by założyć szereg j8; innymi słowy, jak wiele cointegration wektory system ma. Ci jest “A maksimum” test, dla hipotez dalej indi-vidual eigenvalues i “ślad” test, dla łącznych hipotez. Sądzić tak eigenvalues Aj jest uporządkowany od największego do najmniejszego. nuli hipoteza dla “A maksimum” przeprowadzają badania dalej ja th eigenvalue jest tak Af = 0. odpowiedni ślad test, zamiast tego, rozważa hipotezę Aj = 0 dla zupełnie j > i. gretl rozkaz coint2 wykonuje tych dwa testy. odpowiednie menu wejście wewnątrz GUI jest “Model, Czas Seriami, Cointegration Testem, Johansen”.
Jako wewnątrz ADF test, asymptotyczna dystrybucja testów zmienia się z deterministic składowym Pt, który to włącza do VAR (zobacz sekcję 21.3 powyższy). następny kod używa Danii plik danych, dostarczony z gretl, do repliki Johansen's znalezisko przykładu wewnątrz jego 1995 książka.
otwarta Dania
coint2 2 LRM LRY IBO IDE --rc --sezonowy
Wewnątrz to przypadek, wektor yt wewnątrz eąuation (21.2) obejmuje cztery zmienne LRM, LRY, IBO, IDE. numer opóźnień eąuals p wewnątrz (21.2) (to jest, numer opóźnień modelu napisanego VAR forma). Część produkcji jest doniesiona pod: Modele Skorygowania Błędu
Rozdział 21. Cointegration i Yector
161
Johansen test:
bardziej
Zdrętwiały wyrównania = 4
Opóźnienie porządek = 2
Oszacowanie okres: 1974:3 - 1987:3 (T = 53)
Przypadek 2: Ograniczony stały
Zjełczały Eigerwalue Ślad test p wartość Lmax test p wartość
0.43317 49.144, [0.1284,] 30.087, [0.0286,]
0.17758 19.057, [0.7833,] 10.362, [0.8017,]
0.11279 8.6950, [0.7645,] 6.3427, [0.7483,]
3 0.043411 2.3522, [0.7088,] 2.3522, [0.7076,]
Zarówno ślad, jak i A maksimum testy akceptują nuli hipoteza tak najmniejszy eigenvalue jest 0 (zobacz ostatni rząd stołu), więc możemy konkludować tak, że serie są faktycznie bzy --stacjonarne. Jakkolwiek sonie linearny połączenie może być 1(0), odtąd A maksimum test odrzuca hipotezę tak szereg n jest 0 (chociaż ślad test daje mniej wyraźny dowód na to, z p wartością 0.1284).
21.5 Identyfikacja cointegration wektory rdzeń problem wewnątrz oszacowanie eąuation (21.2) jest, aby znaleźć ocenę II, które ma około, oszustwo struction zjełczały r, więc to może zostać napisane jako II = ap', gdzie jest p macierzą zawierającą cointegration wektory i zawiera “dostosowanie" lub “ładowanie” współczynniki zgodnie, z którym endogeniczny koślawości ables odpowiada na odchylenie od eąuilibrium w poprzednim okresie.
Na
zewnątrz dalsza specyfikacja, problem ma wielokrotne rozwiązania (faktycznie, nieskończenie dużo). parametry i p poniżej zidentyfikowany: jeżeli zupełnie kolumny p są cointegration wektory, wtedy trochę arbitralne linearne połączenia tych kolumny jest cointegration wektor także. położyć to różnie, jeżeli II = aop'0 f ° r określony macierze «och i po, wtedy II również eąuals (< xoQ)(Q-1p'0) f ° r trochę dostosowuje zdolny bez --pojedynczą macierz, która Q. In zamawia, by znaleźć uniąue rozwiązanie, to jest, dlatego konieczne narzucić się trochę restrykcje dalej i / lub s. To może zostać pokazane że numer minimum restrykcji to jest konieczny, by gwarantować identyfikacja jest r2. Normalizując jeden współczynnik na kolumnie do 1 (lub -1, zgadzając się, by spróbować) jest trywialny pierwszy krok, który również pomaga, w że pozostałe współczynniki mogą zostać zinterpretowane jako parametry w eąuilibrium relacjach, ale to tylko wystarcza kiedy r = 1..
Metoda, której gretl używa, domyślnie być znany jako “Filip normalizacja”lub “trójkątna reprezentacja”.1 które punkt początkowy pisze p w dzielonej formie jako wewnątrz
pi
P2,
[Pi 1 f > 2,
gdzie jest stopa r x r macierzą i p2 jest (n - r) x r. Arogancki to pi ma fuli szereg, p może po -mnożony około P-1, dawanie
ja ja
ja =
P2P1 -B
r ja ja r ja
p
-B współczynniki tak gretl produkuje są p, z B znanym jako macierz swobodnych współczynników. Pod względem podlegania eąuilibrium relacja, Filip normalizacja wyraża system
^ lub porównanie z innym nauki, możesz zechcieć znormalizować /? różnie. Używając zbiór rozkaz możesz ustawić vecm_norm linię ukośną do wybrany normalizacja tak po prostu skale kolumny oryginału /? taki tak / Jy = 1, ponieważ ja = j i ja < r, jak używany w empirycznej sekcji Boswijk i Doornik (2004). Inny alternatywny jest ustawiony vecm_norm pierwszy, który skale /? taki tak elementy na pierwszym rząd eąual 1., By znieść normalizację zupełnie, użycie ustawiło vecm_norm żaden. (wrócić do zaniedbania: zbiór vecm_norm Filip.)
Chapter21. Modele Skorygowania Błędu Cointegration i Wektora 162 r eąuilibrium relacje
jako
yi, t = Ł?l, r + l3V + l, t + ■ ■ ■ + vitnyn, t yi, t = & 2, r + iyr + l, t + ■ ■ ■ + L > 2, nyn, t
Vr , t - Ł?r, r + l3V + l, t + ■ ■ ■ + Vy \ nyr, t,
gdzie pierwszy r, który zmienne są wyrażone jako funkcje pozostałego n -r.,
Chociaż trójkątna reprezentacja zapewnia tak, statystyczny problem szacowania j8 jest rozwiązany, wynikanie eąuilibrium relacje mogą być trudne, by zinterpretować. Wewnątrz to przypadek, użytkownik może zechcieć osiągnąć identyfikację około wyszczególniając ręcznie system r2 ograniczenia tak gretl używane, by doprowadzić do oceny j8. jako przykład, rozważyć pieniądze żądanie, które system wystąpił w przekroju 9.6 Verbeek (2004). zmienne używane są m (kloc pieniędzy kruszcowych towar Ml), infl (inflacja), cpr (weksel handlowy tempo), y (kloc prawdziwego GDP) i tbr (tempo rachunku Skarb Państwa).2
Oszacowaniem j8 może zostać wykonany przez rozkazy
otwarte money.gdt
smpl 1954:1 199 4:4
vecm 6 2 m infl cpr y tbr --oceny prawdopodobieństwa
Maksimum lektur rc
i związanej porcji produkcji, obsen / ations 1954:1-1994:4 (T = 164) Cointegration zjełczały = 2 Przypadek 2: Ograniczony stałą
ocenę
dobra (cointegrating wektory, standard błędy w nawiasach)
m 1.0000 0.0000
(0.0000) (0.0000)
infl 0.0000 1.0000
(0.0000) (0.0000)
cpr 0.56108 -24.367
(0.10638) (4.2113)
y -0.40446 -0.91166
(0.10277) (4.0683)
tbr -0.54293 24.786
(0.10962) (4.3394)
const -3.7483 16.751
(0.78082) (30.909)
Interpretacja współczynników cointegration macierz f > byłby łatwiejszy, jeżeli znaczenie mogłoby być przymocowane do każdego z jego kolumny. To jest możliwy przez hypothesizing istnienie dwóch długi bieg relacje: pieniądze żądanie eąuation
m = ci + jSiinfl + /^ y + j63tbr
i ryzyko premia eąuation
cpr = C2 + / M nfl + /?5y + zbiór danych 2This jSetbr jest dostępny w verbeek dane paczka; zobaczyć http://gretl.sourceforge.net/gret! _data.html. < http://gretl.sourceforge.net/gretl_data.html > Modelami Skorygowania Błędu
Rozdziałem 21. Cointegration i Yector
163,
które sugerują tak, cointegration macierz może zostać znormalizowana jako
P =
-1
Pi 0
p2
0
p4 -1
Ps
p3 P &
C \ C2
Tym procedura renormalizacją może zostać skończona przez znaczy restri et rozkaz, do zostać dany po vecm rozkazie lub, w graficznej powierzchni międzyfazowej, około wybierając “Test, Linearny Restrykcje” menu wejście. składnia dla stawania do restrykcji powinna być dość oczywisty:3
restri et
b,[l, l,] = -1
b,[l, 3,] = 0
b,[2,1,] = 0
b,[2,3,] = -1 koniec ogranicza,
które doprowadza do
Cointegrating wektory (błędy standardu w nawiasach)
m
infl
cpr
y
tbr
const
-1.0000 (0.0000) -0.023026 (0.0054666) 0.0000 (0.0000) 0.42545 (0.033718) -0.027790 (0.0045445) 3.3625 (0.25318)
0.0000 (0.0000) 0.041039 (0.027790) -1.0000 (0.0000) -0.037414 (0.17140) 1.0172 (0.023102) 0.68744 (1.2870)
21.6 Tu identyfikujący restrykcje
Jeden cel narzucania VECM restrykcje system jest po prostu, by osiągnąć identyfikację. Jeżeli ci restrykcje są po prostu normalizacjami, oni są przeprowadzać badania zdolny i powinien mieć żaden nie powoduje dalej maksimum imized prawdopodobieństwa. Ponadto, jakkolwiek, można, bym zechciałby sformułować ograniczenia dalej j8 i / lub to wywodzą się z teorii ekonomiczne podlegającej eąuilibrium relacje; rzeczowe restrykcje tego rodzaju są wtedy testem zdolny przez dane prawdopodobieństwo stosunku.
Gretl potrafi przeprowadzające badania ogólne linearne restrykcje formy
Rbvec {(3) =
(21.5)
i / lub
Ravec() = 0
(21.6)
Notatka tak j8 restrykcja może być bez --homogeniczny ( =/= 0) ale restrykcja musi być homo geneous. Nieliniowe restrykcje nie są poparte i żadni z dwóch nie są restrykcje, które krzyżują pośrodku,
3Note tak wewnątrz to kontekstowy zginamy zwykły wskazanie macierzy coiwention, używając wiodący indeks, by odnosić z /? (szczególny cointegrating wektor). To jest praktyka standardu wewnątrz literatura i dający się obronić o ile, ponieważ to jest kolumny z /? (cointegrating relacje lub eąuilibrium błędy) które są pierwszorzędowego zainteresowania.
Rozdział 21. Cointegration i Modele Skorygowania Błędu Yector
164
0 i a. Wewnątrz przypadek, gdzie r > 1 taki restrykcje mogą być wspólnie przez zupełnie kolumny 0 (lub) lub może być określony do pewnych kolumien tych macierze. To przedstawia się tak dyskutował wewnątrz Boswijk (1995) i Boswijk i Doornik (2004, sekcja 4.4). restrykcjami (21.5) i (21.6) może zostać napisany wewnątrz wyraźną formę jako
vec(0) = H 4 > + hej (21.7)
i
vec(«') = Gip (21.8)
odpowiednio, gdzie { p i > p jest wolny parametr wektory związane z 0 i odpowiednio. Możemy odnosić wspólnie jako 6 (kolumna wektor utworzył się około powiązując 4 > i ip). Cretl używa to reprezentacja wewnątrz kiedy testując restrykcje.
Jeżeli wykaz restrykcji to jest minięty do restri et rozkaz zawiera więcej ograniczenia niż konieczny, aby osiągnąć identyfikację, wtedy LR test jest wykonany; ponadto, restri et command może zostać dany -fuli witka, wewnątrz, które przypadek fuli oceny, ponieważ ograniczony system jest drukowany (w tym lf okresy)i system w ten sposób ograniczył staje się “aktualny model” w celach dalszych testów. W ten sposób jesteś przeprowadzać w stany carry łączne testy, jak wewnątrz Rozdział 7 Johansen (1995).
Składnia fuli składnia dla wyszczególniania restrykcja jest rozszerzenie tego zilustrowała w poprzedniej sekcji. Wewnątrz restri et... koniec restri et blok, ważny stwierdzenia są formy
parametr linearny połączenie = skalar,
gdzie parametr linearny połączenie obejmuje obciążona suma indMdual elementy 0 lub (ale nie zarówno wewnątrz to sam połączenie); skalar na prawej stronie musi być 0, ponieważ combina-tions obejmując «, ale może być trochę naprawdę numerować dla połączeń obejmujących 0. Poniżej, dajemy kilka przykładów ważnych restrykcji:
b,[l, l,] = 1.618
b,[l, 4,] + 2 * b,[2,5,] = 0,[l, 3,] = 0,[l, 1,] - [l, 2,] = 0 specjalna składnia jest zarezerwowana, ponieważ przypadek kiedy pewne ograniczenie powinno zostać stosowane do zupełnie kolumny 0: wewnątrz to przypadek, jeden, który indeks jest dany, ponieważ każdy b okres i sąuare nawiasy są upuszczone. Odtąd, następna składnia
restri et
bl + b2 = 0 koniec ogranicza
odpowiada
0 =
P11 P21
011 "021
013 023
P14 P24 to sam, które konwencja jest użyta, ponieważ «: kiedy tylko jeden, który indeks jest dany, ponieważ każdy okres, restrykcja jest przypuszczona, by odnieść się do zupełnie r rzędy z «lub innymi słowy podane zmienne są słabo exogenous. na przykład, Modele Skorygowania Błędu sformułowanie
Rozdział 21. Cointegration i Yector
165
restri et
a3 = 0
a4 = 0 koniec ogranicza
wyszczególnia tak zmienne 3 i 4 nie odpowiada na odchylenie od eąuilibrium w poprzednim okresie.
W
końcu, skrót jest dostępny dla ustawiania w górze złożonego restrykcje (ale aktualnie tylko w odniesieniu do j6): możesz wyszczególnić Rb i, jako wewnątrz ja?ja, vec(j6) =, około dając imiona z poprzednio zdefiniowany macierze. na przykład,
macierz 14 = 1(4) macierz vR = I4 **(I4 ~ zera(4,1)) macierz vq = mshape(I4, 16, l) restri et
R = vR
q = vq koniec ograniczyć,
które ręcznie narzuca j8 ocenom Filip normalizację, ponieważ system z cointegrating zjełczałym 4. przykład
Marka i Cassola (2004) proponuje pieniądze wymagać system dla Euro obszaru, wewnątrz, które oni postu-późno trzy długi bieg eąuilibrium relacje: żądanie
pieniędzy m = pil + { 3yy
Wędkarz eąuation n = { fil
Oczekiwanie teoria l = s stopy procentowe,
gdzie jest m żądaniem pieniędzy kruszcowych, l i 5 są długi- i tymczasowe stopy procentowe, y jest przetworzony i tt jest inflation.4 { imiona dla tych zmienne w gretl plik danych są m_p, rl, rs, y i infl, odpowiednio.) cointegration szereg założony przez autorów jest 3 i są 5 zmiennych, dając 15 elementów w j8 macierzy. 3x3 = 9 restrykcji jest reąuired dla identyfikacji i tylko zidentyfikowany system miałby 15-9 = 6 wolny parametry. Jakkolwiek postulowane relacje długiego biegu prezentują tylko trzy wolne parametry, więc szereg tu-identyfikacji jest 3..
Przykład 21.1 repliki Stołu 4 na stronie 824 Marki i Cassola article.5 Notatki, że używamy $ lnl accessor po tym, jak vecm rozkazuje, by zgromadzić swobodne kloc prawdopodobieństwo i $ rlnl accessor po restri et dla jego ograniczonego odpowiednika.
Przykład kontynuuje wewnątrz scenariusz 21.2, gdzie wykonujemy dalsze testowanie, by sprawdzić, czy () elastyczność dochodu w żądanie pieniędzy eąuation jest 1 (j6y = 1) i (b) Wędkarz relacja jest homo geneous {(fi = 1). Odtąd --fuli witka podana do początkowego ograniczają rozkaz, dodatkowe restrykcje mogą być stosowane na zewnątrz musząc powtarzając poprzedni. (drugi scenariusz zawiera kilka printf rozkazów, które nie są ściśle konieczne, do formatu produkcja ładnie.) To obraca się, że zarówno dodatkowych hipotez jest odrzucony około danymi, z p wartościami 0.002 i 0.004.
4 tradycyjne sformułowanie Wędkarz eąuation odwróciłoby role zmiennych w drugim eąuation, ale ten szczegół jest nieistotny w obecnym kontekście; ponadto, teoria oczekiwania stóp procentowych sugeruje tak, że trzecia eąuilibrium relacja powinna zawrzeć stała dla liąuidity premii. Jakkolwiek, od wewnątrz ten przykład system jest estimated ze stałym okresem swobodnym, liąuidity premia dostaje się zlał się wewnątrz system przejmują i znika od zt-
5Modulo, który co wydaje się być kilku błędów maszynowych w artykule. Modele Skorygowania Błędu
Rozdział 21. Cointegration i Yector
166
Przykład 21.1: Oszacowanie pieniędzy wymagają systemu z ograniczeniami dalej fi
Wejście:
otworzyć brancLcassola.gdt
# wykonać kilka transformat!ons
m_p = m_p * 100
y = y * 100 infl = infl / 4 rs = rs / 4 rl = rl / 4
# powielić stół 4, stronę 824
vecm 2 3 m_p infl rl rs y -q
genr 110 = $ lnl
ogranicza --fuli
b,[l, 1,] = 1
b,[l, 2,] = 0
b,[l, 4,] = 0
b,[2,1,] = 0
b,[2,2,] = 1
b,[2,4,] = 0
b,[2,5,] = 0
b,[3,1,] = 0
b,[3,2,] = 0
b,[3,3,] = 1
b,[3,4,] = -1
b,[3,5,] = 0
koniec ogranicza
genr 111 = Srlnl
Częściowy produkcja:
Swobodny loglikelihood (lu) = 116.60268 Ograniczył loglikelihood (lr) = 115.86451 2 * (lu - lr) = 1.47635 P(Chi Kwadratowy(3) > 1.47635) = 0.68774
ocena
dobra (cointegrating wektory, standard błędy w nawiasach)
m_p 1.0000 0.0000 0.0000
(0.0000) (0.0000) (0.0000)
infl 0.0000 1.0000 0.0000
(0.0000) (0.0000) (0.0000)
rl 1.6108 -0.67100 1.0000
(0.62752) (0.049482) (0.0000)
rs 0.0000 0.0000 -1.0000
(0.0000) (0.0000) (0.0000)
y -1.3304 0.0000 0.0000
(0.030533) (0.0000) (0.0000)
Rozdział 21. Cointegration i Yector Błąd Modele Skorygowania
167
Przykład 21.2: Dalsze testowanie pieniędzy wymagają systemu Wejście:
restri et
b,[l, 5,] = -1 koniec restriet genr ll_uie = Srlnl
restri et
b,[2,3,] = -1 koniec restriet genr ll_hfh = Srlnl
# stół repliki 5, strona 824
printf "Testując zerowy restrykcje w cointegration przestrzeń:\ n" printf " LR TEST, zjełczały = 3: chiA2(3) = % 6.4f, [% 6.4f,]\ n", 2 *(110-111), \ pvalue(X, 3, 2 *(110-111)elastyczność dochodu Części)
printf ": LR TEST, zjełczały = 3:\ n" printf " chiA2(4) = % g, [% 6.4f,]\ n", 2 *(110-1l_uie), \ pvalue(X, 4, 2 *(110-ll_uie))
printf "Homogeniczność wewnątrz Wędkarz hipoteza:\ n"
printf " LR TEST, zjełczały = 3: chiA2(4) = % 6.3f, [% 6.4f,]\ n", 2 *(110-1l_hfh), \ pvalue(X, 4, 2 *(110-ll_hfh))
Produkcja:
Testując zerowy restrykcje w cointegration przestrzeń:
LR TEST, zjełczały = 3: chiA2(3) = 1.4763, [0.6877,] Część dochód elastyczność: LR TEST, zjełczały = 3:
chiA2(4) = 17.2071, [0.0018,] Homogeniczność wewnątrz Wędkarz hipoteza:
LR TEST, zjełczały = 3: chiA2(4) = 15.547, [0.0037,]
Inny typ testu, który zwykle jest wykonany, jest “słabym exogeneity” test. Wewnątrz to kontekstowy, mówi się, że zmienna jest słaba exogenous, jeżeli zupełnie współczynniki na odpowiednim rzędzie wewnątrz macierz są zerowym. Jeżeli to przedstawia się tak, tak zmienna nie dostosowuje do odchyleń od trochę długo biegnie eąuilibria i może zostać rozważony autonomiczne kierowanie siła całości systemem. kod w Przykładzie 21.3 wykonuje to test dla każdego zmiennego kolejno, w ten sposób powielając pierwszy kolumna Stołu 6 dalej stronę 825 Marki i Cassola (2004). skutki pokazują tak, że słaby exogeneity mógłby może zostać zaakceptowany, ponieważ długotrwała stopa procentowa i prawdziwy GDP (p wartości 0.07 i 0.08 odpowiednio).
Identyfikacja i testability
Jeden punkt odnośnie VECM restrykcji, które mogą być zagmatwane najpierw, jest tę identyfikacją (restrykcja identyfikuje system?) i testability (test zdolny restrykcji jest?) są ąuite oddzielnymi sprawami. Restrykcje mogą identyfikować ale przeprowadzać badania zdolny; mniej oczywiście oni mogą być testem zdolny ale nie identyfikując.
To jest zobaczony ąuite łatwo w odniesieniu do systemu 1. Restrykcja /?ja = 1 identyfikuje (to przyciska skalę j8) ale, będąc czystym ważeniem, to nie przeprowadza badania zdolny. Z drugiej strony restrykcja j6i + {$ 2 = 0 jest testem zdolny - system z tym reąuirement narzuconym prawie na pewno będzie mieć niewysoko zmaksymalizowane prawdopodobieństwo - ale to nie identyfikuje; to nadal odchodzi otwierać skalę j8.
Powiedzieliśmy powyższy, że numer restrykcji musi eąual w najmniej r2, gdzie jest r cointegrating
Rozdziałem 21.. Cointegration i Modele Skorygowania Błędu Yector
168
Przykładu 21.3: Testowanie forweak exogeneity Wejście:
restri et al = 0 koniec restriet ts_m = 2 *(110 - Srlnl)
restri et a2 = 0 koniec restriet ts_p = 2 *(110 - Srlnl)
restri et a3 = 0 koniec restriet ts_l = 2 *(110 - Srlnl)
restri et a4 = 0 koniec restriet ts_s = 2 *(110 - Srlnl)
restri et a5 = 0 koniec restriet ts_y = 2 *(110 - Srlnl)
zrób
pętlę foreach ja m p 1 s y --cichy
printf "\ Delta < plik:/// Delta > $ ja \ t % 6.3f, [% 6.4f,]\ n", ts_ $ ja, pvalue(X, 6, ts_ $ ja) pętla końca
Produkcja (zmienna, LR test, p wartość):
\ Delta < plik:/// Delta > m 18.111, [0.0060,]
\ Delta < plik:/// Delta > p 21.067, [0.0018,]
\ Delta < plik:/// Delta > 1 11.819, [0.0661,]
\ Delta < plik:/// Delta > s 16.000, [0.0138,]
\ Delta < plik:/// Delta > y 11.335, [0.0786,]
zjełczały, dla identyfikacji. To jest konieczny i nie dostateczny warunek. Faktycznie, kiedy r > 1 to może być ąuite podstępnym, by ocenić, czy podany ustawiony restrykcji identyfikuje. Cretl używa metody sugerowanej przez Doornik (1995), gdzie jest identyfikacja oceniona przez szereg informacja mama trix.
To może zostać pokazane, że dla restrykcji rodzaj (21.7) i (21.8) macierz informacji ma ten sam szereg jak Jacobian macierz
J(9) = \ (Ip ® f >)G : ( ® IPl)H dostateczny warunek dla identyfikacji jest, że szereg J(6) eąuals numer wolnych para liczników. Szereg tej macierzy jest oceniony przez egzamin jego pojedynczych wartości w losowo wybranym punkcie w przestrzeni parametru. Dla praktycznych celów traktujemy ten warunek jak gdyby to byli zarówno konieczny i dostateczny; to jest, lekceważymy specjalne okoliczności, gdzie identyfikacja mogłaby zostać osiągnięta na zewnątrz ten warunek będący met.6
6See Boswijk i Doornik (2004, s. 447-8) dla dyskusji tego punkt.
Rozdział 21.. Cointegration i Modele Skorygowania Błędu Yector
169
21.7 Numeryczne metody rozwiązania
Ogólnie, ML kosztorysanta dla ograniczonego VECM problemu nie ma żadnego zamkniętego rozwiązania formy, odtąd maksimum musi zostać znalezione przez numeryczny methods.7 W jakiejś zbieżności przypadków może być trudny i gretl dostarcza kilka wyborów, by rozwiązać problem.
Przełączając i LBFGS
Dwie metody maksymalizacji są dostępne w gretl. Zaniedbanie jest algorytmem rozsyłania komunikatów w sieci określony w Boswijk i Doornik (2004). Alternatywa jest wariantem ograniczyłeś-wspomnienia BFGS algorytmu (LBFGS), używając analityczne pochodne. To jest odwołany używając -lbfgs flaga z ograniczyć rozkaz.
Algorytm rozsyłania komunikatów w sieci pracuje przez jawnie maksymalizowanie prawdopodobieństwo w każdym powtarzaniu, z spect do 4 >, ip i D. (macierz kowariancji reszt) kolejno. Ta metoda dzieli cechę z basie Johansen eigenvalues postępowaniem, mianowicie, to może poradzić zbiór restrykcji to w pełnych nie identyfikuje parametrów.
LBFGS z drugiej strony reąuires że model w pełnych być zidentyfikowany. Używając LBFGS, dlatego, możesz musieć uzupełnić restrykcje zainteresowania z normalizacjami, które służą zidentyfikować parametry. Na przykład można, by użyć wszystkiego lub części Filip normalizacji (widzą sekcję 21.5).
Ani algorytm rozsyłania komunikatów w sieci ani LBFGS nie jest gwarantowany, by znaleźć ML globalnego solution.8, który optymalizator może skończyć się w miejscowym maksimum (lub, w przypadku algorytmu rozsyłania komunikatów w sieci, w punkcie siodła).
Rozwiązanie (lub brak tamże) może być wrażliwy do początkowej wartości wybranej dla 6.. Domyślnie gretl wybiera punkt początkowy używający deterministic metodę opartą na Boswijk (1995), ale dwie dalsze opcje są dostępne: inicjacja może zostać dostosowana używanie symulowało wyżarzanie lub użytkownik może dostarczyć wyraźną początkową wartość dla 6..
Domyślna metoda inicjacji jest:
Obliczyć ML swobodnego j6 używającego Johansen postępowanie.
Jeżeli restrykcja dalej j8 jest bez --homogeniczny, użyć metody proponowanej około Boswijk (1995):
4 > och = -[(Ir ® P ±)'H,] + (Ir ® P ±)' hej (21.9)
gdzie j6'± j6 = 0 i + oznacza Moore-Penrose odwrotny A. Otherwise
4 > och = (H'H)~ 1H'vec((3) (21.10)
vec(j8o) = Hcfio + hej.
Obliczyć swobodny ML warunkowy dalej /?och, jako przez pośrednictwo Johansen: = SbijSo ^ ó ^ ii ^ och)-1 (21.11)
5.. Jeżeli jest ograniczony przez vec(«') = Gip, wtedy ipo = (G'G)~ 1G' vec(«') i vec(«Q) = Gipo.
7 wyjątek jest restrykcjami, które są homogeniczne, wspólne do wszystkiego, /? lub wszystko (w przypadek r > 1)i obejmij oba /? tylko lub tylko. Takie restrykcje są poradzone przez zmodyfikowaną eigenvalues metodę wyruszaną przez Johansen (1995). Rozwiązujemy bezpośrednio dla ML kosztorysanta, bez jakiejś potrzeby dla wielokrotnych metod.
TESTUJĄCE VECM udogodnienia 8fn rozwijającego się gretl's, które rozważyliśmy jasny numer “podstępnych przypadków” z różnych źródeł. Chcielibyśmy podziękować Luca Fanelli Uniwersytetu Bolonii i Sven Schreiber Frankfurtu Uniwersytetu Goethe dla ich pomocy w wymyślaniu tortury testów dla gretTs VECM kodu.
Rozdział 21.. Cointegration i Modele Skorygowania Błędu Yector
170
Alternatywnych metod inicjacji
Jako wspomniany powyżej, gretl oferuje opcję dostosowywania inicjacji używającej symulowany ing. To jest odwołany przez dodawanie --opcja drgania do ograniczyć rozkaz.
basie pomysł jest tym: zaczynamy się w pewnym punkcie w przestrzeni parametru i dla każdego z n powtarzania (aktualnie n = 4096) losowo wybieramy nowy punkt w pewnym promieniu poprzedniego jednego i określamy prawdopodobieństwo w nowym punkcie. Jeżeli prawdopodobieństwo jest wyższe, skaczemy do nowego punktu; inaczej skaczemy z prawdopodobieństwem P (i pozostać w poprzednim punkcie z prawdopodobieństwem 1 - P). Ponieważ powtarzanie przechodzą, system stopniowo “ochładza się” - to jest, promień przypadkowej perturbacji jest zmniejszony, jako jest prawdopodobieństwem robienia skoku, kiedy prawdopodobieństwo zawodzi do inerease.
W trakcie tego postępowania wiele punktów w przestrzeni parametru jest ocenionych, rozpoczynanie od punktu przybyło do przez deterministic metodę, którą chcemy cali 6q. Jeden z tych punktów będzie “najlepszy” w zmyśle wydawania najwyższego prawdopodobieństwa: cali to 6 *. Ten punkt może lub nie może mieć większego prawdopodobieństwa niż 6o. I postępowanie ma punkt końca, 9n, który może lub nie może być “najlepszy”.
Reguła mającą za sobą gretl w wybieraniu początkowej wartości dla 6 bazował dalej udawanym wyżarzającym jest tym: użyć 6 * jeżeli 6 * > 6o, inaczej użyć 6n. To jest, jeżeli dostajemy poprawę w prawdopodobieństwie przez wyżarzanie, sprawiamy, że fuli używa tego; z drugiej strony jeżeli zawodzimy dostać poprawę, niemniej jednak pozwalamy wyżarzaniu, by ustalić losowo punkt początkowy. Eksperymenty wskazywały, że ten ostatni efekt może być pomocny.
Oprócz wyżarzania, dalej alternatywny jest ręczną inicjacją. To jest zrobiony przez mijanie ukaranego grzywną przez prede wektora do rozkazu zbioru z parametr initvals, jako w
zbiór initvals myvec szczegóły liczą dalej czy to algorytm rozsyłania komunikatów w sieci czy LBFGS jest użyty. Dla rozsyłania komunikatów w sieci algo-rithm, są dwa opcje, ponieważ wyszczególniając początkowe wartości. Więcej user-friendly (dla większości ludzi, sądzimy) ma wyszczególnić macierz, która zawiera vec(j6) mający za sobą vec,(«). Na przykład
otwórz denmark.gdt
vecm 2 1 LRM LRY IBO IDE --rc --seasonals
macierz BA = { 1, -1, 6, -6, -6, -0.2, 0.1, 0.02, 0.03 } zbiór initvals BA restri et
b,[l,] = 1
b,[l,] + b,[2,] = 0
b,[3,] + b,[4,] = 0 końca ograniczają
W tym przykładzie - od Johansen (1995) - cointegration szereg jest 1 i są 4 zmienne. Jakkolwiek model zawiera ograniczony stały ( -rc flaga) żeby j8 miał 5 elementów. Macierz ma 4 elementy, jeden na eąuation. Tak macierz, jako która BA może zostać przeczytany
(Pi, p2, p3, p4, p5, «1, «2, «3, &) inna opcja, która jest obowiązkowy kiedy używający LBFGS, ma wyszczególnić początkowe wartości pod względem wolnych parametrów, { p i ip. Dostając temu prawu jest nieco mniej oczywisty. Jak wspomniany powyżej, restrykcja ukrytej formy Rvec {(3) = ma wyraźny forma vec(j6) = Hep + hej, gdzie H = R ±, właściwy nullspace R. The wektora { p jest krótszy, około numer restrykcji, niż vec(/$). użytkownik talentu wtedy będzie widzieć to, co potrzebuje, by zostać zrobiony. inny punkt, by wziąć do konta jest, że, jeżeli jest swobodny, efektywna długość ip jest 0, odkąd to jest wtedy optymalny policzyć używanie formułkę Johansen's, warunkową dalej j8 (eąuation 21.11 powyższy). przykład powyższy mógłby zostać przepisany jako:
otwarty denmark.gdt
vecm 2 1 LRM LRY IBO IDE --rc --seasonals
Rozdział 21. Cointegration i Modele Skorygowania Błędu Yector
171
macierz phi = {-8, -6 } zbiór initvals phi ogranicza --lbfgs
b,[l,] = 1
b,[l,] + b,[2,] = 0
b,[3,] + b,[4,] = 0 końca ograniczyć
Wewnątrz to bardziej ekonomiczne sformułowanie initializer wyszczególnia tylko dwa wolne parametry w 4 > (5 elementów wewnątrz j8 3 ujemne restrykcje). jest żaden cali dać wartościom dla ip odtąd jest swobodny.
Skala usunięcie
Rozważają prostsza wersja restrykcji dyskutowała w poprzedniej sekcji, mianowicie,
restri et
b,[l,] = 1
b,[l,] + b,[2,] = 0 końca ograniczają
Ta restrykcja obejmuje rzeczownik, test zdolny reąuirement - tak j6i i /?2 suma do zerowego - i normalizacja lub ważąc, j6i = 1. ąuestion powstaje, to mogłoby być łatwiejszy i bardziej godny zaufania zmaksymalizować prawdopodobieństwo na zewnątrz imponujący j6i = l?9, Jeżeli tak, moglibyśmy rejestrować tę normalizację, przenosić się to w celu maksymalizowania prawdopodobieństwo, wtedy reimpose to około ważenie skutku.
Niestety to jest nie możliwy do z góry, czy “usunięcie skali” tego rodzaju da skutecznościom, dla trochę szczególnego problemu oszacowania. Jakkolwiek, to naprawdę wydaje się, by przedstawić się tak bardziej częsty niż nie. dlatego też Gretl wykonuje usunięcie skali, gdzie wykonalne, chyba że
jawnie zabroniłbyś temu, około dając --nie ważąca flaga opcji do ograniczyć rozkaz; lub
dostarczyć określony wektor początkowych wartości; lub
wybrany LBFGS algorytm dla maksymalizacji.
Skala usunięcie jest uważane infeasible, jeżeli są trochę restrykcje rozgniewanej kolumny dalej j8 lub trochę bzy --homogeniczne restrykcje obejmujące więcej niż jeden element j8.
Ponadto, eksperymentowanie sugerowało do nas tak usunięcie skali jest niewskazany, jeżeli system tylko jest zidentyfikowany z normalizacją,(s) zawarł, więc nie robimy temu w tym przypadku. Około “tylko zidentyfikowany” znaczymy tak system nie byłby zidentyfikowany, jeżeli jakakolwiek z restrykcji został usunięty. Dalej tak kryterium powyższy przykład tylko nie jest zidentyfikowany, odtąd usunięcie drugiej restrykcji nie wpływałoby na identyfikację; i gretl faktycznie gra usunięcie skali wewnątrz ten przypadek, chyba że użytkownik wyszczególnił inaczej.
9As numeryczny miej znaczenie, to jest w zasadzie to powinien nie robić różnicy.
Rozdział 22
Dyskretny i spełniony obowiązki cenzora zależne zmienne
22.1 Logit i probit modele
To często zdarza się tak to chce wyszczególnić i oszacować model, w którym zależna zmienna jest, nie ciągły, ale dyskretny. typowy przykład jest modelu, w który zależny zmienny jest zawodowym stanem osoby (1 = zatrudniony, 0 = bezrobotny). dogodny sposób kształtowania ta sytuacja ma rozważyć zmienny yi jako Bernoulli przypadkowy zmienny i analizować jego dystrybucja warunkowa na objaśniającym zmienne xu To jest,
f 1 P;
Ji = (22.1)
0 1 - Pi,
gdzie Pi = P(yt = 1 \ ksi) jest dana funkcja objaśniającego ksi zmienne
w większości wypadków, funkcja Pi jest łączną funkcją dystrybucji F, stosowany do linearnego combi narodu XfS. Wewnątrz probit model, normalny cdf być używany, kiedy logit model zatrudnia logistyczna funkcja(). Dlatego, mamy
probit Pi = F(zi) = < l >(zt)
logit Pi = F(zt) =(zf) = 1
1 + e-zt
fc Zi = X xijPj
(22.2) (22.3)
(22.4)
gdzie z * zwykle jest znany jako indeks funkcja. Notatka tak wewnątrz to przypadek współczynniki, które j8j nie może zostać zinterpretowany jako częściowe pochodne E(yi \ xt) w odniesieniu do xy. Jakkolwiek, ponieważ dana wartość ksi można policzyć wektor “zboczy”, tych jest
Cretl automatycznie liczy zbocza, ustawiając każdą objaśniającą zmienną w jego środku próbki.
Inny, równoważna droga myślenia o tym modelu jest pod względem nieobserwowanej zmiennej y *
które może zostać opisane w ten sposób:
k
y * = X xijPj + £ ja = zi + £ ja (22.5) Przestrzegamy yt = \ kiedykolwiek y * > 0 i yi = 0 inaczej. Jeżeli ei jest założony, by być normalny, wtedy mamy probit model. logit model powstaje, jeżeli zakładamy tak, że funkcja gęstości ei jest
3A(ff) e ~£ t(ff) = -r =
d £ ja (1 + e ~ Et)2
Zarówno probit, jak i logit model jest oszacowany wewnątrz gretl przez prawdopodobieństwo maksimum, gdzie klocem prawdopodobieństwo może zostać napisane jako
L(fi) = X m,[l_-f(zt)]+ X m-f(zt)> (22.6)
yi = och yt = ja
172
Rozdział 22.. Dyskretne i cenzurowane zależne zmienne
173,
które jest zawsze przeczący, od 0 < F(-) < 1.. Odkąd wynik eąuations nie ma zamkniętego rozwiązania formy, numeryczna optymalizacja jest użyta. Jakkolwiek w większości wypadków to jest użytkownikowi całkowicie przezroczysty, od zwykle tylko kilka powtarzanie są potrzebowane zapewnić zbieżność. --Wielomówna witka może zostać użyta, by śledzić algorytm maksymalizacji.
Przykład 22.1: Oszacowanie prosty logit i probit modele
otwartego greene19_1
logit STOPIEŃ const GPA TUCE PSI probit STOPIEŃ const GPA TUCE PSI
Jako przykład, powielamy skutki oddawane Greene (2000), dzieli na rozdziały 21, gdzie efektywny przylądek programu dla nauczania ekonomia jest oceniona przez poprawy stopni studentów. Bieżący kod w przykładzie 22.1 daje następną produkcję:
Model 1: Logit oceny używające 32 obserwacji 1-32 Zależny zmienny: CRADE
ZMIENNY
const GPA TUCE PSI
OEFFICIENT STDERR0R T BEZZWŁOCZNIE ZBOCZE (w znaczyć)
-13.0213 4.93132 -2.641
2.82611 1.26294 2.238 0.533859
0.0951577 0.141554 0.672 0.0179755
2.37869 1.06456 2.234 0.449339
Środek CRADE = 0.344
Numer przypadków 'correctly predicted' = 26 (81.2 %)
f(beta'x) w znaczyć niezależnego vars = 0.189
McFadden's RZEKOMY-R-zgodził = 0.374038
Kloc prawdopodobieństwo = -12.8896
Prawdopodobieństwo stosunek test: Chi kwadrat(3) = 15.4042 (p wartość 0.001502)
Akaike informacje kryterium (AIC) = 33.7793
Schwarz Bayesian kryterium (BIC) = 39.6422
Hannan-Quinn kryterium (HQC) = 35.7227
Przewidział 0 1 Faktyczny 0 18 3 13 8
Model 2: Probit oceny używające 32 obsen / ations 1-32 Zależny zmienny: CRADE
ZMIENNY
const GPA TUCE PSI
SKUTECZNY STDERROR T BEZZWŁOCZNIE ZBOCZE (w znaczyć)
-7.45232 2.54247 -2.931
1.62581 0.693883 2.343 0.533347
0.0517288 0.0838903 0.617 0.0169697
1.42633 0.595038 2.397 0.467908
Środek CRADE = 0.344
Numer przypadków 'correctly predicted' = 26 (81.2 %)
f(beta'x) w znaczyć niezależnego vars = 0.328
Rozdział 22.. Dyskretne i cenzurowane zależne zmienne, które
174
McFadderTs RZEKOMY-R-zgodził = 0.377478
Kloc prawdopodobieństwa = -12.8188 testu stosunku
Prawdopodobieństwa: Chi kwadrat(3) = 15.5459 (p wartość 0.001405)
Akaike informacje kryterium (AIC) = 33.6376
Schwarz Bayesian kryterium (BIC) = 39.5006
Hannan-Quinn kryterium (HQC) = 35.581
Przewidział 0 1 Faktyczny 0 18 3 13 8
Wewnątrz to kontekstowy, $ uhat accessor funkcja bierze specjalne znaczenie: to wraca uogólniony resid-uals określonych w Gourieroux et al (1987), które może zostać zinterpretowane jako bezstronni kosztorysanci utajonych zakłóceń et. Ci są zdefiniowani jako
ja
y ja - P ja dla logit modelu
Ó(Ż-) Ó(Ż-) r (22.7)
yi · $ W) - (1 - >"ja) · \ >(ja) ror probit model
Między innym użycie, uogólnione reszty często są użyte, ponieważ diagnostyczne cele. Na przykład to jest bardzo łatwo ustawić pominięte zmienne testują ekwiwalent do LM znajomego testu w kontekście linearnej regresji; przykład 22.2 pokazuje jak wykonać zmienny test dodatku.
Przykład 22.2: test dodatku Yariable wewnątrz probit model
otwarty greenel9_l
probit CRADE const CPA PSI
serie u = Suhat
%$
ols u const CPA PSI TUCE -q
printf "Zmienny test dodatku dla TUCE:\ n"
printf "Rsq * T = % g (s. val. = % g)\ n", $ trsq, pvalue(X, l, $ trsq) doskonały problem przepowiadania
Jeden ciekawy charakterystyczny logit i probit modeli jest tak (ąuite paradoksalnie) oszacowanie nie jest wykonalne, jeżeli model pasuje dane doskonale; to nazywa się doskonały problem przepowiadania. Jest łatwo widzieć przez rozważanie eąuation (22.6)powód, dlaczego ten problem powstaje: jeżeli dla jakiegoś wektor j8 i skalar k to przedstawia się tak ten Zf < k kiedykolwiek yi = 0 i Zf > k kiedykolwiek yt = \, ta sam rzecz jest prawdziwa dla jakiejś wielokrotności j8. Odtąd, ja, który(j8) może zostać zrobiony arbitrażowo blisko 0 po prostu przez wybieranie ogromnych wartości dla j8. Jako conseąuence, kloc prawdopodobieństwo nie ma żadnego maksimum, wbrew byciu ograniczonemu.
Cretl ma mechanizm dla zapobiegania algorytmu od powtarzania bez końca w poszukiwaniu nieistniejącego maksimum. Jeden łódź podwodna przypadek zainteresowania jest kiedy doskonały problem przepowiadania powstaje z powodu pojedynczej dwójkowej objaśniającej zmiennej. W tym przypadku, wykraczająca zmienna jest upuszczona od modelu i przychodu oszacowania ze zredukowaną specyfikacją. Niemniej jednak, to może zdarzyć się tak żaden singiel “doskonały klasyfikator” nie egzystuje między regressors, wewnątrz, które oszacowanie przypadku jest po prostu impos-sible i algorytm zatrzymania z błędem. To zachowanie jest wywołane podczas procesu powtarzania, jeżeli
maksimum zi < min zi
ja:yi = 0 ja:yi = l
Rozdział 22.. Dyskretne i cenzurowane zależne zmienne
175,
Jeżeli to zdarza się, chyba że twój model byłby, trMally wyszczególnił na mis (jak przewidywanie, czy kraj jest eksporterem oleju na podstawie dochodów oleju), to jest zwykle problem małej próbki: prawdopodobnie tylko nie masz wystarczających danych, by oszacować twój model. Możesz zechcieć upuścić kilka z twoich objaśniających zmiennych.
Zamówił modele, które
Te modele są prostymi odmianami zwykły logit / probit modeli i zwykle jest stosowany w przypadku zależna zmienna jest dyskretnym i zamówionym pomiarem, niekoniecznie ilościowym. Na przykład ten rodzaj modelu może zostać stosowany kiedy zależna zmienna jest jakościową oceną jak “Dobrze”, “Średnia” i “Zły”. Arogancki mamy p kategorie, prawdopodobieństwo tak indywidualne ja spada j-th dano kategorii około
P(yt = j \ xt) =
F(zt + ja ^ och) ponieważ j = 0
F(zt + Hj) - F(zt + Hj-ja) ponieważ 0 < j < p (22.8)
1 - F(zi + Sprzedaż ratalna-\) ponieważ j = p nieznane parametry \ ij nazywa się “punkty odcięcia” i są estimated razem z /?s. Ponieważ identihcation cele, \ ja § jest założony, by być 0.. Pod względem nieobserwowana zmienna y *, model może równie zostać rzucony jako P(yt = j \ ksi) = P(/ Aj-ja < y * < Hj).
Przykład 22.3: Zamówił probit model
otwarty pension.gdt serie pctstck = pctstck / 50 dyskretny wiek wyboru const pctstck
probit pctstck educ żeńska czerń poślubił finc25 finc35 \ finc50 finc75 finclOO finclOl wealth89 prftshr,
Aby stosować te modele, zależna zmienna musi zostać oznaczona jako dyskretny i jego najniższa wartość musi być 0.. Przykład 22.3 powiela oszacowanie oddawane spierzchnięcie. 15 z Wooldridge (2002a). Zauważ, że gretl nie dostarcza oddzielnego rozkazu dla zamówionych modeli: logit i probit rozkazuje automatycznie szacować zamówioną wersję, jeżeli zależna zmienna nie jest dwójkowa (profesjonalny vided, który to już zostało oznaczone jako dyskretny).
Po oszacowaniu zamówionych modeli, $ uhat accessor produkcje uogólniły reszty jako w dwójkowym models; dodatkowo $ powroty funkcji accessor yhat żu więc można policzyć bezstronnego kosztorysanta utajona zmienna y * po prostu przez dodawanie dwa.
Wielomianowy logit
Kiedy zależna zmienna nie jest dwójkowa i naprawdę nie ma naturalnego porządkowania,
modele wielomianowego są użyte. Gretl nie dostarcza ojczystego wprowadzenia tych jeszcze, ale proste modele
mogą zostać poradzone przez mle rozkaz (widzą rozdział 17). Dajemy tu przykład wielomianowy
logit modelu. Pozwól zależnej zmiennej, yu przyjmuje wartości całości 0,1... s. prawdopodobieństwo tak
yt = k jest dany około
, exp(xf6fc)
P(yi = k \ Ksi) = -p
Xj = oexP(xif > j)
W cel identihcation jednego rezultatów musi zostać wzięty jako “punkt odniesienia”; to zwykle jest założone, że /?och = 0, w który przypadek
\ exp(Xfj6k)
P(yi = k \ Ksi) =
1 + Z /"= ja exp(% fj8j)
Dziel
na
rozdziały 22.. Dyskretne i cenzurowane zależne zmienne
176
i
1
P(yi = och \ Ksi) = p .
1 + Z.j(= ja exp(xfj6j)
Przykład 22.4 powiela Stół 15.2 wewnątrz Wooldridge (2002a), oparte dalej dane dalej pędzą wybór od Keane i Wolpin (1997). zależny zmienny jest zawodowym stanem osoby (0 = wewnątrz szkoła; 1 = nie wewnątrz szkoła i nie pracując; 2 = działanie)i objaśniające zmienne są edukacją i obsługują doświadczenie (linearny i sąuare) plus “czerń” dwójkowa zmienna. zbiór danych fuli jest panelem; tu analiza jest ograniczona do rozgniewanej sekcji dla 1987. Dla wytłumaczeń metod macierzy zatrudnił wewnątrz scenariusz, zobaczyć rozdział 12.
Przykład 22.4: Wielomianowy logit
funkcja mlogitlogprobs(serie y, macierz X, macierz theta)
skalar n = maksimum(y)
skalar k = przełęcze(X)
macierz b = mshape(theta, k, n)
macierz tmp = X * b
serie ret = -ln(l + sumr(exp(tmp)))
pętla dla ja = l..n --ciche
serie x = tmp,[, ja,]
ret += (y =$ ja) ? x : 0 koniec pętla
powrót serie ret
koniec funkcja
otwarta Keane.gdt
stan = 1 # dep. var. musi 0-zostać oparty
smpl (rok = 87 & ok(stan)) --ograniczyć
macierz X = { educ exper expersq czarny const }
skalar k = przełęcze(X)
macierz theta = zera(2 * k, 1)
mle loglik = mlogitlogprobs(stan, X, theta)
params theta koniec mle --wielomówny --juta
22.2 Tobit model Tobit model być używany kiedy zależna zmienna modelu jest, censored.1 Zakłada utajona zmienna y * może zostać opisany jako
fc
j = l
lWe zakłada tu to pełnienie obowiązków cenzora występuje z dołu w 0. Pełnienie obowiązków cenzora z góry lub w punkcie innym niż zerowy, może być raczej łatwo poradzony około odnośnie definiujący zależną zmienną właściwie. bardziej ogólny przypadek dwustronnego pełnienia obowiązków cenzora nie jest poradzony około gretl przez ojczysty rozkaz jeszcze, ale można oszacować taki modele używające mle rozkaz (zobacz rozdział 17).
Rozdział 22. Dyskretny i cenzurowany zależne zmienne
177,
gdzie Ei ~ N(0, er2). Jeżeli y * byli dostrzegalne, modeFs parametry mogłyby zostać oszacowane przez zwykły mały sąuares. Przeciwnie, sądźmy tak, że spostrzegamy, że yu zdefiniował jako
ja, ponieważ yf >{)
Ji = (22.9)
och
dla y * < 0
Wewnątrz to przypadek, regressing yi dalej % fS nie wydaje stałych ocen parametrów p, ponieważ warunkowy znaczyć E(yt \ xt) jest nie eąual do Z /= ja xtjf > j- To może zostać pokazane tym ograniczając próbka do bzu --zerowego obserwacje nie wydałyby stałych ocen też. Rozwiązanie ma oszacować parametry przez prawdopodobieństwo maksimum. Składnia jest po prostu
tobit depvar indvars
Jak zwykle, postęp algorytmu maksymalizacji może zostać śledzony przez --wielomówna witka, kiedy $ uhat powroty uogólnione reszty. Zauważ, że w tym przypadku uogólniony końcowy jest zdefiniowany jako ui = E(£ ja \ yi = 0) dla cenzurowanych obserwacji, więc znajomy eąuality ui = yi - yi tylko trzyma się dla niecenzurowanych obserwacji, to jest, kiedy yi > 0..
Ważna różnica między Tobit kosztorysantem i OLS jest, że conseąuences bez --normalności okresu zakłócenia są dużo bardziej surowy: bez --normalność sugeruje niezgodność dla Tobit kosztorysanta. Z tego powodu, produkcja dla tobit modelu zawiera Chesher-Irlandczycy (1987) test dla normalności domyślnie.
Model wyboru próbki
Wewnątrz model wyboru próbki (również znany jako “Tobit II” model), są dwie utajone zmienne:
fc
y * = X Xij { 3j + Ei (22.10)
p
ul. = X ZiJyj + Vi (22.11)
i regule obserwacji dano przez
f y * ponieważ sf ♦ ponieważ s *
, ponieważ sf > 0
Ji = r * (22.12)
♦ tor s < < 0
Wewnątrz ten kontekst, ♦ symbol wskazuje tak, ponieważ trochę obserwacje, których po prostu nie mamy danych na temat y: yi może być 0 lub chybia, lub coś innego. smoczek zmienny di zwykle być używany, by odróżnić cenzurowane obserwacje.
Jedno z najbardziej popularnych stosowania tego modelują wewnątrz econometrics jest zarobek eąuation łączonym z udział siły pracy eąuation: tylko przestrzegamy zarobek dla zatrudnionych. Jeżeli y * i s * byli (warunkowo) niezależny, nie byłby żadnym powodem nie użyć OLS dla szacowania eąuation (22.10); inaczej, OLS nie wydaje stałych ocen parametry j6j.
Odtąd warunkowa niepodległość pośrodku y * i s * jest równoważny warunkowemu niepodległość between Ei i r } ja, można, bym umodelować co zależność pośrodku Ei i rn jako
Ei = Xr,]ja + vi \
zastępując powyższe wyrażenie wewnątrz (22.10), uzyskujesz model, który właściwie jest oszacowany:
k yi = X Xijpj + ^ Vi + VU
Rozdział 22.. Dyskretne i cenzurowane zależne zmienne
178
tak hipoteza to pełnienie obowiązków cenzora nie ma znaczenia jest równoważna hipotezie Hej : = 0, które może łatwo zostać testowane.
Parametry mogą zostać oszacowane przez prawdopodobieństwo maksimum pod założeniem łącznej normalności ei i r,]ja \ jakkolwiek, szeroko użyta alternatywna metoda wydaje tak zwany Heckit kosztorysant, dawany imię po Heckman (1979). Postępowanie może krótko zostać szkicowane następująco: pierwszy, probit model być przymierzony eąuation (22.11); następny, uogólnione reszty są wstawione w eąuation (22.10) by poprawić dla efektu wyboru próbki.
Cretl pod że warunkiem, że heckit rozkazuje, by przeprowadzić oszacowanie; jego składnia jest
heckit y X ; d Z
gdzie jest y zależną zmienną, X jest wykazem regressors, d jest zmienną smoczka trzymającą się 1 dla niecenzurowanych obserwacji i Z jest wykazem objaśniających zmiennych dla pełniącego obowiązki cenzora eąuation.
Od w większości wypadków prawdopodobieństwo maksimum jest metodą wyboru, domyślnie gretl liczy ML ocen. 2-wkraczać do Heckit ocen mogą zostać uzyskany przez używanie --dwa wkraczać do opcji. Po oszacowaniu, $ uhat accessor zawiera uogólnione reszty. Jako w zwykłym Tobit modelu, reszty eąual różnica między faktycznym i dopasowanym yi tylko dla niecenzurowanych obserwacji (tych, dla którzy di = 1).
Przykład 22.5 pokazuje, że dwie oceny od zestawu danych użyły w Mroź (1987): pierwszy jeden repliki Stół 22.7 w Greene (2003), 2, podczas gdy sekunda jeden stół replik 17.1 w Wooldridge (2002a).
Przykład 22.5: Heckit model
otwarty mroz87.gdt
genr EXP2 = AXA2
genr WA2 = WAA2
genr DZIECI = (KL6 + K618)> 0
#
lista specyfikacji Greene's X = const TOPÓR EXP2 MY CIT
lista Z = const WA WA2 FAMINC DZIECI MY
heckit WW X ; LFP Z --dwa wkraczać do heckit WW X ; LFP Z
#
serie specyfikacji Wooldridge's NWINC = FAMINC - WW * WHRS serie lww = wpisz(WW) sporządzają listę X = const OBCINAMY EXP2 listę Z = X NWINC WA KL6 K618
heckit lww X ; LFP Z --dwa wkraczać do
2Note, że oceny podane przez gretl nie zbiegają się z tymi znalazł w drukowanym tomie. Oni naprawdę, jakkolwiek, dopasowują tych znalezionych na stronie sieć błędów druku dotycząca Greene'sbook: http://pages.stem.nyu.edu/ ~ wgreene / Tekst / Błędy druku / ERRATAB.htm. < http://pages.stern.nyu.edu/ ~ wgreene / Tekst / Błędy druku / ERRATA5.htm >
Rozdział 23
Quantile regresji
23.1 Wprowadzenia
W Zwykły Najmniejszy Sąuares (OLS) regresji, dopasowanych wartościach, j > ja = -^ ijŚ, reprezentuj warunkowy środek zależnej zmiennej - warunkowy, to jest, na funkcji regresji i wartościach niezależnych zmiennych. W regresji środkowej, przeciwnie i, ponieważ imię sugeruje, dopasowane wartości reprezentują warunkową środkową zależnej zmiennej. To obraca się, że zasada oszacowania dla środkowej regresja łatwo jest stwierdzona (chociaż nie tak łatwo policzony), mianowicie, wybrać j6, aby pomniejszyć sumę absolutnych reszt. Odtąd metoda być znany jako Najmniej Absolutne Odchylenia lub CHŁOPIEC. Kiedy OLS problem ma bezpośrednie analityczne rozwiązanie, CHŁOPIEC jest linearnym problemem programowania.
Quantile regresja jest generalizacją środkowej regresji: funkcja regresji przewiduje warunkowych T-quantile zależnej zmiennej - na przykład pierwszy ąuartile (t = .25) lub dziewiąty decile (t = .90).
Jeżeli klasyczne warunki dla ważności OLS są zadowolone - to jest, jeżeli okres błędu jest inde-pendently i identycznie rozprowadzony, warunkowy dalej X - wtedy ąuantile regresja jest zbyteczna: zupełnie warunkowy ąuantiles zależnej zmiennej będzie maszerować wewnątrz lockstep z warunkowym środkiem. Odwrotnie, jeżeli ąuantile regresja ujawnia, że warunkowy ąuantiles zachowuje się w sposób ąuite odmiennym od warunkowego środka, to sugeruje, że OLS oszacowanie jest problematyczne.
Wersja 1.7.5, gretl oferuje funkcjonalność regresji ąuantile (oprócz basie CHŁOPIEC regression, który był dostępny od wczesnego w historii gretl's przez 1 rozkaz ogłoszenia,).1
23.2 basic składni basie inwokacja ąuantile regresja jest
ąuantreg tau reglist, gdzie
reglist jest listą regresji gretl standard (zależna zmienna mającą za sobą regressors, zawierając stała, jeżeli przejąć jest poszukiwany); i
tau jest pożądanym warunkowym ąuantile, w zasięgu 0.01 do 0.99, podany albo jako numeryczna wartość lub imię wstępnie zdefiniowanej zmiennej skalara (ale patrzcie poniżej dla dalszej opcji).
Oszacowanie jest przez rozpuszczalnik punktu wnętrza Frisch-Newtona (Portnoy i Koenker, 1997), który jest łodzią podwodną stantially szybciej, niż “tradycyjni” Barrodale-Robert (1974) podejście simpleks dla dużego prob-lems.
lWe z wdzięcznością uznaje naszą pożyczkę od quantreg paczki dla GNU R (wersji 4.17). Rdzeń quantreg paczki składa się z Fortran kodu napisanego przez Rogera Koenker; to są w towarzystwie różnego kierowcy i pomocniczych funkcji napisanych w R języku przez Koenker i Marcina Mächler. Ten ostatnie funkcje odnośnie obsługiwane w C dla gretl. Dodaliśmy jakichś strażników przeciw potencjalnym numerycznym problemom w smali próbkach.
179
Chapter23. Quantile regresja
180
domyślnie, błędy standardu są policzone zgodnie z asymptotyczną formułką podaną przez Koenker i Bassett (1978). Alternatywnie, jeżeli --krzepka opcja jest dana, używamy kosztorysanta kanapki rozwiniętego w Koenker i Zhao (1994).2
23.3 Przedziałów ufności opcja --odstępy jest dostępny. Kiedy to jest dany, drukujemy przedziały ufności dla ocen para licznika zamiast błędów standardu. Te odstępy są policzone używając zjełczałą metodę odwrócenia i ogólnie oni są asymetryczni o ocenach punktu - to jest, oni są nie po prostu “plus lub minus tyle błędy standardu”. Specyfiki obliczenia są odmieniane przez --krzepka opcja: bez tego, odstępy są policzone na założeniu IID błędów (Koenker, 1994); z tym, oni używają heteroskedasticity krzepkiego kosztorysanta rozwiniętego przez Koenker i Machado (1999).
Domyślnie do 90 odstępów procentu jest doprowadzonych. Możesz zmienić to przez dodawanie wartości zaufania (wyrażonej jako dziesiętny ułamek) do opcji odstępów, jako w
quantreg tau reglist --odstępy =.95
Kiedy opcja przedziałów ufności jest wybrana, oceny parametru są obliczone używanie Barrodale-Robert metody. To jest po prostu, ponieważ Frisch-Newton kod aktualnie nie popiera obliczenia przedziałów ufności.
Dwa dalsze szczegóły. Pierwszy, mechanizmy dla przedziałów ufności generowania dla ąuantile estimates reąuire, że model ma atleasttworegressors (zawierający stała). Jeżeli --opcja odstępów jest dana dla modelu zawierającego tylko regressor, błąd jest wybrukowany. Drugi, kiedy model jest oszacowany w tym trybie, możesz odzyskać przedziały ufności używające accessor $ coeff_ci. To doprowadza do k x 2 macierz, gdzie jest k numerem regressors. Bardziej dolne granice są w pierwszej kolumnie, górnych granicach w drugim. Zobacz również sekcją 23.5 poniżej.
23.4 Wielokrotny quantiles
Jako dalsza opcja, możesz dać tau jako macierz - jeden z dwóch imię uprzednio zdefiniowanej macierzy lub w numerycznej formie, asin {.05 .25 .5 .75 .95 }. Dany model jest oszacowany dla wszystkich t wartości i skutki są drukowane w specjalnej formie, jako pokazany poniżej (w tym przypadku --opcja odstępów również została dana).
Model 1: Quantile oceny używające 235 obserwacji 1-235
Zależny zmienny: foodexp
Z 90 procenty przedziały ufności
ZMIENNE
TAU
WSPÓŁCZYNNIK
NIŻSZY
GÓRNY
const
dochód
0.05 124.880 98.3021 130.517
0.25 95.4835 73.7861 120.098
0.50 81.4822 53.2592 114.012
0.75 62.3966 32.7449 107.314
0.95 64.1040 46.2649 83.5790
0.05 0.343361 0.343327 0.389750
0.25 0.474103 0.420330 0.494329
0.50 0.560181 0.487022 0.601989
0.75 0.644014 0.580155 0.690413
0.95 0.709069 0.673900 0.734441
2These odpowiada iid i nid opcje wewnątrz R's quantreg paczka, odpowiednio.
Chapter23. Quantile regresja 181
Współczynnika na dochodzie 0.75
0.7 0.65
0.6 0.55
0.5
Ouantile szacuje z 90% zespół OLS oceną z 90% zespołem
0.45
0.4
0.35
0.3
0 0.2 0.4 0.6 0.8 1
tau
Cyfra 23.1: Regresja wydatku jedzenia na dochodzie; EngeFs dane gretl, który GUI ma wejście dla Quantile Regresji (poniżej / Model / Krzepkie oszacowanie)i możesz wybrać wielokrotny ąuantiles tam także. W tym kontekście, tylko daj rozdzielone przez przestrzeń numeryczne wartości (jako na uprzednio zdefiniowanych opcjach, pokazany w rozwijanej liście).
Kiedy szacujesz model w ten sposób, większości rzeczy menu standardu w oknie modelu są niepełnosprawne, ale jedna dodatkowa rzecz jest dostępna - wykresy pokazujące t seąuence dla danego coefficient w porównaniu z OLS współczynnikiem. Przykład jest pokazany w Cyfra 23.1. Ten rodzaj wykresu, pod że warunkiem, że prosty znaczy osądzania, czy ąuantile regresja jest zbyteczna (OLS jest grzywną) lub informacyjny.
Wewnątrz przykład pokazany - bazowany dalej dane dalej household dochód i wydatek jedzenia zgromadził się około Ernst Engel (1821-1896) - to wydaje się elear tak prosty OLS regresja potencjalnie wprowadza w błąd. “Krzyżowanie” OLS oceny przez ąuantile szacuje bardzo jest oznaczony.
Jakkolwiek to jest nie zawsze elear, który, które implikacje powinny zostać narysowane od tego rodzaju konfliktu. Z Engel danymi tam są dwoma zagadnieniami, by rozważyć. Pierwszy, EngeFs sławne “prawo” twierdzi dochód elastyczność konsumpcji jedzenia, która jest mniej niż jednym i rozmowa elastyczności sugeruje logarytmiczne sformułowanie modelu. Drugi, są dwie najwidoczniej nieprawidłowe obserwacje w zbiorze danych: gospodarstwo domowe 105 ma trzeci-najwyższy dochód ale niespodziewanie Iow wydatek na jedzeniu (jako osądzony od prostego wątku niewielkiej ilości), kiedy gospodarstwo domowe 138 (które również ma niespodziewanie konsumpcję jedzenia Iow) ma dużo najwyższy dochód, prawie dwa razy tamten z najbardziej następnych najwyższych.
Z n = 235 to wydaje się rozsądny, by rozważyć upuszczanie tych obserwacji. Jeżeli robimy tak i zaadoptujemy sformułowanie kloc kloca, dostajemy się wątek pokazany w Cyfra 23.2. ąuantile szacuje nadal krzyżować OLS ocenę, ale “dowód przeciwko OLS” jest dużo mniej ważny: 90 zespołów zaufania procentu poszczególnych ocen pokrywa się częściowo w cały ąuantiles rozważonym.
23.5 Dużych zestawów danych
Jako zauważony powyżej, kiedy dajesz --opcja odstępów z quantreg rozkazem, który wzywa do oszacowania przedziałów ufności przez odwrócenie szeregu, gretl przełącza od zaniedbanie Frisch-Newton algorytmu do metody simpleks Barrodale-Roberta.
Chapter23. Quantile regresja 182
Współczynnika na kloc(dochodzie) 0.96
0.94
0.92
0.9 0.88 0.86 0.84 0.82
0.8 0.78
0.76
0 0.2 0.4 0.6 0.8 1
tau
Cyfra 23.2: Kloc kloc regresja; 2 obserwacje spadły od fuli zbioru danych Engel.
To jest ok dla umiarkowanie dużych zestawów danych (w górze, powiedz, kilka tysiąca obserwacji) ale na bardzo dużych problemach algorytm simpleks może stać się poważnie zapadli się. Na przykład Koenker i Hallock (2001) przedstawia analizę wyznaczników wag przy urodzeniu, używając 198377 obserwacji i z 15 regressors. Generowanie przedziały ufności przez Barrodale-Roberta dla pojedyncza wartość t wzięła o pół godzinę na Lenovo Thinkpad T60p z 1.83GHz Intel Rdzeń 2 procesor.
Jeżeli chcesz przedziały ufności w takich przypadkach, jesteś doradzony nie użyć -opcja odstępów, ale policzyć ich używając metoda z “więcej lub bez tyle błędów standardu”. (Jeden Frisch-Newton bieg wziął około 8 sekund na tej sam maszynie, pokazując wyższość metody punktu wnętrza.) scenariusz poniżej ilustruje:
quantreg .10 y 0 xlist
skalar crit = qnorm(.95)
macierz ci = Scoeff - crit * Sstderr
ci = ci ~($ coeff + crit * Sstderr)
drukuj ci, który macierz ci zawrze niższe i górne granice 90 (symetrycznych) przedziałów ufności procentu.
Unikają sytuacji, gdzie gretl staje się niereagujący dla bardzo długiego czasu ustawiliśmy numer maxi mamy powtarzania dla Borrodale-Robert algorytmu do (nieco arbitralnej) wartości 1000.. Zaeksperymentujemy dalej z tym, gdyby nie międzyczas, jeżeli naprawdę chcesz użyć tej metody na dużym zestawie danych i naprawdę nie masz coś przeciw czekaniu na skutki, możesz zwiększać ograniczenie używające rozkaz zbioru z parametr rq_maxiter, jako w
zbiór rq_maxiter 5000
Części III
Techniczne szczegóły
183
Rozdziału 24
Gretl i T \ X
24.1 Wprowadzenie
TęX - początkowo rozwinięty przez Donalda Knuth Stanford Uniwersytetu i od ulepszonego przez setki ofiarodawców dookoła świata - jest parytetem złota naukowego składania. Gretl dostarcza różne haki, które umożliwiają ci podglądnięcie i drukowanie ekonometrycznych skutków używających TęX silnik i uratować produkcję w formie odpowiedniej dla dalszego przetwarzania z TgX.
Ten rozdział wyjaśnia piękniejsze punkty związanej TgK funkcjonalności gretl's. Następna sekcja opisuje związane rzeczy menu; sekcja 24.3 dyskutuje drogami nastawiającego nne TgX przetworzył; sekcja 24.4 byłych równin jak radzić kodujący charakterów nie znalezionych po angielsku; i sekcja 24.5 daje jakieś wskazówki na instalowaniu (i ucząc się) TgX, jeżeli robisz nie już, mieć to na twoim komputerze. (Tylko po to, by być elear: TgX nie jest zawarty z gretl dystrybucją; to jest oddzielna paczka, zawierając kilka programów i bardzo dużo popierania plików.)
Przed postępowaniem, jakkolwiek, to może być przydatne, by wyruszyć krótko sceny produkcji końcowego dokumentu używającego TgX. Przeważnie nie musisz zaniepokoić się o tych szczegółach, od, pod względem podglądania za każdą cenę, gretl radzi ich dla ciebie. Ale mienie jakiegoś uścisku czego idzie dalej za scences umożliwią ci zrozumienie twoich opcji lepszych.
Pierwszy krok jest tworzeniem czysty tekst “źródło” pliku, zawieranie tekstu lub matematyki, by być typset, przeplatanego z marżą, która definiuje, jak to powinno zostać sformatowane. Drugi krok ma przebiegnąć źródło przez silnik przetwarzania, który robi faktyczne formatowanie. Typowo to jest albo: program nazwał lateks, który wygenerowuje DVI tak zwanej (niezależnej od urządzenia) produkcji lub program nazwał pdflatex, który wygenerowuje PDF output.1
Dla podglądania, to używa jeden z dwóch DVI widzów (typowo xdvi na GNU / Linuks systemach) lub PDF widz (na przykład, Acrobat Reader Cegły niewypalanej lub xpdf), licząc dalej jak źródło zostało przetworzone. Jeżeli DVI trasy jest wziętego, jest wtedy trzeci krok, aby doprowadzić do nadającej się do druku produkcji, typowo używanie program dvips, by wygenerować Postscriptum plik. Jeżeli PDF trasa jest wzięta, produkcja jest przygotowana do bycia w druku bez jakiegoś dalszego przetwarzania.
Na PANI Windows i X KOŚĆ Płaszcza nieprzemakalnego platformach, gretl nazywa pdflatex, by przetworzyć plik źródłowy i oczekuje, by system obsługiwania był w stanie znaleźć domyślny widz dla PDF przetworzył; DVI nie jest poparty. Na GNU / Linuks zaniedbanie ma wziąć DVI trasy, ale, jeżeli wolisz użyć PDF, możesz zrobić co następuje: wybrać rzecz menu “Narzędzia, Preferencje, Ogólne” wtedy “Programy” tabulator. Znajdź, że rzecz tytułowała “Rozkazywać, by zestawić TeX pliki”i ustawić to do pdflatex. Upewnij się “Rozkaż, by obejrzeć PDF pliki” jest zabierze się do czegoś odpowiedniego.
24.2 T[:rzeczy menu X relatecl okno modelu najpełniejsze TgX poparcie wewnątrz gretl jest znaleziony wewnątrz oknem modelu GUI. To ma menu podobnie tytułowało “Lateks” z łódź podwodna rzeczy “Widokiem”, “Kopią”, “Chyba że” i “Eąuation opcje” (zobacz Cyfrę 24.1).
1Experts będzie świadom trochę nazwanego “prostego TęX”, który jest przetworzony używaniem program tex. wielka większość TjX użytkowników, jakkolwiek, używają ETjX makropolecenie, początkowo rozwinął się około Leslie Lamport. Gretl nie popiera prostego TjX.
184
Rozdziału 24. Cretl i T ^<
185
Cyfry 24.1: KTgX menu wewnątrz umodelować okno pierwsze trzy łódź podwodna rzeczy mają gałęzie były tytułowane “Tabelaryczny” i “Eąuation”. Około “Tabelaryczny” znaczymy tak model jest reprezentowany w formą stołu; to jest najpełniejsza i najbardziej wyraźna prezentacja skutków. Zobaczyć Stół 24.1 dla przykładu; to został sklejony do instrukcji po używaniu “Kopia, Tabelaryczna” podobnie wewnątrz gretl (kilka kreśli linie został wydany dla krótkości).
Stół 24.1: Przykład KTjX tabelarycznego został przetworzony
Modelem 1: OLS oceny używające 51 obserwacji 1-51 Zależny zmienny: WPISAĆ
Zmienny Współczynnik Std. Błąd t statystyczny p wartość
const 0.241105 0.0660225 3.6519 0.0007
CATHOL 0.223530 0.0459701 4.8625 0.0000
UCZEŃ -0.00338200 0.00271962 -1.2436 0.2198
BIAŁY -0.152643 0.0407064 -3.7499 0.0005
Środek z zależny zmienny 0.0955686
S.D. z zależny zmienny 0.0522150
Suma sąuared reszty 0.0709594
Standard błąd reszt (ćr) 0.0388558
Nieuregulowany R2 0.479466
Dostosował R2 0.446241
F(3,47) 14.4306 “Eąuation” opcja jest dość jasny - skutki są napisane przez stronę w eąuation format, jako poniżej:
ZAPISAĆ = 0.241105 + 0.223530CATHOL - 0.00338200PUPIL - 0.152643 BIAŁY
(0.066022) (0.04597) (0.0027196) (0.040706)
T = 51 R2 = 0.4462 F(3,47) = 14.431 ćr = 0.038856 (błędy standardu w nawiasach) rozróżnienie pośrodku “Kopia” i “Chyba że” opcje (ponieważ zarówno tabelaryczny i eąuation) jest dwukrotny. pierwszy, “Kopia” kładzie TpX źródło dalej podręczny notatnik kiedy z “Chyba że” jesteś podpowiedziany, ponieważ imię pliku, do którego źródło powinno zostać uratowane. drugi, z “Kopią” materiał jest skopiowany jako
Rozdział 24. Cretl i T ^<
186
“fragment” kiedy z “Chyba że” to jest napisane jako kompletny plik. punkt jest tak kształtny TgX plik źródłowy musi mieć nagłówek, który definiuje, documentclass (artykuł, sprawozdanie, książka lub cokolwiek) i oznacza to mówią \ zacząć się { dokument } i \ koniec { dokument }. To materialny jest zawarty kiedy robisz “Chyba że” ale nie kiedy zrobisz, “Skopiuj”, od w ten ostatnim przypadku oczekiwanie jest tak skleisz dane do istniejącego TpX plik źródłowy tak już ma związany aparat wewnątrz umieścić. rzeczy poniżej “Eąuation opcje” powinny być jasny: kiedy będąc w druku model w equa-tion forma, zrobić ci chcieć błędy standardu lub t stosunki pokazały w nawiasach poniżej parametr oceny? zaniedbanie jest pokazać błędy standardu; jeżeli chcesz t stosunki, wybranych tak podobnie.
Inne okna
Kilka inne rodzaje produkcji okna również ma TpX podgląd, kopię i zaoszczędza umożliwiony. W przypadku okien mających graficzny pasek narzędzi, spojrzenie dla TpX guzika. Cyfra 24.2 pokazy to ikona (drugi od prawa dalej pasek narzędzi) wraz z dialogiem, który wydaje się, kiedy naciskasz guzik.
Cyfra 24.2: TjX ikona i dialog
Jeden aspektu gretl's TgX poparcie, które jest, prawdopodobne być szczególnie przydatny dla publikacja zamierza jest zdolność wyprodukować złożyć wersję “stołu modelu” (zobacz sekcję 3.4). przykład tego jest pokazany wewnątrz Stół 24.2.
24.3 Świetnie nastawiający złożył produkcja
Tam jest trzy aspekty do tego: dostosowując pojawienie się produkcji wyprodukowało około gretl wewnątrz tryb podglądu ETpX; dostosowując formatowania gretl's tabelarycznego produkcja dla modeli kiedy używając tabprint rozkaz; i łącząc się gretl's produkcja do twojego własnego TgX pliki.
Podglądając wewnątrz GUI
Jak szacunki podglądają tryb, możesz skontrolować pojawienia się gretl's produkcja używająca plik nazwał gretlpre.tex, który powinien zostać umieszczony wewnątrz twój gretl użytkownik kierujący (zobacz Gretl Rozkaz Dotyczący erence). Jeżeli taki plik jest znaleziony, jego, które zawartości będą użyte jako “wstęp” do TpX źródło. wartość domyślna wstępu jest następująco:
\ documentclass < plik:/// documentclass >[llpt,]{ artykuł }
\ usepackage,[latini,]{ inputenc } %% ale patrzcie poniżej
\ usepackage { amsmath }
\ usepackage { dcolumn, longtable }
\ begi < plik:/// begi > n { dokument }
\ thispagestyle { wypróżnić się }
Rozdział 24. Cretl i T ^<
187
Stół 24.2: produkcja stołu Przykładu modelu
OLS oceny Zależne zmienne: WPISAĆ
Model 1 Model 2 Model 3
const 0.2907 ** 0.2411 ** 0.08557
(0.07853) (0.06602) (0.05794)
CATHOL 0.2216 ** 0.2235 ** 0.2065 **
(0.04584) (0.04597) (0.05160)
UCZEŃ -0.003035 -0.003382 -0.001697
(0.002727) (0.002720) (0.003025)
BIAŁY -0.1482 ** -0.1526 **
(0.04074) (0.04071)
ADMEXP -0.1551 (0.1342)
n 51 51 51
R2 0.4502 0.4462 0.2956
■ £ 96.09 95.36 88.69
Standard błędów w nawiasach * wskazuje znaczenie w 10 procent równy ** wskazuje znaczenie w 5 procent równej
Notatce tak amsmath i dcolumn paczki są reąuired. (Dla sonie rodzajów produkcji 1 ongtable paczka również jest potrzebowany.) że możesz, na przykład, zmienić wielkość typu lub czcionkę przez al tering documentclass deklaracja lub zawierając alternatywną paczkę czcionki.
Linia \ usepackage,[latinl,]{ inputenc } automatycznie jest zmieniony, jeżeli gretl znajduje się przebiegając system, gdzie UTF-8 jest domyślnym charakterem kodującym - zobaczyć sekcję 24.4 poniżej.
Ponadto, jeżeli powinieneś zechcieć złożyć, gretl przetworzył w więcej niż jeden język, możesz ustawić pliki wstępu przez pośrednictwo -języka. “Zlokalizowany” plik wstępu jest zidentyfikowany przez imię forma gretlpre_xx.tex, gdzie xx zastępuje się pierwszymi dwoma listami aktualnego ustawienia zmiennej środowiska LANG. Na przykład, jeżeli przebiegasz program w języku polskim, używanie LANG = pl_PL, wtedy gretl zrobi co następuje pisząc wstęp dla TpX pliku źródłowego.
Spojrzenie dla pliku nazwało gretlpre_pl.tex w katalogu użytkownika gretl. Jeżeli to nie jest znaleziony, wtedy
szukać plik nazwał gretlpre.tex w katalogu użytkownika gretl. Jeżeli to nie jest znaleziony, wtedy
użyć domyślnego wstępu.
Odwrotnie sądzisz ty zwykle przebiegają gretl w języku innemu niż Anglicy i mają odpowiedni gretlpre.tex plik na miejscu dla twojego języka rodzimego. Jeżeli na jakichś okazjach chcesz doprowadzić do TpX, przetworzyć po angielsku, wtedy mógłbyś utworzyć dodatkowy plik gretlpre_en.tex: ten plik będzie użyty dla wstępu, kiedy gretl będzie przebiegany z językiem ustawiającym z, powiedz, en_US.
Rozdział 24.. Cretl i T ^<
188
Rozkaz linia opcji
Po oszacowaniu modelu przez scenariusz - lub interaktywnie przez gretl konsolę lub używając program rozkaz linii gretlcli - możesz użyć rozkazy tabprint lub eqnprint, by drukować model, by rejestrować w tabelarycznym formacie lub eąuation formacie odpowiednio. Te opcje są wyjaśnione w Odniesieniu Rozkazu Gretl.
Jeśli chcesz zmieniacie pojawienie się tabelarycznej produkcji gretl's dla modeli w kontekście tabprint rozkazu, możesz wyszczególnić custom format rzędu używający --flaga formatu. Sznur formatu musi zostać dołączony w podwójnym ąuotes i musi zostać związany do flagi z eąuals znakiem. Wzór dla sznura formatu jest następująco. Są cztery pole, reprezentując współczynnik, błąd standardu, t stosunek i p wartość odpowiednio. Te pole powinny zostać rozdzielone przez pionowe bary; oni mogą zawrzeć specyfikację printf typu dla formatowania numerycznej wartości w ąuestion lub mogą zostać odchodzony czysto, by znieść druk tej kolumny (temat do ograniczenia, którego nie możesz zostawić cały luce kolumien,). Tu są kilka przykłady:
--format ="%.4f |%.4f |%.4f |%.4f" --format ="%.4f |%.4f \%.3f |" --format ="%.5f |%.4f ||%.4f" --format ="%.8g |%.8g ||%.4f" pierwszy tych specyfikacji jest w druku wartości we wszystkich kolumnach używających 4 dziesiętne miejsca. Drugi znosi p wartość i drukuje t stosunek do 3 miejsc. Trzeci pomija t stosunek. Ostatni znów pomija t i drukuje zarówno współczynnik, jak i standard błąd do 8 znacznych cyfr.
Gdy tylko ustawiłeś custom format w ten sposób, to jest zapamiętane i jest użyte dla trwania gretl sesji. Aby wrócić do zaniedbania formatującego ciebie może użyć specjalnego wariantu --format = zaniedbanie.
Dalsze redagowanie,
Gdy tylko skleiłeś TjX gretl's przetworzył do twojego własnego dokumentu lub uratował to, by rejestrować i otworzył to w edytorze, możesz oczywiście zmodyfikować materiał w jakimś życzeniu, które życzysz. W jakichś przypadkach, jest trudno zrozumieć wygenerowany na maszynie TpX, ale produkcja gretl's jest zamierzona, by być ludzki czytelna i -edytowalny. Ponadto, to nie używa jakichś paczek stylu bzu --standardu. Oprócz standard KTpX dokument klas, jedyne pliki potrzebne są, jako zauważony powyżej, amsmath, dcolumn i 1 ongtable paczki. Ci powinni zostać zawarty trochę rozsądnie fuli TęX wprowadzenie.
24.4 Charakter encodings
Ludzi używających gretl w anglojęzycznych widowniach jest nieprawdopodobne, by mieć problem z tym, ale, jeżeli wygenerowujesz, TgX przetworzył w widowni, gdzie zaakcentowanej charaktery (nie w ASCII zestaw znaków) jest zatrudniony, możesz zechcieć zwrócić uwagę tu.
Cretl wygenerowuje TpX produkcję używającą jakikolwiek charakter kodujący jest standardem na miejscowym systemie. Jeżeli system kodujący będzie w rodzinie 8859, to prawdopodobnie będzie ok wihout jakiś specjalny wysiłek ze strony użytkownika. Nowsza GNU / Linuks systemy jakkolwiek typowo użyj Unicode (UTF-8). To jest również ok o ile twój TgX system może sprawować się UTF-8 wejście, które reąuires użycie lateks ucs paczka. A więc jeżeli używasz gretl, by wygenerować TpX wewnątrz bez --angielską widownię, gdzie jest system kodujący UTF-8, będziesz musieć zapewnić tak lateks ucs paczka jest zainstalowana. Ta paczka może lub nie może zostać zainstalowana domyślnie kiedy instalujesz TpX.
Dla odniesienia, jeżeli gretl dostrzega UTF-8 środowisko, następne linie są użyte w TgX wstęp:
\ usepackage { ucs } \ usepackage < plik:/// usepackage >[utf8x,]{ inputenc }
Rozdział 24.. Cretl i T ^<
189
24.5 Instalowanie i uczenie się T ^ X, który
To nie jest miejsce dla szczegółowego naświetlenia tych spraw, ale tu jest kilka wskazówek.
Dotychczas, ponieważ wiemy, każda GNU / Linuks dystrybucja ma paczkę lub ustawia paczek dla TgX i faktycznie ci są prawdopodobni zostać zainstalowani domyślnie. Sprawdź dokumentację dla twojej dystrybucji. Dla PANI Windowsa, kilka spakowanych wersji TpX jest dostępne: jeden z najbardziej popularnych jest MiKTpX w < http://www.miktex.org/ >. Dla X KOŚĆ Płaszcza nieprzemakalnego miłe wprowadzenie jest iTpXMac, w http:// itexmac. sourceforge.net / < http://itexmac.sourceforge.net/ >. Istotny punkt początkowy dla online TęX zasobów jest Wszechstronna Sieć Archowum TgX (CTAN) w http://www.ctan.org/ < http://www.ctan.org/ >.
Jeśli chodzi o uczenie się TpX, wiele przydatnych zasobów jest dostępne zarówno online i w być w druku. Między online przewodnikami, Antoni Robert - "F > TpX: od ąuick i brudny tytułować i finezja” jest bardzo pomocny, w
< http://www.sci.usq.edu.au/staff/robertsa/LaTeX/latexintro.html > doskonałe źródło dla wysuniętego do przodu materiału jest BTjX Towarzysz (Goossens et al, 2004).
Rozdział 25
Gretl i R, którym
25.1 Wprowadzenie
R jest, o wiele, największy wolny statystyczny project.1 Jak gretl, to jest GNU projekt i dwa ma dużo wspólnie; jakkolwiek podejście gretl's skupia się na spokoju użycia o wiele więcej niż R, który zamiast tego celuje okrążyć najszerszy możliwy zasięg statystycznych postępowań.
Jako jest naturalny w wolnym ekosystemie oprogramowania, nie obejrzymy siebie jako konkurenci do R, 2 ale raczej jako projekty dzielące wspólny cel, który powinien poprzeć siebie kiedykolwiek możliwy. Z tego powodu, gretl dostarcza sposobem współdziałania z R i w ten sposób umożliwiają użytkownicy złożenie zdolności dwóch paczek.
W tym rozdziale, wyjaśnimy jak wykorzystać władzę R's od wewnątrz gretl. Zakładamy, że czytelnik ma roboczą instalację R dostępnego i basie uścisku syntax.3 R's
Wbrew kilku dzielnym próbom, żadna graficzna muszla nie zyskała szerokiej akceptacji w R wspólnocie: ogólnie mówiąc, metoda standardu pracowania z R około pisze scenariusze lub przez pisanie rozkazów w R zachęcie, dużo w tej sam drodze, ponieważ to pisałby gretl scenariusze lub pracowałby z gretl konsolą. W tym rozdziale, skupienie będzie na metodach dostępne, by wykonać R rozkazy nie zostawiając gretl.
25.2 Zaczynania interakcyjnej R sesji najłatwiejszym sposobem użycia R od gretl ma zrobić tak interaktywnie: gdy tylko masz twoje dane władowały się w gretl, możesz wybrać rzecz menu “Narzędzia, GNU Początku R” i R będzie zaczęty, z twoim zestawem danych automatycznie miniętym do R sesji.
Prosty przykład: OLS na danych rozgniewanej sekcji
Dla tego przykładu, używamy zestawu danych l od Ramanathan podręcznika, który jest częścią zestawów danych próbki gretl's. Gdy tylko zestaw danych jest otwarty, przebiegamy OLS regresję ceny na sqft, bedrms i kąpielach. Część skutki gretl daje jest pokazany w Stół 25.1.
Stół 25.1: regresja ceny domu OLS przez gretl
Zmienny Współczynnik Std. p wartość t danych błędu
const 129.062 88.3033 1.4616 0.1746
sqft 0.154800 0.0319404 4.8465 0.0007
bedrms -21.587 27.0293 -0.7987 0.4430
kąpieli -12.192 43.2500 -0.2819, którymi strona główna 0.7838
1R's jest w http://www.r-project.org/. < http://www.r-project.org/ > 2OK, który jest nami nabierającymi? Ale to jest przyjazna konkurencja!
3The główne odniesienie dla R dokumentacja jest < http://cran.r-project.org/manuals.html >; to powiedział, R podręczniki obfitują na Sieci. Jako zawsze, Google jest twoim przyjacielem.
190
Rozdziału 25.. Gretl i R
191 Teraz powielimy powyższe skutki używające R. Select rzecz menu “Narzędzia, GNU Początku R”. Okno podobne do tego pokazanego w cyfrze 25.1 powinno wydać się.
Cyfra 25.1: R okno, którym
kilka sprzeciwy są w porządku tu: faktyczne spojrzenie R okna może być nieco inne niż co widzisz cyfrę 25.1 (specjalnie dla Windows użytkowników), ale to jest nieistotny. Ważny punkt jest, że masz okno, gdzie możesz napisać rozkazy do R. If, którego powyższe postępowanie nie obsługuje i żadne R okno nie otwiera się, to znaczy, że gretl był niezdolny, by rozpocząć R: powinieneś zapewnić, że R jest zainstalowany i pracujesz nad twoim systemem i, że gretl wie, gdzie jest to. Związane ustawienie można znaleźć przez wybieranie “Narzędzia, Preferencje, Ogólne” wejście menu, pod “Programy” tabulatorem.
Zakładając, że R został rozpoczęty szczęśliwie, zauważysz, że dwa rozkazy zostały wykonane automatycznie:
gretldata <- read.table("/ dom / podnosić /.gretl / Rdata.tmp", nagłówek = PRAWDZIWY) przymocuj(gretldata) który
Te rozkazy uczynią z tego, żeby nasz zestaw danych już mógł władowany do R workspace jako rama danych i został użyty natychmiast. W R języku, rama danych jest jednym z drogi R używa, by zgromadzić dane. Zaleta używania ramy danych jest, że kolejni przymocowują() rozkaz zapewnia, że zmienne imiona zdefiniowały w gretl workspace są dostępne jako ważne identyfikatory w R sesji.
Aby powielić OLS oszacowanie gretl's, wybrać R okno i napisać w szybkim
modelu <- lm(cena ~ sqft + bedrms + kąpie się) streszczenie(model) Powinieneś zobaczyć coś podobnego, by Wyobrazić 25.2. Surprise - oceny zbiegają się! W tym momencie możesz tylko zamknąć R okno lub napisać q() w R zachęcie.
Dane serii czasu
Pozwolone nas teraz zwracają się do podobnego przykładu, który używa danych serii czasu: porównamy gretl's i ocen R's nieśmiertelnego “linia lotnicza” modelu Pudła i Jenkins'. Dane są zawarte w zestawie danych próbki bjg. Następny gretl kod
Rozdział 25.. Gretl i R
192
Cyfry 25.2: OLS regresja na domu wycenia przez R
otwarty bjg
arima 0 1 1 ; 0 1 1 ; lg --nc
doprowadza do ocen pokazanych w Stół 25.2.
Zmienny © ja
Stół 25.2: Linia lotnicza model od Pudło i Jenkins (1976) - wybrana porcja gretTs szacuje
Współczynnik
Std. p wartość
t danych błędu
-4.4825 -7.6184 0.00134810 244.696 -483.39
0.0000 0.0000
-0.401824 0.0896421
-0.556936 0.0731044
Niezgodności kryterium informacji
Akaike
Kloc prawdopodobieństwo innowacji
Kiedy otwieramy R sesję jako opisany w poprzednim subsekcja, mijający danych mechanizm jest nieznacznie inny: odkąd nasze dane zostały zdefiniowane w gretl jako zestaw danych czas serii, R przedmiot używamy dla przenoszenie danych jest przedmiotem czas serii lub ts dla krótko. R dowodzi to przeczytany dane od gretl są w tym przypadku
# dane ładunku od gretl
gretldata <- read.table("/ dom / podnosić /.gretl / Rdata.tmp", nagłówek = PRAWDZIWY)
gretldata <- ts(gretldata, zacząć się = c(1949, 1), częstość = 12)
Ten mechanizm umożliwia zatrzymanie w R trochę przydatnej informacji, takiego jak okresowości danych i ograniczeń próbki, ale zbliża się do ceny, że imiona indywidualnych serii, określonych w gretl zestawie danych, są nie ważnymi identyfikatorami. Aby ekstrahować zmienny lg, trzeba użyć składnia lg <- gretldata,[, "lg"].
W praktyce ARIMA oszacowanie może zostać niesione przez wydawanie co następuje dwa R rozkazy:
Rozdział 25.. Gretl i R
193
Ig <- gretldata,[, "Ig"]
arima(lg, c(0, l, l), sezonowy = c(0,1, 1))
które wydaje
Współczynniki:
mai smal
-0.4018 -0.5569
s.e. 0.0896 0.0731
sigmaA2 estimated jako 0.001348: prawdopodobieństwo kloca = 244.7, aic = -483.4
Na
szczęście, oceny znów zbiegają się.
25.3 Biegania R scenariusz
Otwierający
się R okno i wpisujący rozkazy w jest coiwenient metodą kiedy praca jest smali. W sonie przypadkach, jakkolwiek, to byłoby lepsze, by mieć R wykonuje scenariusz przygotowany z góry. Oczywisty sposób zrobienia to ma użyć źródła() rozkaz w R. Alternatively, gretl oferuje komfort, aby wydać R scenariusz i przebiegnąć to, mienie aktualny zestaw danych wstępnie władował się automatycznie. Ta cecha może zostać wchodzona przez “Plik, Pliki Scenariusza” wejście menu. Przez wybieranie “Użytkownik pliku”, to może władować wstępnie istniejący R scenariusz; jeżeli chcesz utworzyć nowy scenariusz zamiast tego, wybrać “Nowy scenariusz, R scenariusz” wejście menu.
Cyfra 25.3: Redagowanie okno dla R scenariuszy
W jednych z dwóch przypadków, będziesz przedstawiony z oknem bardzo podobnym do okna edytora używanego dla zwykłych gretl scenariuszy, jako w cyfra 25.3.
Są dwie główne różnice: pierwszy, dostajesz składnię podświetlającą dla składni R's zamiast gretl's. Drugi, klikając na Wykonać ikona (ikonę biegów), rozpoczyna przykład R, w którym twoje rozkazy są wykonane. Zanim R właściwie jest przebiegany, jesteś spytany, czy chcesz przebiegnąć R interaktywnie lub nie (widzieć Cyfrę 25.4).
Interakcyjny bieg otwiera R przykład podobny do tego zobaczonego w poprzedniej sekcji: twoje dane wstępnie ładowane (jeżeli “dane wstępnie-ładunku” tyknięcie jest włączone jako jest domyślnie) i twoje rozkazy będą wykonane. Gdy tylko to jest zrobiony, znajdziesz się w R zachęcie, gdzie możesz stawać do więcej rozkazów.
Nieinteraktywny bieg, zamiast tego, wykonuje twój scenariusz, zbiera produkcję od R i przedstawia to tobie w oknie produkcji; R tylko będzie przymknięty tło. Jeżeli na przykład scenariusz w Cyfrze
25.3 jest przebiegany bez --interaktywnie, okno podobne do Cyfry 25.5 wyda się.
25.4 Biorącej rzeczy z powrotem i naprzód
Dotychczas, przejazd danych został ograniczony do przemijających serii od gretl do R. In porządek, by osiągnąć stopień satis fabryki współpracy, więcej jest potrzebowany.
Rozdział 25.. Gretl i R
194
Cyfry 25.4: Redagowanie okno dla R scenariuszy
Przechodzących macierze od gretl do R
Dla przemijających macierzy od gretl do R, możesz użyć funkcji macierzy mwrite opisanej w sekcja 12.6. Na przykład następny fragment kodu gretl wygenerowuje macierz =
7 11
8 12
9 13
10 14
3 i gromadzi to do plik mymatfi 1 e.mat.
macierz = mshape(seq(3,14), 4,3) zbłądź = mwrite(, "mymatfile.mat")
Aby odzyskać tę macierz od R, wszystko, co musisz zrobić jest <- as.matrix(read.table("mymatfile.mat", skoczyć = l))
To powinno być znany, że, chociaż w zasadzie nazwa zbioru, którą wybierasz może być jakąś ważną nazwą zbioru, kilka coiwentions może okazać się przydatny. Pierwszy, możesz zechcieć użyć informacyjnego przyrostka pliku taki jak “.mata”, ale to jest sprawa smaku. Co ważniejsze, dokładne miejsce pliku utworzonego przez mwrite mogłoby być zagadnieniem. Domyślnie, jeżeli żadna ścieżka nie jest wyszczególniona w imieniu pliku, gretl gromadzi pliki macierzy w aktualnym katalogu pracy. Jakkolwiek to może być mądry dla celu pod ręką, by użyć katalogu, w którym gretl gromadzi, cały jego pliki robocze, imię jest zgromadzone we wbudowanym sznur dotdir (zobacz sekcję 11.2). Wartość tego sznura automatycznie jest minięta do R jako zmienna sznura gretl.dotdir, więc powyższy przykład może zostać przepisany więcej czysto jako
Gretl strona:
macierz = mshape(seq(3,14), 4,3)
zbłądzić = mwrite(, "@ dotdir / mymatfile.mat")
R strona:
fname <- skleić(gretl.dotdir, "mymatfile.mat", sep ="") <- as.matrix(read.table(fname, skoczyć = l))
Mijając dane od R do gretl
Dla przemijających danych w przeciwnym kierunku, gretl definiuje specjalną funkcję, która może zostać użyta w R środowisku, by automatyzować, tak dużo jak możliwy, mechanizm, który jest podobny do tego zobaczonego w
Chapter25. Cretl i R 195
Cyfry 25.5: Redagowanie okno dla R pisze scenariusz według poprzedni subsekcja. R przedmiot będzie napisany jako plik roboczy w dotdir katalogu gretl's, skąd to może łatwo zostać odzyskane od wewnątrz gretl.
Imię tej funkcji jest gretl.export()i to akceptuje jedną dyskusję, przedmiot, by zostać skręcony w lewie na byłym. Obecnie, jedyne przedmioty, które mogą zostać wyeksportowane z tę metodą, są macierzami, ramami danych i przedmiotami czas serii. Funkcja tworzy plik tekstu z tym sam imieniem jak eksportowanym przedmiotem w tymczasowym katalogu gretl's. Dane ramy i przedmioty czas serii mogą zgromadzone jako CSV pliki i są odzyskane przez używanie dodać rozkaz. Macierze, zamiast tego, są zgromadzone w specjalnym formacie tekstu, że gretl używa dla gromadzenie macierzy w plikach tekstu (widzą sekcję 12.6); przyrostek pliku jest w tym przypadku .mata i przeczytać macierz w gretl tobie musi użyć mread() funkcja.
Jako przykład, bierzemy dane linii lotniczej i używamy ich, by oszacować strukturalny model serii czasu à la Harvey (1989). Model, którego użyjemy jest basic Strukturalny Model (BSM), wewnątrz, które serie czasu jest rozłożone do trzech okresów:
yt = Ht + Yt + £ t, gdzie, [xt jest komponentem trendu, yt jest sezonowy składowy i et jest okresem hałasu. Kolejno, co następuje jest założony, by trzymać się: )L / t = Bt- \ + Ht ABt = & Asyt = Acot,
gdzie jest A5 sezonowym odróżnianiem operatora, (1 - Ls)i qt, X, t i łóżeczko jest wzajemnie uncorre-lated biały hałas procesy. przedmiot analizy jest, aby oszacować niezgodności hałasu komponenty (które może być zerem) i odzyskać oceny utajonych procesów, [xt ( “poziom”), Bt ( “zbocze”) i yt.
Cretl nie dostarcza (jeszcze) rozkazu dla szacowania to klasa modeli, więc użyjemy R's jest StructTS rozkaz i importować skutki tylne do gretl. Gdy tylko bjg zestaw danych jest władowany wewnątrz gretl, mijamy dane do R i wykonujemy następny scenariusz:
Rozdział 25. Gretl i R
196
fragment kloc serie y <- gretldata,[, "Ig"]
ocena model strmod <- StructTS(y)
chyba
że dopasowane komponenty (wygładziły) compon <- as.ts(tsSmooth(strmod))
chyba
że estimated niezgodności vars <- as.matrix(strmod $ coef)
wyeksportować do gretl's jest czasowym pracownikiem dir gretl.export(compon)
gretl.export(vars)
Wewnątrz tym przypadek, przebiegając powyższych R doprowadza nic ważne tak do rozbrzmiewania rozkazów:
# dane ładunku od gretl
gretldata <- read.table("/ dom / podnosić /.gretl / Rdata.tmp", nagłówek = PRAWDZIWY)
gretldata <- ts(gretldata, początek = c(1949, 1), częstość = 12)
# scenariusz ładunku od gretl
# fragment kloc serie
y <- gretldata,[, "Ig"]
# ocena model
strmod <- StructTS(y)
# chyba że dopasowane komponenty (wygładziły)
compon <- as.ts(tsSmooth(strmod))
# chyba że estimated niezgodności
vars <- as.matrix(strmod $ coef)
# eksportu do gretl's czasowy pracownik dir
gretl.export(compon)
gretl.export(vars)
Jakkolwiek, widzimy od produkcja tej dwa gretl.export() rozkazy biegły na zewnątrz błędy. Odtąd, jesteśmy gotowi do puli skutki tylne do gretl około wykonując następne rozkazy, albo od konsoli lub około tworząc smali scenariusz:4
dodaje @ dotdir / compon.csv
vars = mread("@ dotdir / vars.mat") pierwszy rozkaz czyta estimated czas seriom komponenty od CSV plik, który jest formatem tak przemijający mechanizm zatrudnia dla serii. macierz vars jest przeczytany od pliku vars.mat.
Potem powyższe rozkazy były wykonane, trzy nowy serie wydają się wewnątrz gretl workspace, który jest ocenami trzech komponenty: około planując ich razem z oryginalnymi danymi, powinieneś dostać wykres podobny do Cyfry 25.6. oceny niezgodności po prostu są zobaczone około drukując vars macierz, jak wewnątrz
? drukować vars vars (4 x 1)
4 To, które przykład będzie pracować nad Linuks i przypuszczalnie dalej OSX na zewnątrz modyfikacje. Dalej Windows platforma, możesz musieć zastępować “/” charakter z “\”.
Rozdział 25. Gretl i R
197
1955 zbocze
Ig
6.4
6.2
6 5.8 /
5.6 5.4 //
l \ t
5 Ąf \
4.8
1961
1949
0.01025 0.0102
0.01015 0.0101
0.01005
0.01
1955
1961
1949
6.2 6 5.8 5.6 5.4 5.2 5 4.8 4.6
1949
0.3
0.25
0.2
0.15
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2
-0.25
1949
poziom
1955
morze
1955
1961
1961
Cyfra 25.6: Oszacowany komponenty od BSM
0.00077185
0.0000
0.0013969
0.0000
To jest,
afj = 0.00077185, ćrJ = 0, ^ = 0.0013969, ćr | = 0
Zawiadomienie tak, odtąd & = 0, ocena dla j8t jest stały i równy komponent jest po prostu przypadkowy spacer z prądem.
25.5 Współdziałanie z R od CLI
W
górze do teraz, założyliśmy to interakcja z R był reąuested od GUI klient. Wewnątrz zamów, by zrobić to sam ze złącza wiersza zlecenia, gretl dostarcza obcy command.5 To rozkaz bierze formie
obcej język = R, [--wyślesz-dane,] [--guiet,]
R rozkazy
kończą
się obcy
i osiąga to sam powodują jako podporządkowywanie się enclosed R rozkazy przez GUI w nieinteraktywnym trybie (zobacz 25.3 powyższy). --opcje wyślesz-danych pozwala użytkownikowi mieć dane obecne w gretl sesja władowała się na aucie; --cicha opcja zapobiega produkcję od R od bycia rozbrzmiana wewnątrz gretl produkcja.
Z tym klauzula, powielając przykład w poprzednim subsekcja jest raczej łatwy: zasadniczo, zupełnie to bierze encapsulating zawartość R scenariusza w obcym... koniec obcy blok; zobacz przykład
25.1.
wersje przyszłości 5In gretl, ten rozkaz będzie radzić interakcję z innymi programami, nie tylko R. For moment, jego zakres nieco jest wyszczególniony.
Rozdział 25.. Gretl i R
198
Przykładu 25.1: Oszacowanie basic Strukturalnego Modelu - prosty
otwarty bjg.gdt
obcy język = R --wyślesz-dane y <- gretldata,[, "Ig"] strmod <- StructTS(y) compon <- as.ts(tsSmooth(strmod)) vars <- as.matrix(strmod $ coef)
gretl.export(compon) gretl.export(vars) skończ się obcy
dodać @ dotdir / compon.csv przemianowuje równy lg_level przemianowywać zbocze lg_slope przemianowują morze lg_seas
vars = mread("@ dotdir / vars.mat")
Przykład 25.2: Oszacowanie basic Strukturalnego Modelu - przez
funkcja funkcji RStructTS(serie myseries)
smpl ok(myseries) --ograniczyć sx = argname(myseries)
obcy język = R --wyślesz-dane --spokój @ sx <- gretldata,[, "myseries"] strmod <- StructTS(@ sx) compon <- as.ts(tsSmooth(strmod)) gretl.export(compon)
skończyć
się obcy
dodać @ dotdir / compon.csv przemianowuje równo @ sx_level przemianowuje zbocze @ sx_slope przemianowuje morze @ sx_seas
lista ret = @ sx_level @ sx_slope @ funkcja końca ret lista powrotu sx_seas
otwarta bjg.gdt
lista X = RStructTS(lg)
Dzieli
na
rozdziały 25.. Gretl i R
199 powyższa składnia, wbrew byciu już całkiem przydatny sam, pokazuje jego pełna władza kiedy to jest użyte w połączeniu z pisanymi przez użytkownika funkcjami: przykład 25.2 pokazuje jak zdefiniować gretl funkcję, która nazywa R wewnątrz.
Notatka na występie: obecnie, kiedy R jest nazwany od wewnątrz gretl używającym obcy blok, R program jest rozpoczęty na każdej inwokacji, która może być prawdziwym razem zużywającym się. Dla występu maksimum, powinieneś zorganizować twój scenariusz, aby grupować razem jak największe ilość R działań, odtąd pomniejszając numer odmiennej obcej blocks.6
6In przyszłości, którą możemy być w stanie poprawić w tym, używanie rozmów do R dzieliło bibliotekę zamiast irwocations programu.
Rozdział 26
Diagnozowanie gretl
26.1 Bug sprawozdania
Bug sprawozdania są mile widzianym. Jak dobrze pójdzie, jesteś nieprawdopodobny, by znaleźć błędy w faktyczne obliczenia zrobionych przez gretl (chociaż to stwierdzenie nie tworzy jakiegoś rodzaju gwarancji). Możesz, jakkolwiek, natknąć się na błędy lub osobliwości w zachowaniu graficznej powierzchni międzyfazowej. Proszę zapamiętaj, że przydatność sprawozdań błędu znacznie jest ulepszona, jeżeli możesz być tak określony jak możliwy: co dokładnie poszło źle, pod którymi warunkami i, na którym systemie obsługiwania? Jeżeli widziałbyś komunikat błędu, co dokładnie zrobiłoby to mówią?
26.2 Pomocniczych programów
Jako wspomniany powyżej, gretl nazywa sonie innymi programami, by skończyć pewne zadania (gnuplot dla powielania, fffgX dla wysokogatunkowego składania produkcji regresji, GNU R). Jeżeli coś idzie źle z takimi zewnętrznymi związkami, to nie jest zawsze łatwe dla gretl, by doprowadzić do informacyjnego komunikatu błędu. Jeżeli taki związek zawodzi, kiedy wchodzony z gretl graficznej powierzchni międzyfazowej, możesz być w stanie dostać więcej informacji przez zaczynanie gretl od rozkazu podpowiadają niż przez wejście menu pulpitu lub ikonę. Na systemie okna x, zacznij gretl od zachęty muszli w xterm; na PANI Windows, zacznij program gretlw32.exe od okna konsoli lub “DOS pudła” używającego -g lub -zdebagować flaga opcji. Dodatkowe komunikaty błędem mogą zostać pokazane na nieuleczalnym oknie.
Również proszę notatka, że dla najbardziej zewnętrznych rozmów, gretl zakłada, że programy w ąuestion są dostępne w twojej “ścieżce” - to jest, że oni mogą zostać odwołany po prostu przez imię programu, bez dostarczania fuli location.1 programu W ten sposób, jeżeli dany program zawodzi, spróbować eksperyment pisania imienia programu w zachęcie rozkazu, jako pokazany poniżej.
Powielając Składanie system okna
X R GNU gnuplot lateksu, xdvi R
PANI Windowsa wgnuplot.exe pdflatex RGui.exe,
Jeżeli program zawodzi zacząć się od zachęty, to nie jest gretl zagadnienie ale raczej, że katalog macierzysty programu nie jest w twojej ścieżce lub program nie jest zainstalowany (właściwie). Dla szczegółów na modyfikowaniu twojej ścieżki proszę widzą dokumentację lub pomoc elektroniczną dla twojego systemu obsługiwania lub łuszczą się.
lThe wyjątek do tej reguły jest irwocation gnuplot pod PANIĄ Windowsem, gdzie jest fuli ścieżka do programu dana.
200
Dzieli
na
rozdziały 27 złącze wiersza zlecenia
27.1 Gretl w konsoli gretl paczka zawiera program rozkaz linii gretlcli. Na Linuks to może zostać przebiegane od nieuleczalnego okna (xterm, rxvt lub podobny)lub w konsoli tekstu. Pod PANIĄ Windowsem it może zostać przymknięty okno konsoli (czasami nieściśle nazywane “DOS pudło”). gretlcli ma, że jego przyznaje się pomóc plikowi, który może zostać wchodzony przez pisanie “pomagają” w zachęcie. To może zostać przymknięte tryb wypieku, wysyłanie przetworzyło bezpośrednio do pliku (zobacz również Odniesienie Rozkazu Gretl).
Jeżeli gretlcli jest łączony do readline biblioteki (to jest automatycznie przypadkiem w PANI Windows version; również zobacz Aneks C), wiersz zlecenia jest odwołaniem zdolny i edytowalny i oferuje zakończenie rozkazu. Możesz użyć W górze i Klawisz strzałki w dół, by jeździć na rowerze przez poprzednio napisane rozkazy. Na danym wierszu zlecenia, możesz użyć strzały wpisuje, by przesunąć, w połączeniu z Emacs redagowanie keystokes.1 najbardziej popularny tych są: Efekt
Naciśnięcia
klawisza Ctrl-pójść, by zacząć się linii
Ctrl-e jechać do końca wiersza
Ctrl-d skreślić charakter do właściwy,
gdzie “Ctrl-” środki tłoczą się “” klucz kiedy “Ctrl” klucz również jest przygnębiony. W ten sposób, jeżeli chcesz zmienić coś na początku rozkazu, nie musisz cofnąć się ponad linią całości, wymazując, ponieważ idziesz. Tylko skocz do początku i dodaj lub skreśl charaktery. Jeżeli piszesz, pierwsze listy imienia rozkazu wtedy naciskają Tabulator klucz, readline będzie usiłować uzupełnić imię rozkazu dla ciebie. Jeżeli będzie unikalne zakończenie, to będzie położone na miejscu automatycznie. Jeżeli jest więcej niż jednym zakończeniem, naciskanie Tabulatora drugim razem wychowuje listę.
27.2 CLI składni
Prawdopodobnie najbardziej przydatny tryb, ponieważ dużej wydajność praca z gretlcli jest wypiek (nieinteraktywnym) trybem, w którym program czyta i przetwarza scenariusz i wysyła produkcję, by rejestrować. Na przykład
gretlcli -b scriptfile > outputfile scriptfile jest potraktowany jako dyskusja programu; to powinno wyszczególnić dane rejestrują, by użyć wewnątrz, używając składnia otwarty datafile. Nie zapominaj -b (wypieku) witka, inaczej program będzie czekać na wejście użytkownika po wykonaniu scenariusza.
1Actually, oprawy klucza pokazane poniżej są tylko zaniedbaniami; oni mogą zostać przystosowany. Zobacz readline instrukcję. < http://cnswww.cns.cwru.edu/ ~ chet / readline / readline.html >
201
Części IV
Aneksów
202
Aneksu, który
Dane plik wyszczególnia format krajowca basica
A.1
W ojczystym układzie danych gretl's, zbiór danych jest zgromadzony XML (rozszerzalnym językiem marży). Dane pliki odpowiadają prosty DTD (definicji typu dokumentu) oddawanej gretldata.dtd, który dostarczony z gretl dystrybucją i jest zainstalowany w danych systemu kierujących, (np. / usr / udział / gretl / dane < plik:/// usr / udział / gretl / dane > dalej Linuks.) Dane hles może być czystym tekstem lub gzipped. Oni zawierają faktyczne wartości danych plus dodatkowa informacja taki jak imiona i opisy zmiennych, freąuency danych i tak dalej.
Większość użytkowników będzie mieć musieć przeczytać lub napisać takim hles inne niż przez sam gretl, ale, jeżeli chcesz zmanipulować nimi używającymi inne oprogramowanie obrabia powinieneś zbadać DTD jak również spoglądają na kilka z dostarczonego dane praktyki hles: data4-l.gdt daje prostemu przykładowi; data4-10.gdt jest przykładem, gdzie etykiety obserwacji są zawarte.
A.2 Tradycyjny ESL format
Dla wstecznej zgodności, gretl może również poradzić dane hles w “tradycyjnych” formatować odziedziczony od ESL programu Ramanathan's. W tym formacie (którym było zaniedbanie w gretl przed wersją 0.98) zbiór danych jest reprezentowany przez dwa hles. To zawiera faktyczne dane i inne informacje dalej jak dane powinny zostać przeczytane. Jest bardziej specihc:
Faktyczne dane: prostokątna macierz białej przestrzeni rozdzieliła numery. Każda kolumna reprezentuje zmienną, każdy rząd obserwacja na każdym ze zmienne (stylu arkusza kalkulacyjnego). Danymi kolumny mogą zostać rozdzielone przez przestrzenie lub tabulatory. hlename powinien mieć sufhx .gdt. Domyślnie dane hle jest ASCII (czystym tekstem). Opcjonalnie to może zostać sprężone na gzip, by uratować ilość miejsca na dysku. Możesz wstawić komentarze do dane hle: jeżeli linia rozpoczyna od znaku haszyszu (#) cała linia jest zignorowana. To jest zgodny z gnuplot i dane oktawy hles.
Nagłówek: danymi hle musi zostać w towarzystwie nagłówek hle, który ma ten sam basename jak dane hle, plus sufhx .hdr. Ten hle zawiera, w porządku:
(Opcjonalne) komentarze na danych, ustawionych przez sznur otwarcia (* i sznur zamknięcia *), każdy z tych sznurów, by wystąpić na liniach sami.
(Reąuired) przechyla się białej przestrzeni oddzielnej imiona zmiennych w dane hle. Imiona są ograniczone do 8 charakterów, muszą rozpocząć od listu i są ograniczone do alfanumerycznych charakterów plus podkreślić. Lista może kontynuować więcej niż jedna linia; to jest rozwiązane z średnikiem,.
(Reąuired) obsewations linia formy 1185.. hrst element daje dane freąuency (1 dla niedatowanych lub rocznych danych, 4 dla ąuarterly, 12 dla miesięcznika). Drugi i trzecie elementy dają start i kończąc obserwacje. Ogólnie ci będą 1 i numerem obserwacji odpowiednio, dla niedatowanych danych. Dla danych czas serii to może użyć dat formy 1959.1 (ąuarterly, jedna cyfra po punkcie) lub 1967.03 (miesięczny, dwie cyfry po punkcie). Zobacz Rozdział 15 dla specjalnego użycia tej linii w przypadku danych panelu.
Słowo kluczowe BYOBS.
203
AppendixA. Szczegóły pliku danych
204
Tu jest przykładem kształtnego pliku nagłówka danych.
(*
DATA9-6:
Dane dalej wpisują(pieniądze), kloc(dochód) i stopa procentowa z USA.
Źródło: Towar i Watson (1993) Econometrica
(niegładzone dane) Okres jest 1900-1989 (roczne dane).
Dane zestawiły około Graham Elliott. *)
lmoney lincome intrate ; 1 190 0 1989 BYOBS który odpowiedni plik danych zawiera trzy kolumny danych, każde mienie 90 wejść. Trzy dalsze cechy “tradycyjny” układ dane mogą być znany.
Jeżeli BYOBS słowo kluczowe się BYVAR i zastępuje mający za sobą słowo kluczowe DWÓJKOWE, to indi-cates tak odpowiednie dane plik jest dwójkowym formatem. Takie dane rejestrują może zostać napisany od gretlcli używającego rozkaz sklepu z -s flaga (pojedynczą precyzją) lub -och flaga (podwójna dokładność).
Jeżeli BYOBS jest śledzonym przez słowo kluczowe MARKERY, gretl oczekuje plik danych, w którym pierwsza kolumna zawiera sznury (8 maksimum charakterów) używanego zidentyfikować obserwacje. To może być zręczny w przypadku rozgniewany przekrojowych danych, gdzie są części obserwacji identyfikowalne: krajów, stanów, miast lub czegokolwiek. To może również być przydatne dla nieregularnych danych serii czasu, takiego jak codziennych danych kursu akcji, gdzie są pewne dni nie handlem dni - w tym przypadku obserwacje mogą zostać oznaczone z sznurem daty takim jak 10/01/98. (Zapamiętaj maksimum 8-charakteru.) Zauważyć, że DWÓJKOWY i MARKERY są wzajemnie wyłącznymi flagami. Również zauważ, że “markery” nie są rozważone, by być zmienną: ta kolumna nie ma odpowiedniego wejścia w wykazie zmiennych imion w pliku nagłówka.
Jeżeli plik z tym sam niegodziwym imieniem jak plikiem danych i plikami nagłówka, ale z przyrostkiem .lbl, jest znaleziony, to jest przeczytane, by wypełnić opisowe etykiety dla serii danych. Format pliku etykiety jest prosty: każda linia zawiera imię jednej zmiennej (jako znalezisko w pliku nagłówka), mający za sobą jeden lub więcej przestrzeni, mający za sobą opisową etykietę. Tu jest przykład: cena Nowy indeks cen samochodu, 1982 niegodziwego roku,
Jeżeli chcesz uratować dane w tradycyjnym formacie, użyć -t flaga z rozkazem sklepu, albo w programie rozkaz linii lub w oknie konsoli GUI programu.
A.3 Dwójkowa baza danych wyszczególnia gretl bazę danych składa się z dwóch części: plik indeksu ASCII (z przyrostkiem nazwy zbioru .idx) zawierając informację o seriach i dwójkowym pliku (przyrostek .kosz) zawierając faktyczne dane. Dwa przykłady formatu dla wejścia w idx pliku są pokazane poniżej:
G0M910 Złożony indeks 11 wiodących wskaźników (1987 = 100) M 1948.01 - 1995.11 n = 575
currbal Bilansu Płatności: Bilans na Aktualnym Koncie; SA Q 1960.1 - 1999.4 n = 160 pierwsze pole jest imieniem serii. Drugi jest opisem serii (maksimum 128 charac-ters). Na drugiej linii pierwsze pole jest kodem częstości: M dla miesięcznika, Q dla kwartalnego, dla jednorocznej rośliny, B dla interes codziennego (codziennie z pięciu dniami tygodniowo) i D dla codziennego (siedem dni tygodniowo). Żadne inne częstości nie są zaakceptowane obecnie. Wtedy przychodzi data startu (N.B. z dwoma cyfry następujące punkt dla miesięcznych danych, jednego dla kwartalnych danych, żadnego dla jednorocznej rośliny), przestrzeń, łącznik pisarski,
AppendixA. Dane plik wyszczególnia
205
inna przestrzeń, data zakończenia, sznur “n ” = i numer całości obserwacji. W przypadku codziennych danych start i kończenie datami powinno zostać oddane formę YYYY / MM / DD. Ten format musi zostać uszanowany dokładnie.
Opcjonalnie pierwsza linia pliku indeksu może zawrzeć krótki komentarz (w górę do 64 charakterach) na źródle i naturze danych, podążając znak haszyszu. Na przykład
# Deska Rezerwy federalnej (stopy procentowe) odpowiedni dwójkowy plik bazy danych trzyma wartości danych, reprezentowany jako “płynie”, to jest, liczby zmiennopozycyjne pojedynczej precyzji, typowo biorąc cztery bajty za sztukę. Numery są spakowane “przez zmienny”, żeby pierwsze n numery były obserwacjami z zmienny 1, następny m obserwacje dalej zmienne 2 i tak dalej.
Aneks B
Dane import przez ODBC
Od wersja 1.7.5, gretl dostarcza metodę dla odzyskiwania danych od baz danych, które popierają ODBC standard. Większość użytkowników będzie interesować się tym, ale może być sonie, dla którego ta cecha ma znaczenie dużo: typowo, ci, którzy obsługują w środowisku, gdzie ogromne gromadzenie danych są dostępni przez System Zarządzania Bazy Danych (DBMS).
ODBC jest de facto standardem dla współdziałania z takimi systemami. W następnej sekcji dostarczamy trochę informacji tła dalej jak ODBC pracuje. To co właściwie musisz zrobić, by mieć gretl odzyskuje dane od bazy danych, jest wyjaśnione w sekcji B.2.
Pojęcia bazy ODBC B.l
ODBC jest krótki dla Otwartej Spójności Bazy danych, grupy metod oprogramowania, które umożliwiają klientowi współdziałanie z ściekiem bazy danych. Najbardziej popularne działanie jest kiedy klient aportuje jakieś dane od serwującego. ODBC służy jako pośrednia warstwa między klientem i serwującym, więc klient “rozmowy” do ODBC niż wchodzącego serwujący bezpośrednio (zobacz Cyfra B.l).
ODBC
*
Cyfra B.l: Odzyskując dane przez ODBC
Dla powyższego mechanizmu do pracy, to konieczne, żeby związane ODBC oprogramowanie zostało zainstalowane i pracując nad maszyną klienta (kontaktują się z twoim DECYBEL administratorem dla szczegółów). W tym momencie baza danych (lub bazy danych) że serwujący dostarcza, będzie dostępne do klienta jako źródło danych z określony identyfikator (Imieniem Źródła danych lub DSN); w większości wypadków nazwa użytkownika i hasło są reąuired, by połączyć się do źródła danych.
Gdy tylko związek jest założony, użytkownik wysyła ąuery do ODBC, który kontaktuje się z kierownikiem bazy danych, zbiera skutki i odsyła ich do użytkownika. ąuery prawie niezmiennie jest sformułowany w specjalnym języku używanym dla celu, mianowicie SOL.1 nie dostarczymy tu SQL podręcznika: są wielu takimi podręcznikami na Sieci; poza tym, każdy kierownik bazy danych ma skłonnością do poparcia jego własnego SQL dialektu tak dokładna forma SQL ąuery może zmienić się nieznacznie, jeżeli DBMS na innym końcu jest Wyrocznią, MySQL, PostgreSQL lub czymś jeszcze.
Sumce to powiedzieć, że główne stwierdzenie, ponieważ odzyskiwanie danych jest WYBRANYM stwierdzeniem. W DBMS, dane są zorganizowane w stołach, które są z grubszą równoważne arkusze kalkulacyjne. WYBRANY stwierdzenie powraca podzespół stołu, który jest sobą stół. Na przykład miej wrażenie tak, że baza danych trzyma się, że stół nazwał “NatAccounts”, zawierając dane pokazane w Stole B.l. SQL stwierdzenie
WYBRANY qtr, tradebal, gdp OD NatAccounts, GDZIE rok = 1970; lSee http://en.wikipedia.org/wiki/SQL.
206
Aneksu B. Dane importują przez ODBC
207
rok qtr gdp consump tradebal
1970 1 584763 344746.9 -5891.01
1970 2 597746 350176.9 -7068.71
1970 3 604270 355249.7 -8379.27
1970 4 609706 361794.7 -7917.61
1971 1 609597 362490 -6274.3
1971 2 617002 368313.6 -6658.76
1971 3 625536 372605 -4795.89
1971 4 630047 377033.9 -6498.13
Stół B.l: “NatAccounts” stół
doprowadza do podzespołu oryginalnych danych pokazanych Stół B.2.
qtr tradebal gdp
1 -5891.01 584763
2 -7068.71 597746
3 -8379.27 604270
4 -7917.61 609706
Stół B.2: Skutek WYBRANEGO stwierdzenia
Cretl dostarcza mechanizm dla wysyłania twojego ąuery do DBMS przez ODBC i zawierania skutków w twoim aktualnie otwartym zestawie danych.
B.2 Składnia
Obecnie, ODBC import jest tylko możliwy przez wiersz zlecenia interface.2 dwa rozkazy, że gretl używa obecnie dla aportowanie danych przez ODBC związek są otwarte i dane.
Otwarty rozkaz jest użyty dla łączenia się do DBMS: jego składnia jest
otwartym dsn = baza danych, [użytkownik = nazwa użytkownika,] [hasło = passworc /] --odbc użytkownik i rzeczy hasła jest opcjonalny; efekt tego rozkazu ma zainicjować ODBC związek. Zakłada, aby maszyna gretl biegł dalej każe roboczy ODBC klient zainstalowany.
Aby właściwie odzyskać dane, rozkaz danych jest użyty. Jego składnia jest: serie
danych, [obs format = format sznur,] pytanie sznur --odbc,
gdzie:
serie jest imieniem gretl serii, by zawrzeć przychodzące dane, które nie potrzebują egzystowali przed ąuery. Zauważ, że rozkaz danych importuje jednymi seriami jednocześnie.
format sznur jest opcjonalnym parametrem, używanym, by poradzić przypadki kiedy “prostokątna” organizacja bazy danymi nie może zostać założona (więcej na tym później);
ąuery-stńng jest sznurem zawierającym SQL, który stwierdzenie użyło, by wyciągnąć dane.
2 Od projektowania graficznej powierzchni międzyfazowej dla to jest konceptualnie prosty ale raczej czasochłonny, to, w czym celujemy, jest krzepkie i rozsądnie potężne wprowadzenie transferu danych. Gdy tylko wszystkie zagadnienia są uporządkowane, zaczniemy wprowadzić w życie GUI powierzchnię międzyfazową.
Aneks B. Dane importują przez ODBC
208, że pytanie sznur może, w zasadzie, zawierać trochę ważny SQL stwierdzenie, które doprowadza do, stołu: “;” charakter na końcu będzie dodany automatycznie. Ten sznur może zostać wyszczególniony bezpośrednio w rozkazie, jako w
danych x "WYBIERAJĄ foo OD baru" --odbc,
który zgromadzi do gretl zmienny x zawartość kolumna foo od baru stołu. Jakkolwiek od w autentycznej sytuacji sznur zawierający SQL stwierdzenie będzie raczej długo, to może być najlepsze, by utworzyć to tuż przed cali do danych. Na przykład
sznur SqlQry = "WYBIERZ foo OD baru" dane x SqlQry --odbc,
Jeżeli opcjonalny obs format parametru jest ieobecny, jako w powyższym przykładzie, SQL ąuery powinien powrócić dokładnie jedną kolumnę danych, które jest przyzwyczajony do fili zmienny x seąuentially. To może być konieczne, by zawrzeć smpl rozkaz zanim dane rozkażą, by ustawić prawo “okno” dla przychodzących danych. Ponadto, jeżeli to nie może założyć, że dane będą dostarczone w poprawnym porządku (typowo, chronologiczny porządek), SQL ąuery powinien zawrzeć odpowiedni PORZĄDEK PRZEZ klauzulę.
Opcjonalny sznur formatu być używany dla tych przypadków kiedy nie ma żadnej pewności, że dane od ąuery przybędą do tego sam porządku jako gretl zestaw danych. To może zdarzyć się kiedy chybiające wartości są przeplatane w kolumnie lub z danymi, które nie miej naturalnego porządkowania, np. rozgniewany przekrojowe dane. Wewnątrz ten przypadek, SQL stwierdzenie powinno powrócić stół z n kolumnami, gdzie pierwszy n - 1 kolumny jest użyte, by zidentyfikować, którą obserwację wartość w n-th kolumna należy do. Sznur formatu jest użyty, by przetłumaczyć pierwszy n - 1 pole do sznura, który dopasowuje sznur gretl, używa, by zidentyfikować obserwacje w aktualnie otwartym zestawie danych. Obecnie, n powinien być między 2 i 4, które powinien przykryć najwięcej, jeżeli nie wszystko, przypadki.
Na przykład rozważ co następuje zmyślony przypadek: mamy zestaw danych 5dniprzez pośrednictwo tygodnia, do którego chcemy dodać wskaźnik giełdowy dla Verdurian rynku;3 to tak zdarza się, że w Verduria soboty pracują dni ale środy nie są. Chcemy kolumnę, która nie zawiera danych na temat sobót, ponieważ nie wiedzielibyśmy, gdzie położyć ich, ale równocześnie chcemy umieścić chybiające wartości we wszystkie środy.
W tym przypadku, następna składnia mogłaby zostać użyta
sznurem QRY ="WYBRANY rok, miesiąc, dzień, VerdSE OD Almealndexes" dane y obs formatu"= % d /% d /% d" @ QRY --odbc kolumna, którą VerdSE trzyma dane, by zostać zaaportowany, które wejdzie do gretl serii y., który pierwsze trzy kolumny są użyte, by zbudować sznur, który identyfikuje dzień. Odkąd sznur jak "2008/04/26" nie odpowiada jakiejś obserwacji w naszym zestawie danych (to jest sobotni), że rząd po prostu jest zrzucony. Z drugiej strony od żadnego sznura "2008/04/23" został znaleziony w danych pochodzących z DBMS (to jest środa), że wejście jest zostawione czysto w naszym zmiennym y.
B.3 Przykłady
W następnych przykładach, założymy, że ten dostęp jest dostępny dla bazy danych znanej do ODBC z imieniem źródła danych “AWM”, z nazwa użytkownika “Otton” i hasło “Bingem”. Baza danych “AWM” zawiera ąuarterly dane w dwóch stoły (zobacz B.3 i B.4): stół Consump jest klasycznym “prostokątnym” zestawem danych; to jest, jego wewnętrzna organizacja jest tym samym jako w arkuszu kalkulacyjnym lub w econometrics paczce jak sam gretl: każdy rząd jest punktem odniesienia i każda kolumna jest zmienną. Z drugiej strony struktura DANE stołu jest inna: każdy zapis jest jedną cyfrą, zgromadzoną kolumna xval i inne pole trzymają szlaku, któremu zmiennego to należy do, dla której daty.
3 Widzi http://www.almeopedia.com/index.php/Verduria. < http://www.almeopedia.com/index.php/Verduria >
Aneks B. Dane importują przez ODBC
209
Stół Consump
Stół DANE
Piszą
Pole
czas dziesiętny(7,2)
dochód dziesiętny(16,6) consump dziesiętny(16,6)
Typ
Pole
rok dziesiętny(4,0)
qtr dziesiętny(l, 0)
varname varchar(16)
xval dziesiętny(20,10)
Stół B.3: Przykład AWM baza danych - DANE
Stołu struktura
Stół Consump
1970.00 1970.25 1970.50 1970.75 1971.00 1971.25 1971.50
424278.975500 433218.709400 440954.219100 446278.664700 447752.681800 453553.860100 460115.133100
344746.944000 350176.890400 355249.672300 361794.719900 362489.970500 368313.558500 372605.015300
1970 1
1970 2
1970 3
1970 4
1970 1
1970 2
1970 3
1970 4
1970 1
1970 2
MOŻE
ZAKONSERWOWAĆ
KONSERWOWAĆ
KONSERWOWAĆ
COMPR
COMPR
COMPR
COMPR
Dl
Dl
-517.9085000000
662.5996000000
1130.4155000000
467.2508000000
18.4000000000
18.6341000000
18.3000000000
18.2663000000
1.0000000000
0.0000000000
Stół B.4: Przykład AWM baza danych - dane
Przykład B.1 pokazy dwa elementarne pytania: pierwszy, który ustawiamy pusty kwartalny zestaw danych. Wtedy łączymy się do bazy danych przez otwarte stwierdzenie. Gdy tylko związek jest założony aportujemy, jedna kolumna jednocześnie, dane od Consump stołu. W tym przypadku, żaden sznur obserwacji nie jest konieczny, ponieważ dane już są ułożone w macierz podobnej strukturze, więc tylko musimy przekonać związane kolumny.
W przykładzie B.2, przeciwnie, wykorzystujemy sznur obserwacji, od rysujemy dane od DANE stół, który nie jest prostokątny. SQL stwierdzenie zgromadziło w sznurze, do którego S doprowadza stół z trzema kolumnami. PORZĄDEK PRZEZ klauzulę zapewnia, że rzędy będą w chronologicznym porządku, chociaż to nie jest ściśle konieczny w tym przypadku.
Aneks B. Dane importują przez ODBC
210
Przykład B.l: Prosty ąuery od prostokątnego stołu
nulldata 160
setobs 4 197 0:1 --czas
otwarty dsn = AWM użytkownik = 0tto hasło = Bingo --odbc
sznur Qryl = "WYBRANY consump OD Consump" oszustwa danych @ Qryl --odbc
sznur Qry2 = "WYBRANY dochód OD Consump" dane inc @ Qry2 --odbc
Przykład B.2: Prosty ąuery od bzu --prostokątnego stołu
sznur S = "wybrany rok, qtr, xval od DANYCH \ gdzie varname = 'WLN' PORZĄDEK OKOŁO rok, qtr" dane wygrywają obs format ="% d:% d" @ S --odbc
Aneks B. Dane importują przez ODBC
211
Przykład B.3: Obsługiwanie gubienia wartości, ponieważ bez --prostokątny stół
sznur foo = "wybrany rok, qtr, xval od DANYCH \
gdzie varname = 'STN' I qtr > l" dane barykadują obs format ="% d, % d" @ foo --odbc drukuje bar --byobs
Przykład B.3 pokazuje, co zdarza się, jeżeli rzędy w rezultacie od WYBRANEGO stwierdzenia nie dopasowują obserwacji w aktualnie otwartym gretl zestawowi danych. ąuery zawiera warunek, który przesącza z cały danymi od pierwszego ąuarter. ąuery skutkiem (niewidzialnym do użytkownika) byłoby coś jak
+ + + +
| rok | qtr | xval |
+ + + +
| 1970 |
| 1970 |
| 1970 |
Ja 1971 |
Ja 1971 |
Ja 1971 |
| 1972 |
| 1972 |
| 7.8705000000 |
| 7.5600000000 |
| 7.1892000000 |
| 5.8679000000 |
| 6.2442000000 |
| 5.9811000000 |
| 4.6883000000 |
| 4.6302000000 |
2
Wewnątrz, gretl napełnia zmienny bar odpowiednią wartością, jeżeli to znajduje mecz; inaczej NA jest użyty. Drukowanie zmienny bar w ten sposób doprowadza do
Obs
baru
1970:1
1970:2 7.8705
1970:3 7.5600
1970:4 7.1892
1971:1
1971:2 5.8679
1971:3 6.2442
1971:4 5.9811
1972:1
1972:2 4.6883
1972:3 4.6302
Aneks C
Budującego gretl
Cl Żądania
Gretl jest napisanego w języku programowania C, stałym o ile możliwym przez ISO / ANSI C Standard (C90) chociaż graficzny interfejs użytkownika i jakieś inne komponenty koniecznie wykorzystują platformy określone rozszerzenia.
Program został rozwinięty pod Linuks. Podzielona biblioteka i klient rozkaz linii powinny zestawić i biec na jakiejś platformie, która popiera ISO / ANSI C i mają biblioteki przechyliły się w Stół Cl. Jeżeli GNU readline biblioteka będzie znaleziona na systemie gospodarza, to będzie użyty dla gretcli, dostarczając dużo ulepszony edytowalny wiersz zlecenia. Zobacz readline stronę główną < http://cnswww.cns.cwru.edu/ ~ chet / readline / rltop.html >.
Sprężanie danych
zlib strona internetowa celu biblioteki informacja zip.org < http://www.info-zip.org/pub/infozip/zlib/ >
libxml2 XML manipulacja xmlsoft.org < http://xmlsoft.org/ >
LAPACK linearny algebra netlib.org < http://www.netlib.org/lapack/ >
FFTW3 Szybko Fourier Przekształcają fftw.org < http://www.fftw.org/ >
gładki 2.0 Liczny pożytki gtk.org < http://www.gtk.org/ >
Stół Cl: Biblioteki reąuired dla budynek gretl graficzny program klienta powinien zestawić i przebiegnąć jakiś system, który, oprócz powyższego reąuirements, oferuje GTK wersja 2.4.0 lub wyższy (zobacz gtk.org < http://www.gtk.org/ >).1 < http://gtk.org).1 >
Gretl nazywa gnuplot dla powielania. Możesz znaleźć gnuplot w gnuplot.info < http://www.gnuplot.info/ >. Tego pisania najnowsze oficjalne wypuszczenie jest 4.2 (marca, 2007). PANI Windows version gretl przychodzi z Windows wersja gnuplot 4.2; gretl strona internetowa również oferuje rpm gnuplot 3.8J0 dla x86 Linuks systemów.
Jakieś cechy gretl wykorzystują porcje gtkextra biblioteki Adriana Feguin's. Związane części tej paczki są zawarte (w nieznacznie zmodyfikowanej formie) z dystrybucją źródła gretl.
Dwójkowa wersja programu jest dostępna dla Windows Microsoft platformy (Windows 98 lub wyższy). Ta wersja została zestawiona na krzyżu pod Linuks używającym mingw (GNU C kompilator, gcc, skręcony w lewie dla użycia z win32) i połączył się przeciw Microsoft C bibliotece, msvcrt.dll. To używa portu Tor Lillqvist's GTK 2.0 do win32. (Wolny, otwarty źródło) program instalatora Windows jest uprzejmością Jordanu Russell (jrsoftware.org < http://www.jrsoftware.org/ >).
C.2 Buduje instrukcje: step-by-step przewodnik
W tej sekcji udzielamy instrukcji szczegółowych wystarczająco, by pozwolić użytkownikowi z tylko basie znajomością Unix typ systemu zbudować gretl. Te kroki testowane na świeżej instalacji Debian Wytrawiają. Dla innych Linuks dystrybucji (specjalnie bazowali na Debian ci, jak Ubuntu i jego pochodne) mało powinien zmienić się. Inny Unix obsługiwanie Drugi taki sam system taki jak MacOSX i BSD zrobiłyby to prawdopodobnie reąuire bardziej konkretne dostosowanie.
^ W górę do wersja 1.5.1, gretl mógłby również zostać zbudowany używaniem GTK 1.2. Poparcie lor, który to został upuszczony w yersion 1.6.0 oi gretl.
212
AppendixC. Budując gretl
213
W tym skierowanym przykładzie, zbudujemy gretl kompletny z dokumentacją. To wprowadza kilka bardziej reąuirements, ale daje cię, by zmodyfikować pliki dokumentacji zdolności również, jak pliki pomocy lub instrukcje.
Instalując prereąuisites Zakładamy, że basie GNU pożytki już są zainstalowane na systemie, razem z tymi innymi programami:
jakimś TpX / BTpXsystem (tetex lub texlive zrobi pięknie)
Gnuplot
ImageMagick Również zakładamy, że użytkownik ma administracyjne przywileje i wie, jak zainstalować paczki. Przykłady poniżej są niesione używając trafny-dostań się rozkaz muszli, ale oni mogą zostać wykonany z opartymi na menu pożytkami jak skłonność, dselect lub OPARTY na GUI programować synaptyczny. Użytkownicy Linuks dystrybucji, które zatrudniają rpm paczki, (np. Czerwony Kapelusz / Fedora, Mandriva, SuSE) może zechcieć odnosić < http://gretl.sourceforge.net/depend.html > przywołaj dalej gretl stronę internetową.
Pierwszy krok instaluje C kompilator i odpowiedziane pożytki. Dalej Debian system, ci są zawarci wewnątrz wiązka paczek, które mogą zostać zainstalowane przez rozkaz trafny-dostać się instalować, ojej bizon sznura sieciowego libtool automakel.9 autoconf doc \ libc6-dev libc-dev libgfortranl libgfortranl-dev gettext pkgconfig
Wtedy to jest konieczne zainstalować “rozwój” (dev) paczki, ponieważ biblioteki tak gretl użycie:
Biblioteka rozkaz
GŁADKI trafny-dostać się instalować libglib2.0-dev
GTK 2.0 trafny-dostaje się instalować libgtk2.0-dev
PNG trafny-dostaje się instalować libpngl2-dev
XSLT trafny-dostaje się instalować libxsltl-dev
LAPACK trafny-dostaje się instalować lapack3-dev
FFTW trafny-dostaje się instalować fftw3-dev
READLINE trafny-dostaje się instalować libreadline5-dev
GMP trafny-dostać się instalować libgmp3-dev
(GMP jest opcjonalny, ale poleca.) dev paczki, ponieważ ci biblioteki są konieczne, by zestawić gretl - również będziesz potrzebować równiny, bzu -dev, który biblioteka pakuje, by przebiegnąć gretl, ale większość tych powinna już być częścią standardu instalacja. Aby umożliwić inne opcjonalne cechy, jak audio poparcie, możesz musieć zainstalować więcej bibliotek.
Dostając źródło: wypuszczenie lub CVS
w tym momencie, można zbudować z źródła. Masz dwie opcje tu: uzyskać najpóźniej wypuszczoną paczkę źródła lub odzyskać aktualną CVS wersję gretl (CVS = Jednoczesny System Wersji). Zwykły sprzeciw odnosi się do CVS wersji, mianowicie, że to nie może zbudować poprawnie i może zawrzeć “doświadczalny” kod; z drugiej strony CVS często zawiera błąd sposoby w stosunku do wypuszczonej wersji. Jeżeli chcesz pomóc w testowaniu i pokryć sprawozdania błędu, polecamy używanie CVS gretl.
Pracują z wypuszczonym źródłem:
AppendixC. Budując gretl
214
Pobierają paczkę źródła gretl od gretl.sourceforge.net < http://gretl.sourceforge.net/ >.
Rozpiać i unsmołuj paczkę. Dalej system z GNU pożytkami dostępnymi, rozkaz byłby smoła xvfz gretl-N.tar.gz (zastąp N z określoną wersją numerują pliku, który pobrałeś o kroku 1).
Zmiana kierująca do gretl źródła kierującego utworzyła o kroku 2 (np. gretl-1.6.6).
Przejdź do następnej sekcji, “Skonfiguruj i zrób”.
Pracują z CVS you'11 najpierw musieć zainstalować program klienta cvs, jeżeli to jest nie już na twoim system. Związane zasoby, które możesz zechcieć skonsultować zawierają CVS stronę internetową we www.nongnu.org/cvs < http://www.nongnu.org/cvs/ >, ogólna informacja o sourceforge CVS na SourceForge CVS stronie < http://sourceforge.net/docman/display_doc.php?docid = 14035 & group_id = 1 > i instrukcje określone do gretl w SF gretl CVS stronie < http://sourceforge.net/cvs/?group_id = 36234 >.
Chwytając CVS źródła pierwszym razem, powinieneś najpierw zdecydować, gdzie chcesz zgromadzić kod. Na przykład mógłbyś utworzyć katalog nazywany cvs pod twoim katalogiem macierzystym. Otwórz nieuleczalne okno, CD do tego katalogu i napisz następne rozkazy:
cvs -d:pserver:anonymous@gretl.cvs.sourceforge.net < http://sourceforge.net >:/ cvsroot / gret1 zarejestrowanie się
cvs -z3 -d:pserver:anonymous@gretl.cvs.sourceforge.net:/ cvsroot / gretl co -P gretl
Po pierwszym rozkazie będziesz podpowiedziany dla hasła: tylko uderz Klawisz Enter. Po drugim rozkazie, cvs powinien utworzyć subdirectory nazywany gretl i fili to z aktualnymi źródłami.
Kiedy chcesz uaktualnić źródło, to jest bardzo prosty: tylko ruch do gretl katalog i typ
cvs uaktualnienie -d -P
Zakładający jesteś teraz w CVS gretl katalogu, możesz przejść w tym sam sposobie tak , jak w przypadku wypuszczonej paczki źródła.
Skonfiguruj źródło następny rozkaz ty potrzebuje był ./ skonfiguruj; to jest złożony scenariusz, który wykrywa, które narzędzia, które masz na twoim systemie i rzeczach zbiorów w górze. Skonfiguruj rozkaz akceptuje wiele opcji; możesz zechcieć biec
./ skonfiguruj --pomóc
najpierw widzieć, które opcje są dostępne. Jedna opcja ty droga chcieliby szczypać jest --prefiks. Domyślnie instalacja zatonie / usr / miejscowy ale możesz zmienić to. Na przykład
./ skonfiguruj --prefiks =/ usr położy wszystko pod / usr drzewo. Inna przydatna opcja odnosi, że, domyślnie, gretl oferuje poparcie dla pulpitu gnoma. Jeżeli chcesz znieść gnom określone cechy, możesz minąć opcję ---gnom, by skonfigurować.
Aby mieć dokumentacja zbudowana, musimy minąć związaną opcję, by skonfigurować, jako w
./ skonfiguruj --doc, który będziesz Widzieć kilka kontroli biegnie i, jeżeli wszystko idzie zgadzać się, by zaplanować, powinieneś zobaczyć streszczenie podobne do tego pokazanego w Przykład Cl.
«• Jeżeli używasz CVS, to jest dobry pomysł, by odnośnie biec skonfigurować scenariusz po zrobieniu uaktualnienia. To nie jest zawsze konieczny, ale czasami to jest i to nigdy naprawdę trochę nie krzywdzi. W tym celu możesz zechcieć napisać mały scenariusz muszli, który woła konfigurować z jakimiś opcjami ciebie chcą użyć.
AppendixC. Budując gretl
215
Przykład Cl: Produkcja od ./ skonfiguruj --doc
Konfiguracja:
Instalacja ścieżka:
Użyć readline biblioteki:
Użyć gnuplot dla powiela:
Użyć PNC dla gnuplot wykresów: Lateks
Użycia dla składania produkcji:
Gnu Wielokrotne Precyzja poparcie:
MPFR poparcie:
LAPACK poparcie:
FFTW3 poparcie:
Zbudować z CTK wersją:
Scenariusz składnia podświetlająca:
Użyć zainstalowanego gtksourceview:
Zbudować z poparciem gnoma:
Zbudować gretl dokumentację:
Zbudować katalogi wiadomości: prefiks instalacji
Gnoma: ARIMA poparcie:
TRAMO / MIEJSCA popierają:
Doświadczalne audio poparcie:
Teraz typ 'make', by zbudować gretl.
/ usr / miejscowy
tak
tak
tak
tak
tak
żaden
tak
tak
2.0
tak
tak
żaden
tak
tak
NA
tak
tak
żaden
nie
buduje i nie instaluje Jesteśmy teraz gotowi, by przedsięwziąć kompilację właściwą: to jest zrobiony przez biegnięcie zrobić rozkaz, który troszczy się o zestawianie cały koniecznych plików źródłowych w poprawnym porządku. Wszystko, co musisz zrobić jest typem
robić
Ten krok prawdopodobnie wezmą kilka minut, by uzupełnić; do wiele produkcji będzie doprowadzonego na ekranie. Gdy tylko to jest zrobiony, możesz zainstalować twoją świeżo upieczoną kopię gretl na twoim systemie przez
zrobić instalować
Na większości systemów, zrobić instalować rozkaz żąda od ciebie mienia administracyjnych przywilejów. Odtąd jeden z dwóch logujecie się jako korzeń zanim wypuszczanie się zrobią instalować lub możesz zechcieć użyć sudo pożytku:
sudo robi instalować
Aneks D
Numeryczną dokładność, przez którą
Cretl używa arytmetyki podwójnej precyzji - z wyjątkiem plugin wielokrotna precyzja voked przez rzecz menu “Model, Inne linearne modele, Wysoka precyzja OLS” które reprezentuje zmiennoprzecinkowe wartości używające kilka kawałków podanych przez eiwironment zmienny GRETL_MP_BITS (wartość domyślną 256).
Normalny eąuations z Najmniej Sąuares domyślnie jest rozwiązany przez Cholesky rozkład, który jest wystarczająco dokładny dla większości celów. W przypadku odkryto, że, gretl automatycznie przełącza, by użyć QR rozkładu; ponadto użytkownik ma opcję robienia QR rozkład zaniedbanie.
Program został testowany raczej gruntownie na statystycznych zestawach danych odniesienia dostarczonych przez NIST (USA Narodowy Instytut Standardów i Technologii) i fuli opis skutków może zostać znaleziony na gretl stronie internetowej (podążają związek “Numeryczną dokładność”).
Do daty, dwie opublikowane rewizje dyskutowały dokładność gretl's: Giovanni Baiocchi i Waltera Dis-taso (2003)i Talha Jałta i Yasemin Jałta (2007). Jesteśmy tym autorom wdzięczni dla ich ostrożnego egzaminu programu. Ich komentarze podpowiedziały kilka modyfikacji includ-ing użycie Stephena Moshier's cephes kod dla p wartości informatyki i innego ąuantities odnoszący się do prawdopodobieństwa dystrybucje (zobaczyć netlib.org < http://www.netlib.org/cephes/ >), zmiany na formatowanie regresji produkcja do en pewny tak program pokazuje stały numerować znacznych cyfr i uwagi do kompilatora zagadnienia wewnątrz produkując PANIĄ Windowsa wersja gretl (które o jednym czas był slighly mniej dokładny niż Linuks wersja).
Cretl teraz zawiera “plugin” który przebiega NIST linearny orszak testu regresji. Możesz znaleźć to pod “Narzędzia” menu w głównym oknie. Kiedy przebiegasz ten test, wstępny tekst wyjaśnia oczekiwany skutek. Jeżeli przebiegasz ten test i widzisz cokolwiek inny niż oczekiwany skutek, proszę wysłać sprawozdanie błędu do cottrell@wfu.edu < mailto:cottrell@wfu.edu >.
Dane regresji Ali są drukowane do 6 znacznych cyfr w aktualnej wersji gretl (oprócz kiedy plugin wielokrotna precyzja jest użyty, w których skutkach przypadku jest dany do 12 cyfr). Jeżeli chcesz zbadać szczególną wartość więcej dokładnie, najpierw uratować to (na przykład, używając genr rozkaz) wtedy drukować to używając być w druku --długi (zobaczyć, że Gretl Dowodzi Odniesienie). To pokaże wartość do 10 cyfr (lub więcej, jeżeli ustawiłeś wewnętrznej zmiennej 1 ongdigits do wyższej wartości przez rozkaz zbioru).
216
Aneks E
Związanego wolne oprogramowanie zdolności
Gretl's jest konkretny i rozszerza. Niemniej jednak możesz znaleźć tam są jakimiś rzeczami nie możesz zrobić gretl lub możesz zechcieć porównać skutki z innymi programami. Jeżeli szukasz uzupełniającej funkcjonalności w królestwie wolnego, oprogramowania otwartego źródła, polecamy następne programy. Jednobarwny opis każdego programu jest wzięty od jego strony internetowej.
GNU R r-project.org < http://www.r-project.org/ >: “R jest systemem dla statystycznego obliczenia i grafiki. To składa się z języka plus środowisko run-time z grafiką, debugerem, dostępem do pewnych funkcji systemu i zdolności, by przebiegnąć programy zgromadzone pliki scenariusza... To zestawia i przebiega dużą różnorodność Unix platform, Windows i MacOS.” Skomentuj: są liczne dodatkowe paczki dla R przykrywającego większość obszarów statystycznej pracy.
Oktawa GNU www.octave.org < http://www.octave.org/ >: “Oktawa GNU jest zaawansowanym językiem, głównie przeznaczonym dla numerycznych obliczeń. To dostarcza dogodne złącze wiersza zlecenia dla rozwiązywania linearnych i nieliniowych problemów numerycznie i dla wykonywania innych numerycznych eksperymentów używa języka, który jest głównie zgodny z Matlab. To może również zostać użyte jako wsadowy język.”
• JMulTi www.jmulti.de < http://www.jmulti.de/ >: “JMulTi pierwotnie został zaprojektowany jako narzędzie do pewnego ekonometrycznego profesjonalnego cedures w samą porę analizą serii to są specjalnie trudne, by użyć i to nie są dostępne w innych paczkach, jak Analiza Odpowiedzi Impulsu z bootstrapped przedziałami ufności dla VAR / VEC modelującego. Teraz wiele innych, jako które cechy były zintegrowane dobrze, by zrobić to possi-ble, aby przekazać wszechstronną analizę.” Skomentuj: JMulTi jest Java GUI programem: potrzebujesz środowiska run-time Java, by wykorzystać to.
Jako wspomniany powyżej, gretl oferuje udogodnienie eksportowania danych w formatach zarówno Oktawy, jak i R. In przypadek Oktawy, zbiór danych gretl jest uratowany jako pojedyncza macierz, X. You może puli x macierz na bok, jeśli chcesz, gdy tylko dane są władowane w Oktawie; zobacz Oktawa instrukcję dla szczegółów. Jeśli chodzi o R, eksportowany plik danych zachowuje serie kiedykolwiek zbudować to jest oczywisty do gretl. Serie są uratowane jako indMdual struktury. Dane powinny zostać przyniesione do R używającego źródło() rozkaz.
Ponadto, gretl ma funkcję komfortu dla przesuwania dane ąuickly do R. Under “Narzędzia” menu gretl's, znajdziesz wejście “Zaczynają GNU R”. To wypisuje R wersję aktualnych gretl danych ustawił (w gretl katalogu użytkownika)i źródeł to do nowej R sesji. Szczególny droga R jest odwołany zależy od wewnętrznej gretl zmiennej Rcommand, którego wartość może zostać ustawiony pod “Narzędziami, Preferencjami” menu. Domyślny rozkaz jest RGui.exe pod PANIĄ Windowsem. Pod x to jest xterm -e R. Please notatka, że w większości trzech rozdzielonych przez przestrzeń elementów w tym sznurze rozkazu będzie przetworzony; jakieś dodatkowe elementy są zignorowane.
217
Aneks F
Przechylającego
się URLs
Poniżej jest wykazem fuli, który URLs stron internetowych wspomnieli w tekście.
Estima (SZCZURY) http://www.estima.com/ < http://www.estima.com/ >
FFTW3 http://www.fftw.org/ < http://www.fftw.org/ > strona główna pulpitu
Gnoma http://www.gnomę.org/ < http://www.gnome.org/ >
GNU Wielokrotna Precyzja (GMP) biblioteka http://swox.com/gmp/ < http://swox.com/gmp/ > Oktawa
GNU strona główna http://www.octave.org/ < http://www.octave.org/ >
GNU Rhomepage http://www.r-project.org/ < http://www.r-project.org/ >
GNU Rmanuał http://cran.r-project.org/doc/manuals/R-intro.pdf < http://cran.r-project.org/doc/manuals/R-intro.pdf >
Gnuplot strona główna http://www.gnuplot.info/ < http://www.gnuplot.info/ >
Gnuplot ręczny http://ricardo.ecn.wfu.edu/gnuplot.html < http://ricardo.ecn.wfu.edu/gnuplot.html > strona danych
Gretl http://gretl.sourceforge.net/gretl_data.html < http://gretl.sourceforge.net/gretl_data.html >
Gred strona główna http://gretl.sourceforge.net/ < http://gretl.sourceforge.net/ >
GTK + strona główna http://www.gtk.org/ < http://www.gtk.org/ >
GTK + port dla win32 http://www.gimp.org/ ~ tml / galon / win32 / < http://www.gimp.org/ ~ tml / galon / win32 />
Gtkextra strona główna http://gtkextra.sourceforge.net/ < http://gtkextra.sourceforge.net/ >
InfoZip strona główna http://www.info-zip.org/pub/infozip/zlib/ < http://www.info-zip.org/pub/infozip/zlib/ >
JMulTi strona główna http://www.jmulti.de/ < http://www.jmulti.de/ >
JRSoftware http://www.jrsoftware.org/ < http://www.jrsoftware.org/ >
Mingw (gcc, ponieważ win32) strona główna http://www.mingw.org/ < http://www.mingw.org/ >
Minpack http://www.netlib.org/minpack/ < http://www.netlib.org/minpack/ > Stół Świata
Penn http://pwt.econ.upenn.edu/ < http://pwt.econ.upenn.edu/ >
Readline strona główna http://cnswww.cns.cwru.edu/ ~ chet / readline / rltop.html < http://cnswww.cns.cwru.edu/ ~ chet / readline / rltop.html >
Readline ręczny http://cnswww.cns.cwru.edu/ ~ chet / readline / readline.html < http://cnswww.cns.cwru.edu/ ~ chet / readline / readline.html >
Xmlsofthomepage http://xmlsoft.org/ < http://xmlsoft.org/ >
218
Bibliografia
Agresti, A. (1992) “Przegląd Dokładnego Wniosku dla Stołów Wariantu”, Statystyczna Nauka, 7, s. 131-53.
Akaike, H. (1974) “Nowe Spojrzenie w Statystycznym Modelu Identyfikacja”, IEEE Transakcje dalej Samochodowy matic Kontrola, PRĄD ZMIENNY 19, s. 716-23.
Anderson, T. W. i Hsiao, C. (1981) “Oszacowanie Dynamie Modeluje z Błędem Komponenty”, Dziennik Amerykanów Statystycznych Stowarzyszenie, 76, s. 598-606.
Andrew, D. W. K. i Monahan, J. C. (1992) “Kosztorysant Macierzy Kowariancji Ulepszonego Heteroskedasticity i Autokorelacji Stałej”, Econometrica, 60, s. 953-66.
Arellano, M. (2003) Dane Panelu Econometrics, Oksford: Oksford Uniwersytet Prasa.
Arellano, M. i Więź, S. (1991) “Sonie Przeprowadza badania Specyfikacji dla Panelu Dane: Monte Karol Dowód i Podanie do Zatrudnienia Eąuations”, Rewizja Ekonomicznych Nauk, 58, s. 277-97.
Baiocchi, G. i Distaso, W. (2003) “GRETL: Ekonometryczne oprogramowanie dla GNU pokolenie”, Dziennik z Stosował Econometrics, 18, s. 105-10.
Baltagi, B. H. (1995) Ekonometryczny Analiza Panelu Dane, New York: Wiley.
Barrodale, I. i Robert, F. D. K. (1974) “Rozwiązanie overdetermined system eąuations wewnątrz £ ja norma”, Komunikacje oftheACM, 17, s. 319-320.
Baxter, M. i Król, R. G. (1999) “Mierząc Cykle Interesu: Przybliżony Band-Pass Przesącza dla Ekonomicznego Czasu Serie”, Rewizja Ekonomii i Dane, 81(4), s. 575-593.
Skinienie, N. i Katz, J. N. (1995) “Co, by zrobić (i nie zrobić) z Czas Seriami Rozgniewana Sekcja Dane”, Politologia Politologia Rewizja Amerykanina, 89, s. 634-47.
Belsley, D., Kuh, E. i Welsch, R. (1980) Regresja Diagnostyki, New York: Wiley.
Berndt, E., Sala, B., Sala, R. i Hausman, J. (1974) “Oszacowanie i Wniosek w Nieliniowych Strukturalnych Modelach”, Annals z Ekonomicznym i Społecznym Pomiar, 3/4, s. 653-65.
Blundell, R. i Więź S. (1998) “Modele Danych Panelu Początkowe Warunki i Moment Restrykcji w Dynamie”, Dziennik Econometrics, 87, s. 115-43.
Bollerslev, T. i Ghysels, E. (1996) “Okresowy Autoregressive Warunkowy Heteroscedasticity”, Journal Interesu i Ekonomiczne Dane, 14, s. 139-51.
Boswijk, H. Peter (1995) “Identihability Cointegrated Systemów”, Papier Dyskusji Instytutu Tinbergen 95-78, http://www.ase.uva.ni/pp/bin/258ful 1text.pdf < http://www.ase.uva.nl/pp/bin/258fulltext.pdf >
Boswijk, H. Peter i Doornik, Jurgen A. (2004) “Identyfikując, szacując i przeprowadzając badania ograniczony cointegrated systemy: przegląd”, Statistica Neerlandica, 58/4, s. 440-465.
Pudło, G. E. S. i Jenkins, G. (1976) Czas Serie Analiza: Przewidywanie i Kontrola, San Franciso: Holden Dzień.
Boksuj się, G E. S. i Młynarz, M. E. (1958) “Notatka dalej Pokolenie z Przypadkowy Normalny Odchyla się”, Annals Matematycznych Danych, 29, s. 610-11.
Marka, C. i Cassola, N. (2004) “pieniądze wymagają systemu dla obszaru euro M3”, Stosowana Ekonomia, 36/8, s. 817-838.
Breusch, T. S. i Pogański, A. R. (1979), “Prosty Test dla Heteroscedasticity i Przypadkowego Współczynnika Odmiana”, Econometrica, 47, s. 1287-94.
Cameron, A. C. i Trivedi, S. K. (2005) Microeconometrics, Metody i Podania, Cambridge: Cambridge Uniwersytet Prasa.
219
Bibliografii
220
Chesher, A. i Irlandczyk, M. (1987), “Końcowa Analiza wewnątrz Pogrupowani i Cenzurował Normalny Linearny Model”, Dziennik Econometrics, 34, s. 33-61.
Cureton, E. (1967), “Normalne Przybliżenie do Podpisałeś-szeregu Próbującego Dystrybucję kiedy Zerowy Różnice są Obecny”, Dziennik Amerykanów Statystycznych Stowarzyszenie, 62, s. 1068- 1069..
Davidson, R. i MacKinnon, J. G. (1993) Oszacowanie i Wniosek wewnątrz Econometrics, New York: Oksford Uniwersytet Prasa.
Davidson, R. i MacKinnon, J. G. (2004) Ekonometryczny Teoria i Metody, New York: Oksford Uniwersytet Prasa.
Doornik, Jurgen A. (1995) “Testowanie ogólne restrykcje dalej cointegrating przestrzeń”, Papier Dyskusji, Nuffield College, < http://www.doornik.com/research/coigen.pdf >
Doornik, J. A. (1998) “Przybliżenia do Asymptotycznej Dystrybucji Cointegration Testy”, Jour-nal Ekonomicznych Przeglądów, 12, s. 573-93. Przedrukował ze skorygowaniem w M. McAleer i L. Oxley Praktycznych Zagadnieniach w Cointegration Analizie, Oksfordzie: Blackwell, 1999..
Doornik, J. A. i Hansen, H. (1994) “Wieloraki Test dla Univariate i O wielu odmianach Normalności”, roboczy papier, Nuffield College, Oksford.
Edgerton, D. i Studnie, C. (1994) “Krytyczne Wartości dla Cusumsq Statystycznych wewnątrz Średnich i Dużych O danym rozmiarze Próbek”, Oksford Biuletyn Ekonomii i Danych, 56, s. 355-65.
Elliott, G., Rothenberg, T. J. i Towar, J. H. (1996) “Skuteczne Testy, ponieważ Korzeń Części Autoregressive”, Econometrica, 64, s. 813-36.
Fiorentini, G., Calzolari, G. i Panattoni, L. (1996) “Analityczne Pochodne i Obliczenie GARCH Oceny”, Dziennik z Stosował Econometrics, 11, s. 399-417.
Frigo, M. i Johnson, S. G. (2005) “Projektowanie i Wprowadzenie FFTW3” , Postępowania IEEE 93, 2, s. 216-231 . Zaproszony papier, Specjalne Zagadnienie na Pokoleniu Programu, Optymalizacji i Adaptacji Platformy.
Gotfryd, L. G. (1994) “Testowanie dla Seryjnej Korelacji około Zmiennej Dodatek w Dynamicznych Modelach skojarzyło przez Esti około Instrumentalne Zmienne”, Rewizja Ekonomii i Dane, 76/3, s. 550-59.
Golub, G. H. i Pożyczka Furgonetki, C. F. (1996) Macierz Obliczenia, 3. wydanie, Baltimore i Londyn: John Hopkins Uniwersytet Prasa.
Goossens, M., Mittelbach, F. i Samarin, A. (2004) LAT X Towarzysz, 2. wydanie, Boston:
E
Addison Wesley.
Gourieroux, C., Monfort, A., Renault, E. i Trognon, A. (1987) “Uogólnił Reszty”, Dziennik Econometrics, 34, s. 5-32.
Greene, William H. (2000) Ekonometryczny Analiza, 4. wydanie, Górne Siodło Rzeka, NJ: Uczeń Sala.
Greene, William H. (2003) Ekonometryczny Analiza, 5. wydanie, Górne Siodło Rzeka, NJ: Uczeń Sala.
Gujarati, Damodar N. (2003) basic Econometrics, 4. wydanie, Boston, MAMA: McGraw Górka.
Sala, Alastair D. (2005) Uogólnił Metodę Momentów, Oksfordu: Oksford Uniwersytet Prasa.
Hamilton, James D. (1994) Analiza Serii Czasu, Princeton, NJ: Prasa Uniwersytetu Princeton.
Hannan, E. J. i Quinn, B. G. (1979) “Determinacja Porządku Autoagresji”, Dziennik Królewskiego Statystycznego Społeczeństwa, B, 41, s. 190-95.
Hansen, L. S. (1982) “Duże Własności Próbki Uogólnionej Metody Oszacowania Momentów”, Econometrica, 50, s. 1029-1054.
Hansen, L. S. i Przypadek wyjątkowy, K. J. (1982) “Uogólnił Instrumentalne Zmienne Oszacowanie Nieliniowych Racjonalnych Oczekiwania Modele”, Econometrica, 50, s. 1269-86.
Harvey, Andrew C. (1989) Prognozujące Strukturalne Serie Czasu Modeluje i Kalman Filtr, Cambridge: Cambridge Uniwersytet Prasa
Hausman, J. A. (1978) “Testy Specyfikacji wewnątrz Econometrics”, Econometrica, 46, s. 1251-71.
Bibliografia
221
Heckman, J. (1979) “Uprzedzenie Wyboru Próbki jako Specyfikacja Błąd”, Econometrica, 47, s. 153-61.
Hodrick, Robert i Prescott, Edward C. (1997) “Powojenne USA Interes Cykle: Empiryczny Inves-tigation”, Dziennik Pieniędzy, Kredytu i Bankowość, 29, s. 1-16.
Johansen, S ø bieg (1995) Bazował na Prawdopodobieństwie Wniosek w Cointegrated Wektor Autoregressive Modelach, Oksfordzie: Oksford Uniwersytet Prasa.
Keane, Michael S. i Wolpin, Kenneth I. (1997) “Decyzje Kariery Młodych Mężczyzn”, Dziennik Politycznej Gospodarki, 105, s. 473-522.
Kiviet, J. F. (1986) “Dalej Rygor z Trochę Misspecification Przeprowadza badania, ponieważ Modelując Dynamiczne Relacja statki”, Rewizja Ekonomicznych Nauk, 53, s. 241-61.
Koenker, R. (1981) “Notatka dalej Studentizing Test dla Heteroscedasticity”, Dziennik Econometrics, 17, s. 107-12.
Koenker, R. (1994) “Przedziały ufności dla regresji quantiles”, wewnątrz P. Mandl i M. Huskova (Ed.), Asymptotyczne Dane, s. 349-359, New York: Skoczek Verlag.
Koenker, R. i Bassett, G. (1978) “Regresja quantiles”, Econometrica, 46, s. 33-50.
Koenker, R. i Hallock, K. (2001) “Quantile Regresja”, Dziennik Ekonomicznych Perspektyw, 15/4, s. 143-56.
Koenker, R. i Machado, J. (1999) “Dobroć z odpowiednim i związanym wniosek rozpoczyna proces dla quantile regresja”, Dziennik Amerykanów Statystycznych Stowarzyszenie, 94, s. 1296-1310.
Koenker, R. i Zhao, Q. (1994) “L oszacowanie dla linearny heteroscedastic modeli”, Dziennik Nieparametrycznych Danych, 3, s. 223-235.
Kwiatkowski, D., Filip, S. C. B., Schmidt, S. i Goleń, Y. (1992) “Testując Pusty Stationarity Przeciw Alternatywie Części Korzeń: Jak Pewny Są Nami Tak Ekonomiczny Czas Serie Mają Część Korzeń?”, Dziennik Econometrics, 54, s. 159-78.
Locke, C. (1976) “Test dla Złożonej Hipotezy tak Populacja ma Dystrybucję Gamma”, Komunikacje w Danych - Teoria i Metody, A5(4), s. 351-64.
Lucchetti, R., Papi, L. i Zazzaro, A. (2001) “Banków Nieskuteczność i Wzrostu ekonomicznego: Mikro Makropolecenie Podejście”, szkocki Dziennik Politycznej Gospodarki, 48, s. 400-424.
McCullough, B. D. i Renfro, Karol G. (1998) “Testy sprawności i oprogramowanie standardy: przypadek nauka GARCH postępowania”, Dziennik z Ekonomicznym i Społecznym Pomiar, 25, s. 59-71.
MacKinnon, J. G. (1996) “Numeryczna Dystrybucja Funkcje dla Części Korzeń i Cointegration Testy”, Dziennik z Stosował Econometrics, 11, s. 601-18.
MacKinnon, J. G. i Biały, H. (1985) “Trochę Heteroskedasticity Stała Kowariancja Macierz Esti-mators z Ulepszył Ograniczoną Próbkę Własności”, Dziennik Econometrics, 29, s. 305-25.
Maddala, G. S. (1992) Wprowadzenie do Econometrics, 2. wydanie, Englewood Klify, NJ: Uczeń Sala.
Matsumoto, M. i Nishimura, T. (1998) “Mersenne twister: dimensionally equidistributed jednolity rzekomy przypadek numerują program generujący”, ACM Transakcje dalej Modelujące i Komputer Symulacja, 8, s. 3-30.
Mroz, T. (1987) “Wrażliwość Empirycznego Modelu Żonatych Kobiet jest Godzinna Pracy do Eco-nomic i Statystyczne wniebowzięcia” Econometrica 55, s. 765-99.
Nerlove, M, (1999) “Własności Alternatywnych Kosztorysantów Dynamicznych Modeli Panelu: Empiryczna Analiza z Na przełaj Dane dla Nauki Wzrostu ekonomicznego”, wewnątrz Hsiao, C., Lahiri, K., Zawietrzny, L.-F. i Pesaran, M. H. (Ed) Analiza Paneli i Ograniczone Zależne Zmienne Modele, Cambridge: Cambridge Uniwersytet Prasa.
Neter, J. Wasserman, W. i Kutner, M. H. (1990) Stosował Linearne Statystyczne Modele, 3. wydanie, Boston, MAMA: Erwin.
Newey, W. K. i Zachodni, K. D. (1987) “Macierz Kowariancji Prostego, Pozytywnego Pół Określonego, Heteroskedasticity i Samochodowej korelacji Stałej”, Econometrica, 55, s. 703-8.
Bibliografia
222
Newey, W. K. i Zachodni, K. D. (1994) “Automatyczne Opóźnienie Wybór wewnątrz Oszacowanie Macierzy Kowariancji”, Rewizja Ekonomicznych Nauk, 61, s. 631-53.
Pesaran, M. H. i Taylor, L. W. (1999) “Diagnostyki, ponieważ IV Regresje”, Oksford Biuletyn Ekonomii i Dane, 61/2, s. 255-81.
Portnoy, S. i Koenker, R. (1997) “Gaussian zając i Laplacian żółw lądowy: obliczalność spotęgowałeś-błędu przeciw absolutnemu błędowi kosztorysanci”, Statystyczna Nauka, 12/4, s. 279-300.
Zespół Rozwoju Rdzenia R (2000) Wprowadzenie do R, wersja 1.1.1.
Ramanathan, Ramu (2002) Wstępny Econometrics z Podaniami, 5. wydaniem, Wartością Fortu: Harcourt.
Schwarz, G. (1978) “Szacowanie wymiaru modelu”, Annals Danych, 6, s. 461-64.
Shapiro, S. i Chen, L. (2001) “Złożone Testy, ponieważ Gamma Dystrybucja”, Dziennik Jakości Technologia, 33, s. 47-59.
Silverman, B. W. (1986) Gęstość Oszacowanie dla Danych i Danych Analiza, Londyn: Chapman i Sala.
Towar, James H. i Watson, Mark W. (2003) Wprowadzenie do Econometrics, Bostonu, MAMY: Addison Wesley.
Swamy, S. A. V. B. i Arora, S. S. (1972) “Dokładna Ograniczona Próbka Własności Kosztorysantów Współczynników w Błędzie Komponenty Modele Regresji”, Econometrica, 40, s. 261-75.
Verbeek, Marno (2004) Przewodnik do Nowoczesnego Econometrics, 2. wydania, New York: Wiley.
Biały, H. (1980) “Heteroskedasticity Stała Kowariancja Macierz Astimator i Bezpośredni Test dla Heteroskedasticity”, Econometrica, 48, s. 817-38.
Windmeijer, F. (2005) “Ograniczona Próbka Skorygowanie dla Niezgodności Linearnego Skutecznego Dwa wkraczać do GMM Kosztorysanci”, Dziennik Econometrics, 126, s. 25-51.
Wooldridge, Jeffrey M. (2002a) Ekonometryczna Analiza Sekcji Krzyża i Danych Panelu, Cambridge, Masy.: MIT Prasa.
Wooldridge, Jeffrey M. (2002b) Wstępny Econometrics, Nowoczesne Podejście, 2. wydanie, Murarz, Ohio: Południowo-zachodni.
Jałta, A. Talha i Jałta, A. Yasemin (2007) “GRETL 1.6.0 i jego numeryczna dokładność”, Dziennik Stosowanego Econometrics, 22, s. 849-54.