WYKŁAD 1
17.02.2012r.
Temat: Przedmiot i istota ekonometrii
Ekonometria zrodziła się w latach 30-tych. Powstała w reakcji na wielki kryzys przełomu lat 20-tych i 30-tych. Kryzys ten spowodował potrzebę znalezienia pewnych narzędzi wspomagania gospodarki, aby zmniejszyć amplitudę wahań koniunkturalnych.
W latach 30-tych rząd amerykański powołał grupę ekonomistów - Komisję COWLES. W komisji tej byli najwybitniejsi ekonomiści głównie o zacięciu ekonomiczno-statystycznym. Szefem tego zespołu był Cowles. Znalazł się w niej także polski ekonomista – geniusz ekonomii (chociaż słabego charakteru) – Oskar Lange, który zajmował się teorią ekonomii, statystyką. Jego student napisał genialne dzieło. Drugim gigantem nauk ekonomicznych był Kalecki.
Pojęcie ekonometria istniało już w czasie kryzysu. W 1926 roku Ragnar FRISCH utworzył Towarzystwo Ekonometryczne, które rozpoczęło wydawanie czasopisma naukowego pt.: „ECONOMETRICA” – stąd wzięło się pojęcie ekonomterii. To czasopismo do dziś jest najważniejszym czasopismem ekonometrycznym. Świat uważa, że rok 1926 jest rokiem, w którym pojawiła się ekonometria w sensie instytucjonalnym. Frisch był Norwegiem, przy czym całe życie naukowe spędził w Stanach Zjednoczonych.
W latach 80-tych uczeni z Krakowa odnaleźli w bibliotece Akademii Ekonomicznej pracę prof. Pawła CIOMPA (pierwszy raz użył słowa ekonometria) wydaną w Galicji w 1910 roku, pt.: „Zarys ekonometrii i teoria buchalterii”.
Słowo „ekonometria” pojawiło się po raz pierwszy w Polsce w 1910r.
Zespół COWLES stworzył pierwsze narzędzia ekonometryczne – barametry koniunktury – narzędzi służące do opisu wahań koniunkturalnych i wykorzystywania ich do prognozowania koniunktury oraz podejmowania decyzji w skali państwa powodujących zmniejszenie amplitudy wahań koniunkturalnych.
Pierwszy okres dynamicznego rozwoju ekonometrii to lata 30-te. Drugi okres to okres II wojny światowej, przy czym w tym czasie powstały zwłaszcza narzędzia badań operacyjnych, które są częścią ekonometrii rozumianej szeroko, np. narzędzia optymalizacji szlaków / dróg transportowych.
Leonid Kantorowicz – znakomity Rosjanin, specjalista badań operacyjnych, opracował metody optymalizacji przemieszczania floty / konwoju.
W okresie po II wojnie światowej rozwijała się teoria estymacji i testowania statystycznego.
Prace ekonometryków pojawiły się w czasopismach w latach 50-tych.
W latach 80-tych nie można było oficjalnie używać słowa „ekonometria”. Jedynym państwem, w którym można było oficjalnie używać tego słowa była Polska, dzięki Oskarowi Lange, który wydał podręcznik pt.: „Wstęp do ekonometrii”. Podręcznik ten wydany został w latach 60-tych i był on książką tłumaczoną na 30 języków – była to książka najbardziej znana na świecie. Hindusi byli pierwszymi, którzy przetłumaczyli tę książkę na swój język.
Za życia Lange nie wykładano ekonometrii na uczelniach polskich. Ekonometrię zaczęto wykładać dopiero w drugiej połowie lat 60-tych. Ekonometria bardzo intensywnie rozwijała się w Katowicach, dzięki Zbigniewowi Pawłowskiemu. Pawłowski pisał książki w sposób zrozumiały, co nie jest łatwe. Zwłaszcza w Poznaniu nie był on lubiany ze względu na pisanie językiem zrozumiałym.
Ekonometrię należy wykładać w sposób niezbyt łatwy, musi to być nauka magiczna.
Ekonometria powstała na styku trzech nauk: matematyka(najstarsza), statystyka i nauki ekonomiczne(najmłodsze).
Matematyka + Statystyka = Matematyka Statystyczna
Statystyka + Ekonomia = Statystyka Ekonomiczna
Ekonomia + Matematyka = Ekonomia Matematyczna
Ekonomia + Matematyka + Statystyka = Ekonometria
ROLA EKONOMTERII W WARUNKACH EKONOMICZNYCH
Laureatami Nagrody NOBLA w dziedzinie ekonomii byli:
Frisch,
Jan Tinbergen.
(Podzielili oni mln dolarów na pół)
Większość noblistów w dziedzinie ekonomii to Amerykanie. Poza nimi to Rosjanin Leonid Kantorowicz – specjalista teorii optymalistycznej (nie był nigdy w Ameryce). Kantorowicz nie odebrał tej nagrody, ponieważ nie został on tam puszczony. Był jeszcze jeden ekonomista rosyjskiego pochodzenia Leontiew, który stworzył teorię „in put, out put” (tzw. „Teoria Leontiewa”), która daje precyzyjne rozwiązania w kalkulacji kosztów. Tę teorię można wykorzystywać w obliczaniu kosztów pośrednich.
Wśród laureatów Nagrody NOBLA w dziedzinie ekonomii ponad ⅔ to ekonometrycy.
Pozycja ekonometryków w świecie ekonomii jest bardzo ważna.
Jan Tinbergen otrzymał Nagrodę NOBLA za budowę modeli gospodarki amerykańskiej. Znany jest on z funkcji produkcji nazywanej funkcją Tinbergena.
Ekonometria należy do sfery nauk ekonomicznych. Najpierw zaczęła rozwijać się w Polsce, ale również jeszcze w dwóch miejscach:
a) Węgry – Węgrzy uzyskali status ważnego państwa badań ekonometrycznych; w 1986 roku w Budapeszcie odbył się światowy kongres ekonometryczny,
b) Słowacja – w Bratysławie prowadzono badania ekonometryczne za sprawą ONZ, która ulokowała tam Ośrodek Badań Ekonometrycznych.
Dwa znane nazwiska: Szujan, Kołek.
WYKŁAD 2
24.02.2012
Lange nie miał pojęcia o teorii pomiaru. Teoria pomiaru pojawiła się w latach 40-tych, której tezą jest, że wszystko jest mierzalne.
W 1945 roku Stevens ogłosił teorię pomiaru, którą opublikował w czasopiśmie „SCIENCE”. Stevens udowodnił, że wszystko da się zmierzyć, przy czym liczby mogą oznaczać różne cechy.
Stevens wyróżnił cztery skale pomiarowe (poziomy pomiaru) – dwie są słabe ,a dwie mocne:
1. skala nominalna – najsłabsza,
2. skala porządkowa (rangowa) – słaba,
3. skala przedziałowa (interwałowa) – mocna,
4. skala stosunkowa (ilorazowa) – najmocniejsza.
Skala nominalna
Najczęściej spotykamy liczby należące do skali nominalnej. W tej skali liczby pełnią role identyfikatorów, pewnych symboli, a więc służą one do odróżniania obiektów bądź ich cech. O liczbach należących do tej skali możemy powiedzieć tylko tyle, że para licz jest równa a=b lub rożna b≠c – dwie liczby są równe lub dwie liczby są różne. Na liczbach tej skali nie wolno wykonywać żadnych operacji arytmetycznych (nie wolno ich dodawać, odejmować, mnożyć i dzielić); wolno je zliczać, np. student opisany numerem albumu.
Zmienna zerojedynkowa należy do pomiaru nominalnego:
1 gdy Vj
0 gdy Vj
Za pomocą zerojedynkowej można zmierzyć wszystko, np. można zmierzyć grupę przypisując wariantom 0 to piłkarze a 1 to sędziowie, a następnie wykonać operację zliczalną, czyli zliczamy „0” i „1”, które można dodać, np. płać – uzyskujemy liczbę kobiet i liczbę mężczyzn.
Do wyniku pomiaru nominalnego mogą być stosowane narzędzia analizy statystycznej w dość ograniczonym zakresie, tzn. dopuszczalne są techniki analizy frakcji, co należy do sfery analizy struktury. Cała sfera rachunku prawdopodobieństwa i empirycznej analizy częstości.
Jeśli mamy pomiar zerojedynkowy to dopuszczalne są narzędzia analizy asocjacji cech, inaczej skojarzenia cech nie tylko za pomocą narzędzi Czuprowa, tymczasem dopuszczalny jest współczynnik kojarzenia z przekształcenia współczynnika korelacji Pearsona, który mieści się w przedziale od –1 do 1.
Współczynnik asocjacji posiada te same cechy co współczynnik Pearsona, czyli –1 do 1.
Możliwe jest stosowanie analizy regresji do zmiennej zerojedynkowej, oznacza to, że:
Zmienna objaśniana może być zmienną zerojedynkową, w takim przypadku mówimy o liniowej funkcji prawdopodobieństwa, która bywa nazywana też Modelem GOLDBERGERA.
Skala rangowa, porządkowa
Liczby posiadają nową cechę, nową własność. Liczby są nie tylko albo równe, albo różne ale możemy ustalić ich kolejność (porządek), np.
a < b < c < ... < j ... < w < z
Wiemy co jest mniejsze a co większe.
Istnieje wiele struktur, które są uporządkowane rangowo, np. struktura przedsiębiorstwa, służby mundurowe, wojsko, armia – są uporządkowane hierarchicznie.
Znany jest porządek, ale nie jest znana odległość między liczbami, oznacza to, że liczby w skali porządkowej nie podlegają operacjom arytmetycznym. Nie wolno wykonywać operacji arytmetycznych na rangach z powodu nieznajomości odległości między rangami oraz różnych odległości między sąsiednimi rangami.
Odległości pomiędzy rangami są różne i nie są znane
5 – 4 ≠ 10 – 9
Na liczbach tej skali nie można wykonywać żadnych operacji arytmetycznych a to oznacza, że współczynnik korelacji rang Spirmana to współczynnik korelacji licz naturalnych.
Przykład 3.
Odległość pomiędzy pułkownikiem, a generałem to jest 1 punkt, a odległość między szeregowym a starszym szeregowym to też 1 punkt – ale te odległości są różne.
Współczynnik korelacji rang jest niedopuszczalny. W przypadku rang dopuszczalna jest analiza frakcji. Rangi można przekształcić metodą zerojedynkową i stosować narzędzia dopuszczalne dla zerojedynkowej.
Kierownicy bardzo lubią stosować podział rangowy. Huragany w Ameryce są opisywane w skali rangowej.
Skala przedziałowa
W skali przedziałowej dochodzi nowa własność, tzn. znane są odległości między liczbami a ponadto odległości między sąsiednimi liczbami są jednakowe i identyczne
5 – 4 = 10 – 9
Natomiast w skali przedziałowej nie jest znane zero naturalne, a to uniemożliwia dzielenie liczb.
Przykładem pomiaru przedziałowego jest pomiar temperatury w skali C°.
Pomiar przedziałowy stosowany jest w statystyce.
Wyróżniamy dwa zapisy stosowane w statystyce prowadzące do pomiaru przedziałowego:
a) normujemy zmienne losowe – polega to na takim przekształceniu zmiennej losowe, że nowa zmienna charakteryzuje się ...................... odchyleniem od średniej arytmetycznej. Suma obserwacji zmiennych unormowanych wynosi 0 i ta średnia arytmetyczna zmiennej unormowanej wynosi też 0.
Zmienna umiarkowana jest wynikiem pomiaru przedziałowego.
b) zmienna losowa standaryzowana – tablice rozkładu są dla zmiennych standaryzowanych. Standaryzacja polega na tym, że zmienną unormowaną przekształcamy dzieląc ją przez odchylenie standardowe. Jak podzielimy zmienną unormowaną przez odchylenie standardowe to otrzymamy zmienną standaryzowaną.
Zmienna standaryzowana posiada dwie cechy:
- wartość średnia wynosi 0,
- wariancja jednostkowa wynosi 1, a tym samym odchylenie standardowe też wynosi 1.
N (0,1) – oznacza, że jest to standaryzowany rozkład unormowany.
Operacja niedopuszczalna na liczbach skali przedziałowej to dzielenie, nie wolno przeprowadzać proporcji.
Skala stosunkowa
Dochodzi kolejny element – zero naturalne.
Liczby mają wszelkie cechy liczb pomiaru przedziałowego, a ponadto znane jest zero naturalne.
Jeśli zmienna jest wyrażona w jednostkach pieniężnych to jest to zmienna ekonomiczna.
Zmiennymi ekonomicznymi wyrażonymi w jednostkach niepieniężnych są jednostki naturalne: kg, litry.
Względne miary ekonomiczne: stopa inflacji (wyrażona w punktach procentowych – zamienna ekonomiczna).
Stopa bezrobocia to zmienna mierzalna, jest po części zmienną ekonomiczną, a po części zmienną społeczną.
BŁĘDY POMIAROWE
Każdy pomiar charakteryzuje się możliwością wystąpienia dwóch rodzajów błędów:
a) błąd losowy pomiaru, który istnieje zawsze,
b) błąd systematyczny lub tendencyjny, który wynika z interesów dokonującego się pomiar.
Błędy systematyczne nie powinny występować. Warunkiem dobrej decyzji jest informacja pozbawiona błędu systematycznego. Gdy błąd systematyczny będzie występował w informacji to nie podejmiemy dobrej decyzji.
Błędy losowe występują w każdym pomiarze. Cechą specyficzną błędu losowego jest:
- rozkład normalny tego błędu,
- zerowa nadzieja matematyczna, tzn. wszelkie dodatnie i ujemne błędy się kompensują.
Odkrywcą błędów losowych i twórcą rozkładu normalnego był GAUSS. Badając w astronomii błędy losowe odkrył rozkład normalny i zapisał go za pomocą funkcji gęstości.
Nie da się uniknąć błędu losowego, popełnia się go chcąc czy nie chcąc. Jest to dopuszczalny błąd losowy, nie dający się uniknąć.
Istnieją dwa rodzaje pomiaru:
a) pomiar bezpośredni,
b) pomiar pośredni.
Pomiar bezpośredni polega na tym, że używając odpowiedniego narzędzia pomiarowego ustalamy miarę cechy albo rzeczy. Wszystkie pomiary są w jednostkach fizycznych, np. dkg. Pomiar bezpośredni dokonywany jest w jednostkach naturalnych.
Pomiar pośredni odbywa się co najmniej w dwóch etapach:
I etap: mierzy się cechę lub rzecz za pomocą odpowiedniego narzędzia pomiarowego i ustala się wymiar w jednostkach fizycznych,
II etap: stosuje się odpowiednie wagi w sensie statystycznym do przeliczenia jednostek fizycznych na nowe jednostki miar.
Należy dbać, aby pomiar nie zawierał błędów systematycznych. Błąd systematyczny jest najgorszym, możliwym błędem. Przez ten błąd można podjąć błędną decyzję.
MODELE EKONOMETRYCZNE
Jednorównaniowy model ekonometryczny
Ekonometria jest dyscypliną nauk ekonomicznych, która tworzy narzędzia analizy współzależności ekonomicznych począwszy od skali mikro, czyli od przedsiębiorstwa a skończywszy na skali makro, czyli gospodarki narodowej. Te narzędzia wykorzystywane są do:
- szacowania prognoz zmiennych ekonomicznych,
- symulacji,
- podejmowania bieżących decyzji.
Podstawowym narzędziem ekonometrii jest model ekonometryczny, który w najprostszej postaci można zapisać następująco:
przy czym mamy do czynienia z obserwacjami statystycznymi od 1 do n, gdzie:
n - liczba obserwacji statystycznych,
yt – obserwacje na zmiennej y, którą nazywamy zmienną objaśnianą o obserwacjach yn
Zmienna y zależy od zbioru zmiennych objaśniających:
x1 ... xj ... xk
Zmienna objaśniająca x1 jest reprezentowana przez obserwację xt1
Zmienna objaśniająca xj jest reprezentowana przez obserwację xtj
Zmienna objaśniająca xk jest reprezentowana przez obserwację xtk
ηt – oznacza składnik losowy, zawsze występujący w modelu, nadaje mu charakter stochastyczny inaczej losowy. Powoduje, że zmienna y jest zmienną losową.
Model w końcowej fazie będzie tym lepszy im mniejszą masę wahań losowych będzie zawierała zmienną objaśniająca.
Istotą modelu ekonometrycznego jest to, że zmienna objaśniana jest zmienną o charakterze ekonomicznym, a więc przynależność zmiennej objaśnianej rozstrzyga o typie modelu, np.
jeśli zmienną objaśnianą jest zmienna demograficzna to model będzie demograficzny,
jeśli zmienną objaśnianą jest zmienna psychologiczna to model będzie psychometryczny,
jeśli zmienną objaśnianą jest zmienna biologiczna to model będzie biometryczny.
Zmienne objaśniające powinny reprezentować przyczyny zmienności zmiennej objaśnianej.
Przykład 1.
Zmienną objaśnianą mogą być dochody pracownicze, czyli płace. Tak więc przedmiotem badania będą dochody pracownicze (y) a model będzie modelem dochodów pracowniczych. Należy ustalić przyczyny, o czego będą zależały dochody pracownicze – należy postawić hipotezę:
- jakość pracy,
- czas pracy,
- kwalifikacje,
- staż pracy, zmienne objaśniające
- efekt pracy, wydajność pracy,
- uciążliwość warunków pracy,
- rodzaj wykonywanej pracy.
Jeśli z tego powstanie model to on pokaże czy te poszczególne zmienne wpływają, czy nie i odpowie czy wpływają one pozytywnie czy negatywnie.
Przykład 2.
Przedmiotem badania może być cena paliwa. Cena paliwa zależy od:
- akcyzy – to składnik ceny,
- podaży – to jest czynnik, jak podaż jest duża to cena powinna być mała - im niższa podaż tym wyższa cena,
- popytu – rynek paliw reguluje popyt, im więcej jeżdżących samochodów tym ceny powinny być większe, czyli większy popyt,
- cen ropy naftowej na rynkach światowych – są to giełdy: nowojorska, londyńska, amsterdamska – jeśli ceny paliw na tych giełdach będą rosły to w Polsce też będą rosły,
- sytuacji politycznej – sytuacja polityczna skutkuje zmianami cen.
Na zmienne ekonomiczne wpływają inne zmienne ekonomiczne oraz również inne czynniki pozaekonomiczne, np.:
a) czynniki polityczne,
b) czynniki socjologiczne.
Popyt jest zmienną ekonomiczną, zależy od ceny. Mogą wystąpić trzy przypadki:
1. ze wzrostem ceny popyt maleje,
2. ze wzrostem ceny popyt rośnie, np. kupujemy, ponieważ jutro zdrożeje,
3. ze wzrostem ceny popyt nie zmienia się.
Model udziela odpowiedzi w jakiej jesteśmy sytuacji, przypadku.
Żeby można było zbudować model ekonometryczny to zarówno zmienna objaśniana i zmienne objaśniające muszą być mierzalne.
WYKŁAD 3
02.03.2012
Temat: Modele ekonometryczne
Liniowy model ekonometryczny
W liniowym modelu ekonometrycznym mamy dwie grupy elementów:
1) zmienne:
- zmienna objaśniana – składnik losowy,
- zmienne objaśniające – powinny być nielosowe,
2) parametry modelu:
- parametry strukturalne,
- parametry struktury stochastycznej modelu.
Parametrami strukturalnymi - są wszystkie α. One informują o strukturze powiązań w modelu. Mierzą siłę i kierunek oddziaływania danej zmiennej objaśniającej na zmienną objaśnianą. Wszystkie z wyjątkiem L0 ( wyraz wolny modelu)
Parametry struktury stochastycznej modelu - dotyczą pewnej części modelu, muszą one dotyczyć parametrów rozkładu składnika losowego. Rozkład składnika lokowego powinien być normalny i posiadać zerową nadzieję matematyczną.
Parametry opisujące rozkład zmiennej losowej:
a) moment pierwszy - nadzieja matematyczna (wartość oczekiwana),
b) moment drugi - wariancje.
Nadzieja matematyczna
Wariancja
Istnieją jeszcze parametry takie jak:
a) pomiaru skośności,
b) pomiaru koncentracji.
Parametry strukturalne
Informuje o kierunku i natężeniu oddziaływania j-tej zmiennej objaśniającej na zmienną objaśnianą. W związku z tym mogą pojawić się trzy możliwości:
I sytuacja αj = 0
Oznacza, że zmienna xj nie zmienia wartości y, nie wpływa na zmienną objaśnianą.
II sytuacja αj > 0
Oznacza, że wraz ze wzrostem wartości xj rośnie wartość zmiennej objaśnianej y.
III sytuacja αj < 0
Oznacza, że wraz ze wzrostem zmiennej objaśniającej xj spada wartość zmiennej objaśnianej y.
ETAPY BUDOWY MODELU EKONOMETRYCZNEGO
W zależności od stopnia koncentracji zagadnień możemy wyróżnić od 5 do 10 etapów budowy modelu.
Najbardziej skoncentrowany sposób postępowania pozwala wyróżnić 5 etapów budowy modelu ekonometrycznego:
ETAP I – Specyfikacja modelu
ETAP II – Identyfikacja modelu
ETAP III – Estymacja parametrów modelu
ETAP IV – Weryfikacja modelu]
ETAP V – Eksploatacja modelu (wyzysk modelu)
ETAP I – Specyfikacja modelu
Jak w każdym badaniu należy po pierwsze zdefiniować jego cel, określić zakres badania zarówno czasowy jak też przestrzenny oraz wybrać metody badań.
W specyfikacji wyróżniamy dwie fazy:
Faza 1 – specyfikacja zmiennych modelu – w tej fazie rozwiązuje się problem celu, zakresu i metody,
Faza 2 – specyfikacja równań modelu.
Faza 1 - Specyfikacja zmiennych modelu - Wadliwość specyfikacji modelu skutkuje wadliwym modelem. Specyfikacje modelu ekonometrycznego można dokonać tylko ekonomista, jest ona bardzo ważna.
W fazie specyfikacji po pierwsze: musimy wskazać przedmiot badania, np. inflacja, popyt na sprzęt elektroniczny gospodarstwa domowego, mechanizm kształtowania się płac.
Wskazujemy czynniki, które wpływać mogą na to co badamy, np. gdy badamy inflację to zmienną objaśnianą będzie stopa inflacji; zastanawiamy się od czego zależy inflacja, co może na nią wpływać, np. dynamika płac, stopy procentowe, kursy walut.
Model podpowie, które czynniki wpływają – co wpływa?, jak? i dlaczego? – wszystko to jest ważne, również odpowiedź „NIE” jest ważna. Odkrywamy czy coś działa albo nie - to właśnie pokazuje model.
W przypadku płac czynnikami, które mogą wpływać są: podaż płac, podaż siły roboczej, struktura gospodarki rynkowej, wydajność (indywidualna wydajność zależy od rozmaitych cech).
W tej fazie musimy i przedmiot badania i czynniki przełożyć na zmienną objaśnianą.
W tej fazie decydujemy, która zmienna będzie reprezentowała przedmiot produkcji.
Poszukujemy zmiennych ekwiwalentnych dla przedmiotu badania, np. wartość przychodów ze sprzedaży netto.
Czy zasoby kapitału mogą wpływać na przychody? - TAK
WARTOŚĆ NETTO = wartość początkowa – umorzenie
Definiujemy zmienne objaśniające (ekwiwalentne) w stosunku do czynników
Musimy zgromadzić dane statystyczne, jeśli tego nie zrobimy to o modelu można zapomnieć. Bez informacji model nic nie znaczy. Te dane statystyczne muszą być rzetelne, kompletne, porównywalne, tzn. jednolite definicyjnie i w jednolitych cenach.
Kompletne – nie może być uszczerbku w szeregu jakichkolwiek braków.
Można uzupełnić szereg statystyczny metodą interpolacji.
Można też szacować techniką ekstrapolacji szeregu statystycznego.
Faza specyfikacji zmiennych kończy się , gdy posiadamy kompletne informacje statystyczne o zmiennej objaśnianej i zmiennych objaśniających.
To pozwala przejść do fazy specyfikacji równań.
Faza 2 - Specyfikacja równań modelu – Jeśli jest to model składający się z jednego równania to musimy wskazać hipotetyczną jego postać analityczną. To może być wariant modelu liniowego lub modelu nieliniowego, najczęściej bywa to model iloczynowy.
Model iloczynowy (in. model multiplikatywny) może występować w postaci potęgowej
Pierwszy wariant modelu:
Model iloczynowy potęgowy
Skrót modelu iloczynowego potęgowego
Π – znak iloczynowy
e – podstawa logarytmu naturalnego
η – składnik losowy
Drugi wariant modelu:
Model iloczynowy wykładniczy
Skrót modelu iloczynowego wykładniczego
Najczęściej jednak występują mieszane wersje modeli iloczynowych, czyli:
- modele potęgowo-wykładnicze,
- modele wykładniczo-potęgowe.
Zależy od tego, które przeważają.
Kiedy wariant potęgowy a kiedy wykładniczy?
Potęgowo nie można ująć zmiennej zerojedynkowej. Zmienne zerojedynkowe można ujmować wyłącznie wykładniczo. Ogólnie potęgowo możemy ujmować tylko zmienne osiągające wartości dodatnie, zmienne ciągłe, z tego wniosek, że wykładniczo ujmujemy wartości ujemne (zero i mnie) i wykładniczo można ujmować tylko zmienne dyskretne (skokowe).
Jeśli ustaliliśmy hipotezę postać analityczną modelu to mówimy, że zdefiniowaliśmy hipotetyczny model ekonometryczny zwany modelem teoretycznym, to oznacza koniec specyfikacji modelu.
Wszelkie błędy specyfikacji wyjdą na koniec modelu.
ETAP II – Identyfikacja modelu – Identyfikacja występuje tylko w przypadku modelu wielorównaniowym. W modelach jednorównaniowych nie ma etapu II.
ETAP III – Estymacja parametrów modelu – Estymacja modelu odbywa się w dwóch fazach:
Faza 1 – dokonujemy wyboru estymatora, czyli funkcji pewnego narzędzia do szacowania parametrów modelu.
Jak dokonać wyboru?
Dokonujemy wyboru estymatora kierując się pewnymi kryteriami (stosuje się trzy kryteria czasami dołącza się czwarte kryterium):
1. estymator zgodny –estymator powinien być zgodny,
2. estymator nieobciążony – estymator pozbawiony błędu systematycznego
Estymator nieobciążony
3. estymator efektywny – poszukujemy estymatora najbardziej efektywnego w danej klasie. Miarą efektywności estymatora jest wariancja.
4. dostateczny
Estymator bardziej efektywny jest estymatorem bardziej precyzyjnym, a wynika to z pojęcia precyzji w statystyce.
Miarą niedokładności estymatora jest odchylenie standardowe. Im większe będzie odchylenie standardowe estymatora tym jest on mniej dokładny.
Odwrotność odchylenia standardowego nosi nazwę precyzji.
Precyzja
Im większe odchylenie standardowe tym precyzja mniejsza. Estymator bardziej precyzyjny tym jest lepszy i jest bardziej efektywny.
Jeśli dokonamy wyboru estymatora zgodnie z w/w trzema zasadami przechodzimy do fazy drugiej.
Faza 2 – Faza obliczeń numerycznych - Dysponując estymatorem wykorzystujemy go do obliczeń numerycznych mając do dyspozycji zapisane w macierzach X oraz Y dane statystyczne. W wyniku obliczeń numerycznych uzyskujemy szacunki albo oceny parametrów modelu (zarówno parametrów składników losowych oraz oceny parametrów stochastycznej struktury modelu).
Faza 2 – obliczenia numeryczne – wybór estymatora do posiadanych informacji statystycznych. Rezultatem estymacji jest wstępny empiryczny model ekonometryczny. Należy zwrócić uwagę , że wynikiem estymacji są oceny parametrów strukturalnych, oceny parametrów struktury stochastycznej i szacunki składnika losowego, które nazywać będziemy resztami modelu. Posiadanie tych wyników upoważnia do weryfikacji modelu.
WYKŁAD 4
09.03.2012
ETAP IV – Weryfikacja modelu –sprawdzanie jakości modelu empirycznego. Weryfikacja modelu dzieli się na dwie fazy:
Faza 1 – Weryfikacja statystyczna – polega na wykorzystaniu statystycznych miar ogólnej dobroci modelu lub ogólnych dokładności modelu oraz szczegółowych miar dobroci modelu.
Ogólne (globalne) dobroci pozwalają na ocenę roli składnika losowego w modelu.
Model będzie tym lepszy im mniejszą rolę będzie odgrywał składnik losowy.
Szczegółowe miary dobroci (są to miary statystyczne) pozwolą ocenić pewne charakterystyki składnika losowego pod kątem tego, czy jest on, tzw. czystym składnikiem losowym, bo takim być powinien i wreszcie dokonuje się oceny znaczenia każdej ze zmiennych objaśniających w tym sensie, że model empiryczny powinien zawierać wyłącznie ważne czyli istotne statystycznie zmienne objaśniające. Jeśli będą zmienne nieistotne to narzędziami statystyki można to ustalić i zmienne nieistotne powinny zostać usunięte. Jeśli model jest dobry i jego własności oraz zawiera wyłącznie ważne zmienne objaśniające to można przejść do jego weryfikacji ekonomicznej.
Weryfikacja ekonomiczna modelu pozytywnie zweryfikowana pod względem statystycznym polega na ocenie ekonomicznej jego logiki zwłaszcza zgodności z teorią.
ETAP IV – weryfikacja modelu – sprawdzenie jakości modelu empirycznego przebiega w dwóch etapach.
1 faza – weryfikacja statystyczna
2 faza – weryfikacja ekonomiczna
W fazie weryfikacji statystycznej stosujemy wiele narzędzi oceny jakości modelu, które podzielić można na dwie grupy:
1 grupa- globalne albo ogólne miary dobroci (jakości) modelu
2 grupa- szczegółowe miary jakości modelu
Wśród narzędzi występować będzie wiele testów statystycznych. W trakcie weryfikacji statystycznej ocenia się role składnika losowego w kształtowaniu zmienności, zmiennych objaśniających. Im mniejszy wpływ składnika losowego tym lepiej dla modelu. Model powinien zawierać istotne czyli ważne zmienne objaśniające. Oznacza to , że zmienne nieistotne należy usunąć. Wynika z tego , że w trakcie weryfikacji po usunięciu zmiennej nieistotnej należy powrócić do etapu estymacji parametrów i ponownej weryfikacji nowych wyników. Może się też zdarzyć , że w trakcie weryfikacji, że konieczna jest korekta zestawu zmiennych objaśniających co zmusza nas do powrotu do etapu specyfikacji modelu, dokładnie do fazy specyfikacji zmiennych. Weryfikacja może też wykazać wadliwość postaci analitycznej w konsekwencji należy powrócić do etapu specyfikacji tzn. do fazy specyfikacji równań. Jeśli w wyniku kolejnej interakcji powstał model empiryczny po uzasadnionej roli składnika losowego posiadającego wymagane własności statystyczne, zmienne objaśniające są istotne statystycznie na racjonalnym poziomie istotności oraz postać analityczna nie budzi naszych zastrzeżeń to uznajemy że empiryczny model ekonometryczny jest akceptowalny pod względem statystycznym. Można wówczas przystąpić do oceny ekonomicznej jakości modelu. Sprawdzić należy czy zależność występująca w modelu są logiczne czyli zgodne z teorią ekonomii, czy też z doświadczeniem w zarządzaniu.
Jeśli uznamy , że model jest logiczny ekonomicznie to oznacza, że posiadamy akceptowalny model empiryczny możliwy do eksploatacji czyli możliwy do wykorzystania. Jeśli natomiast uznamy że model nie jest logiczny ekonomicznie to mimo jego walorów statystycznych powinniśmy powrócić do specyfikacji
Przykład 6.
Jak działa cena na popyt na dobro podstawowe?
Ze wzrostem ceny popyt spada. W naszym badaniu okazuje się, że cena nie wpływa na popyty (popyt jest sztywny, ponieważ cena nie działa). Może się zdarzyć tak, że ze wzrostem ceny popyt rośnie.
Weryfikacja ekonomiczna polega na właśnie takiej interpretacji logicznej w oparciu o literaturę i doświadczenia. Jeśli uznamy, że model jest ekonomicznie logiczny. Kończy się weryfikacją modelu i możemy przejść do eksploatacji
ETAP V – Eksploatacja modelu - Najczęściej model ekonometryczny wykorzystywany jest do szacowania prognoz (do przewidywania tego co stanie się w przyszłości).
Prognozy ekonometryczne stanowią grupę najdoskonalszych, najlepszych, najbardziej precyzyjnych, najmniej uzależnionych od woluntaryzmu prognoz.
Wszelkie prognozy makroekonomiczne konstruowane są za pomocą modeli ekonometrycznych.
Prognozy stóp procentowych, prognozy kursów walutowych, prognozy GUS-u są prognozami ekonometrycznymi opartymi na modelach, więc najczęstszym kierunkiem wykorzystania modelu jest budowa prognoz.
Drugi kierunek – model może być narzędziem symulacji ekonomicznej. Symulacja ekonomiczna polega na wariantowaniu możliwości decyzyjnej.
Przykład 7.
Model opisujący przychody ze sprzedaży przedsiębiorstwa. Aby model dobrze funkcjonował należy ustalić cel, np. wzrost wartości sprzedaży o 10%. Musimy określić warianty osiągnięcia sprzedaży o 10%. To model pozwala nam na ustalenie różnych wariantów dojścia do tego wyniku. W ostatecznym wyniku możemy ustalić, który wariant jest najlepszy i tańszy. (Rozważanie wielu wariantów decyzji ekonomicznych, który daje efekt najlepszy z najtańszymi kosztami).
Trzeci wariant, kierunek: Bieżące podejmowanie decyzji, np. mamy model indywidualnej wydajności pracy dla danej grupy stanowisk robotniczych. Indywidualna wydajność pracy zależy od wielu cech osobistych ( do 5 cech osobistych). Powstaje pytanie: Jak dokonać rekrutacji na brakujące stanowiska pracy? Kryterium jest wydajność, wygenerowana przez wiązkę cech osobistych kandydatów. Model pozwoli ustalić jaki w kandydacie tkwi potencjał i spośród kandydatów można wybrać którego potencjalna wydajność będzie największa, można się pomylić, ponieważ model obarczony jest błędem losowym. Błąd przyjęcia niewłaściwego człowieka jest kosztowny. Zatrudnienie nawet na jeden dzień powoduje koszty na 50 lat, ponieważ jego akta firma musi przechowywać przez 50 lat.
Możemy wykorzystać ten model do sterowania zespołową wydajnością pracy.
Jednym z czynników może być średnia płaca. Możemy dokonać takiego rachunku gdzie wyjdzie wynik, czy nam się opłaca, może być narzędziem rachunku ekonomicznego.
Model ekonomiczny może być narzędziem bieżącego rachunku ekonomicznego. Model może być wielorako wykorzystywany, ale pod warunkiem, że jest dobrze zbudowany.
Nie można używać złego modelu, może on doprowadzić do manipulacji.
Model może się zdezaktualizować. Model nie jest wietrzny. Należy go aktualizować. Jeżeli wykorzystany zostanie na etapie eksploatacji model nieaktualny to może on wyrządzić więcej szkód niż brak jakiegokolwiek modelu.
V Eksploatacja modelu
Głównym kierunkiem wykorzystywania modelu jest szacowanie prognoz ekonometrycznych. Użytkowaniem takich prognoz może być rząd, minister czy zarząd spółki. Czy takie prognozy są potrzebne i komu? Tworzą duże państwa dokonujemy szacunku prognoz dużej ilości zmiennych. Szacuje się takie zmienne które mają wpływ na kształtowanie się budżetu szczególnie po stronie dochodowej. (dochód, stopa, wpływy podatku) Za pomocą modelu ekonometrycznego szacuję się wszelkie prognozy budżetu państwa. Modele są najbardziej dokładnym narzędzie do badania prognoz.
Drugi kierunek wykorzystania modeli ekonometrycznych to stymulacja. Istota stymulacji jest przygotowanie rozmaitych wariantów decyzyjnych. Stymulacja oznacza rozważanie wariantów decyzyjnych za pomocą modelu empirycznego.
Model może służyć do bieżącego podejmowania decyzji zarządczych. Przykładam może być model indywidualnej wydajności pracy przedsiębiorstwa na określonym stanowisku pracy. Należy do klasy mikroekonomiczny modeli . Jeśli mamy taki model i mamy jedno miejsce do pracy, taki model pokazuje jakie cechy pracownika są ważne i jak wpływają na indywidualną wydajność. Takimi zmiennymi może być: liczba osób na utrzymaniu ( jeśli pracownik ma dużo osób na utrzymaniu wówczas jest bardziej wydajny – oczywiście do czasu), czas dojazdu do pracy ( im dłużej zajmuje dojazd do pracy tym pracownik jest mniej wydajny), wykształcenie. Otrzymamy potencjalna wydajność pracownika – indywidualną. Model ten może służyć do podejmowania bieżących decyzji.
Model może się zdezaktualizować. Model nie jest wietrzny. Należy go aktualizować. Jeżeli zostanie wykorzystany na etapie eksploatacji model nieaktualny może wyrządzić więcej szkód niż brak jakiegokolwiek modelu.
Estymacja parametrów modelów jednorównaniowych
Zapis macierzowy, który uwzględnia obserwacje statystyczne
W tym modelu Y jest wektorem n x 1
Model liniowy dla obserwacji statystycznej na zmiennej objaśnianej
X – jest macierzą obserwacji dla zmiennych objaśniających, ma ona n-wierszy oraz k+1 kolumn
α – to wektor parametrów strukturalnych (to wektor kolumnowy o k+1 wierszy) k+1 x 1
η – jest wektorem składników losowych.
lewa strona = prawa strona
zapis jest równoważny
X · α – taki iloczyn jest dopuszczalny
α · X – taki iloczyn nie jest dopuszczalny
Dwie macierze są macierzami obserwacji statystycznej (m·y i m·x zawierają obserwacje statystyczne)
Natomiast wektory α i η są wektorami elementów nieobserwowalnych, które będziemy szacować (α i η podlegają szacowaniu – estymacji)
Obserwacje na zmiennej X zaczynamy od xt0, np.
(xt0 – zmienna „ślepej”)
xto – jest związany z wyrazem wolnym
α – wektor parametrów strukturalnych
k – dla liczby zmiennych objaśniających
η – składnik losowy
Na podstawie macierzy obserwacji X oraz Y będziemy szacowali składniki losowe α i η.
α i η są nieznane, możemy je tylko oszacować (estymować).
To co jest dane zawarte jest w macierzy X i Y – wielkości które są dane- gromadzimy je w trakcie specyfikacji modelu. Nie są znane natomiast składowe wektora Ƞ i alfa.
Naszym zadaniem jest oszacowanie wartości nie znanych. Mając do dyspozycji dane , które zawarte są w macierzy X i Y.
W trakcie estymacji wybierzemy estymator czyli funkcję matematyczną służącą głównie do oszacowania składowych wektor a ALFA. Jeśli wykorzystamy wybrany estymator do obliczeń numerycznych, wykorzystują dane statystyczne zawarte w macierzach X oraz Y to uzyskamy oceny parametrów strukturalnych modelu które możemy też nazwać szacunkami parametrów strukturalnych modelu.
Estymacja – szacowanie parametrów strukturalnych modelu i parametry struktury stochastycznej modelu a nie MODEL. Po drodze szacuje się składnik losowy, którego szacunki nazywać będziemy resztami modelu.
WYKŁAD 5
16.03.2012
Temat: Klasyczna metoda najmniejszych kwadratów (KMNK)
x – punkty empiryczne – obserwacje statystyczne
Im wyższe działania marketingowe tym wyższe przychody ze sprzedaży.
Jest to pewna smuga, należy dopasować przebieg prostej do y-tych rozrzutów.
Aprokrymanta – to prosta wyrównująca
Jak dopasowujemy prostą wyrównującą?
Kierujemy się tym, żeby składnik losowy empirycznych reszt grał jak najmniejszą rolę.
Powstają różnice Ut między wartościami rzeczywistymi yt a wartościami teoretycznymi ŷt.
Musimy znaleźć prostą, dla której suma reszt będzie zerowa.
Gauss wpadł na pomysł, aby interpretować sumę kwadratów reszt, że jest ona minimalna.
Suma kwadratów reszt jest parabolą, charakteryzująca się tym, że posiada extremum (max lub min.).
Będziemy chcieli zminimalizować dumę kwadratów reszt, przy czym u jest wektorem reszt n x1, który powstaje
Ze znalezienia wektora ŷ i wektora wartości teoretycznej zmiennej objaśnianej.
Minimalizujemy funkcję S
Estymator KMNK (ά) równa się:
Jeśli dokonamy przekształceń macierzy X i Y to otrzymamy ά, w którym będą szacunki modelu liniowego i otrzymamy wektor takich składowych:
Estymator Gaussa
Ten iloczyn jest dozwolony, ponieważ wewnętrzne parametry są takie same
- to macierz HESSA zwana hesjanem
Jest to macierz kwadratowa, stopnia k+1.
Tego typu konstrukcja generuje macierz o jeszcze jednej charakterystyce.
Macierz symetryczna – charakteryzuje się tym, że istnieją pary identycznych elementów, np.
macierz jest systematyczna, jeśli istnieją takie pary:
a25 = a52
Macierz Hessa należy do klasy pewnych form. Jest formą kwadratową, a to oznacza, że jej wyznacznik nie może być ujemny.
Estymator powinien dać wynik o postaci wektora (k+1) x 1, a więc powinien dać wynik o postaci parametrów strukturalnych.
Warunki stosowania KMNK
Warunek 1. Model musi być liniowy, możliwe jest jednak stosowanie KMNK do modeli nieliniowych, które daje się zlinearyzować, czyli sprowadzić do postaci liniowej, np. mamy model potęgowy:
to do tego modelu KMNK nie da się zastosować ale jeżeli uda nam się przekształcić do postaci liniowej to możemy go zlogarytmować.
Dokonujemy podstawień:
za podstawiamy
Po podstawieniach otrzymujemy model:
Powstał model liniowy ze względu na parametry. Parametry od α0 do αn można zlinearyzować za pomocą KMNK. Linearyzacja modelu za pomocą KMNK jest dopuszczalna.
Warunek 2. Zmienne objaśniające modelu powinny być nielosowe. Losowość zmiennych objaśniających powoduje, że estymator KMNK jest obciążony. ( obciążenie – systematyczny błąd w estymatorze)
Warunek 3. Zmienne objaśniające modelu nie mogą być skorelowane ze składnikiem losowym modelu, co zapisujemy w następujący sposób:
Jeśli ten warunek nie jest spełniony estymator KMNK traci zgodność..
Warunek 4. Rząd macierzy obserwacji na zmiennych objaśniających powinien wynosić k+1
rz(x) = k+1
To oznacza dwa warunki:
1.model powinien posiadać dodatnią liczbę stopni swobody, czyli:
n – (k+1) > 0
musi być więcej obserwacji statystycznych niż parametrów strukturalnych.
2.w modelu nie powinna występować współliniowość zmiennych objaśniających, przy czym wyróżniamy współliniowość deterministyczną i współliniowość stochastyczną (żadna z nich nie powinna wystąpić).
Współliniowość deterministyczna – jest elementarnym błędem specyfikacji modelu, oznacza ona, że w modelu istnieje co najmniej jedna para zmiennych objaśniających w postaci kombinacji liniowej, czyli
dla wszystkich j, j` = 0,1,2,...,k
j ≠ j`
Mamy parę zmiennych objaśniających, z których jedna zmienna jest liniową funkcją drugiej zmiennej.
Rząd – to jest liczba kolumn liniowo niezależnych.
Jeśli pojawi się liczba kolumn liniowo niezależnych:
rz(x) < k+1
Jeśli rząd macierzy Hessa jest taki jak rząd macierzy X
rz(xTx) = k+1
Rząd macierzy Hessa w tym przypadku będzie
rz(xTx) < k+1
Oznacza to wyznacznik macierzy
det (xTx) = 0
Macierz Hessa staje się osobliwa, a wtedy estymator KMNK ...
i nie istnieje odwrotność macierzy Hessa.
Współliniowość stochastyczna zmiennych objaśniających – oznacza występowanie w modelu co najmniej jednej pary zmiennych objaśniających skorelowanej istotnie statystycznie to mówimy współliniowości stochastycznej. Skutkiem współliniowości stochastycznej jest pogorszenie efektywności estymatora KMNK, czyli zmniejszenie jego presji.
Macierze wariancji i kowariancji
Składnik losowy modelu powinien być tzw. czystym składnikiem losowym. Inne określenia: powinien być „białym szumem”, „sferyczny”. Określenie „biały szum” odnosi się wyłącznie do procesów stochastycznych (a nie odnosi się do danych przekrojowych).
Założenie sferyczności oznacza, że macierz wariancji i kowariancji składników losowych jest iloczynem wariancji składnika losowego i macierzy jednostkowej stopnia n.
Struktura macierzy wariancji i kowariancji składników losowych
Każda macierz wariancji i kowariancji jest symetryczna. Wariancje i kowariancje odgrywają ogromną rolę przy wykorzystywaniu pewnej miary współzależności cech – jest to wzór na współczynnik korelacji.
Struktura macierzy:
=
=
=
t, t` = 1, ... , n ; t t`
Dwa pod warunki:
Równość wariancji dla poszczególnych obserwacji i równej dla wartości ogólnej nosi nazwę jednorodności wariancji składnika losowego(homoscedastyczny). Jeżeli warunek nie jest spełniony mówimy o niejednorodności wariancji składnika losowego, który powoduje pogorszenie efektywności estymatora KMNK. W takim przypadku stosuje się często uogólnioną metodę KMNK (zwaną metodą Actken’a)
Kowariancja składników losowych powinny być 0. Jest to warunek braku autokorelacji składnika losowego. Wystąpienie autokorelacji składnika losowego powoduje pogorszenie efektywności estymatora KMNK. Autokorelacja składnika losowego jest konsekwencją błędu specyfikacji modelu. W specyfikacji modelu może pojawić się zarówno w formie specyfikacji zmiennych jak też w fazie specyfikacji równań.
WYKŁAD 6
24.03.2012
Temat: Weryfikacja statystyczna
Model będzie tym lepszy im składnik losowy będzie grał mniejszą rolę.
Modelowi hipotetycznemu (liniowemu)
musimy przypisać odpowiednik empiryczny w oparciu o próbę statystyczną, czyli musimy znaleźć następujący model:
άj (j=0, 1, ..., k) – to oceny parametrów strukturalnych,
ŷt – teoretyczne wartości zmiennej objaśnianej uzyskane na podstawie modelu empirycznego.
Model empiryczny możemy zapisać następująco
Modele a i b różnią się wielkością Ut:
(t= 1,….,n)
Ut – to reszty modelu
Związek między ηt a Ut
ηt - to składnik losowy nieobserwowalny,
Ut - to szacunki / oceny składników losowych
Weryfikacje modelu zaczynamy od badania reszt. Reszty powinny tworzyć proces losowy o rozkładzie normalnym i o zerowej nadziei matematycznej.
U = Y- Y(z daszkiem)
F(U) = 0 ------wartość oczekiwana = 0
N(0,gama do2 ) – reszty powinny osiągać wartość normalną z przedziału (0,gama do2 )
W pierwszej części weryfikacji badamy tzw. ogólne miary dobroci modelu i oceniamy rolę składnika losowego w modelu. (Im mniejsza rola składnika losowego tym lepszy jest model empiryczny) W drugiej części stosujemy tzw. szczegółowe miary dobroci modelu oraz stosujemy adekwatne testy statystyczne. Testy statystyczne dzielimy na testy parametryczne i nieparametryczne. Parametryczne służą do mierzenia konkretnych parametrów.
Globalne miary jakości modelu (dobroci modelu)
Estymator wariancji składnika losowego - Su² (wariancja resztowa)
Wariancja resztowa jest nieobciążonym estymatorem wariancji składnika losowego uzyskanym za pomocą KNMK. Oblicz się go następująco:
n-(k+1) to liczba stopni swobody – musi być dodatnia i duża,
1 – suma kwadratu reszt, którą można zapisać:
Wariancja resztowa jest liczbą nieujemną (brak jest przypadku zerowej wariancji resztowej); zasadniczo wariancja resztowa jest dodatnia.
Reszty powstają ze zmiennych objaśnianych, dlatego muszą być wyrażone w tych samych jednostkach miary jak zmienna objaśniana (czyli wariancja będzie formą kwadratową).
SU² – nie ma ekonomicznej interpretacji
Im mniejsze SU2 tym lepszy jest model. Im mniejsza jest wariancja resztowa tym lepszy jest model.
W praktyce będziemy posługiwać się wielkością dwuznakową (+ , -), mianowaną
i jest ona wyrażona w takich samych jednostkach jak zmienna objaśniana.
A zatem SU ma ekonomiczną interpretację.
SU nazywać będziemy błędem standardowym reszt.
SU jest estymatorem δ, czyli odchylenia standardowego składnika losowego
Interpretacja Su
SU informuje o tym, o ile średnio rzecz biorąc teoretyczne wartości zmiennej objaśnianej (ŷt) obliczone na podstawie modelu empirycznego różnią się od empirycznych (rzeczywistych) wartości zmiennej objaśnianej yt.
SU jest wyrażone w jednostkach zmiennej objaśnianej.
Współczynnik zmienności losowej V
(może być wyrażony procentowo)
Interpretacja V : V informuje o tym jaki jest udział błędu standardowego reszt w średniej arytmetycznej zmiennej objaśnianej.
Jeśli mamy powyższe dwa modele, ustalamy, że dla:
I modelu V = 4,7%
II modelu V = 7,2%
Model pierwszy opisuje lepiej zmienną objaśnianą, ponieważ V jest tam mniejsze.
Interpretacja V=4,7% ------- V=4,7% informuje o tym, że błąd standardowy reszt modelu empirycznego stanowi 4,7% średniej arytmetycznej zmiennej objaśnianej.
Całkowita zmienności zmiennej objaśnianej
Wyrażenie w postaci udziałów poszczególnych części całości
Odwracamy:
yt – indeks „t” jest przy „y“,
y – nie ma indeksu „t” przy „y”, ponieważ jest to średnia identyczna dla wszystkich obserwacji (nic się nie zmienia), y jest stabilne, stałe.
Współczynnik determinacji: Współczynnik zbieżności
Z tego wynika, że:
W statystyce symbol R to współczynnik korelacji wielorakiej, czyli:
R2 – to kwadrat współczynnika korelacji wielorakiej, my nazywać go będziemy współczynnikiem determinacji,
Y2 – nazywać będziemy współczynnikiem zbieżności.
R2 i Y2 nie mogą być ujemne, ponieważ są formami kwadratowymi. Teoretycznie mogą być zerowe, ale takich raczej nie ma w ekonometrii.
Każda z tych liczb mieści się w przedziale:
Duży udział miary zmienności powodowanej przez zmienne objaśniające natomiast mały udział miar zmienności losowej. W modelach opartych na makro danych R² powinno być znacznie wyższe od 0,9 (90%).
Model oparty na danych rocznych powinien posiadać znacznie wyższe R² niż modele budowane na danych. Po okresie obserwacji krótszym niż rok. W mikromodelu ekonomicznym opartym na danych miesięcznych lub kwartalnych R² na poziomie 0,7 uznać należy za zadawalający. Makro modele wygładzają szeregi statystyczne , w mikromodelach tego nie ma.
R2 - powinno być duże,
Y2 - powinno być małe.
Model jest tym lepszy im R2 jest bliższe jedności a Y2 bliższe zeru.
Interpretacja (Y²) – Informuje jaką część całkowitej zmienności zmiennej objaśniającej stanowią wahania losowe(przypadkowe). Im mniejsze Y² tym lepszy model.
Y² = 0,075=7,5% - informuje że 7,5% całkowitej zmienności zmiennej objaśniającej stanowią wahania losowe
Interpretacja (R ²) – Informuje jaka część całkowitej zmienności zmiennej objaśnianej stanowią wahania powodowane przez zmienne objaśniające modelu empirycznego.
R²= 92,5% - 92,5% całkowitej zmienności zmiennej objaśnianej stanowią wahania powodowane przez zmienne objaśniające modelu empirycznego.
Szczegółowe miary dobroci
Błędy średnie ocen parametrów strukturalnych
Każda ocena parametrów strukturalnych aj dla wszystkich j od 0 do k, jest uzyskana z określoną dokładnością. Należy ustalić zatem błąd szacunku dla każdej oceny aj. Błąd szacunku oznaczać sobie będziemy Saj. Błąd powinien być mały – im mniejszy błąd tym lepszy wynik estymacji.
Model empiryczny powinien zawierać wyłącznie ważne, czyli statystycznie istotne zmienne objaśniające. W związku z tym każdej ocenie parametru strukturalnego należy
przyporządkować miarę jej dokładności nazywaną średnim błędem oceny j-tego parametru strukturalnego, oznaczamy to symbolem:
Pod każdą empiryczną znajdzie się średni błąd szacunku.
Błędy w stosunku do oceny powinny być małe. Im mniejszy błąd tym większa precyzja szacunku.
Błędy powstają z wariancji. Błąd jest pierwiastkiem kwadratowym wariancji. Najpierw musimy ustalić wariancję ocen parametrów strukturalnych, a potem ich błędów. Konieczne jest oszacowanie macierzy wariancji i kowariancji ocen parametru strukturalnego. Macierz oznaczać będziemy symbolem
i będziemy ją obliczać za pomocą:
Struktura tej macierzy:
1 2 3
4
Interesują nas elementy diagonalne macierzy: 1, 2, 3 i 4.
WYKŁAD 7
30.03.2012
Temat: Badanie istotności zmiennych objaśniających
Model empiryczny będziemy zapisywać w następującej postaci:
Zadaniem jest sprawdzenie czy każda ze zmiennych objaśniających modelu empirycznego wpływa w istotnie statystycznie na zmienną objaśnianą.
Najpierw skorzystamy z hipotezy 0 a następnie z odpowiedniego testu statystycznego .
obszar klasyczny dzielimy na : dwustronny i jednostronny (prawostronny lub lewostronny)
TEST T-STUDENTA
Stosunek oceny parametru strukturalnego do błędu średniego ma rozkład t-studenta.
Tγ – w statystyce nosi nazwę wartości krytycznej, przy czym γ w statystyce jest poziomem istotności.
Poziom istotności w statystyce oznacza ryzyko / prawdopodobieństwo popełnienia błędu pierwszego rodzaju, czyli przyjęcia fałszywej hipotezy zerowej.
Wybierając ryzyko błędu pierwszego rodzaju wybieramy małe ryzyko. Gama γ powinna być liczbą małą. Nie ma możliwości wyboru z ryzykiem zerowym.
W statystyce rozsądny poziom ryzyka wynosi nie więcej niż 5%.
Ryzyko na poziomie 0,85 jest ryzykiem fatalnym.
To co jest poza obszarem zera w statystyce nazywa się obszarem krytycznym.
Jeśli t-studenta trafi do obszaru zerowego to jest ono zerowe, a jeśli trafi do obszaru krytycznego to jest ono wartością niezerową.
Wartość krytyczna zależy od trzech parametrów:
poziom istotności – bierze się ono stąd, że my go wybieramy, godzimy się na dane ryzyko. Najczęściej poziom ryzyka określany na poziomie
wartość krytyczna zależy od γ oraz od liczby stopni swobody:
Przypadek 1:
w tym przypadku nie ma podstaw do odrzucenia hipotezy zerowej.
Przypadek 2:
W przypadku tym statystyka tj trafia do obszaru krytycznego. Wniosek statystyczny: odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej z ryzykiem błędu pierwszego rodzaju.
Zmienna istotna – dobra sytuacja
Zmienna nieistotna – zła sytuacja – należy wyeliminować z modelu i ponownie przeprowadzić estymację parametrów z pominięciem zmiennej nieistotnej.
Usuwamy zmienną o najniższej statystyce tj spośród nieistotnych i ponownie szacujemy parametry. W tym nowym modelu ekonomicznym respecyfikowanym (pozbawiony najgorszej zmiennej) , może okazać się że niektóre spośród zmiennych poprzednio nieistotnych stały się statystycznie istotne. Poprzednia nieistotność mogła być bowiem efektem strumieniowości stochastycznej związanej ze zmienną wyeliminowaną, Zmienne nieistotne eliminujemy w kolejnych krokach pojedynczo aż do uzyskania modelu empirycznego który będzie zawierał wyłącznie zmienne istotnie statystycznie na racjonalnym poziomie istotności . W wyjątkowych przypadkach można przyjąć gama = 0,1 czyli zgodzić się na ryzyko błędu pierwszego rodzaju na poziomie 10%. Z tego wynika, że lepiej będzie jak statystyka tj będzie duża. Jeżeli poniżej 0,02 tj to sytuacja jest słaba/nie dobra.
Współliniowość stochastyczna i wpływ na wyniki modelowania ekonometrycznego.
Współliniowość stochastyczna- gdy istnieje para zmiennych objaśniających jest skorygowana.
|rij| = 0 (r,j = 0,1,…k; i=j)
Liczba stopni swobody (n-2)
rij = 0 (i,j = 0, 1…k,i=j) – wówczas mówimy że zmienne objaśniające są ortogonalne w takim przypadku det(XT X) osiąga wartość maksymalną ( diag(XTX )−1 = min)
rtj= βj0 + $\beta_{j0}\beta_{xtj"}$ – para zmiennych jest współliniowa deterministycznie i
det ( XTX) = 0 = macierz staje się osobliwa.
Przestrzeń między ortodoksyjnością a osobliwością : wtedy – 0 < det ( XTX) < det ( XTX) max ,
|diag ( XTX)−1 = nieskończoność|
Gdy |rij| rośnie ( rosnące moduły współczynnika korelacji pary zmiennych objaśniających jest wzrost wariancji ocen parametrów strukturalnych a tym samym wzrost wartości błędów ocen parametrów strukturalnych) - jeśli rośnie ten moduł to maleje wartość wyznacznika macierzy Hessa i rosną elementy diagonalne odwrotności macierzy Hessa oraz rosną elementy diagonalne wariancji i kowariancji , czyli rosną błędy średnie ocen parametrów strukturalnych.
Wariancja ocen paramentów strukturalnych jest miarą efektywności .
Mała wariancja oznacza duże odchylenie standardowe i dużą precyzję.
Duża wariancja oznacza małe odchylenie standardowe.
Jeżeli rosną błędy ocen parametrów strukturalnych to .
Efektem może być taki spadek statystyki tj że będzie ona mniejsza od wartości krytycznej co oznacza nieistotność danej zmiennej objaśniającej (efektywność szacunku). Może się okazać że owa nieistotność zmiennej objaśniającej jest tylko pozorną bowiem stanowi efekt współliniowości stochastycznej. Podsumowując współliniowość stochastyczną może doprowadzić do błędu poznawczego polegającego na usunięciu ważnej zmiennej objaśniającej na skutek pozornej jej nieistotności to współliniowości stochastycznej można uniknąć badając w fazie specyfikacji zmiennych macierzy współczynników korelacji par zmiennych objaśniających. Spośród zmiennych współliniowych stochastycznie wybrać należy jedna do modelu hipotetycznego czyli taką która jest bardziej logiczna ekonomicznie.
Autokorelacja składnika losowego
E( NNT) = sigma ^2 In
Cov ( NtNt′ ) = 0 (t,t’ = 1,…,r,t =t’)
Miarą autokorelacji składnika losowego jest współczynnik autokorelacji składnika losowego ρ (ro).
-współczynnik autokorelacji rzędu 1. Może osiągać trzy wartości graniczne (takie jak współczynnik korelacji Pearsona):
-1
1
0 wówczas nie ma autokorelacji
Należy ustalić kiedy w modelu może wystąpić autokorelacja. Istnieją trzy przyczyny występowania autokorelacji składnika losowego, z których dwie powodują autokorelację dodatnią, natomiast jedna autokorelację ujemną:
a)w modelu empirycznym pominięto ważną czyli istotną statystycznie zmienną objaśniającą czego skutkiem jest dodatnia autokorelacja składnika losowego. Może się zdarzyć, że ominęliśmy ważną zmienną przyczynową, o której istnieniu wiemy, ale nie udało się zgromadzić kompletnych informacji statystycznych o tej zmiennej. Jeśli posiadamy znaczącą większość informacji statystycznych o pominiętej zmiennej objaśniającej to można podjąć próbę uzupełnienia szeregu statystycznego – jeśli ubytki są niewielkie.
Jeśli nie ma możliwości ujęcia w modelu ważnej zmiennej ze względu na brak danych można wówczas zastosować rozwiązanie zastępcze. Rozwiązaniem zastępczym jest zmienna symptomatyczna, inaczej zastępcza.
Możemy wykorzystać w miejsce zmiennej pominiętej zmienną symptomatyczną, która charakteryzuje się tym, że jest silnie skorelowana z pominiętą zmienną objaśniającą, np. wiemy, że w pominiętej zmiennej występuje silny i wyraźny trend liniowy.
b) wadliwa postać modelu powoduje dodatnią autokorelację składnika losowego
reszty ujemne
Reszta dodatnia
Powyższy model jest modelem liniowym katastroficznym, wadliwym ze względu na postać autonomiczną z dodatnią autokorelacją składnika losowego. Mniej jest reszt dodatnich, więcej jest reszt ujemnych. Wadliwość postaci jest błędem specyfiki modelu. Należy zastosować inny model.
Jeśli zmienimy postać analityczną na adekwatną do rozrzutu punktów empirycznych to dodatnia autokorelacja zniknie.
c)Jego skutkiem jest ujemna autokorelacja składnika losowego. Może mieć miejsce wówczas gdy model empiryczny zawiera znaczną liczbę nieistotnych statystycznie zmiennych objaśniających.
Usunięcie nieistotnych zmiennych objaśniających z modelu powoduje eliminację ujemnej autokorelacji składnika losowego.
Każda z przyczyn autokorelacji składnika losowego jest błędem specyfikacji.
Model źle wyspecyfikowany ma zerowe walory.
=0 - autokorelacji nie ma, nie ma autokorelacji pierwszego rzędu. Może wykazać że jeśli nie ma autokorelacji składnika losowego pierwszego rzędu to nie występuje autokorelacji składnika losowego wyższego rzędu.
Autokorelacja składnika losowego dodania pojawia się z dwóch powodów:
• brak w modelu ważnej (istotnej statystycznie) zmiennej objaśniającej
• wadliwa jest postać analityczna modelu
Oba te przypadki powodują że model hipotetyczny jest wadliwy. Model taki należy skorygować. W pierwszym przypadku znaleźć ważna zmienną objaśniającą uwzględniając ja w modelu hipotetycznym. Rezultatem będzie zniknięcie autokorelacji dodatniej. Przykładem takiego błędu specyfikacji może być model oparty na danych kwartalnych w których nie uwzględniono zmiennych sezonowych. Uzupełnienie takiego modelu o zmienne sezonowe spowoduje zniknięcie autokorelacji . Inny przypadek takiego błędu specyfikacji może polegać na tym, że pominęliśmy ważną zmienną objaśniającą z powodu braku informacji. Niekompletność informacji można usunąć droga INTERPORACJI lub EKSPLOATACJI STATYSTYCZNEJ. Brak informacji statystycznych jest przypadkiem trudniejszym można wówczas skorzystać z zmiennej zastępczej zwaną też zmienną symptomatyczną o której wiemy że jest silnie skorelowana ze zmienna pominiętą. Wykorzystywanie zmiennej symptomatycznej może wyeliminować autokorelacje dodatnią. Model nazywać będziemy wówczas modelem symptomatycznym.
WYKŁAD 8
13.04.2012
Temat: Badanie autokorelacji składnika losowego
AUTOKORELACJA jest wynikiem błędów specyfikacji modelu. Autokorelację należy usunąć poprzez likwidację błędu. Skutkiem autokorelacji składnika losowego jest pogorszenie efektywności estymatora KMNK, czyli zmniejszenie jego precyzji albo dokładności.
Autokorelację testujemy za pomocą odpowiednich testów, których istnieje wiele. Najbardziej popularnym testem jest test DURBINA WOTSONA. W przypadku tego testu badamy autokorelację rzędu pierwszego, a miarą jest współczynnik ρ1 (ro jeden).
Testowanie autokorelacji pierwszego rzędu jest wystarczające, ponieważ jeśli nie występuje autokorelacja rzędu pierwszego to nie ma również autokorelacji rzędów wyższych.
Układ hipotez:
Stawiamy hipotezę zerową:
Hipoteza zerowa zakładamy, że nie ma autokorelacji
Hipoteza alternatywna jest następująca:
jest to test z prawostronnym obszarem krytycznym, występuje autokorelacja dodatnia
Sprawdzianem hipotezy zerowej jest statystyka DW:
Statystyka D i W
Pamiętamy, że:
Jeśli mamy obserwacje statystyczne t (od 1 do n)
t (obserw. Satyst.) |
Ut (reszty) |
Ut-1 (ciąg reszy) |
(Ut – Ut-1)2 (kwadrat reszt) |
1 | U1 | - | - |
2 | U2 | U1 | (U2 – U1)2 |
3 | U3 | U2 | (U3 – U2)2 |
4 | U4 | U3 | (U4 – U3)2 |
5 | U5 | U4 | (U5 – U4)2 |
... | ... | ... | ... |
n-1 | Un-1 | Un-2 | (Un-1 – Un-2)2 |
n | Un | Un-1 | (Un – Un-1)2 |
Istnieją trzy skrajne sytuacje:
Jeśli ρ1 równa się 1 to statystyka DW w przybliżeniu osiągnie 0.
Na wykresie pokazujemy obszary, gdzie jest autokorelacja, a gdzie jej nie ma. W tablicach statystycznych D i W należy znaleźć dwie wartości krytyczne:
wartość krytyczna dolna dl,
wartość krytyczna górna du,
przy czym: du > dl
Wartości krytyczne zależą od trzech wielkości:
1. od liczby obserwacji statystycznych n,
2. od liczby k,
3. od poziomu istotności γ.
Gamę γ wybieramy sami. Każda tablica jest dla innego poziomu istotności.
Najczęściej spotyka się tablicę na poziomie 0 ; 0,5.
Następnie tablicę na poziomie 0 ; 0,01 oraz tablicę na poziomie 0 ; 0,025.
Dl odcina liczbę bliską d,
du odcina liczbę bliską k.
Jak znajdziemy wartości krytyczne to nanosimy je na wykres:
Wnioski:
I przypadek: DW > du to znajdujemy się w
Wniosek statystyczny: Nie ma podstaw do odrzucenia hipotezy zerowej pierwszego rzędu. Sytuacja modelu jest dobra, co oznacza, że nie ma autokorelacji w modelu.
Wnioski:
II przypadek: DW > dl to znajdujemy się
Znajdujemy się w okolicach zera, stąd wniosek statystyczny: Odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej. Oznacza to, że występuje dodatnia autokorelacja składnika losowego. Jest to niedobra sytuacja. W tej sytuacji należy naprawić błąd poprzez ustalenie przyczyny autokorelacji, przyczynami są:
a) wadliwa postać autokorelacji,
b) brak ważnej zmiennej objaśniającej.
III przypadek: dl < DW< du to oznacza, że statystyka D i W znajduje się pomiędzy dl a du, znajdujemy się w obszarze oznacza to, że statystyka D i W trafiła w tzw. obszar nieczułości testu D i W, a zatem nie wiemy czy jest autokorelacja, czy jej nie ma.
Pojawiają się trzy szkoły, które proponują swoje kombinacje:
1) głosi, że skoro nie udowodniono, że autokorelacja występuje, to oznacza że jej nie ma,
2) głosi, jeżeli nie wykonano braku autokorelacji to znaczy, że ona jest,
3) głosi, że skoro ten test nie wyjaśnił sprawy autokorelacji należy zastosować inny test, który jednoznacznie udzieli odpowiedzi na zadane pytanie, np. testu t-studenta na współczynnik korelacji.
Takie rozstrzygnięcie występuje w trzecim przypadku.
Może zdarzyć się, że statystyka D i W przekroczy 2
DW > 2
to wtedy będzie większe od du i w tym przypadku wchodzimy w obszat potencjalnie ujemnej autokorelacji składnika losowego.
2 < DW < 4
Jeśli DW przekracza 2 to musimy zmienić hipotezę alternatywną.
W tej sytuacji musimy zastosować skorygowaną statystykę D i W, którą obliczamy następująco:
W tym przypadku pojawiają się trzy możliwości:
1* DW* > du obszar
2* DW* < du obszar
3* dl < DW* < du obszar
Wniosek statystyczny do 1* - nie ma podstaw do odrzucenia hipotezy zerowej, nie ma ujemnej autokorelacji składnika losowego a więc model jest dobry, akceptowalny.
Wniosek statystyczny do 2* - występuje ujemna autokorelacja składnika losowego, należy usunąć nieistotną zmienną objaśniającą (najgorszą lub najsłabszą charakteryzującą się wartością statystyki t-studenta).
Wniosek statystyczny do 3* - test nie rozstrzyga czy autokorelacja występuje czy też nie (należy sugerować się propozycją szkoły nr 3, a więc należy zastosować test t-studenta, który jednoznacznie odpowie czy jest czy nie ma).
Modele wielorównaniowe
MODEL WIELORÓWNANIOWY składa się z wielu równań stochastycznych. Najogólniej w modelu wielorównaniowym występuje G zmiennych endogenicznych. Najmniejsza G wynosi co najmniej 2.
Będziemy posługiwali się obserwacjami oznaczonymi:
y1t, y2t, …, yt, …, yGt
Model wielorównaniowy opisuje system ekonomiczny albo jego część nazywaną subsystemem lub podsystemem. Dla potrzeb tego modelu wprowadzimy nowe pojęcie:
1) zmienna łącznie współzależna modelu to każda zmienna endogeniczna nie opóźniona w czasie,
2) zmienne z góry ustalone to wszystkie zmienne egzogeniczne oraz zmienne endogeniczne opóźnione w czasie.
Takim modelem może być przedsiębiorstwo, gospodarka narodowa – są to opisy oparte na modelach wielorównaniowych. W modelu wielorównaniowych występuje wiele zmiennych endogenicznych.
Zmienna endogeniczna – charakteryzuje się tym , że przynajmniej w jednym z równań pełni rolę zmiennej objaśnianej, może jednak w modelu pełnić rolę zmiennej objaśniającej. Alternatywną jest zmienna egzogeniczna – czyli zmienna zewnętrzna systemu która w równaniach może występować jedynie w roli zmiennej objaśniającej. Zmienne endogeniczne można podzielić na dwie grupy.
1 grupa – zmienne endogeniczne bez opóźnień czasowych które nazywać będziemy zmiennymi łącznie współzależnymi.
2 grupa – zmienne endogeniczne z opóźnieniem czasowymi
W modelach wielorównaniowych mówić będziemy o zmiennych z góry ustalonych do których należą zmienne egzogeniczne i zmienne endogeniczne opóźnione w czasie. Wśród zmiennych egzogenicznych wyróżnić możemy grupę tzw. zmiennych sterujących. Specyfiką zmiennych sterujących jest to , że użytkownik modelu (decydent) może mieć przynajmniej częściowy wpływ na ich wielkość.
W modelach wielorównaniowych mogą występować dwa rodzaje równań:
Równania stochastyczne – czyli takie jak w modelach jednorównaniowych , takich które zawierając składnik losowy
Równania definicyjne ( równania tożsamościowe)
model gospodarki narodowej – kluczowa rola PKB, można rozważać np. miejsce tworzenia PKB, PKB w rolnictwie, PKB w przemyśle. Suma tych poszczególnych części będzie tworzyła równanie tożsamościowe.
Model kosztów w przedsiębiorstwie – kluczową rolę odgrywają koszty – koszt transportu, koszt pracy, koszt materiałów i koszty pozostałe – równanie tożsamościowe : po lewej stronie będą koszty całkowite , natomiast po prawej suma poszczególnych kosztów.
Rozważać będziemy trzy typy ( trzy klasy) równań wielorównaniowych:
1 klasa – modele proste
2 klasa – modele rekurencyjne
3 klasa – modele równań współzależnych
MODELE PROSTE
W modelach prostych nie ma żadnych powiązań pomiędzy zmiennymi łącznie współzależnymi. Oznacza to, że w każdym z równań takiego modelu zmiennymi objaśniającymi są wyłącznie zmienne z góry ustalone.
MODELE REKURENCYJNE
W modelu rekurencyjnym zmienne łącznie współzależne są powiązane łańcuchowo czyli rekurencyjnie. Oznacza to tzw. jednokierunkowy mechanizm powiązań zmiennych łącznie współzależnych, którego specyfiką jest możliwość wskazania początku i końca łańcucha.
UKŁADY RÓWNAŃ WSPÓŁZALEŻNYCH
W układach równań współzależnych występują dwa mechanizmy powiązań:
- sprzężenie zwrotne nazywane niekiedy sprzężeniem zwrotnym bezpośrednim,
- zamknięty cykl powiązań zmiennych łącznie współzależnych nazywany niekiedy sprzężeniem zwrotnym pośrednim.
Model prosty: y1t , y2t, y3t, y4t
Model rekurencyjny:
Jeśli będzie mechanizm przypadku łańcuchowego czyli y4t wpływa na y3t, y3t na y2t a y2t na y1t
Specyfiką tego modelu jest to, że występują zmienne ustalone z góry ale również zmienne objaśniająca y2t
y1t będzie równaniem końcowym
y4t będzie równaniem początkowym
Cechą równania początkowego modelu rekurencyjnego jest to, że zawiera jako objaśniające wyłącznie zmienne z góry ustalone, np.
y1t y1t
y2t y2t
y3t y3t
y4t y4t
W modelu rekurencyjnym może wystąpić więcej niż jedno równanie początkowe. Model ten będzie rekurencyjny dopóki da się ustalić początek i koniec, minimum jedno powiązanie, np.
y1t
y2t
y3t
y4t
W momencie kiedy nie można ustalić początku i końca model przestaje być rekurencyjny.
( powiązania musza iść w jednym kierunku, aby powstał model rekurencyjny potrzebne jest chociaż jedno powiązanie, w modelu tym trzeba rozróżnić równania początkowe i końcowe, modele rekurencyjne istnieją tak długo aż powiązania idą w jednym kierunku)
Układy równań współzależnych
1 przypadek
ygt yg’t
gg’ = 1, …, G, g = g’
Taki przypadek nazywamy sprzężeniem zwrotnym. Jest to oddziaływanie, w którym nie ma początku ani końca.
2 przypadek
y1t
y2t
y3t
y4t
Taki przypadek nazywamy zamkniętym cyklem powiązań. Specyfiką cyklu jest to, że nie ma równania początkowego ani końcowego.
Przypuśćmy, że:
g = 5 to oznacza, że mamy sprzężenie zwrotne między g=5 i g’=8
g’ = 8
W równaniu y5 zmienną objaśniającą będzie y8 i odwrotnie.
y5t y8t
WYKŁAD 9
20.04.2012
Przykład modelu prostego
y1t = α10 + α11 xt1 + α14 y3t-1 + η1t
y2t = α20 + α22 xt2 + α23 y2t-1 + α25t + η2t
y3t = α30 + α31 xt1 + α34 y3t-1 + α35t + η3t
Lista zmiennych z góry ustalonych: xt0, xt1, xt2, y2t-1 , y3t-1, t
Zmienne z góry ustalone oznaczać będziemy symbolem – α
Natomiast symbolem β będziemy oznaczać zmienne łącznie współzależne ( jeśli nie ma w modelu symbolu β oznacza, że model jest prosty)
IDEKSACJA PARAMETRU:
Numer równania zawsze jest pierwszym indeksem zmiennej z góry ustalonej
Składnik losowy ma dwa indeksy: numer równania jako indeks pierwszy i indeks czasowy t
Przykład modelu rekurencyjnego
Przykład 1
y1t = α10 + β12 y2t + α11 xt1 + α14 t + η1t
y2t = α20 + β23 y3t + α22 xt2 + α25 y4t-1 + η2t
y3t = α30 + β34 y4t + α33 xt3 + η3t
y4t = α40 + α41 xt1 + α45 y4t-1 + η4t
y4t-1 - zmienna z góry ustalona, której nie bierzemy pod uwagę
y2t, y3t , y4t – zienne łącznie współzależne – z tego powodu nie może być to model prosty
Pojawiły się zmienne współzależne, więc nie jest to model prosty. Jest to model rekurencyjny, ponieważ ustalamy mechanizm powiązań zmiennych łącznie współzależnych.
Mamy 4 zmienne łącznie współzależne:
y1t y2t y3t y4t
Na y1t wpływa y2t, miarą oddziaływania jest β12,
Na y2t wpływa y3t, miarą oddziaływania jest β23,
Na y3t wpływa y4t, miarą oddziaływania jest β34.
Równaniem początkowym jest y4t ( wśród zmiennych objaśniających nie ma żadnej zmiennej łącznie współzależnej) , a końcowym y1t ( potencjalnie mogą wystąpić wszystkie zmienne)
Przykład 2
y1t = α10 + α11 xt1 + α14 t + η1t
y2t = α20 + β23 y3t + α25 y4t-1 + η2t
y3t = α30 + α33 xt3 + η3t
y4t = α40 + α41 xt1 + α45 y4t-1 + η4t
y1t, y4t – równanie oderwane , choć spełniają warunki definicyjne równań początkowych. Natomiast klasycznym równaniem początkowym jest tównanie opisujące y3t , natomiast równanie końcowe y4t. W modelu rekurencyjnym może występować więcej niż jedno równwnie końcowe.
Przykład układu równań wspołzależnych
y1t = α10 + β12 y2t + α16 y4t-1 + η1t
y2t = α20 + β23 y3t + α22 xt2 + α35 xt + η2t
y3t = α30 + β31 y1t + β34 y4t + α33 xt3 + η3t
y4t = α40 + β43 y3t + α45 t + α46 y4t-1 + η4t
y1t y2t y3t y4t
y1t y2t y3t y4t y5t
sprzężenie zwrotne nie ma początku ani końca- zamknięty cykl powiązań
Macierzowy zapis modelu wielorównaniowego
Poprzednie 3 modele to modele w formie strukturalnej, które macierzowo mają następującą postać:
BY + AZ = η
Postać strukturalna modelu ujawnia wszystkie bezpośrednie powiązania między zmiennymi łącznie współzależnymi oraz wszystkie bezpośrednie oddziaływania zmiennych z góry ustalonych na zmienne łącznie współzależne. Alternatywą w formie strukturalnej jest forma ZREDUKOWANA modelu.
Forma strukturalna: BY + AZ = η
GxG Gx1 (K+1)x1 Gx1
Y – jest wektorem zmiennych łącznie współzależnych
wektorem zmiennych łączniewspółzależnych
y1t η1t
Y = ygt η = ηgt
Gx1 yGt Gx1 ηGt
Z – to wektor zmiennych z góry ustalonych oznaczone symbolami „z”
zt0
Z = zt1
(K+1)x1 ztj
ztk
B – macierz parametrów strukturalnych przy zmiennych łącznie współzależnych.
Zmiennych łącznie współzależnych mamy 2 zatem B wygląda następująco:
1 -β12... -β1g... -β1G
-β21... 1 -β2g... -β2G
B = -βg1 βg2 1 -βgG
-βG1... -βG2... -βGg.. . 1
Macierz B jest macierzą kwadratową.
A – to macierz, która zawiera parametry przy zmiennych z góry ustalonych. Musimy mieć kolumn tyle ile składowych wektora „z”.
-α10... -α11... -α1j... -α1K
A = -αg0 -αg1 -αgj -αgK
Gx(K+1) -αG0... -αG1... -αGj... -αGK
Zapis macierzowy modelu
y1t - α10 - β12 y2t - α11 xt1 - α16 y4t-1 = η1t
y2t - α20 - β23 y3t - α22 xt2 - α35t = η2t
y3t - α30 - β31 y1t - β34 y4t - α33 xt3 = η3t
y4t - α40 - β45 y3t - α45 t - α46 y4t-1 = η4t
B Y A
1 -β12 0 0 y1t -α10 -α11 0 0 0 -α16
0 1 -β23 0 y2t + -α20 0 -α22 0 -α35 0
-β31 0 1 -β34 y3t -α30 0 0 -α33 0 0
0 0 -β45 1 y4t -α40 0 0 0 -α45 -α46
Z η
xt0
xt1 ηt1
xt2 = ηt2
xt3 ηt3
t ηt4
y4t-1
WYKŁAD 10
27.04.2012
TEMAT: Modelowanie ograniczonych zmiennych zależnych
Milcząco zakłada się w modelowaniu ekonometrycznym, ze zmienna objaśniająca jest nieograniczona. Zarówno od dołu jak też od góry i osiąga wartości od –nieskończoności do + nieskończoności.
-nieskończoności <= yt <= + nieskończoności – jest to założenie fałszywe
Większość zmiennych posiada co najmniej jedno ograniczenie, które jest znane w praktyce natomiast ograniczenia pojawiają się obustronnie.
Ymin <= yt <= ymax dla wszytskich t=1,…,n.
Często bywa tak, że jedno z ograniczeń jest znaną zmienna a drugie nie.
Np. Zatrudnienei, produkcja, koszty nie mogą być ujemne;
Zysk finansowy, stan konta może być ujemmny lub dodatni
Występują górne granice , których my często nie dostrzegamy
Czy to ma wpływ na modelowanie?
Przykład ograniczonej zmiennej : wskaźnik struktury ( najniższa wartość 0, najwyższa wartość to 100% lub 1000 promili) jest to zmienna ograniczona obustronnie. Jeśli wyrazimy częstością to min=0 , max=1
Jak zmienia sie prawdopodobieństwo jakiegoś zdarzenia pod wpływem różnych zdarzeń czynników?
Przykład: kryzys, który pojawia sie przy różnych czynnikach makroekonomicznych. Można oszacować prawdopodobieństwo wystąpienia krysysu. Można jako 0 oznaczyć czynniki, które nie będą powodować kryzysu i 1 jako te które znacząco wpływają.
Możemy rozważyć następujący model prawdopodobieństwa:
$y_{t} = \ \sum_{j = 0}^{k}\alpha_{j}X_{\text{tj}} + \ n_{t}$ (t=1,….,n) liniowa funkcja prawdopodopieństwa zwana też
Funkcją Goldberga)
Yt= 1, gdy wystąpią warunki Vj ( mogą być jednowymiarowe lub wielowymiarowe)
0, w przypadku przeciwnym
dolna granica obserwacji ymin =0
górna granica obserwacji ymax =1
xxx x___xxx___xxx__xxxxx___xx__xx________gwałtowne załamanie
xxxx____xx_xxxx____xxx__xxx______xxx_x
x – obserwacje , albo 1 albo 0
yt – częstość, oszacownie prawdopodobieństwa Vj i danej konfiguracji wartości zmiennych objaśniających
Mankament funkcji liniowej prawdopodobieństwa: szacunki prawdopodobieństwa mogą wyjść poza ograniczoną wartość ( waertość maksymalną);
jest możliwość osiągania przez wartości teoretyczne modele empirycznego poziomu poza przedziłu zmienności zmiennej ograniczonej czyli mniejszych niż ymin albo większych niż ymax
W przypadku modelu Goldebergera estymacja KNMK charakteryzuje się obniżoną efektywnością, ponieważ wariancje składników losowych są niejednorodne, dlatego też metodą estymacji parametrów modelu Goldebergera winna być uogólniona metoda najmniejszych kwadratów Aitken’a czyli stosowanie αA = (XTomega−1X)-1 Xt omega-1Y
Gdy omega jest macierzą jednostkową to przekształca sie w metodę najmniejszych kwadratów. Gdy składnik losowy jest niesferyczny to należy stosować metodę Aitken’a. Przy czym nie dopuszczona jest autokorelacja. Zasadniczo motoda Aitken’a dopuszczalna jest w przypadku niejednorodności wariancji składnika losowego.
Funkcja krzywoliniowa byłaby lepsza, charakteryzuje się tym , że początkowo rośnie bardzo szybko do momentu punktu przegięcia, a następnie rośnie znacznie wolniej- taka funkcja nazywa sie funkcją logistyczną.
Modele z transformacjami ograniczonych zmiennych zależnych
Ymin <= yt <= ymax o <= p <=1
Transformacja:
prolitowa – stosuje pewne przekształcenia prawdopodobieństwa
logitowa- wykorzystała dystrybuantę rozkładu normalnego , ze względu na tablice rzadko stosowana.
Transformacja podstawowa $\text{\ \ \ p}^{*\ } = \ \frac{p}{1 - p}$
Transformacja logitowa prawdopodobienstwa p (l) = lnp* = ln$\left( \frac{p}{1 - p} \right)$
Transformacja podstawowa dowolnej zmiennej ograniczonej:
Min=0
Max- nieograniczone
Yt(l) = yt-ymin
ymax -yt
Transformacja logitowa dowolnej ograniczonej zmiennej
Yt(l) = lngt(p) = ln yt - ymin
ymax - yt
Idealna zmienna objaśniająca modelu- w postaci transformacji logitowej
Yt(l) = α0 + α1xt1 + …. + αjxtj+ …+ αkxtk+ nt
Yt(l) = $\sum_{j = 0}^{k}\alpha_{j}x_{\text{tj}}$+ nt
Liniowy model zlogitował transformacje zmiennej ograniczonej jako objaśnianej jest równoważny wielowymiarowemu modelowi logistycznemu ale oryginalnej zmiennej objaśnianej.
Forma strukturalna i zredukowana modelu
B – jest macierzą nieosobliwą czyli istnieje odwrotność macierzy B, wówczas możemy pomnożyć równanie strukturalne przez B odwrotne tylko lewostronnie:
B-1/BY + AZ = η
otrzymamy
B-1BY + B-1AZ = B-1 η
J
w efekcie otrzymamy iloczyn jednostkowy (J)
Po lewej stronie mamy Y
Y = - B-1AZ + B-1 η
Formę zredukowaną uprościmy podstawiając pod - B-1A jakieś C, a za B-1 η jakieś ε.
C = - B-1A
B-1 η = ε
Wówczas otrzymujemy formę zredukowaną o postaci:
Y = CZ + ε
Gx1
Y – wektor zmiennych łączniewspółzależnych,
Z – wektor zmiennych z góry ustalonych,
ε – wektor składników losowych w formie zredukowanej,
C – macierz parametrów strukturalnych równań formy zredukowanej modelu.
Gx(K+1)
Identyfikacja modelu prowadzi do ustalenia czy jest on poprawnie skonstruowany pod względem matematycznym. Żeby mówić o identyfikacji modelu potrzebne jest pojęcie równania identyfikacyjnego.
RÓWNANIE, które wiąże parametry w formie strukturalnej ze zredukowaną:
C = - B –1 A
To równanie nazywamy RÓWNANIEM IDENTYFIKACYJNYM, które będziemy nazywali UWIKŁANE.
Forma uproszczona tego równania to:
BC = - BB-
Które otrzymaliśmy poprzez pomnożenie:
B/C = - B-
- BB-1 to macierz jednostkowa, wówczas równanie możemy zapisać następująco:
BC = - A
GxG Gx(K+1) Gx(K+1)
Gx(K+1)
Jest to RÓWNANIE IDENTYFIKACYJNE
Model WIELORÓWNANIOWY jest identyfikowalny (poprawnie zbudowany) wówczas gdy równanie identyfikacyjne jest rozwiązywalne czyli posiada rozwiązanie przy znanych składowych macierzy C ze względu na nie znane parametry zawarte w macierzach B oraz A. Problem identyfikacji jest równoważny problemowi rozwiązania układu równań liniowych wynikających z równania identyfikacyjnego.
WYKŁAD 11
17.05.2012
Temat: Zasada konstrukcji formy zredukowanej modelu
Y = CZ + ε
Gx1
Y – wektor zmiennych łączniewspółzależnych,
Z – wektor zmiennych z góry ustalonych,
ε – wektor składników losowych w formie zredukowanej,
C – macierz parametrów strukturalnych równań formy zredukowanej modelu.
Gx(K+1)
W formie zredukowanej równań jest tyle ile zmiennych łącznych współzależnych czyli 5.
ε1t C10 C11... C1j... C1K
ε = εgt C = Cg0 Cg1... Cgj... CgK
εGt CG0 CG1... CGj... CGK
Zt0
Y1t Zt1
Y = ……. Z = …..
Ygt Ztj
……. …..
YGt Ztk
y1t = α10+ β12 y2t + α11 x1t + η1t
y2t = α20 + β23 y3t + α22t + α24 y1t-1 + η2t
y3t = α30 + β31 y1t + α33 xt3 + α35 y2t-1 + η3t
zmienne z góry ustalone: xt1 , xt0 , xt2 , t , y2t-1
y1t = C10 + C11 xt1 + C12xt2 + C13xt3 + C14t + C15 y2t-1 + ε1t
y2t = C20 + C21 xt1 + C 22xt2+ C23xt3 + C24t + C25 y2t-1 + ε2t
y3t = C30 + C31 xt1 + C32xt2 + C33 xt3 + C34t + C35 y2t-1+ ε3t
W każdym równaniu są te same zmienne, forma zredukowana jest modelem prostym.
W formie zredukowanej pojawiają się tzw. Mnożniki , forma zredukowana daje onformacje o mnożnikach.
Zasadniczym przeznaczeniem formy zredukowanej jest rola techniczna w modelach wielorównaniowych.
Jest wykorzystywana w procesach sytuacyjnych np. W podwójnej metodzie najmniejszych kwadratów, w pośredniej metodzie najmniejszych kwadratów.
Jest też niezbędna przy szacowaniu prognoz z układów równań współzależnych
Identyfikacja modelu: (II etap budowy modelu wielorównaniowego) , w modelach jednorównaniowych identyfikacja nie istnieje.
Rozważać można jedynie model identyfikowalny , czyli poprawnie skonstruowany pod względem matematycznym.
-A=BC Roztrzyga o tym równanie identyfikowalne – równanie przejścia pomiędzy formą zredukowaną a normalną i na odwrót.
-α10... -α11... -α1j... -α1K
-αg0 -αg1 -αgj -αgK =
-αG0... -αG1... -αGj... -αGK
1 -β12... -β1g... -β1G
-β21... 1 -β2g... -β2G
-βg1 βg2 1 -βgG
-βG1... -βG2... -βGg.. . 1
C10 C11... C1j... C1K
Cg0 Cg1... Cgj... CgK
CG0 CG1... CGj... CGK
To nie jest model prosty , bo one są zawsze identyfikowane ( identyfikacja dotyczy głownie układów równań współzależnych).
Model jest identyfikowalny , jeżeli równanie identyfikowalne posiada rozwiązanie przy znanych składowych macierzy C, ze względu na nieznane parametry zawarte w macierzach A oraz B.
Gdyby wszystkie parametry macierzy A i B były nieznane to model nie byłby identyfikowalny , ponieważ układ równań liniowych nie posiadałby rozwiązania.
W praktyce zawsze w macierzach A oraz B pojawiają się zera jako wartość parametrów. Tyle zer musi być odpowiednie duże, by układ równań liniowych posiadał rozwiązanie. Liczba rozwiązanych równań jest taka jak liczba składowych macierzy G(G*(k+1))
Jeżeli układ równań liniowych nie posiada rozwiązań, to model jest nieidentyfikowalny
( czyli wadliwie skonstruowany) , wymaga on przebudowy.
Jeśli układ równań liniowych posiada rozwiązanie:
może być rozwiązany jednoznacznie – identyfikalny jednoznacznie
może być rozwiązany niejednoznacznie (wiele rozwiązań) – identyfikowalny niejednoznacznie.
Model identyfikowalny jednoznacznie i niejednoznacznie oznacza poprawę jego konstrukcji.
W praktyce modele identyfikowalne jednoznacznie są rzadkością. Dominują modele identyfikowalne niejednoznacznie (nazywane wadliwymi prze identyfikowalnymi).
Specyfiką modelu identyfikowalnego jednoznacznie jest to, że posiada tylko jedną formułę zredukowaną.
Model prze identyfikowany ( identyfikowalny niejednoznacznie) posiada więcej niż jedną formułę zredukowaną.
Badanie identyfikowalności modelu:
Podając identyfikowalność modelu należy spełnić dwa warunki identyfikalności:
warunków niezbędnej liczby zmiennych – jako koniecznego
warunku rzędu odpowiedniej macierzy jako warunku koniecznego i wystarczającego.
Lg – liczba zmiennych, które nie występują w G-tym równaniu musi być równa conajmnniej (g=1,….,G) G-1.
Lg >= G-1 – wówczas równanie może być identyfikowalne
Lg < G-1 – równanie jest nieidentyfikowalne
Jeśli jedno równanie jest nieidentyfikowalne, to model jest również nieidentyfikowalny.
Model jest identyfikowalny, jeśli każde z jego równań jest identyfikowalne.
Nejpierw sporządzamy listę wszytskich zmiennych
Ustalamy których zmiennych nie ma w każdym z równań i prównujemy G-1
rzWg = G-1 – równanie identyfikowalne
(g=1,…,G)
rzWg <G-1 – rówanie nieidentyfikowalne
Macierz Wg jest tworzona z parametrów przy zmiennych, które nie występują w G-tym równaniu.
Jeżeli spełniony jest 2. Warunek , to równanie jest identyfikowalne jednoznacznie, gdy
Lg=G-1 ( Wg – macierz kwadratowa)
Lg = G-1 - równanie identyfikowalne
Lg > G-1 - równanie przeidentyfikowalne
rzWg nie może być mniejsza niż (G-1)
Konstrukcja macierzy Wg (wypisujemy zmienne, ktorych nie ma w ! równaniu)
y3t t xt3 y1t-1 y2t-1 pamiętać o minusach!
W1 = -β23 -α22 0 -α24 0
1 0 -α33 0 -α35
rzW1 = 2= G-1 - równanie I jest identyfikowalne niejednoznacznie ( jest przeidentyfikowalne)
Gdy model jako całość jest identyfikowalny , to jest on identyfikowalny jednoznacznie, gdy każde równanie jest identyfikowalne jednoznacznie.
Gdy model jest identyfikowalny i choć jedno z równań jest przeidentyfikowane to model jest przeidentyfikowany.