Metoda Największej Wiarygodności i modele zmiennych jakościowych (2)


Metoda Największej Wiarygodności (MNW)

Polega na znalezieniu ocen parametrów, gwarantujących największe prawdopodobieństwo uzyskania wartości zaobserwowanych w próbie.

Jako ilustrację wprowadzającą rozważmy klasyczny model regresji z jedną zmienną objaśniającą:

0x01 graphic
, 0x01 graphic
.

Wówczas funkcja wiarygodności jest funkcją gęstości łącznego rozkładu prawdopodobieństwa zmiennych 0x01 graphic
, traktowaną jako funkcja nieznanych prametrów modelu:

0x01 graphic

Logarytm funkcji wiarygodności (ang. loglikelihood) dany jest następująco:

0x01 graphic
.

Poszukując ocen parametrów 0x01 graphic
oraz 0x01 graphic
maksymalizujemy powyższe wyrażenie. W tym celu wyznaczamy pochodne cząstkowe i przyrównujemy je do zera:

0x01 graphic
,

0x01 graphic
,

0x01 graphic

Pierwsze dwa warunki dostarczają ocen parametrów strukturalnych identycznych z ocenami KMNK, zaś z ostatniego otrzymujemy:

0x01 graphic
.

Estymator wariancji składnika losowego uzyskany MNW jest obciążony, ale obciążenie to zanika wraz ze wzrostem próby. Natomiast oceny parametrów strukturalnych uzyskane MNW i KMNK są identyczne. Podobne wyniki otrzymuje się w przypadku regresji wielorakiej.

Pamiętamy, że metoda najmniejszych kwadratów ma zastosowanie przy mniej restrykcyjnych założeniach (nie wymaga normalności rozkładu składnika losowego). Ilustruje to fakt, że MNW często może być również stosowana przy niespełnieniu założenia odnośnie przyjętego rozkładu - mówimy wówczas o metodzie quasi-największej wiarygodności.

Statystyczne własności estymatora MNW

Przy spełnieniu pewnych warunków regularności:

- estymator MNW jest zgodny,

- estymator ten ma asymptotyczny rozkład normalny postaci:

0x01 graphic
,

gdzie 0x01 graphic
jest wektorem teoretycznych wartości parametrów, 0x01 graphic
jest wektorem ocen MNW tych parametrów oraz

0x01 graphic
,

przy czym 0x01 graphic
jest graniczną macierzą informacyjną:

0x01 graphic
.

Macierz informacyjna zawiera więc (wzięte z przeciwnym znakiem) wartości oczekiwane drugich pochodnych cząstkowych logarytmu funkcji wiarygodności. Jeśli logarytm funkcji wiarygodności jest bardzo zakrzywiony w pobliżu swojego maksimum, drugie pochodne przyjmują duże wartości co do wartości bezwględnej, a wariancja estymatora jest mała - estymator staje się bardziej precyzyjny. Ponadto można wykazać, że odwrotność macierzy informacyjnej dostarcza dolnego ograniczenia dla asymptotycznej macierzy wariancji i kowariancji wszystkich zgodnych estymatorów asymptotycznie normalnych. Jest to tzw. dolne ograniczenie Rao-Cramera. Wiąże się ono z kolejną ważną własnością estymatora MNW:

- estymator MNW jest asymptotycznie najefektywniejszy w klasie wszystkich zgodnych estymatorów o asymptotycznym rozkładzie normalnym.

Ta ostatnia własność jest podstawową zaletą metody największej wiarygodności: ponieważ metoda ta wykorzystuje w pełni informację z próby (na temat rozkładów skończenie wymiarowych dla obserwacji na zmiennej zależnej), otrzymujemy estymatory o minimalnej wariancji w dużych próbach. Należy jednak podkreślić, że dobre własności tej metody nie muszą przejawiać się w małych próbach.

Inną ważną zaletą MNW jest możliwość wygodnego testowania liniowych i nieliniowych restrykcji dotyczących estymowanych parametrów. Wykorzystuje się w tym celu trzy różne zasady konstrukcji testów statystycznych.

Załóżmy dla uproszczenia, że testujemy hipotezę odnośnie pojedynczego parametru:

0x01 graphic
.

Można wówczas rozważyć następujące testy:

  1. Test ilorazu wiarygodności LR (ang. likelihood ratio test) (Neyman, Pearson, 1928) - dostarcza łatwego w konstrukcji sposobu porównania dwu modeli zagnieżdżonych. Wykorzystuje się tutaj iloraz funkcji wiarygodności i konstruuje statystykę postaci:

0x01 graphic
, (*)

gdzie 0x01 graphic
jest wartością funkcji wiarygodności wyliczoną dla oceny MNW wyznaczonej przy nieograniczonej estymacji, zaś 0x01 graphic
jest wartością tej funkcji dla oceny wyznaczonej przy założeniu prawdziwości hipotezy zerowej. Statystyka (*) ma asymptotycznie przy założeniu prawdziwości 0x01 graphic
rozkład 0x01 graphic
.

  1. Test Walda W (Wald, 1943) - zasadza się na obserwacji, iż jeśli testowana restrykcja jest prawdziwa, to 0x01 graphic
    powinno być w przybliżeniu równe 0, gdzie, jak poprzednio, 0x01 graphic
    jest oceną parametru uzyskaną MNW bez nakładania restrykcji. Odrzucenie hipotezy zerowej następuje, jeśli 0x01 graphic
    jest istotnie różne od 0. Warto zauważyć, że identyczną zasadę stosujemy, wykonując test t istotności parametrów. Testy Walda wymagają jedynie estymacji modelu nieograniczonego (bez nakładania restrykcji). Są one asymptotycznie równoważne testom LR.

  1. Test mnożnika Lagrange'a LM (ang. Lagrange multiplier test) (Rao, 1948) - korzystamy tu z obserwacji, że ocena parametru wyznaczona przy założeniu prawdziwości restrykcji występującej w hipotezie zerowej powinna znajdować się blisko wartości 0x01 graphic
    maksymalizującej funkcję wiarygodności. Z tego powodu pochodna logarytmu funkcji wiarygodności w punkcie 0x01 graphic
    powinna być bliska zero, gdzie 0x01 graphic
    jest oceną parametru 0x01 graphic
    uzyskaną z estymacji MNW przy warunku pobocznym. Test ten wymaga estymacji jedynie modelu z restrykcjami i jest asymptotycznie równoważny testom LR i W.

0x01 graphic

Rys. 1. Testowanie restrykcji z wykorzystaniem estymacji MNW

(Greene, Econometric Analysis, s. 485)

W przypadku modeli regresji liniowej trzy wspomniane statystyki mają postać:

0x01 graphic

oraz zachodzi:

0x01 graphic
.

Stąd wniosek, że test W jest testem najmocniejszym w skończonych próbach. Ponadto widać związek tego testu z testem F postaci:

0x01 graphic

O tym, która zasada jest stosowana w konkretnej sytuacji decyduje łatwość przeprowadzenia odpowiedniej estymacji. Ponieważ najłatwiejsze do uzyskania są zwykle oceny parametrów w estymacji z restrykcjami, w praktyce dosyć często stosuje się test LM.

Pamiętamy, że do testowania ogólnej hipotezy liniowej w modelu liniowej regresji używaliśmy do tej pory statystyki postaci:

0x01 graphic
.

Test F jest testem dla małej próby. Teraz widzimy, że w dużych próbach test F można zastąpić asymptotycznie równoważnymi testami LR, W i LM. Przy okazji testy te mają znacznie ogólniejsze zastosowanie (np. do testowania restrykcji nieliniowych).

Poniżej prezentuje się jedno z ważniejszych zastosowań estymacji metodą największej wiarygodności - estymację modeli logitowych i probitowych.

Modele zmiennej jakościowej. Przypadek zmiennej dychotomicznej (zero-jedynkowej)

Informacje wprowadzające:

  1. Liniowy model prawdopodobieństwa (LMP):

Rozważmy przypadek pojedynczej zmiennej objaśniającej. LMP to zwykłe równanie regresji:

0x01 graphic
, 0x01 graphic
,

gdzie zmienna zależna jest zmienną dychotomiczną.

Wówczas 0x01 graphic
jest równe prawdopodobieństwu, że zero-jedynkowa zmienna objaśniana przyjmuje wartość 1:

0x01 graphic

Problemy:

- Heteroskedastyczność składnika losowego - ponieważ składnik losowy przyjmuje tylko dwie wartości: 0x01 graphic
i 0x01 graphic
z prawdopodobieństwami wynoszącymi odpowiednio 0x01 graphic
i 0x01 graphic
, więc można łatwo wyliczyć wariancję:

0x01 graphic

Wariancja ta nie jest stała (zależy od wartości zmiennej objaśniającej).

- Składnik losowy nie ma rozkładu normalnego (ma rozkład dwupunktowy), co powoduje problemy z wnioskowaniem statystycznym.

- Wartości teoretyczne (oceny prawdopodobieństw,0x01 graphic
) mogą wychodzić poza przedział [0, 1].

  1. Modele logitowe i probitowe

Rozważamy model regresji, w którym zmienna objaśniana 0x01 graphic
jest nieobserwowalna (inaczej - ukryta, ang. latent variable):

0x01 graphic
.

Obserwujemy zmienną postaci:

0x01 graphic

Np. jeśli 0x01 graphic
informuje o tym, czy dana osoba kupiła samochód (zaciągnęła kredyt, podjęła pracę), to 0x01 graphic
informuje o skłonności (zdolności) do kupna samochodu (zaciągnięcia kredytu, podjęcia pracy). Dla obserwowanej zmiennej o rozkładzie dwupunktowym prawdopodobieństwo sukcesu wynosi:

0x01 graphic
,

gdzie F jest dystrybuantą rozkładu składnika losowego. Jeśli rozkład składnika losowego jest symetryczny, otrzymujemy:

0x01 graphic
.

Przyjmując, że F jest dystrybuantą rozkładu logistycznego, otrzymujemy model logitowy, podczas gdy przyjęcie dystrybuanty rozkładu normalnego daje model probitowy.

Funkcja gęstości i dystrybuanta rozkładu logistycznego są postaci:

0x01 graphic
;

0x01 graphic
.

Stąd dla modelu logitowego:

0x01 graphic

lub równoważnie

0x01 graphic
.

Wyrażenie powyższe to tzw. logarytm ilorazu szans (logit). W modelu logitowym logarytm ilorazu szans jest liniową funkcją zmiennych objaśniających. W LMP taką funkcją było samo prawdopodobieństwo.

W przypadku rozkładu normalnego mamy:

0x01 graphic
;

0x01 graphic
.

Stąd w modelu probitowym:

0x01 graphic
.

Wyrażenie 0x01 graphic
jest określane w tym przypadku jako probit.

Estymacja modeli logitowych i probitowych odbywa się najczęściej metodą największej wiarygodności, polegającą na poszukiwaniu takich ocen parametrów, które maksymalizują funkcję wiarygodności przyjmującą w tym wypadku postać:

0x01 graphic
.

Logarytm funkcji wiarygodności dany jest następująco:

0x01 graphic
,

Wyznaczając pochodne i przyrównując do 0 mamy:

0x01 graphic

Wyrażenia występujące pod pierwszym znakiem sumy są to tzw. uogólnione reszty. Warunki pierwszego rzędu stwierdzają, że uogólnione reszty sumują się do 0 i są ortogonalne do zmiennych objaśniających.

W przypadku modelu logitowego łatwo sprawdzić, że warunki powyższe redukują się do:

0x01 graphic

i uogólnione reszty stają się zwykłymi resztami. W szczególności mamy więc: 0x01 graphic
, tj. rzeczywista częstość względna jest równa przewidywanej częstości względnej (częstości z modelu).

Warunek ten nie zachodzi dla modeli probitowych (zachodzi jedynie w przybliżeniu).

Ponieważ rozkłady logistyczny i normalny są zbliżone, miary dopasowania obu modeli są bardzo podobne. Ponadto mając oceny parametrów modelu logitowego, przybliżone oceny parametrów modelu probitowego otrzymujemy przemnażając te pierwsze przez 1/1,6 = 0,625.

Istnieje także przybliżony związek między ocenami parametrów liniowego modelu prawdopodobieństwa i modelu logitowego postaci:

0x01 graphic

Predykcja efektów zmian wartości zmiennych objaśniających (inaczej mówiąc - interpretacja parametrów):

  1. w liniowym modelu prawdopodobieństwa parametry informują, o ile wzrośnie średnio prawdopodobieństwo sukcesu, jeśli dana zmienna wzrośnie o jednostkę przy innych zmiennych na tym samym poziomie.

  2. w modelu logitowym wielkość 0x01 graphic
    informuje, ilukrotnie wzrośnie iloraz szans przy jednostkowym wzroście danej zmiennej objaśniającej.

  3. w przypadku modeli logitowych i probitowych efekty krańcowe zależą od wartości zmiennych objaśniających i można je wyznaczyć następująco:

0x01 graphic

gdzie ϕ to funkcja gęstości standardowego rozkładu normalnego.

W programach komputerowych wyznacza się je dla średnich wartości zmiennych objaśniających.

Miary dopasowania:

W ocenie i porównywaniu różnych modeli zmiennych jakościowych stosuje się mierniki takie jak:

a) współczynnik korelacji między wartościami rzeczywistymi 0x01 graphic
i teoretycznymi 0x01 graphic
, tj. ocenami prawdopodobieństw, 0x01 graphic
:

0x01 graphic

gdzie to dystrybuanta standardowego rozkładu normalnego.

b) pseudo-R2 McFaddena oparty na ilorazie logarytmów funkcji wiarygodności modelu bez restrykcji (U, ang. unrestricted) i z restrykcjami zerowymi na parametrach j , j = 1, …, k, (R, ang. restricted) postaci:

0x01 graphic
;

0x01 graphic

c) zliczeniowy R2 (count-R2): po oszacowaniu parametrów modelu logitowego, probitowego lub LMP szacujemy dla każdej obserwacji odpowiednie prawdopodobieństwa, 0x01 graphic
, a następnie wyznaczamy prognozy według reguły:

0x01 graphic

Trafność prognoz wygodnie jest badać w oparciu o tablicę trafności:

Empiryczne

Prognozowane

Razem

Y = 1

Y = 0

Y = 1

n11

n10

n1.

Y = 0

n01

n00

n0.

Razem

n.1

n.0

Wówczas

0x01 graphic

Do weryfikacji modeli szacowanych MNW służy test ilorazu wiarygodności - jego wariant w Gretlu testuje łączną istotność wszystkich parametrów poza wyrazem wolnym i ma rozkład χ2 z k stopniami swobody (k - liczba parametrów).



Wyszukiwarka

Podobne podstrony:
Wykresy do MODELE ZMIENNEJ JAKOSCIOWEJ, SGH, Ekonometria
Modele zmiennej jakościowej sgh
Modele zmiennej jakosciowej efekt krańcowy str 9
E2 10 modele zmiennych jakosciowych
E2 11 modele zmiennych jakosciowych
Wyklad 7b modele ze zmiennymi jakościowymi
Metoda PNF szansą na poprawę jakości życia
Metoda PNF szansą na poprawę jakości życia
Zadanie 3 Modele rozwoju organizacyjnego perspektywa zarządzania jakością informacją zarządzania efe
metoda qfd zarzadzanie jakoscia
Plaszczyzna-konspekt, Metoda płaszczyzny fazowej stosuje się do układów drugiego rzędu, których zmie
¤ QFD metoda rozwinięcia jakości, zarządzanie jakością, Zagadnienia Jakości
Metoda QFD w procesie zarządzania jakością w predsiębiorstwie
Folia Obena wypowiedzi wg Berelsona, W literaturze posługującej się metodami analizy treści pewne ty
Cwiczenie Metoda Lean (1), STUDIA, studia materiały, MATERIAŁY DODATKOWE, Jakość w Logistyce

więcej podobnych podstron