str. 23
MODELE ZMIENNEJ JAKOŚCIOWEJ
Zmienne jakościowe – zmienne, których wartości mają postać niemierzalnych „kategorii”,
np. zmienna płeć przyjmuje wartości „mężczyzna” lub „kobieta”.
W modelach ekonometrycznych zmienne te jakościowe najczęściej zamieniane są na
zmienne zero-jedynkowe, np.
0 dla mężczyzn oraz
1 dla kobiet.
Model zmiennej jakościowej – model ekonometryczny, w którym zmienną objaśnianą jest
zmienna jakościowa (zer-jedynkowa)
LINIOWY MODEL PRAWDOPODOBIEŃSTWA (LMP)
W LMP szacowane są parametry modelu liniowego:
gdzie
jest zmienną zero-jedynkową.
Powstają dwa pytania:
1/ Jak interpretujemy wartość teoretyczną modelu LMP?
Przykładowo, co oznacza że
0,7 dla zmiennej płeć?
2/ Jak interpretujemy parametry modelu LMP?
Aby odpowiedzieć na te pytania zauważmy, że:
1 1
0 0
1
Oznacza to, że wartość teoretyczna modelu LMP określa prawdopodobieństwo, że zmienna
objaśniana
przyjmie wartość 1.
Tym samym parametr
interpretujemy jako wzrost prawdopodobieństwa zdarzenia
1
w wyniku wzrostu
o jednostkę.
str. 24
LINIOWY MODEL PRAWDOPODOBIEŃSTWA, CD.
PRZYKŁAD
Oszacowano model LMP dla wiarygodności klientów banku następującej postaci:
0.66 0.005
gdzie:
- wiarygodność kredytobiorców
(
1 dla osób regularnie płacących raty oraz
0 dla pozostałych kredytoborców)
- wysokość zarobków (w tys PLN rocznie).
Zinterpretuj wartość teoretyczną dla klienta, dla którego
40 oraz
100.
Jaka jest interpretacja parametru 0.005?
0.66 0.005 40 0.86 - prawdopodobieństwo regularnej spłaty rat wynosi 86%
0.66 0.005 100 1.16 - prawdopodobieństwo regularnej spłaty rat wynosi 116%
Parametr 0.005 interpretujemy jako wzrost prawdopodobieństwa, że klient będzie
regularnie spłacał raty w wyniku wzrostu rocznych zarobków o 1 tys PLN.
WADY LMP
1/ Wartości teoretyczne modelu, interpretowane jako prawdopodobieństwo, mogą być
większe od 1 lub mniejsze od 0.
2/ Problemy z heteroskedastycznością składnika losowego:
można wykazać, że
!
1 "
, czyli zależy od wartości zmiennych objaśniających.
Wykres: Wartości teoretyczne i rzeczywiste w modelu LMP
str. 25
MODEL LOGITOWY
W modelu logitowym prawdopodobieństwo jest dane funkcją logistyczną:
#
$%
&#
$%
,
gdzie
'
(
A zatem wartości teoretyczne należą do przedziału [0,1] dla wszystkich wartości
'
.
Warto zauważyć, że
1 "
&#
$%
, co implikuje, że ILORAZ SZANS wynosi:
1 "
)
*
%
zaś wartość tzw LOGITU jest równa:
ln -
1 "
. '
Interpretacja parametrów
/
jest stosunkowo trudna.
Interpretujemy natomiast EFEKT KRAŃCOWY, dany wzorem:
0
0
/
/
1 "
określający jak jednostkowa zmiana
/
wpływa na prawdopodobieństwo
.
Uwaga: w wydrukach komputerowych podawane są efekty krańcowe dla średniej wartości
w próbie, liczone wg wzoru:
/
1
1 " 1
MODEL PROBITOWY
W modelu probitowym prawdopodobieństwo jest dane zależnością:
Φ'
,
gdzie
'
(
zaś
Φ jest dystrybuantą rozkładu normalnego.
Tak jak w modelu logitowym wartości teoretyczne należą do przedziału [0,1] dla wszystkich
wartości
'
.
Model probitowy jest stosowany substytucyjnie z modelem logitowym, gdyż teoretyczne
wartości prawdopodobieństwa oraz dopasowanie modelu do danych jest zbliżone. W
przypadku oszacowań parametrów, zachodzi zależność:
456(
7 1,7
895:(
str. 26
MIARY DOPASOWANIA W MODELU LOGITOWYM/PROBITOWYM
;<=>?@ " A
B
W modelu logitowym nie można stosować zwykłego współczynnika determinacji
C
ze
względu na nieliniowość.
Stosuje się tzw.
DEFGHI " A
B
określany także jako
JKLMHHFN A
B
:
O)PQR " C
1 "
ln S
TU
ln S
TV
gdzie
S
TU
jest wartością funkcji wiarygodności dla modelu pełnego, natomiast
S
TV
dla
modelu zredukowanego do wyrazu wolnego.
TABLICA TRAFNOŚCI
Drugą miarą dopasowania jest tzw. tablica trafności. W celu skonstuowania tablicy trafności
liczymy teoretyczne wartości dla
, czyli prawdopodobieństwa
oraz wypełniamy tabelę:
Model
Dane
1
0
1
W
W
0
W
W
Powstaje jednak pytanie, kiedy przyjąć, że model wskazuje na
1? Istnieją dwie
dominujące metody.
1/ zasada standardowa:
1 gdy
X 0,5
2/ metoda optymalnej wartości granicznej (metoda Cramera):
1 gdy
X Y.
str. 28
EKONOMETRIA SZEREGÓW CZASOWYCH
Proces stochastyczny – zbiór zmiennych losowych {
(
uporządkowany zgodnie z indeksem
czasu
Z.
Szereg czasowy – pojedyncza realizacja procesu stochastycznego w próbie, dla
Z 1,2, … , ]
Przykład:
Temperatura notowana 22 listopada o godzinie 10:00 przed wejściem do SGH
Proces stochastyczny:
(
^ _5,4
dla każdego Z
Szereg czasowy:
`
6,7;
b
1,2;
c
"3,7;
e
12,3
Przykłady procesów stochastycznych
(Gaussowski) proces białego szumu
(
(
,
gdzie
(
^ _0, f
oraz gRh
(
,
(i
0 dla j k 0
Proces błądzenia losowego
(
(i
(
Proces autoregresyjny rzędu
; - AR(;)
(
(i
U
(iU
(
,
Proces średniej ruchomej rzędu
l – MA(l)
(
(
m
(i
m
n
(i
Autoregresyjny proces średniej ruchomej – ARMA(
;, l)
(
(i
U
(iU
(
m
(i
m
n
(i
,
str. 29
STACJONARNOŚĆ
Proces ściśle stacjonarny:
proces stochastyczny, którego wszystkie własności statystyczne nie zmieniają się w czasie
Proces słabo stacjonarny:
proces stochastyczny, dla którego wartość oczekiwana, wariancja oraz autokowariancja nie
zmieniają się w czasie, tj.:
(
o dla Z 1,2, … , ]
!
(
f
dla
Z 1,2, … , ]
pRh
(
,
(i
q
dla
Z 1,2, … , ]
Stacjonarność procesu AR(1)
Proces
(
(i
(
jest stacjonarny wtedy i tylko wtedy gdy
|
| s 1.
W pozostałych przypadkach proces jest niestacjonarny.
Wynika to z faktu, że proces stacjonarny
(
musi powracać do swojej średniej wartości
o.
Oznacza to, że wpływ szoku
(
powinien wygasać w czasie, tj.
lim
vw
xy
z{|
x}
z
0.
W przypadku procesu AR(1) zachodzi natomiast zależność
xy
z{|
x}
z
str. 30
Test Dickeya-Fullera (DF)
Aby zweryfikować hipotezę, że proces
(
jest niestacjonarny, można zastosować m.in. test DF. W
wersji podstawowej, proces AR(1)
(
(i
(
jest przekształcany do postaci:
Δ
(
o
(i
(
[Warto zauważyć, że
o
zaś
]. Następnie weryfikowany jest zespół hipotez:
: 0 " W)OZpRW WRść
(
: s 0 " OZpRW WRść
(
Do weryfikacji powyższych hipotez wykorzystywana jest statystyka Dickeya-Fullera postaci:
!
5:4
,
która ma rozkład Dickeya Fullera, który został stablicowany w tzw. tablicach McKinnona.
Wnioskowanie jest następujące:
!
5:4
!
odrzucamy
, czyli
(
jest stacjonarny (zapisujemy to jako
(
^ 0)
!
5:4
X !
nie ma podstaw do odrzucenia
, czyli
(
jest niestacjonarny
Wersje testu Dickeya-Fullera
wersja bez stałej i bez trendu
Równanie testowe:
Δ
(
(i
(
wersja ze stałej i bez trendu
Równanie testowe:
Δ
(
o
(i
(
wersja ze stałej i trendem
Równanie testowe:
Δ
(
o
o
Z
(i
(
Stopień zintegrowania szeregu czasowego
Jeżeli w teście DF nie odrzuciliśmy
, to należy znaczy, że proces
(
jest niestacjonarny. W
takim przypadku możemy testować stopień zintegrowania szeregu
(
. W tym celu liczymy
przyrost
Δ
(
i za pomocą testu DF sprawdzamy, czy ten szereg jest stacjonarny. Jeżeli tak, to
mówimy, że
(
jest niestacjonarny, zintegrowany w stopniu 1 i zapisujemy jako
(
^ 1. W
przeciwnym przypadku liczymy kolejny przyrost
Δ
(
i stosujemy test DF, itd.