Mierzenie efektu zarażenia za pomocą bayesowskiego
modelu ze współczynnikami zmiennymi w czasie
Streszczenie artykułu Matteo Ciccarelli i Alessandro Rebucci
„Measuring contagion with a Bayesian, time-varying coefficient
model”
Maja Królikowska
Numer albumu: 158017
Wstęp
Streszczana praca zawiera propozycję pewnego modelu mierzenia efektu zarażenia (ang.
contagion). Na potrzeby artykułu efekt zarażenia definiowany jest jako czasowa zmiana
charakteru wzajemnych oddziaływań między rynkami następująca na skutek szoku na
jednym lub wielu z tych rynków. Definicja ta pozwala oddzielić takie czasowe zmiany
wywołane szokami od głębokich, trwałych zmian w samej naturze połączeń między po-
szczególnymi rynkami, nazywanych czasem zaburzeniami strukturalnymi.
W artykule opisano pewne, zdaniem autorów nietypowe, podejście do modelowania
efektu zarażenia – dzięki wykorzystanym metodom Bayesowskim pozwala ono ominąć
istotne statystyczne trudności modelowania tego zjawiska, do których należy heteroske-
dastyczność i w zasadzie niemożliwa do uniknięcia obecność zmiennych pominiętych.
Modelowanie współzależności i efektu zarażenia
Proponowany w artykule model jest modelem wektorowo-autoregresyjnym (VAR) o współ-
czynnikach zmiennych w czasie, należącym do klasy modeli o ogólnej postaci:
A
t
(L)Y
t
= B
t
(L)W
t
+ D
t
+ U
t
,
gdzie Y
t
= [y
1
t
, . . . , y
n
t
]
0
jest wektorem cen lub wielkości aktywów, W
t
= [w
1
t
, . . . , w
m
t
]
0
wektorem zmiennych będących źródłem szoków, L – operatorem opóźnienia, A
t
, B
t
–
1
macierzami wielomianowymi operatora opóźnień o p i q odpowiednio; D
t
– wektorem
stałych, a U
t
wektorem szoków specyficznych dla danego kraju lub rynku o macierzy
wariancji-kowariancji Σ. Taka specyfikacja pozwala pokazać zarówno współzależność,
jak i efekt zarażenia. Stabilne powiązania między rynkami w czasie przed i po kryzysie
mogą być analizowane za pomocą funkcji reakcji (impuls-response analysis), a zarażenie
można interpretować jako czasową zmianę w parametrach modelu. Ponieważ zakładamy
zmienność tych parametrów w czasie, to takie zachowanie da się dość łatwo wychwycić.
Specyfikacja
Niech X
t
oznacza wszystkie zmienne i ich opóźnienia zawarte w Y
t
i W
t
w ogólnym modelu,
a β
t
wszystkie parametry. Wówczas model można przepisać do następującej postaci:
Y
t
= X
t
β
t
+
t
,
gdzie X
t
jest macierzą rozmiaru n × k, β
t
rozmiaru k × 1, gdzie k = np + mq + 1, a Y
t
i
t
to wektorowe procesy stochastyczne. Dodatkowo zakładamy, że dla każdego t:
•
t
|X
t
∼ iid, gdzie E[
t
|X
t
] = 0 i E[
t
0
t
|X
t
] = Σ;
• β
t
= Gβ
t−1
+ F β
0
+ Hζ
t
, gdzie ζ
t
∼ iid N (0, Φ);
• X
t
,
t
i ζ
t
są warunkowo niezależne;
•
t
|X
t
∼ iid t
ν
(0, Ω), gdzie Ω =
ν−2
ν
Σ i ν > 2.
Pierwsze założenie jest standardowe dla stacjonarnych szeregów czasowych, drugie
określa pewną klasę modeli VAR, a trzecie jest standardowym założeniem upraszcza-
jącym model. Czwarte założenie, mniej standardowe, stanowi uogólnienie założenia o
rozkładzie normalnym i niezależności wektora błędów, przy okazji biorąc pod uwagę czę-
ste występowanie wartości istotnie odbiegających od średniej wśród danych finansowych
o wysokiej częstości.
Przyjmując powyższe założenia otrzymujemy następujący model:
Y
t
= X
t
˜
β
t−1
+ ˜
t
,
gdzie
˜
β
t−1
= Gβ
t−1
+ F β
0
i ˜
t
= X
t
Hζ
t
+
t
,
i
E[Y
t
|X
t
] = X
t
˜
β
t−1
i V [Y
t
|X
t
] = Σ + X
t
HΦH
0
X
0
t
Z pierwszych trzech założeń można wywnioskować, że Y
t
jest warunkowo heteroske-
dastyczny, z nieliniową warunkową średnią i wariancją. Założenie czwarte sprawia, że nie
ma on rozkładu normalnego, co odzwierciedla charakter danych finansowych o wysokiej
częstości.
2
Estymacja
Estymacja Bayesowska nie jest oczywiście jedynym możliwym sposobem estymacji w
tym modelu, ale została wybrana głównie ze względu na łatwość korekty zmiennych
pominiętych. Rozkłady apriori zostały przypisane hiperparametrom modelu: Σ, ˜
β
0
, Φ
i ν.
Rozkład aposteriori uzyskiwany jest za pomocą metod Monte Carlo (losowanie
Gibbsa), bo jego obliczenie, jak to często okazuje się w przypadku metod bayesowskich,
jest numerycznie bardzo trudne.
W celu ułatwienia estymacji, zgodnie ze stosowanymi powszechnie praktykami, przy-
jęto niezależność rozkładów apriori, jeśli zatem jako p oznaczona zostanie funkcja gęstości
prawdopodobieństwa, to:
p(Σ, β
0
, Φ, ν) = p(Σ)p(β
0
)p(Φ)p(ν).
O poszczególnych prawdopodobieństwach założono, że mają następujace rozkłady:
• p(Σ
−1
) = W (ς, S),
• p(β
0
) = N (β
∗
0
, Ω),
• p(Φ
−1
) = W (q, Q),
• p(ν) = U nif orm(2, r),
gdzie W (q, Q) oznacza rozkład Wisharta o q stopniach swobody i dodatnio określo-
nej macierzy skali Q. Przyjęto, że parametry powyższych rozkładów są znane. Przy
powyższych założeniach można wyznaczyć łączny rozkład aposteriori.
Rozkłady aposteriori w tej estymacji wyznaczane są metodą losowania Gibbsa. W
tym celu wyznaczone zostały warunkowe rozkłady aposteriori szacowanych parametrów, z
których następnie, za pomocą standardowej procedury, można wyznaczyć łączny rozkład
aposteriori.
Kolejny etap estymacji polega na korekcie zmiennych pominiętych, o których wia-
domo, że obciążają wyniki estymacji modelu liniowego, nawet jeśli zmienne pominięte
są ortogonalne do tych uwzględnionych w analizie. Korekta ta dokonywana jest metodą
Leamera. W tej metodzie stosowane jest podejście Bayesowskie. Zakłada się zależność li-
niową zmiennych pominiętych od zmiennych objaśniających i otrzymuje model, w którym
parametry przy zmiennych objaśniających są rozbite na dwa rodzaje: estymowane i te,
które występują przy zmiennych objaśniających. Dzięki odpowiednim założeniom o roz-
kładach apriori tych parametrów daje się je oddzielnie wyestymować, co jest niemożliwe
przy podejściu klasycznym. Metodę Leamera można interpretować jako wykorzystanie
zmiennych instrumentalnych, gdzie włączona zmienna objaśniania jest instrumentem dla
zmiennych pominiętych. Korekta parametru o zmienne pominięte ma spore znaczenie w
estymacji, co pokazują przytoczone w artykule przykłady.
3
Weryfikacja modelu
Estymacja parametrów dla sztucznych danych
Pierwszą weryfikację modelu przeprowadzono na specjalnie wygenerowanych danych. Zo-
stały one tak przygotowane, żeby oddawały sytuację, w której:
1. charakter powiązań między rynkami jet staly w czasie,
2. występuje faktyczna zależność między rynkami,
3. w pewnym momencie zwiększa się zmienność danych na skutek szoku wspólnego
dla obydwu rynków,
4. model używany do mierzenia efektu zarażenia pomija wspólne źródło zwiększonej
zmienności (na przykład na skutek tego, że zmienna ta jest nieobserwowalna).
Model, z którego generowane są dane ma oczywiście parametry stałe w czasie, wpro-
wadzone są do niego pominięte zmienne wpływające na zmienną objaśnianą, a rozkłady
parametrów są tak dobrane, żeby maksymalizować obciążenie estymatorów. Estymacji
na tak wygenerowanych danych poddane są dwa modele: bez korekty i z korektą zmien-
nych pominiętych. Dla każdego modelu obserwowane są średnie rozkładu aposteriori z
68% przedziałami ufności wokół średniej (co zwykle odpowiada jednemu błędowi stan-
dardowemu). Taka analiza pozwala powiedzieć, czy rzeczywiście zachodzi istotna zmiana
w charakterze powiązań między rynkami, czyli efekt zarażenia. Jeśli w jednym okresie
średnia przekroczy podane 68% ograniczenie, to można to uznać za taką zmianę.
W modelu estymowanym bez korekty zmiennych pominiętych średnia rozkładu apo-
steriori jest tak bardzo obciążona, że może to świadczyć nie tylko o wystąpieniu efektu za-
rażenia, ale także o wybitnie zmiennym charakterze powiązania rynków. Model z korektą
zmiennych pominiętych pokazuje jednak bardzo dobre wyniki. Obciążenie estymatora
spada do zaledwie 5% średnio, wyeliminowane są losowe zmiany estymowanej średniej
rozkładu aposteriori. Wynikiem tej analizy według autorów artykułu jest stwierdzenie,
że proponowany sposób mierzenia efektu zarażenia pozwala efektywnie wykryć pozorne
wystąpienie tego zjawiska.
Estymacja parametrów dla danych rzeczywistych
Drugi zestaw eksperymentów z modelem autorzy przeprowadzili dla danych wykorzysta-
nych wcześniej w innego rodzaju modelowaniu efektu zarażenia. Przedmiotem badania
jest wpływ kryzysu argentyńskiego na rynek walutowy w Chile w 2001 roku. Autorzy
powołują się na pracę, w której dowiedziono, że podstawowe zależności między Chile a
Argentyną nie są w stanie w pełni wyjaśnić kursu dolara do peso w drugiej połowie 2001
roku i w związku z tym nie można wyeliminować wystąpienia efektu zarażenia. Dane do
estymacji są danymi dziennymi i pochodzą z okresu od 2 czerwca 1999 do 31 stycznia
2002. Ponieważ tak naprawdę trudno jest określić datę początku kryzysu argentyńskiego,
to prezentowane szacunki są także ciekawe z tego punktu widzenia.
4
Celem badania jest pokazanie, że model zaproponowany w arykule, celowo pomija-
jący wiele zmiennych, których istotność była już potwierdzona, estymowany z korektą
Leamera daje tak dobre wyniki jak poprzednie badanie – model z pełniejszą informacją.
Metodą zaprezentowaną w artykule, estymowane były dwa modele - zarówno uwzględ-
niający szeroki zestaw zmiennych, jak i model uproszczony. Model z pełną informacją
został przedstawiony w postaci:
DLe
t
= α
0
t
+ α
1
t
DLe
t−1
+ Z
0
t
γ
t
+
t
,
gdzie e
t
jest kursem peso do dolara, Dx
t
= x
t
−x
t−1
, Lx
t
= log(x
t
), a Z
t
reprezentuje zbiór
kilkunastu potencjalnych zmiennych objaśniających charakterystycznych dla rynku Chile,
Argentyny, Brazylii, a także na przykład kurs Euro do dolara i ceny półprzewodników.
Model z ograniczoną informacją ma taką samą formę funkcyjną:
DLe
t
= α
0
t
+ α
1
t
DLe
t−1
+ γ
t
Di
AR
t
+
t
,
gdzie i
A
t
R jest argentyńskim indeksem giełdowym, a reszta zmiennych jest świadomie
pomijana. W obydwu modelach przyjęto rozkłady apriori takie, jak wcześniej pokazano i
przeprowadzono estymacje zarówno z korektą Leamera jak i bez niej. Losowanie Gibbsa
przeprowadzono dla 5000 iteracji, odrzucając pierwszych 2500 (żeby zapewnić niezależ-
ność od warunków początkowych.
W modelu z pełną informacją, ale bez korekty wykazano czasową zmianę w charak-
terze oddziaływań między rynkami, czyli efekt zarażenia. W tym samym modelu, ale
estymowanym z korektą zmiennych pominiętych obserwowany efekt zarażenia jest staty-
stycznie trochę słabszy, ale nadal widoczny. Podobne wyniki daje skorygowany model
z ograniczoną informacją, ale model ze zmiennymi pominiętymi nie pokazuje tych wła-
sności. Dzieje się tak prawdopodobnie dlatego, że obciążenie generowane przez zmienne
pominięte ma bardzo duży wpływ na estymowany rozkład aposteriori.
Podsumowanie
Zaproponowana estymacja modelu dała dobre wyniki nawet przy wystąpieniu heteroske-
dastyczności oraz pominiętych zmiennych. Siłą modelu jest też to, że jego konstrukcja nie
wymaga znajomości dokładnego czasu kryzysu i pozwala na odróżnienie efektu zarażenia
od współzależności i załamań strukturalnych. Cecha ta pozwala wykorzystać go także do
modelowania charakteru powiązań między rynkami, niekoniecznie tylko w sytuacji wy-
stąpienia szoków. Ciekawą właściwością modelu jest też to, że nadaje się do mierzenia
zarówno pozytywnych jak i negatywnych efektów zarażenia.
Część empiryczna artykułu pokazuje, że wyniki otrzymane w prezentowanym modelu z
ograniczoną informacją skorygowanym o potencjalne obciążenie wynikające ze zmiennych
pominiętych są porównywalne z wynikami estymacji z użyciem pełniejszej informacji.
Streszczony powyżej artykuł dostępny jest w Internecie, pod adresem:
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=457531
5