Mierzenie efektu zarażenia za pomocą bayesowskiego modelu ze współczynnikami zmiennymi w czasie Streszczenie artykułu Matteo Ciccarelli i Alessandro Rebucci Measuring contagion with a Bayesian, time-varying coefficient model Maja Królikowska Numer albumu: 158017 Wstęp Streszczana praca zawiera propozycję pewnego modelu mierzenia efektu zarażenia (ang. contagion). Na potrzeby artykułu efekt zarażenia definiowany jest jako czasowa zmiana charakteru wzajemnych oddziaływań między rynkami następująca na skutek szoku na jednym lub wielu z tych rynków. Definicja ta pozwala oddzielić takie czasowe zmiany wywołane szokami od głębokich, trwałych zmian w samej naturze połączeń między po- szczególnymi rynkami, nazywanych czasem zaburzeniami strukturalnymi. W artykule opisano pewne, zdaniem autorów nietypowe, podejście do modelowania efektu zarażenia dzięki wykorzystanym metodom Bayesowskim pozwala ono ominąć istotne statystyczne trudności modelowania tego zjawiska, do których należy heteroske- dastyczność i w zasadzie niemożliwa do uniknięcia obecność zmiennych pominiętych. Modelowanie współzależności i efektu zarażenia Proponowany w artykule model jest modelem wektorowo-autoregresyjnym (VAR) o współ- czynnikach zmiennych w czasie, należącym do klasy modeli o ogólnej postaci: At(L)Yt = Bt(L)Wt + Dt + Ut, 1 n 1 m gdzie Yt = [yt , . . . , yt ] jest wektorem cen lub wielkości aktywów, Wt = [wt , . . . , wt ] wektorem zmiennych będących zródłem szoków, L operatorem opóznienia, At, Bt 1 macierzami wielomianowymi operatora opóznień o p i q odpowiednio; Dt wektorem stałych, a Ut wektorem szoków specyficznych dla danego kraju lub rynku o macierzy wariancji-kowariancji Ł. Taka specyfikacja pozwala pokazać zarówno współzależność, jak i efekt zarażenia. Stabilne powiązania między rynkami w czasie przed i po kryzysie mogą być analizowane za pomocą funkcji reakcji (impuls-response analysis), a zarażenie można interpretować jako czasową zmianę w parametrach modelu. Ponieważ zakładamy zmienność tych parametrów w czasie, to takie zachowanie da się dość łatwo wychwycić. Specyfikacja Niech Xt oznacza wszystkie zmienne i ich opóznienia zawarte w Yt i Wt w ogólnym modelu, a t wszystkie parametry. Wówczas model można przepisać do następującej postaci: Yt = Xtt + t, gdzie Xt jest macierzą rozmiaru n k, t rozmiaru k 1, gdzie k = np + mq + 1, a Yt i t to wektorowe procesy stochastyczne. Dodatkowo zakładamy, że dla każdego t: " t|Xt <" iid, gdzie E[ t|Xt] = 0 i E[ t |Xt] = Ł; t " t = Gt-1 + F 0 + Hśt, gdzie śt <" iid N(0, Ś); " Xt, t i śt są warunkowo niezależne; -2 " t|Xt <" iid t(0, &!), gdzie &! = Ł i > 2.
Pierwsze założenie jest standardowe dla stacjonarnych szeregów czasowych, drugie określa pewną klasę modeli VAR, a trzecie jest standardowym założeniem upraszcza- jącym model. Czwarte założenie, mniej standardowe, stanowi uogólnienie założenia o rozkładzie normalnym i niezależności wektora błędów, przy okazji biorąc pod uwagę czę- ste występowanie wartości istotnie odbiegających od średniej wśród danych finansowych o wysokiej częstości. Przyjmując powyższe założenia otrzymujemy następujący model:
Yt = Xtt-1 + t,
gdzie
t-1 = Gt-1 + F 0 i t = XtHśt + t,
i
E[Yt|Xt] = Xtt-1 i V [Yt|Xt] = Ł + XtHŚH Xt Z pierwszych trzech założeń można wywnioskować, że Yt jest warunkowo heteroske- dastyczny, z nieliniową warunkową średnią i wariancją. Założenie czwarte sprawia, że nie ma on rozkładu normalnego, co odzwierciedla charakter danych finansowych o wysokiej częstości. 2 Estymacja Estymacja Bayesowska nie jest oczywiście jedynym możliwym sposobem estymacji w tym modelu, ale została wybrana głównie ze względu na łatwość korekty zmiennych
pominiętych. Rozkłady apriori zostały przypisane hiperparametrom modelu: Ł, 0, Ś i . Rozkład aposteriori uzyskiwany jest za pomocą metod Monte Carlo (losowanie Gibbsa), bo jego obliczenie, jak to często okazuje się w przypadku metod bayesowskich, jest numerycznie bardzo trudne. W celu ułatwienia estymacji, zgodnie ze stosowanymi powszechnie praktykami, przy- jęto niezależność rozkładów apriori, jeśli zatem jako p oznaczona zostanie funkcja gęstości prawdopodobieństwa, to: p(Ł, 0, Ś, ) = p(Ł)p(0)p(Ś)p(). O poszczególnych prawdopodobieństwach założono, że mają następujace rozkłady: " p(Ł-1) = W (, S), " " p(0) = N(0, &!), " p(Ś-1) = W (q, Q), " p() = Uniform(2, r), gdzie W (q, Q) oznacza rozkład Wisharta o q stopniach swobody i dodatnio określo- nej macierzy skali Q. Przyjęto, że parametry powyższych rozkładów są znane. Przy powyższych założeniach można wyznaczyć łączny rozkład aposteriori. Rozkłady aposteriori w tej estymacji wyznaczane są metodą losowania Gibbsa. W tym celu wyznaczone zostały warunkowe rozkłady aposteriori szacowanych parametrów, z których następnie, za pomocą standardowej procedury, można wyznaczyć łączny rozkład aposteriori. Kolejny etap estymacji polega na korekcie zmiennych pominiętych, o których wia- domo, że obciążają wyniki estymacji modelu liniowego, nawet jeśli zmienne pominięte są ortogonalne do tych uwzględnionych w analizie. Korekta ta dokonywana jest metodą Leamera. W tej metodzie stosowane jest podejście Bayesowskie. Zakłada się zależność li- niową zmiennych pominiętych od zmiennych objaśniających i otrzymuje model, w którym parametry przy zmiennych objaśniających są rozbite na dwa rodzaje: estymowane i te, które występują przy zmiennych objaśniających. Dzięki odpowiednim założeniom o roz- kładach apriori tych parametrów daje się je oddzielnie wyestymować, co jest niemożliwe przy podejściu klasycznym. Metodę Leamera można interpretować jako wykorzystanie zmiennych instrumentalnych, gdzie włączona zmienna objaśniania jest instrumentem dla zmiennych pominiętych. Korekta parametru o zmienne pominięte ma spore znaczenie w estymacji, co pokazują przytoczone w artykule przykłady. 3 Weryfikacja modelu Estymacja parametrów dla sztucznych danych Pierwszą weryfikację modelu przeprowadzono na specjalnie wygenerowanych danych. Zo- stały one tak przygotowane, żeby oddawały sytuację, w której: 1. charakter powiązań między rynkami jet staly w czasie, 2. występuje faktyczna zależność między rynkami, 3. w pewnym momencie zwiększa się zmienność danych na skutek szoku wspólnego dla obydwu rynków, 4. model używany do mierzenia efektu zarażenia pomija wspólne zródło zwiększonej zmienności (na przykład na skutek tego, że zmienna ta jest nieobserwowalna). Model, z którego generowane są dane ma oczywiście parametry stałe w czasie, wpro- wadzone są do niego pominięte zmienne wpływające na zmienną objaśnianą, a rozkłady parametrów są tak dobrane, żeby maksymalizować obciążenie estymatorów. Estymacji na tak wygenerowanych danych poddane są dwa modele: bez korekty i z korektą zmien- nych pominiętych. Dla każdego modelu obserwowane są średnie rozkładu aposteriori z 68% przedziałami ufności wokół średniej (co zwykle odpowiada jednemu błędowi stan- dardowemu). Taka analiza pozwala powiedzieć, czy rzeczywiście zachodzi istotna zmiana w charakterze powiązań między rynkami, czyli efekt zarażenia. Jeśli w jednym okresie średnia przekroczy podane 68% ograniczenie, to można to uznać za taką zmianę. W modelu estymowanym bez korekty zmiennych pominiętych średnia rozkładu apo- steriori jest tak bardzo obciążona, że może to świadczyć nie tylko o wystąpieniu efektu za- rażenia, ale także o wybitnie zmiennym charakterze powiązania rynków. Model z korektą zmiennych pominiętych pokazuje jednak bardzo dobre wyniki. Obciążenie estymatora spada do zaledwie 5% średnio, wyeliminowane są losowe zmiany estymowanej średniej rozkładu aposteriori. Wynikiem tej analizy według autorów artykułu jest stwierdzenie, że proponowany sposób mierzenia efektu zarażenia pozwala efektywnie wykryć pozorne wystąpienie tego zjawiska. Estymacja parametrów dla danych rzeczywistych Drugi zestaw eksperymentów z modelem autorzy przeprowadzili dla danych wykorzysta- nych wcześniej w innego rodzaju modelowaniu efektu zarażenia. Przedmiotem badania jest wpływ kryzysu argentyńskiego na rynek walutowy w Chile w 2001 roku. Autorzy powołują się na pracę, w której dowiedziono, że podstawowe zależności między Chile a Argentyną nie są w stanie w pełni wyjaśnić kursu dolara do peso w drugiej połowie 2001 roku i w związku z tym nie można wyeliminować wystąpienia efektu zarażenia. Dane do estymacji są danymi dziennymi i pochodzą z okresu od 2 czerwca 1999 do 31 stycznia 2002. Ponieważ tak naprawdę trudno jest określić datę początku kryzysu argentyńskiego, to prezentowane szacunki są także ciekawe z tego punktu widzenia. 4 Celem badania jest pokazanie, że model zaproponowany w arykule, celowo pomija- jący wiele zmiennych, których istotność była już potwierdzona, estymowany z korektą Leamera daje tak dobre wyniki jak poprzednie badanie model z pełniejszą informacją. Metodą zaprezentowaną w artykule, estymowane były dwa modele - zarówno uwzględ- niający szeroki zestaw zmiennych, jak i model uproszczony. Model z pełną informacją został przedstawiony w postaci: 0 1 DLet = ąt + ąt DLet-1 + Z łt + t, t gdzie et jest kursem peso do dolara, Dxt = xt-xt-1, Lxt = log(xt), a Zt reprezentuje zbiór kilkunastu potencjalnych zmiennych objaśniających charakterystycznych dla rynku Chile, Argentyny, Brazylii, a także na przykład kurs Euro do dolara i ceny półprzewodników. Model z ograniczoną informacją ma taką samą formę funkcyjną: 0 1 DLet = ąt + ąt DLet-1 + łtDiAR + t, t gdzie iAR jest argentyńskim indeksem giełdowym, a reszta zmiennych jest świadomie t pomijana. W obydwu modelach przyjęto rozkłady apriori takie, jak wcześniej pokazano i przeprowadzono estymacje zarówno z korektą Leamera jak i bez niej. Losowanie Gibbsa przeprowadzono dla 5000 iteracji, odrzucając pierwszych 2500 (żeby zapewnić niezależ- ność od warunków początkowych. W modelu z pełną informacją, ale bez korekty wykazano czasową zmianę w charak- terze oddziaływań między rynkami, czyli efekt zarażenia. W tym samym modelu, ale estymowanym z korektą zmiennych pominiętych obserwowany efekt zarażenia jest staty- stycznie trochę słabszy, ale nadal widoczny. Podobne wyniki daje skorygowany model z ograniczoną informacją, ale model ze zmiennymi pominiętymi nie pokazuje tych wła- sności. Dzieje się tak prawdopodobnie dlatego, że obciążenie generowane przez zmienne pominięte ma bardzo duży wpływ na estymowany rozkład aposteriori. Podsumowanie Zaproponowana estymacja modelu dała dobre wyniki nawet przy wystąpieniu heteroske- dastyczności oraz pominiętych zmiennych. Siłą modelu jest też to, że jego konstrukcja nie wymaga znajomości dokładnego czasu kryzysu i pozwala na odróżnienie efektu zarażenia od współzależności i załamań strukturalnych. Cecha ta pozwala wykorzystać go także do modelowania charakteru powiązań między rynkami, niekoniecznie tylko w sytuacji wy- stąpienia szoków. Ciekawą właściwością modelu jest też to, że nadaje się do mierzenia zarówno pozytywnych jak i negatywnych efektów zarażenia. Część empiryczna artykułu pokazuje, że wyniki otrzymane w prezentowanym modelu z ograniczoną informacją skorygowanym o potencjalne obciążenie wynikające ze zmiennych pominiętych są porównywalne z wynikami estymacji z użyciem pełniejszej informacji. Streszczony powyżej artykuł dostępny jest w Internecie, pod adresem: http://papers.ssrn.com/sol3/papers.cfm?abstract_id=457531 5