markov v2 streszczenie


Aańcuchy Markowa
Porównanie adekwatności Aańcuchów
Markowa oraz modelu Mover-Stayer w
kontekście wzorców zachowań kont
kredytowych
Szczepan Bujalski
Paweł Elert
1 Wstęp Teoretyczny
1.1 Istota Aańcuchów Markowa
Pojęcie  Markowskość  oznacza pewną formę zapominania o przeszłości procesu.
Ściślej mówiąc: Stany przyszłe procesu, przy tak ustalonym stanie terazniejszym, nie zależą
od przeszłości, a jedynie od stanu terazniejszego. Matematycznie właściwość tą zapisujemy
jako:
P(X | X0, X1, X2,..., Xn)= P(X | X )
n+1 n+1 n
O Aańcuchach Markowa możemy też myśleć w następujący sposób: obserwując proces
startujący z punktu x, jeżeli kiedyś jeszcze, wrócimy do tego punktu, to dalej będziemy
obserwować taki sam proces jak od początku.
1.2 Wykorzystanie Aańcuchów Markowa
Analizując zachowanie się łańcuchów Markowa próbujemy zrozumieć strukturę przejść
między poszczególnymi stanami. Zwykle interesuje nas, które stany łańcuch odwiedzi, czy
zrobi to skończoną czy nieskończoną liczbę razy? Ostatecznym zaś celem jest znalezienie
takiego rozkładu stacjonarnego, który opisywałby prawdopodobieństwa przebywania w
danym stanie dla bardzo odległych czasów.
Jednym z bardziej typowych zastosowań łańcuchów markowa jest teoria kojek. W
symulacjach tych tworzymy niejako bufor, gdzie każda ilość elementów oczekujących
odpowiada jednemu stanowi. W sposób ten możemy modelować między innymi obciążenie
serwera, średni czas oczekiwania na obsługę przez klienta oraz niektóre systemy finansowe 
na przykład: systemy wczesnego informowania o niewypłacalności
2 Streszczenie artykułu
Oryginalny tytuł opisanego przez nas artykułu to:
 Testing the Adequacy of Markov Chain and Mover-Stayer as Representations of
Credit Behavior .
Halina Frydman, Jarl G. KallBerg oraz Duen-li Kao
New York University, Wrzesień 1984
2.1 Wprowadzenie
Celem pracy jest porównanie trzech stochastycznych procesów  stacjonarnych oraz
niestacjonarnych łańcuchów Markowa oraz jego proste rozszerzenie  model:  Mover-
Stayer . Jako kryterium porównawcze autorzy przyjęli dopasowanie owych procesów do
danych empirycznych.
Stacjonarne łańcuchy Markowa były od dawna używane do modelowania zachowań
kont kredytowych. W pierwszej pracy, opublikowanej w 1962, konta kredytowe podzielono
na (n + 2) stany, w zależności od spłaty kredytów, tzn.: spłacone, bieżące, zaległe 1 miesiąc,
..., zaległe (n  1) miesięcy, zły dług. Zakładano, iż przejścia między poszczególnymi stanami
odbywają się zgodnie z założeniami stacjonarnego modelu Markowa. Prawdziwość wniosków
była zatem uzależniona od prawdziwości tego stwierdzenia. W literaturze naukowej, brak jest
jednak odpowiednich prac badających adekwatność Aańcuchów Markowa w modelowaniu
zachowań kont kredytowych. Celem tej pracy jest właśnie odpowiedz na pytanie: Czy
Aańcuchy Markowa dobrze modelują proces w tej i podobnych dziedzinach? A może istnieją
inne,  lepsze modele, bardziej pasujące do danych empirycznych?
Autorzy zwracają uwagę na dwa założenia modelu Markowa. Po pierwsze, zmiany w
oprocentowaniu kredytów albo wzorców konsumpcyjnych mogą powodować zmianę procesu
w czasie, inaczej nie stacjonarność. Po drugie, użytkownicy kont kredytowych
najprawdopodobniej nie są homogeniczni. Możemy założyć, że pewna podgrupa
użytkowników kont będzie preferować spłatę całego kredytu pod koniec miesiąca, podczas
gdy inna podgrupa będzie spłacać jedynie minimalną wymaganą płatność, traktując kartę
kredytową jako rodzaj krótkookresowej pożyczki.
W pracy porównane zostały trzy modele. Stacjonarne Aańcuchy Markowa, które przez
swoją prostotę traktowane są jako punkt odniesienia dla porównań, Nie stacjonarne Aańcuchy
Markowa, zakładające nie stacjonarność procesu oraz proste rozszerzenie modelu Markova 
model Mover-Stayer. Model ten zakłada podział populacji na dwie pod grupy: część mobilną,
zachowującą się zgodnie z procesem Markowa oraz drugą niemobilną, nie zmieniająca nigdy
stanu.
Do porównania modeli użyto testów wiarygności oraz analizy residów.
2.2 Dane i Modele
Dane wykorzystane do badania zostały zebrane z 200 aktywnych, odnawialnych kont
kredytowych, tzn. takich na których została odnotowana chociaż jedna transakcja w badanym
okresie oraz pozostały aktywne do końca rozpatrywanego okresu. Dane dotyczą zachowania
się płatności i zobowiązań na kontach kredytowych. Dla każdego z kont zostały zebrane
następujące dane w okresie od września 1978 do maja 1981 :
" Bilans otwarcia
" Minimalna wymagana płatność
" Aktualna płatność
" Wielkość nowych zakupów
Cztery pierwsze miesiące potraktowano jako okres  rozgrzewki , aby być pewnym, iż
wszystkie nowe konta mają już ustabilizowany wzorzec zachowania płatności.
W celu modelowania dynamiki zachowania płatności badanych kont, wprowadzono
następujące zmienne definiujące stan:
" Stan P (Paid up): konto na początku miesiąca jest zadłużone mniej niż $1
" Stan C (current): zadłużenie jest na nie mniejszym poziomie niż $1 i ostatnia płatność
nie mniejsza niż wymagana
" Stan D (overdue): aktualna płatność (jeżeli taka jest) jest mniejsza niż wymagana
Dla rozpatrywanych danych, minimalna wymagana płatność stanowiła odsetek zadłużenia,
który rósł wraz ze wzrostem zadłużenia. W przypadku jeśli konto było zadłużone 4 miesiące,
minimalna płatność wynosiła całość zadłużenia.
W literaturze występują przykłady podobnych badań, w których rozpatruje się więcej
możliwych stanów. W niniejszej pracy zdecydowano się na tylko trzy, wynika to z chęci
skupienia się na jakościowych charakterystykach zachowań płatności, a nie na predykcji
przepływów pieniężnych. Drugim powodem jest załagodzenie sutków malej próby oraz
ułatwienie porównania pomiędzy Aańcuchami Markowa, a modelem Mover-Stayer.
W niniejszej pracy podjęto próbę porównania następujących modeli:
" Stacjonarne Aańcuchy Markowa
" Niestacjonarne Aańcuchy Markowa
" Model Mover-Stayer
W literaturze zakłada się, iż stacjonarne łańcuchy Markowa dobrze modelują zachowanie
płatności, dlatego też model ten jest traktowany jako swojego rodzaju benchmark. Jednakże
autorzy sugerują, że zmiany oprocentowania kredytów lub zmiany zachowań
konsumpcyjnych, mogą prowadzić do zmienności procesu w czasie czyli niestacjonarności i
sugerują, iż takim przypadku lepszym do opisu procesu byłby model niestacjonarny.
Ideą modelu Mover-Stayer jest zerwanie z założeniem, iż populacja jest homogeniczna.
Zaklada się iż populacja dzieli się na dwie grupy:  Movers - tzn. jednostki, które dokonują
zmian zgodnie ze stacjonarnym Aańcuchem Markowa oraz  Stayers - ci którzy nigdy nie
zmieniają stanu (tylko w stanie P i C mogą być stayers, D nie gdyż w przypadku ciągłego
zadłużenia konto jest likwidowane).
Dane użyte do modelowania mogą być traktowane jako 200 niezależnych realizacji
jakiegoś nieznanego dyskretnego procesu stochastycznego {Z(j): j>=0} z miesięcznym
odstępem czasu i przestrzenią stanów W= {P, C, D}. Dane można podsumować w
następujący sposób:
gdzie Zl(j) jest stanem konta l w chwili j dla j=1,& ,J=16.
Następnie przedyskutowano estymację parametrów dla trzech rozpatrywanych
procesów, bazujących na danych (1). Zapisano przestrzeń stanów procesów jako
W={1,2& ,w} a ich początkowy rozkład przez:
Model A: Niestacjonarny Aańcuch Markowa
Niech
będzie macierzą przejść jedno-krokową. Wykorzystując podstawową własność Aańcuchów
Markowa, j-krokowa macierz przejść P(0,j) dana jest następującym wzorem:
Estymator największej wiarogodności P(j-1,j), 1d"jd"J bazujący na danych (1) dany jest
następująco:
Gdzie nik(h,j) jest liczbą obserwacji w stanie k w chwili j, które były w stanie i w chwili h;
ni(j) jest liczbą obserwacji w stanie i w chwili j.
Model B: Stacjonarny Aańcuch Makowa
Macierz j-krokowa przejść tego łańcucha ma taką samą postać jak w przypadku
niestacjonarnym (2). Jeżeli przyjmiemy P(j-1,j)=P dla 1d"jd"J, to estymator największej
wiarogodności P wynosi:
gdzie:
= suma przejść ze stanu i do stanu w próbie
- suma wizyt stanu i
Model C: Stacjonarny Mover-Stayer model
Niech M = ||mik|| - macierz prawdopodobieństw przejść dla  movers ,
S=diag(s1,s2,& ,sw) si  proporcja  stayers w stanie i. J-krokowa macierz przejść tego modelu
wygląda następująco:
gdzie I jest macierzą jednostkową.
Estymatory największej wiarogodności obliczane są następująco:
Dla każdego i należącego do W, rozwiązywane jest następujące równanie dla mii:
gdzie ni liczba obserwacji, które pozostają w stanie i podczas badanego okresu.
Wstawiając do poniższego wzoru obliczone mii, wyliczamy mik dla k`"i iteracyjnie od k=1:
Estymator si największej wiarogodności jest dany następująco:
Można zauważyć, iż dla J dążącego do nieskończoności równanie (6) przyjmuje następującą
postać:
W związku z tym dla dużej próby, estymator mii największej wiarogodności dąży do
poniższej wartości:
Odpowiednio mik jest wyliczane z (7) i si = ni/ni(0) z (8)
Skomplikowanie wzorów na estymatory jest spowodowane brakiem bezpośredniej
obserwacji proporcji  stayers w stanie i. Całkowita liczba kont, które pozostają w stanie i,
jest sumą dwóch rodzajów kont. Takich które są naprawdę stayers w stanie i oraz takich, które
są movers ale pozostają w stanie i przez badany okres.
2.3 Testy kompatybilności i macierze residualne
Niech ni0,& ,ij będzie liczbą razy wystąpienia historii (io,& ,iJ) wśród n zaobserwowanych
historii na danych (1), im należy do przestrzeni stanów W dla 0d"md"J. Zakładając, iż
indywidualne historie są niezależne od siebie, zmienne losowe
mają rozkład wielomianowy z całkowitą liczbą procesów równą n oraz wielomianowe
prawdopodobieństwa dane przez łączne rozkłady
procesu {Z(j):je"0}
Rozkład wielomianowy umożliwia testowanie kompatybilności modelu z danymi.
Funkcja wiarogodności obserwacji w (1) jest dana następująco:
Maksimum funkcji (jeśli prawdopodobieństwa nie są ograniczone) jest dane przez:
Maksimum funkcji wiarogodności przy założeniu, że {Z(j): je"0} jest stacjonarnym
łańcuchem Markowa (model B), np. takich Ąi0,& ,iJ danych jako łączny rozkład Modelu B
wylicza się, używając wzoru (4), następująco:
Podobnie max funkcji wiarogodności dla modelu A oblicza się jako:
Dla modelu C:
Można zauważyć, iż stacjonarny model Markowa jest zagnieżdżony zarówno w Modelu A jak
i C. W związku z tym formułuje się testy LR, dla testowania stacjonarnego łańcucha
Markowa przeciwko niestacjonarnemu oraz modelowi Mover-Stayer. Testy te wyglądają
następująco:
Macierz residuów
Macierze residuów są drugim narzędziem porównawczym pomiędzy jakością modeli.
Poniżej zdefiniujemy macierze residuów dla każdego modelu. Niech
będzie macierzą przejść pomiędzy chwilami h i j.
W przypadku niestacjonarnego Aańcucha Markowa, macierz residuów dana jest następująco:
Dla stacjonarnego Aańcucha Markowa:
Dla modelu Mover-Stayer:
2.4 Wyniki
Zaczniemy od skomentowania wyników estymacji dla modelu Mover-Stayer. Procent
populacji niemobilnej będącej w stanie  Spłacony , równy \P = 33.22% jest dość wysoki,
oznacza to, iż około 33% kont, będących aktywnymi w okresie  rozgrzewki stało się po
rozgrzewce nieaktywne. Procent populacji niemobilnej w stanie  Bieżący , wynosi 5.12%.
Uwzględnienie w modelu populacji niemobilnej, zaniża wartości oszacowań na diagonalnych
macierzy przejść  w tym przypadku P-P oraz C-C  w stosunku do modelu Markova. Brak
populacji niemobilnej, w stanie  Zaległy - \D = 0% , powoduje, że dolne wiersze macierzy
P oraz M są identyczne. Fakt ten jest zgodny z charakterem danych, gdyż konta permanentnie
zadłużone były zamykane i przez to nie uwzględnione w badaniu.
Autorzy zwracają uwagę również na niedoszacowanie parametrów na diagonalnych
macierzy przejść we wszystkich oszacowanych modelach. Zjawisko to dość często występuje
w empirycznych pracach poświęconych Aańcuchom Markova. Analizując różnicę procentową
w niedoszacowaniu pomiędzy modelami, dostrzeżemy że oba modele Markova mają podobny
błąd. W modelu Mover-Stayer błędy te są jednak średnio o połowę mniejsze dla przejścia P-P
oraz o jedną czwartą mniejsze dla przejścia C-C oraz D-D, w porównaniu do Aańcuchów
Markowa.
Tabela 1  Wyniki estymacji Parametrów metodą największej wiarygodności
Model B: Stacjonarne Aańcuchy Markowa.
0.879 0.076 0.045
Ć
Macierz przejścia jednokrokowego P = 0.079 0.736 0.185
0.113 0.408 0.479
Model C:  Mover-Stayer
Macierz przejścia populacji niemoblinej Procent populacji niemobilnej
0.830 0.107 0.063
\P : 33.22%
Ć
M = 0.084 0.720 0.196
\C : 5.12%
0.113 0.408 0.479
\D : 0.00%
Tabela III
Macierz Residuów, utworzona jako różnica wartości zaobserwowanej i wyestymowanej
Okres Model A Model B Model C
Niestacjonarny Aańcuch Stacjonarny Aańcuch Mover-Stayer Model
Markowa Markowa
-.092 .034 0.058 -.055 .040 .015 -.007 .005 .002
(0, 4) .071 -.071 .000 .038 .030 -.068 .017 .049 -.066
.004 .099 -.103 .003 .172 -.175 -.013 .173 -.160
-.206 .119 .087 -.205 .123 .082 -.111 .055 .056
(0, 8) .203 -.174 -.029 .167 -.151 -.016 .114 -.107 -.007
-.084 .174 -.090 -.107 .188 -.081 -.148 .207 -.059
-.321 .175 .146 -.315 .147 .168 -.195 .059 .136
(0, 12) .210 -.190 -.020 .208 -.213 .005 .136 -.156 .020
-.100 .115 -.215 .103 .088 -.191 .046 .119 -.165
-.242 .136 .106 -.223 .119 .104 -.090 .022 .068
(0, 16) .161 -.188 -.043 .179 -.135 -.044 .098 -.071 -.027
.072 .021 -.093 .092 .003 -.095 .027 .039 .-066
Test największej wiarygodności potwierdził wnioski płynące z analizy residuów przy
założonym poziomie istotności ą = 1% . Nie odrzucono stacjonarnych łańcuchów Markowa
na korzyść niestacjonarnych łańcuchów, odrzucono natomiast model stacjonarny na korzyść
modelu Mover-Stayer
3 Wnioski
Analiza Residuów macierzy przejścia pokazuje, iż modele Markova znacznie zaniżają
wartości macierzy przejść na diagonalnych. Różnica ta jest na tyle istotna, iż badania oraz
poszukiwania lepszych modeli zdają się być uzasadnione. Zarówno testy wiarygodności jak i
macierzy residuów pokazują, iż założenie heterogeniczności populacji ma dużo większe
znaczenie niż założenie niestacjorności. Proste rozszerzenie modelu Markova, jakim jest
model Mover-Stayer, lepiej zatem modeluje zachowania kont kredytowych niż model
Markova. Wykorzystując model Mover-Stayer, należy pamiętać że uwzględnia on jedynie
jeden prosty podział populacji, w rzeczywistości mogą być inne podziały.


Wyszukiwarka

Podobne podstrony:
panele v2 streszczenie
bayes v2 streszczenie
duration analysis v2 streszczenie
gmm v2 streszczenie
BORODO STRESZCZENIE antastic pl
WESELE streszczenie szczegółowe i boh
notatek pl irydion streszczenie utworu
EMC Spectrum Analyzer v2
streszczenie raportu pzh dla portalu
projekt SD NAW MT RW v2
Streszczenie Pieśni VI Iliady
Pytania na test z AIR v2
Williams, WJ Aristoi (v2 0)
gene wolfe ?staway [v2 0]
BAZY DANYCH Streszczenie z wykładów
Folie wyklad3 Krakow v2

więcej podobnych podstron