Ob

O j

b e

j c

e t

c

t 1

2

3

4

Proces stochastyczny to funkcja losowa, czyli funkcja matematyczna, której wartości leżą w przestrzeni zdarzeń losowych. Innymi słowy pewnej wielkości (jakiemuś człowiekowi, liczbie,

chwili czasu, punktowi płaszczyzny) przypisane jest zdarzenie losowe (wzrost, losowo wybrana

liczba, wartość waluty wg. notowań giełdowych, liczba rzeczywista).

Najprostszym przykładem procesu stochastycznego jest wielokrotny rzut monetą: dziedziną funkcji

jest zbiór liczb naturalnych (ilość rzutów), natomiast wartością funkcji dla danej liczby jest jeden z dwóch możliwych stanów losowania (zdarzenie), orzeł lub reszka. Nie należy mylić procesu

losowego którego wartości są zdarzeniami losowymi z funkcją która zdarzeniom przypisuje

wartość prawdopodobieństwa ich wystapienia (mamy wówczas do czynienia z rozkładem gęstości

prawdopoobieństwa).

W praktyce dziedziną, na której zdefiniowana jest funkcja, jest najczęściej przedział czasowy (taki proces stochastyczny nazywany jest szeregiem czasowym) lub obszar przestrzeni (wtedy nazywany jest polem losowym). Jako przykłady szeregów czasowych można podać: fluktuacje giełdowe,

sygnały, takie jak mowa, dźwięk i wideo, dane medyczne takie jak EKG i EEG, ciśnienie krwi i temperatura ciała, losowe ruchy takie jak ruchy Browna. Przykładami pól losowych są statyczne obrazy, losowe krajobrazy i układ składników w niejednorodnych materiałach.

Definicja

Matematycznie, proces stochastyczny jest zazwyczaj definiowany jako rodzina zmiennych

losowych:

gdzie: X_t - zmienna losowa, zaś T to zbiór indeksów procesu stochastycznego.

Zmienne muszą być określone na tej samej przestrzeni probabilistycznej.

Zbiór wartości zmiennych losowych X_t nazywamy przestrzenią stanów procesu

stochastycznego, zaś pojedyncza wartość zmiennej losowej to stan procesu stochastycznego.

Procesy stochastyczne zdefiniowane na dyskretnej przestrzeni stanów nazywane są łańcuchami.

Definicja obejmuje ideę funkcji losowej w następujący sposób. Aby z funkcji

f : D → R

z dziedziną funkcji D i obrazem R zrobić funkcję losową, należy wszystkie wartości funkcji f( x) we wszystkich punktach

D zamienić na zmienne losowe z wartościami w R. Dziedzina D staje się zbiorem indeksów procesu stochastycznego, zaś proces stochastyczny jest zdeterminowany przez połączone dystrybuanty

różnych zmiennych losowych f( x).

Należy jednak zauważyć, że definicja procesu stochastycznego jako rodziny

zmiennych losowych jest o wiele bardziej ogólna niż przypadek, kiedy indeksami są punkty

dziedziny funkcji losowej.

Implikacje definicji

Oczywiście matematyczna definicja funkcji dopuszcza przypadek "funkcja ze zbioru { 1,..., n} w R

jest wektorem w R n", więc wielowymiarowa zmienna losowa stanowi specjalny przypadek procesu stochastycznego.

Interesujące przypadki specjalne

• proc

esy Bernoulliego

• proc

esy Wienera

• proc

esy Markowa to takie, w których przyszłość jest warunkowo niezależna od przeszłości przy danej teraźniejszości.

• procesy Poissona

• procesy homogeniczne: proces, gdzie dziedzina posiada pewną symetrię i skończenie-wymiaroww rozkłady prawdopodobieństwa także mają tę symetrię. Specjalny przypadek

obejmuje proces stacjonarny.

• procesy z niezależnymi przyrostami: procesy, gdzie dziedzina jest przynajmniej częściowo

uporządkowana i jeśli x <...< x , wszystkie zmienne f( x

) − f( x ) są niezależne.

1

n

k+1

k

Specjalnym przykładem są łańcuchy Markowa.

• procesy punktowe: losowe ustawienia punktów w przestrzeni S

• procesy Gaussa: procesy, gdzie wszystkie liniowe kombinacje współrzędnych są zmiennymi losowymi z rozkładem normalnym

• procesy Gaussa-Markowa: procesy, które są jednocześnie procesami Gaussa i Markowa

• procesy Martingale'a

• procesy Galtona-Watsona

• paradoks windy

• proces gałązkowy

Błądzenie losowe to pojęcie z zakresu matematyki i fizyki określające sformalizowane przedstawienie procesu, polegającego na podejmowaniu kolejnych kroków, każdy w losowo

wybranym kierunku. Błądzenie losowe jest przykładem prostego procesu stochastycznego.

Własności

Najprostszy przykład błądzenia losowego to ścieżka skonstruowana według następujących zasad:

• Istnieje punkt początkowy

• Odległość od jednego punktu ścieżki do następnego jest stała

• Kierunek od jednego punktu ścieżki do drugiego jest wybierany losowo i żaden z kierunków

nie jest bardziej prawdopodobny od drugiego

Średnia odległość w linii prostej pomiędzy punktem

początkowym i punktem końcowym po n krokach rośnie zgodnie z sqrt n. Jeśli przez "średnią"

będziemy rozumieć średnią kwadratową, wtedy średnia odległość po n krokach wyniesie dokładnie

sqrt n.

Przykład

Wykres (n,R(n)) ośmiu różnych symulacji błądzenia losowego zaczynających się w 0.

Wykres przedstawia osiem przykładów błądzenia losowego, każdy o długości 100 kroków. W

każdym kroku proces może pójść do góry lub na dół. Można zauważyć, że pozostają one skupione

wokół punktu początkowego, a średnia odległość od tego punktu zwiększa się, ale wolniej niż

liniowo.

Większa liczba wymiarów

Wyobraźmy sobie pijaka spacerującego po mieście. Miasto jest nieskończone i całkowicie uporządkowane, a na każdym skrzyżowaniu pijak ma do wyboru jedną z czterech dróg (włączając

tę, którą przyszedł). Formalnie jest to proces błądzenia losowego na płaszczyźnie o całkowitych

współrzędnych. Czy pijak kiedykolwiek wróci z baru do domu? Okazuje się, że

prawdopodobieństwo powrotu pijaka do domu wynosi 1 (!) – matematycy mówią w takiej sytuacji: prawie na pewno. Jest to wielowymiarowa wersja problemu przekraczania poziomu, opisanego

wcześniej. Jednak podobieństwa na tym się kończą. W trzech i więcej wymiarach to twierdzenie nie

jest prawdziwe. Innymi słowy, pijany ptak mógłby zawsze błądzić w przestrzeni, nigdy nie trafiając

do swojego gniazda. Opisując rzecz formalnie, błądzenie losowe w 1

i 2 wymiarach jest procesem stochastycznym ze stanami powtarzającymi się, natomiast błądzenie

losowe w 3 wymiarach to proces o stanach chwilowych. Udowodnił to w 1921 roku George Polya.

Trajektoria błądzenia losowego to kolekcja miejsc odwiedzonych przez proces, rozważana jako

zbiór bez brania pod uwagę kiedy proces osiągnął dany punkt. W jednowymiarowej przestrzeni

trajektoria to po prostu wszystkie punkty pomiędzy minimalną wysokością osiągniętą przez proces

a maksymalną wysokością (obie rosną średnio zgodnie z sqrt n). Przy większej liczbie wymiarów

dostajemy dyskretny fraktal, to znaczy zbiór, który w dużej skali wykazuje własność samopodobieństwa, ale w mniejszej skali zobaczymy wpływ siatki, na której odbywa się proces.

Błądzenie losowe na grafie

Przypuśćmy teraz, że nasze miasto nie jest uporządkowane. Kiedy pijak dociera do skrzyżowania,

może wybrać jedną z wielu dróg, każdą z jednakowym prawdopodobieństwem. Jeśli ze

skrzyżowania wybiega siedem dróg, pijak wybierze każdą z nich z prawdopodobieństwem 1/7. Taki

problem nazywamy błądzeniem losowym na grafie. Czy nasz pijak ciągle ma szansę na powrót do

domu? Okazuje się, że przy pewnych łagodnych założeniach odpowiedź ciągle brzmi: tak. Na

przykład jeśli długość wszystkich bloków pozostanie w przedziale od 10 metrów do 10 kilometrów

(albo pomiędzy dwoma innymi dowolnymi liczbami), wtedy pijak prawie na pewno dotrze do

domu. Ciekawe jest, że nie zakładamy przy tym, że graf jest planarny, tzn. że w mieście mogą być

tunele i mosty. Jeden z dowodów opiera się na związkach z sieciami

elektrycznymi. Weźmy mapę miasta i umieśćmy rezystor na każdym bloku. Teraz zmierzmy "opór pomiędzy danym punktem a nieskończonością". Innymi słowy, wybierzmy liczbę R i weźmy

wszystkie punkty w sieci elektrycznej odległe o więcej niż R od naszego punktu i połączmy

je razem. Mamy skończoną sieć elektryczną i jesteśmy w stanie zmierzyć opór od naszego punktu

do połączonych punktów. Zwiększajmy R do nieskończoności. Granicę nazwiemy oporem

pomiędzy punktem i nieskończonością. Okazuje się, że prawdą jest:

Twierdzenie: proces błądzenia losowego na grafie posiada stany chwilowe wtedy i tylko wtedy, gdy

opór pomiędzy punktem i nieskończonością jest skończony. Nie jest ważne, jaki punkt wybierzemy.

Okazuje się, że taki opis procesów ze stanami chwilowymi i powtarzającymi się jest bardzo

wygodny i w szczególnym przypadku pozwala na analizę przypadku miasta na płaszczyźnie z

ograniczonymi odległościami.

Nie należy mylić błądzenia losowego na grafie z łańcuchem Markowa. W przeciwieństwie do

łańcuchów Markowa, błądzenie losowe na grafie posiada własność symetrii względem czasu lub

odwracalności. Oznacza to mniej więcej, że prawdopodobieństwa przejścia danej trasy w jednym

lub drugim kierunku są ze sobą w prosty sposób powiązane (jeśli graf jest regularny są po prostu równe). Okazuje się, że ta własność pociąga za sobą ważne konsekwencje.

Szereg czasowy to realizacja procesu stochastycznego, którego dziedziną jest czas; to ciąg informacji uporządkowanych w czasie, których pomiary wykonywane są z dokładnym krokiem

czasowym. Jeżeli krok nie będzie regularny wtedy mamy do czynienia z szeregiem czasowym

rozmytym.

Wśród składników szeregu czasowego możemy wyróżnić:

• t rend (tendencję rozwojową)

• wahania sezonowe

• wahania cykliczne (koniunkturalne)

• wahania przypadkowe

Badaniem własności szeregów czasowych i prognozowaniem na ich podstawie zajmuje się analiza

szeregów czasowych.

Modele szeregów czasowych mają wiele postaci. Ich trzy klasyczne klasy to modele autoregresyjne

(AR, od ang. AutoRegressive), scałkowane (I, Integrated) oraz z ruchomą średnią (MA, Moving Average) . Złożenia tych trzech klas to m.in. popularne modele autoregresyjne ze średnią ruchomą

(ARMA), modele autoregresyjne scałkowane ze średnią ruchomą (ARIMA), modele autoregresji z heteroskedastycznością warunkową np: CGARCH, EGARCH, FIGARCH, GARCH.

Document Outline

  • Definicja
    • Implikacje definicji
    • Interesujące przypadki specjalne
  • Własności
  • Przykład
  • Większa liczba wymiarów
  • Błądzenie losowe na grafie