Rachunek prawdopodobieństwa
Wielowymiarowa zmienna losowa (wektor losowy)
Niech dana będzie przestrzeń probabilistyczna (W, , P).
Wektor (X1,....,Xn), którego każda współrzędna jest zmienną losową, będziemy nazywać n-wymiarowym wektorem losowym (n-wymiarową zmienną losową)
Rozkład wektora losowego (X1,....,Xn) jest jednoznacznie określony funkcją daną następującym wzorem
i nazywaną dystrybuantą wektora losowego.
Warunki, które musi spełniać dystrybuanta wektora losowego (dla przypadku n=2)
Niech będzie dana dwuwymiarowa dystrybuanta
Wówczas musi ona spełniać następujące warunki:
i są dystrybuantami jednowymiarowych zmiennych losowych jako funkcje zmiennej x względnie y.
dla dowolnych ;
dla dowolnych .
W przypadku rozkładów wielowymiarowej zmiennej losowej dyskretnej (X1,....,Xn) wygodnie jest posługiwać się funkcją rozkładu prawdopodobieństwa
dla wszystkich , dla których powyższe prawdopodobieństwo jest dodatnie.
Przykład 1
W pojemniku znajdują się trzy kule ponumerowane od 1 do 3. Dwie kule losowane są kolejno z pojemnika bez zwrotu. Niech (X,Y) oznacza taki wektor losowy, że
X - numer pierwszej wylosowanej kuli
Y - numer drugiej wylosowanej kuli
Funkcję prawdopodobieństwa p(x,y) można przedstawić w postaci tabeli
Y / X |
1 |
2 |
3 |
1 |
0 |
1/6 |
1/6 |
2 |
1/6 |
0 |
1/6 |
3 |
1/6 |
1/6 |
0 |
Korzystając z tej tabeli możemy wyznaczyć różne prawdopodobieństwa ( np. P(X<Y)=0,5)
W przypadku rozkładów wielowymiarowej zmiennej losowej ciągłej (X1,....,Xn) odpowiednikiem funkcji rozkładu prawdopodobieństwa jest funkcja gęstości (gęstość) rozkładu prawdopodobieństwa dana zależnością
Przykład 2
Funkcja jest gęstością wektora losowego (X,Y)
Rozkłady brzegowe wielowymiarowej zmiennej losowej (wektora losowego)
Niech (X,Y) będzie wektorem losowym. Dystrybuanty
będziemy nazywać dystrybuantami brzegowymi wektora losowego (X,Y), lub dystrybuantami rozkładów brzegowych tego wektora.
Dla zmiennej typu ciągłego mamy, np.
Gęstość rozkładu brzegowego zmiennej losowej X dana jest zależnością
Przykład 3
Niech Funkcja będzie gęstością wektora losowego (X,Y). Rozkład brzegowy zmiennej losowej X ma gęstość
Dla zmiennej typu dyskretnego (skokowego) określana jest brzegowa funkcja rozkładu prawdopodobieństwa, np.
Przykład 4
W przypadku z problemu z Przykładu 1 mamy
Y / X |
1 |
2 |
3 |
pY(yj) |
1 |
0 |
1/6 |
1/6 |
1/3 |
2 |
1/6 |
0 |
1/6 |
1/3 |
3 |
1/6 |
1/6 |
0 |
1/3 |
pX(xi) |
1/3 |
1/3 |
1/3 |
|
Rozkłady warunkowe wielowymiarowej zmiennej losowej (wektora losowego)
Przypadek dwuwymiarowy (n=2)
Interesuje nas rozkład prawdopodobieństwa jednej zmiennej losowej, np. X, pod warunkiem, że wartości drugiej zmiennej losowej, np. Y, spełniają jakiś warunek, np. .
Mamy wówczas
W szczególnym przypadku warunek może mieć postać Y=y.
W przypadku rozkładów zmiennych losowych typu ciągłego oraz warunku Y=y powyższa definicja jest bezużyteczna, gdyż P(Y=y)=0.
W takim przypadku do opisu rozkładu warunkowego należy wykorzystać pojęcie warunkowej gęstości
Funkcja regresji
Jest to więc warunkowa wartość oczekiwana X, przy warunku Y=y. Tak zdefiniowana funkcja regresji nazywana jest funkcją regresji pierwszego rodzaju. Analogicznie zdefiniowana jest funkcja regresji pierwszego rodzaju w przypadku odwrotnym, tzn. dla E(Y|X=x).
Przykład
Rozważmy wektor losowy (X,Y) o rozkładzie prawdopodobieństwa opisanym dwuwymiarową funkcją gęstości
Warunkowa gęstość wynosi
W rezultacie mamy
Funkcja regresji drugiego rodzaju (regresja liniowa)
Funkcja liniowa postaci , taka że
Parametry rozkładów dwuwymiarowych
Kowariancja
Współczynnik korelacji
Współczynnik korelacji nie zależy od przyjętej skali oraz od położenia początku układu współrzędnych, w którym rejestrujemy zmienne X oraz Y.
Można udowodnić, że wtedy i tylko wtedy gdy . Jest to więc miara liniowej zależności pomiędzy X oraz Y.
Niezależność zmiennych losowych
Warunek niezależności:
Konsekwencje:
Twierdzenie odwrotne jest fałszywe.
Jeżeli Cov(X,Y)=0, to o zmiennych losowych X oraz Y możemy powiedzieć, że są nieskorelowane. Zmienne niezależne są zawsze nieskorelowane. Zmienne nieskorelowane nie muszą być niezależne.
Dwuwymiarowy rozkład normalny
Wektor losowy (X,Y) ma dwuwymiarowy rozkład normalny, gdy dwuwymiarowa funkcja gęstości przyjmuje postać:
gdzie
Rozkłady brzegowe: oraz
Współczynnik korelacji:
Rozkłady warunkowe:
Przykłady dwuwymiarowych rozkładów normalnych
1) Dwuwymiarowy rozkład normalny o parametrach:
mX=1, mY=0, sX=0.361 ,sY=0.539, r=0.206
1a) Jednowymiarowy rozkład normalny (rozkład brzegowy) o parametrach: mX=1, sX=0.361
1b) Jednowymiarowy rozkład normalny (rozkład brzegowy) o parametrach: mY=0, sY=0.539
2) Dwuwymiarowy rozkład normalny o parametrach:
mX=1, mY=0, sX=0.361 ,sY=0.539, r=0.82
2a) Jednowymiarowy rozkład normalny (rozkład brzegowy) o parametrach: mX=1, sX=0.361
2b) Jednowymiarowy rozkład normalny (rozkład brzegowy) o parametrach: mY=0, sY=0.539