Dziś zajmiemy się tak, jak ostatnio zmiennymi losowymi. I tak na początek kilka definicji.
(X, Y) nazywamy zmienna losową ciągłą, jeśli jej dystrybuanta da się przedstawić w postaci:
dla pewnej nieujemnej funkcji f zwanej gęstością.
Dla tej definicji istnieje jednak kilka uwag, które należy dodać:
W punktach ciągłości funkcji f zachodzi:
Dla
mamy:
Mając gęstośc rozkładu łącznego gęstości rozkładów brzegowych wyznaczamy nastepująco. Jeśli f(x, y) jest gęstością zmiennej losowej (X, Y), to funkcje:
są gęstościami odpowiednich rozkładów brzegowych. Jeśli łączny rozkład (X, Y) jest ciągłym to zmienne losowe X, Y są niezależne wtedy i tylko wtedy, gdy dla dowolnych x, y rzeczywistych
.
Teraz powiemy sobie o informacji o zmiennych losowych n - wymiarowych. Niech
będzie ustalona przestrzenia probablistyczną. Z kolei niech
będzie zmienną losową n - wymiarową (wektor losowy). Dystrybuantę dla n - wymiarowych zmiennych losowych wyznacza się wzorem:
. X nazywamy zmiernna losową skokową, jeśli jej zbiór wartości jest skończony lub przeliczalny. Z kolei X nazywamy zmienna losową ciągłą, jeśli jej dystrybuanta da się przedstawić w postaci:
dla pewnej nieujemnej funkcji f zwanej gęstością. I tutaj także dla tej definicji istnieje kilka uwag. Oto one:
W punktach ciągłości funkcji f zachodzi:
Dla
mamy:
Kolejna rzecz, to funkcja charakterystyczna zmiennej losowej n - wymiarowej. Jest ona okreslana wzorem:
Z tymi zmiennymi związane jest tez pojęcie rozkładu warunkowego. Jeśli
, to rozkład zmiennej losowej skokowej (n - k) wymiarowej określonej wzorem:
nazywamy rozkładem warunkowym zmiennej losowej
pod warunkiem, że
Funkcja rozkładu prawdopodobieństwa zmiennej losowej dwuwymiarowej (przykładowo) (X, Y) dana jest tabelką:
Tutaj rozkład warunkowy zmiennej losowej X pod warunkiem, że Y = 1 jest określone przez funkcję prawdopodobieństwa:
I teraz pojawia się bardzo ważna definicja. Jeśli gęstość
, to rozkład zmiennej losowej ciągłej (n - k) wymiarowej okreslonej wzorem:
nazywamy rozkładem warunkowym zmiennej losowej
pod warunkiem, że
Popatrzmy na przykład. Funkcja f(x, y) jest gęstością zmiennej losowej (X, Y):
Tu gęstość rozkładu warunkowego X|Y = 1 ma dla 0 < x < 2 postać 0,25/0,5 = 0,5, więc:
Teraz omówmy sobie wybrane parametry zmiennej losowej dwuwymiarowej. Kowariancją zmiennych losowych (X, Y) nazywamy wielkość:
Dla zmiennej losowej skokowej (X, Y) mamy:
Z kolei dla zmiennej losowej ciągłej (X, Y) mamy:
Tutaj jednak także pojawiają się trzy ważne uwagi dla tej definicji. A mianowicie:
Dla zmiennych losowych niezależnych Cov(X, Y) = 0, zatem zmienne losowe niezależne są nieskorelowane.
gdzie X i Y to dowolne zmienne losowe.
Unormowaną kowariancję nazywamy współczynnikiem korelacji między zmiennymi X i Y:
Współczynnik korelacji mierzy siłę zależności liniowej między zmiennymi X i Y. Oto pięć podstawowych własności współczynnika korelacji:
Dla niezależnych zmiennych losowych współczynnik korelacji jest równy 0.
Jeśli współczynnik korelacji jest dodatni, to między zmiennymi X i Y istnieje zależność liniowa dodatnia, co oznacza, że ze wzrostem wartości jednej zmiennej rosną średnie wartości drugiej zmiennej.
Jeśli współczynnik korelacji jest ujemny, to między zmiennymi X i Y istnieje zależno.ść liniowa ujemna, co zonacza, że ze wzrostem wartości jednej zmiennej maleją średnie wartości drugiej zmiennej.
Jeśli współczynnik korelacji jest równy 1, lub -1, to między zmiennymi X i Y istnieje funkcyjna zależność linowa.
I na samo zakończenie wykładu takie twierdzenie. Jeśli poszukujemy funkcji linoowej minimalizującej wyrażenie
, to otrzymamy prostą regresji zwaną prosta regresji drugiego rodzaju. Regresja II rodzaju Y względem X, to prosta:
Z kolei regresja II rodzaju X względem Y, to prosta: