DWUWYMIAROWE ZMIENNE LOSOWE
Rozkład łączny pary zmiennych losowych
określonych na tej samej przestrzeni zdarzeń elementarnych:
, A - dowolny podzbiór zbioru par wartości zmiennych X, Y.
Definicja. Dystrybuantą zmiennej losowej
nazywamy funkcję
,
gdzie
Twierdzenie. Łączny rozkład prawdopodobieństwa zmiennej losowej
określony jest jednoznacznie przez jej dystrybuantę.
Zmienne dyskretne
Funkcja prawdopodobieństwa ( łącznego ) dwuwymiarowej zmiennej losowej dyskretnej:
.
Własności:
(i)
, dla dowolnej pary wartości
,
,
,
(iv)
.
Przykład. W każdym z dwóch etapów teleturnieju można otrzymać 0, 1, lub 2 punkty. Niech zmienne losowe X, Y oznaczają liczby punktów uzyskane w etapie I i II, odpowiednio, przez losowo wybranego
uczestnika. Funkcję prawdopodobieństwa łącznego określa tabela:
YX |
0 |
1 |
2 |
0 |
0,5 |
0,05 |
0,01 |
1 |
0,2 |
0,1 |
0,06 |
2 |
0,02 |
0,03 |
A |
Znaleźć:
.
(a)
= 1. Stąd
= A = 1 - ( 0,5 + 0,05 + 0,01 + 0,2 + 0,1 +
+ 0,06 + 0,02 + 0,03 ) = 1 - 0,97 = 0,03.
=
= 0,01 + 0,06 + 0,03 = 0,1.
(c)
=
=
=
=
= 0,5 + 0,05 + 0,2 + 0,1 = 0,85.
Zmienne ciągłe
Zmienna losowa (
jest dwuwymiarową ciągłą zmienną losową, jeśli jej łączny rozkład prawdopodo- bieństwa określony jest przez funkcję gęstości łącznej
( łączną gęstość prawdopodobieństwa ), taką że
W szczególności dla
:
=
.
,
,
.
Przykład. Zmienna losowa
ma gęstość prawdopodobieństwa
gdy
.
Obliczyć
=
=
=
= ?
Rozkłady brzegowe
Niech
będzie dwuwymiarową zmienną losową o rozkładzie prawdopodobieństwa określonym przez funkcję
( funkcja prawdopodobieństwa lub gęstość ).
Rozkład brzegowy = rozkład prawdopodobieństwa zmiennej losowej X lub zmiennej losowej Y.
dla dyskretnych zmiennych X, Y , brzegowe funkcje prawdopodobieństwa są postaci
dla ciągłych zmiennych X, Y , brzegowe gęstości są postaci
.
D. (a)
=
.
(b)
=
=
. Stąd
=
.
Przykład. Dwuwymiarowa zmienna losowa
ma gęstość
gdy
Znaleźć gęstość zmiennej losowej X.
Niech
.
=
=
=
.
gdy
.
Gęstość zmiennej losowej Y ma identyczną postać.
Rozkłady warunkowe
Niech
będzie dyskretną zmienną losową mającą funkcję prawdopodobieństwa
.
Niech y - ustalone oraz
.
Rozkład warunkowy zmiennej losowej X pod warunkiem, że Y = y określa warunkowa funkcja prawdopodobieństwa:
=
, x - dowolna wartość zmiennej X.
=
=
funkcja prawdopodobieństwa zmiennej X pod warunkiem, że zmienna Y przyjęła wartość y.
Analogicznie:
=
=
, gdzie
.
Notacja:
(b) Niech
będzie ciągłą zmienną losową o łącznej gęstości
.
Niech y - ustalone oraz
.
Warunkową gęstością prawdopodobieństwa zmiennej
losowej X pod warunkiem, że
nazywamy funkcję
=
,
.
Przykład. (kontynuacja)
gdy
gdy
Niech
- ustalone.
=
=
dla
= 0 dla
Uwaga. Analogicznie określamy rozkład warunkowy
zmiennej losowej Y pod warunkiem X = x. Zatem
=
, gdzie y - dowolna wartość Y,
x - ustalone, takie że
.
Notacja:
,
Przykład. (kontynuacja)
(a) Znaleźć rozkład brzegowy zmiennej Y, liczby punktów uzyskanych w II etapie teleturnieju przez losowo wybranego uczestnika.
(b) Wyznaczyć rozkład warunkowy Y pod warunkiem, że w I etapie uzyskano 2 punkty, tzn. X = 2.
YX |
0 |
1 |
2 |
0 |
0,5 |
0,05 |
0,01 |
1 |
0,2 |
0,1 |
0,06 |
2 |
0,02 |
0,03 |
0,03 |
YX |
0 |
1 |
2 |
0 |
0,5 |
0,05 |
0,01 |
1 |
0,2 |
0,1 |
0,06 |
2 |
0,02 |
0,03 |
0,03 |
=
. Stąd
Y |
0 |
1 |
2 |
|
0,72 |
0,18 |
0,1 |
=
= ?
=
=
=
= 0,02/(0,02 + 0,03 + 0,03) =1/4,
=
=
=
= 0,03/0,08 = 3/8,
=
=
=
= 0,03/0,08 = 3/8.
Niezależne zmienne losowe
Definicja. Niech
będzie dwuwymiarową zmienna losową o dystrybuancie
oraz dystrybuantach brzegowych
,
. Zmienne losowe X, Y są niezależne, jeśli
,
dla wszystkich wartości x, y.
Twierdzenie. Zmienne losowe X, Y są niezależne wtedy i tylko wtedy gdy
,
dla wszystkich wartości x, y.
Wniosek. Poniższe warunki są równoważne:
(i) Zmienne losowe X, Y są niezależne.
(ii)
,
, dla wszystkich y,
takich że
.
(iii)
,
, dla wszystkich x,
takich że
.
Przykład. ( kontynuacja )
Czy liczby punktów uzyskane w I i II etapie teleturnieju przez losowo wybranego uczestnika są niezależnymi zmiennymi losowymi ?
YX |
0 |
1 |
2 |
0 |
0,5 |
0,05 |
0,01 |
1 |
0,2 |
0,1 |
0,06 |
2 |
0,02 |
0,03 |
0,03 |
= 0,5 + 0,05 +
+ 0,01 = 0,56.
= 0,5 + 0,2
+ 0,02 = 0,72.
Stąd
,
Zmienne losowe
są zależne.
Przykład. ( kontynuacja ). Czy X, Y są niezależnymi zmiennymi losowymi, jeśli ich łączna gęstość ma postać:
gdy
Dla
:
oraz
.
.
Przykład. Czasy poprawnej pracy dwu podzespołów są niezależnymi zmiennymi losowymi X, Y o rozkładach wykładniczych z parametrami
odpowiednio.
Średnie czasy pracy podzespołów wynoszą 1000 (godzin ) i 1200 ( godzin ). Obliczyć prawdopodobieństwo zdarzenia takiego, że każdy podzespół nie ulegnie awarii przed upływem 1500 godzin.
(godz.),
(godz.)
Stąd
(1/godz.)
(1/godz.).
=
=
=
=
= 0,2231
0,2865 = 0,0639.
Wartość oczekiwana. Kowariancja.
=
,
gdy X, Y są dyskretne,
=
,
gdy X, Y są ciągłe.
Uwaga. Dla
lub
otrzymujemy wartości oczekiwane brzegowych zmiennych losowych X lub Y.
Np.
=
=
=
=
.
Stwierdzenie. Niech c będzie dowolną stałą, a
,
,
zmiennymi losowymi
jednowymiarowymi. Wówczas
,
.
D. Dowód jest bezpośrednią konsekwencją definicji wartości oczekiwanej oraz własności całki i sumowania.
Stwierdzenie. Jeśli zmienne losowe X, Y są niezależne, to
.
Niezależność zmiennych jest równoważna
. Stąd i z definicji wartości oczekiwanej mamy
(zmienne dyskretne )
=
.
=
=
=
=
=
.
(b) (zmienne ciągłe) Dowód analogiczny - Sumowanie należy zastąpić całkowaniem.
Definicja. Niech X i Y będą zmiennymi losowymi o łącznej funkcji prawdopodobieństwa ( gęstości )
. Kowariancją zmiennych X i Y nazywamy liczbę:
.
Uwaga.
Z definicji
oraz
, przyjmując
, otrzymujemy wzory:
,
gdy X, Y są dyskretne
,
gdy X, Y są ciągłe.
Notacja: Zamiast
często piszemy Cov (X,Y).
Interpretacja. Kowariancja określa pewną współzależność między zmiennymi losowymi:
(a) Jeśli „dużym” wartościom zmiennej X przewyższającym
towarzyszą zwykle „duże” wartości zmiennej Y przewyższające
, a wartościom X mniejszym od
towarzyszą zwykle wartości Y mniejsze od
, to
> 0.
(b) Jeśli wartościom zmiennej X większym od
towarzyszą zwykle wartości Y mniejsze od
wartościom X mniejszym od
towarzyszą zwykle wartości Y większe od od
, to
< 0.
Stwierdzenie. Cov(X,Y) =
.
Cov(X,Y) =
=
=
=
=
=
=
.
Twierdzenie. Jeśli zmienne losowe X i Y są niezależne, to
Cov(X,Y) = 0.
Dla niezależnych zmiennych losowych
. Stąd oraz wzoru na kowariancję mamy:
Cov(X,Y) =
=
=
= 0.
Uwaga. Twierdzenie odwrotne nie jest na ogół prawdziwe.
Twierdzenie. Dla dowolnych stałych a, b
Var(
=
Var(X) +
Var(Y) + 2
Cov(X,Y).
D. E{
} =
E{
} = E{
}
+ E
+ E{
} =
=
Var(X) + 2abCov(X,Y) +
Var(Y). c.k.d.
Wniosek. Jeśli zmienne losowe X i Y są niezależne, to
Var(
) =
Var(X) +
Var(Y).
Definicja. Współczynnikiem korelacji między zmiennymi losowymi X i Y nazywamy liczbę:
.
Przykład.
YX |
0 |
1 |
2 |
0 |
0,5 |
0,05 |
0,01 |
1 |
0,2 |
0,1 |
0,06 |
2 |
0,02 |
0,03 |
0,03 |
=
= 0
(0,5 + 0,05 + 0,01) +
+ 1
(0,2 + 0,1 + 0,06) + 2
(0,02+0,03+0,03) = 0,52.
=
= 0
(0,5 + 0,2 + 0,02) +
+ 1
(0,05 + 0,1 + 0,03) + 2
(0,01+0,06+0,03) = 0,38.
YX |
0 |
1 |
2 |
0 |
0,5 |
0,05 |
0,01 |
1 |
0,2 |
0,1 |
0,06 |
2 |
0,02 |
0,03 |
0,03 |
=
= 0 + 0 + 0 + 0 + 1
0,1 +
+
+
+
= 0,31.
Cov(X,Y) = 0,31 - 0,52
= 0,1124.
(0,2 + 0,1 + 0,06) +
+
= 0,68
(0,05 + 0,1 + 0,03) +
+
= 0,58.
Var(X) =
= 0,4096
Var(Y) =
= 0,4356
Własności współczynnika korelacji
Jeśli a i b są stałymi, oraz jeśli
Y = a + bX,
to
gdy
(iii) Jeśli zmienne losowe X i Y są niezależne, to
(iv) Jeśli
, to między zmiennymi losowymi X, Y
istnieje liniowa zależność funkcyjna.
Interpretacja. Współczynnik korelacji jest miarą zależności liniowej między zmiennymi losowymi.
Dwuwymiarowy rozkład normalny
Zmienna losowa
ma dwuwymiarowy rozkład normalny, jeśli ma gęstość postaci:
exp
,
gdzie
,
, stałe
,
,
spełniają warunki
> 0,
> 0,
.
Notacja:
Twierdzenie. Jeśli
, to
(i) X ~
, Y ~
.
(ii) Cov(X,Y) =
.
(iii) X, Y są niezależne wtedy i tylko wtedy gdy
= 0.
Twierdzenie. Zmienna losowa (X,Y) ma dwuwymiarowy rozkład normalny wtedy i tylko wtedy gdy zmienna losowa aX + bY ma rozkład normalny, a, b są dowolnymi stałymi.
CIĄGI ZMIENNYCH LOSOWYCH
Niech
będą zmiennymi losowymi określonymi na tej samej przestrzeni zdarzeń elementarnych
.
=
=
dystrybuanta wektora losowego (
).
= funkcja prawdopodobieństwa łącznego lub funkcja gęstości łącznej wektora losowego (
).
Definicja. Zmienne losowe
są niezależne, jeśli
=
,
gdzie
, i = 1,2,...,n.
Definicja.
=
,
lub
.
Stwierdzenie.
=
.
Wniosek. Niech
,
i = 1,2,..,n.
=
.
D. W stwierdzeniu trzeba przyjąć
, i = 1,2,..,n.
Stwierdzenie. Jeśli
są niezależnymi zmiennymi losowymi, to
Var
=
Var(
) +
Var(
) + ... +
Var(
).
W szczególności, jeśli Var(
) =
oraz
,
i = 1,2,..,n, to
Var(
) =
.
Przykład. Dokonujemy n jednakowych, niezależnych doświadczeń Bernoulli'ego o prawdopodobieństwie sukcesu p,
. Znaleźć wartość oczekiwaną i wariancję zmiennej losowej Y będącej liczbą sukcesów.
Niech
1, gdy sukces w i-tym doświadczeniu,
0, gdy porażka w i-tym doświadczeniu. Wówczas
są niezależnymi zmiennymi losowymi o
funkcjach prawdopodobieństwa:
,
.
Stąd:
, Var(
) =
.
Liczba sukcesów =
=
=
=
.
Var(Y) =
Var(
+ Var(
+ ... + Var(
=
Definicja. Prostą próbą losową o liczności n nazywamy ciąg niezależnych zmiennych losowych
określonych na przestrzeni zdarzeń elementarnych
i takich, że każda ze zmiennych ma taki sam rozkład.
Twierdzenie. ( CENTRALNE TWIERDZENIE
GRANICZNE)
Niech
będzie prostą próbą losową z rozkładu o średniej
i wariancji
. Wówczas dla dużych liczności próby n rozkład prawdopodobieństwa standaryzowanej średniej ( = standaryzowanej sumy
) jest bliski standardowemu rozkładowi normalnemu
, dokładniej dla dowolnych liczb a, b,
przy
. Równoważnie rozkład średniej
jest bliski rozkładowi normalnemu
.
Przykład. Załóżmy, że rozkład codziennego dojazdu do pracy jest w przybliżeniu rozkładem jednostajnym na przedziale [0,5 godz., 1 godz. ] i że czasy dojazdów w różne dni są niezależne. Obliczyć przybliżone prawdopodobieństwo zdarzenia, że średni dzienny dojazd w ciągu 30 dni przekroczy 0,8 godz.
Niech
oznacza czas dojazdu w i-tym dniu ,
.
,
.
,
=
.