Definicja:
Dana jest przestrzeń probabilistyczna (Ω, S, P ) i w tej przestrzeni n zmiennych losowych X , X ,..., X
X = { X , X ,..., X
1
2
n . Uporządkowany układ n zmiennych losowych oznaczamy jako:
}
1
2
n
i
nazywamy n – wy miarową zmienną losową lub wektorem losowym X.
W ten sposób każdemu zdarzeniu elementarnemu ω ∈ Ω przyporządkowujemy układ n liczb n
rzeczywistych, czyli punkt n – wymiarowej przestrzeni euklidesowej ℜ .
Przykład 1:
Wyobraźmy sobie doświadczenie, w czasie którego wykonujemy jednoczesny rzut kostką i monetą.
Wyniki rzutu kostką można uważać za zmienną losową :
X 1 - przyjmującą wartości 1, 2, ... , 6 z prawdopodobieństwem 1/6.
X 2 - przyjmującą wartości 0 –orzeł, 1 – reszka z prawdopodobieństwem ½.
W wyniku jednoczesnego rzutu kostką i monetą otrzymujemy 2 wartości. Mamy więc do czynienia ze zmienną losową dwuwymiarową ( X , X )
1
2
, która może przyjąć jedną z 12 wartości:
(1,0), (1,1), (2,0), (2,1), (3,0), (3,1), (4,0), (4,1), (5,0), (5,1), (6,0), (6,1).
Jest sprawą intuicyjnie oczywistą, że wszystkie12 wartości zmiennej losowej ( X , X ) 1
2
są równo
prawdopodobne. Czyli: P( X = k, X = l) = 1/12
1
2
dla k = 1, ... , 6 ; l = 0, 1.
Tabelaryczny zapis tej dwuwymiarowej zmiennej losowej ( X , X ) 1
2
:
X
X
1
2
0
1
1
1/12
1/12
2
1/12
1/12
3
1/12
1/12
4
1/12
1/12
5
1/12
1/12
6
1/12
1/12
Definicja:
Dystrybuantą zmiennej losowej n – wymiarowej ( X , X ,..., X ) 1
2
n
nazywamy funkcję:
F ( x , x ,..., x )
P( X < x , X < x ,..., X < x 1
2
n
=
)
1
1
2
2
n
n
Właściwości:
1. F (
,
∞ ,...,
∞
∞) = P( X < ,
∞ X < ,...,
∞
X n < ∞) = 1
1
2
2. Dystrybuanta jest funkcją lewostronnie ciągłą.
3. F ( x , x ,..., x
x
x
i −
− ,
∞
,...,
)
i +
n
= 0
1
2
,
1
1
. Wynika to z tego, że zdarzenie polegające na tym, że
zmienna losowa X
−
i przyjmuje wartość mniejszą niż
∞ , jest zdarzeniem prawie niemożliwym
(prawdopodobieństwo równe zeru).
4. Jeżeli zbiór wartości dystrybuanty jest skończony lub przeliczalny, to zmienną losową n –
wymiarową nazywamy dyskretną lub typu skokowego.
Jeżeli dystrybuanta jest różniczkowalna ( w sensie klasycznym), to zmienną losową wielowymiarową nazywamy ciągłą.
Definicja:
Funkcja gęstości prawdopodobieństwa wielowymiarowej zmiennej losowej ciągłej jest pochodną jej dystrybuanty:
F
∂ ( x , x ,..., x )
1
2
n
f ( x , x ,..., x )
1
2
n
=
x
∂ x
∂ ... x
1
2
∂ n
Własności funkcji gęstości prawdopodobieństwa:
1. f ( x , x ,..., x )
n
≥ 0
1
2
∞
∞
f x x
x dx dx
dx
n
n =
2.
...
( ,
,...,
)
...
1
∫ ∫
1
2
1
2
−∞
−∞
Momenty zmiennej losowej wielowymiarowej
Mamy zmienną losową n – wymiarową ( X , X ,..., X ) 1
2
n
. Zakładamy, że dla każdej z tych
zmiennych X i ( i = 1, 2, ... , n ) są określone momenty zwykłe.
Definicja:
Momenty mieszane rzędu r + s zmiennej losowej wielowymiarowej definiuje się następująco: rs
α = E X ⋅ X
kl
( r s
k
l )
dla k, l = 1, 2, ... , n
Sumę r + s nazywamy rzędem momentu.
Definicja dla zmiennej losowej wielowymiarowej skokowej X i ( i = 1, 2, ... , n ) przyjmującej wartości x
( m =
,...,
2
,
1
K
im
) :
i
i
i
Kk
Kl
rs
r
s
α =
x
x P( X
∑∑
= x , X = x )
kl
k
km
l
lm
k
k
km
l
l
lm
m
1
= m 1
=
k
l
Definicja dla zmiennej losowej wielowymiarowej ciągłej:
∞
∞
rs
r
s
α = ... x x f ( x , x ,..., x ) dx dx dx
...
∫ ∫
kl
k
l
1
2
n
1
2
n
−∞ −∞
Momenty poszczególnych zmiennych losowych X i można uważać za graniczne przypadki momentów mieszanych, np.
10
α = EX
kl
k - jest wartością oczekiwaną zmiennej losowej X k
Centralne momenty mieszane rzędu r + s zmiennej losowej ( X , X ) k
l
rs
µ = E ( X − EX ) ⋅( X − EX )
kl
[
r
s
k
k
l
l
]
Z tej definicji wynika, że:
10
µ
E X
EX
kl =
( k −
)
k
= 0 dla k, l = 1, 2, ... , n
2
µ
= E( X − EX ) = V ( X )
kl
k
k
k
r 0
r
µ
= E( X − EX ) = µ ( X )
X
kl
k
k
r
k
- r –ty moment centralny zmiennej losowej
k .
Momenty mieszane dla zmiennej losowej dwuwymiarowej ( X, Y )
α = E( r
s
X ⋅ Y )
rs
- moment mieszany zwykły,
µ = E[( X − EX ) r ⋅( Y − EY ) s]
rs
- centralny moment mieszany,
α = E( X 1
10
⋅ Y 0) = EX
α = E( X 0
01
⋅ Y 1) = EY
µ = E[( X − EX )] = 0
(
∑ x EX p
x p
EXp
i −
) i = ∑ i i − ∑
i =
10
bo:
0
i
i
i
µ = E[( Y − EY )] = 0
01
2
2
µ = E[( X − EX ) ] = σ
20
x
2
2
µ = E[( Y − EY ) ] = σ
02
y
µ = E[( X − EX ) ⋅( Y − EY )] =
(
Cov X , Y )
11
- moment mieszany 2-go rzędu.
Kowariancja zmiennej losowej dwuwymiarowej ( X, Y )
Definicja:
Kowariancją zmiennej losowej dwuwymiarowej ( X, Y ) nazywamy liczbę Cov( X , Y ) określoną wzorem:
11
Cov( X , Y ) = E[( X − EX ) ⋅ ( Y − EY )] = µ XY
Jest to oczywiście centralny moment mieszany rzędu drugiego.
Czyli:
Cov( X , Y ) = E( X ⋅ Y ) − EX ⋅ EY
E( X ⋅ Y ) =
gdzie:
∑∑ x y p
i
k
ik - dla zmiennej losowej skokowej ,
i
k
oraz: p
= P( X = x , Y = y )
ik
i
k
.
∞ ∞
E( X ⋅ Y ) =
∫ ∫ xyf ( x, y) dxdy - dla zmiennej losowej ciągłej.
−∞ −∞
Twierdzenie 1:
Jeśli zmienne losowe X i Y są niezależne i mają wartości oczekiwane, to: E( X ⋅ Y ) = EX ⋅ EY
Twierdzenie 2:
2
2
Jeśli: EX
< ∞ i EY < ∞ , to:
V ( X ± Y ) = VX + VY ± 2 ⋅ Cov( X , Y )
Twierdzenie 3:
Dla dowolnych liczb a, b, c, d zachodzi: Cov( aX + ,
b cY + d ) = a ⋅ c ⋅ Cov( X , Y ) Twierdzenie 4:
Cov( X , Y ) ≤ σ
⋅σ
X
Y
ρ
Współczynnik korelacji
XY zmiennych losowych X, Y
Niech zmienne losowe X i Y posiadają momenty dwóch pierwszych rzędów: m = EX
m =
2
σ
2
σ Y = V ( Y ) >
X = V ( X ) >
X
,
EY
Y
,
0 ,
0 .
Współczynnik korelacji jest parametrem służącym do badania zależności między zmiennymi losowymi X i Y . Służy on do dwóch celów:
a) zaprzeczeniu zdania: zmienne losowe X i Y są niezależne, b) pokazaniu, że między zmiennymi losowymi X i Y istnieje zależność liniowa z prawdopodobieństwem 1.
Definicja:
Współczynnikiem korelacji ρ XY zmiennych losowych X i Y nazywamy liczbę: E{( X − m
Y
)( − m )}
Cov( X , Y
X
Y
ρ
)
=
=
XY
σ σ
σ σ
X
Y
X
Y
Własności współczynnika korelacji
Twierdzenie 5:
Wartość bezwzględna współczynnika korelacji jest niezmiennikiem przekształceń liniowych, czyli: ρ =
|
| |
|
∧
ρ
ρ
+
+
= ρ
XY
aX + b, cY + d
, czyli: |
( aX
,
b cY
d ) | | ( X , Y ) |
a, c ≠0, b, d
Twierdzenie 6:
Moduł współczynnika korelacji jest nie większy od jedności:
| ρ
|
XY ≤ 1
Twierdzenie 7:
Jeśli zmienne losowe X i Y są niezależne, to ρ XY = 0 .
O zmiennych losowych, dla których ρ XY = 0 mówimy, że są nieskorelowane.
Praktyczne znaczenie współczynnika korelacji
Rozważmy zależność liniową zmiennych losowych X i Y : Y = aX + b
Obliczmy współczynnik korelacji zmiennych losowych X i Y : Cov( X , Y
ρ
)
=
XY
σ σ
X
Y
Cov( X , Y ) = E[( Y − EY )( X − EX )] = E[( aX + b − aEX − b)( X − EX )] =
= E[ a( X − EX )( X − EX )] = E[ a( X − EX )2] = aE[( X − EX )2] =
2
= aσ X
2
2
2
2
2
2
σ = E[( Y − EY ) ] = E[( aX + b − aEX − b) ] = E[( a( X − EX )) ] = a σ
Y
X
σ = a σ
2
2
|
= a |σ
Y
X
X
Zatem współczynnik korelacji wyniesie:
2
aσ
a
X
ρ =
=
XY
σ σ
| a |
| a |
X
X
Czyli współczynnik korelacji tych zmiennych losowych wyraża się wzorem:
1 dla a >
ρ XY =
0
−1 dla a < 0
Dla ρ
ρ XY =
XY = 1 i
1
− zależność stochastyczna przechodzi w zależność funkcyjną:
y
y
Y=aX+b
Y=aX+b
a>0
a<0
x
x
ρ
ρ XY =
XY = 1
1
−
y
y
x
x
− 1 < ρ
0 < ρ XY <
XY < 0
1
x
ρ XY = 0 - zmienne losowe nieskorelowane.
Rozkłady brzegowe zmiennych losowych dwuwymiarowych ( X, Y )
Dla dwuwymiarowej zmiennej losowej ( X, Y ) funkcje dystrybuant: F ( x) =
F ( x, )
F ( y) =
F ( x,
X
lim
y
)
Y
lim
y
y →∞
x→∞
są funkcjami jednej zmiennej losowej, odpowiednio x oraz y i każda z nich ma wszystkie własności dystrybuanty jednowymiarowej.
Definicja:
Funkcje F
F
X oraz
Y , otrzymane jako odpowiednie wartości graniczne funkcji F , nazywamy
dystrybuantami brzegowymi, a jednowymiarowe rozkłady prawdopodobieństwa wyznaczone przez funkcje F
F
X oraz
Y , nazywamy rozkładami brzegowymi.
W przypadku zmiennej losowej dwuwymiarowej ( X, Y ) typu ciągłego o funkcji gęstości prawdopodobieństwa f ( x, y) , mamy:
f ( x)
f ( y)
Y
= f ( x, y) dx
X
=
∫ f ( x, y) dy,
∫
ℜ1
ℜ1
Funkcje f ( x)
f ( y
X
i
)
Y
są funkcjami gęstości prawdopodobieństwa odpowiednio zmiennych losowych X oraz Y i nazywać je będziemy brzegowymi gęstościami prawdopodobieństwa.
Oczywiście zachodzi:
∂
∂
=
F ( x) = f ( x) ,
F ( y)
f ( y)
Y
x X
X
∂
y
Y
∂
Dla zmiennej losowej dwuwymiarowej typu skokowego o rozkładzie określonym parami liczb p( x , y ) i
k
,
mamy:
p ( x )
p( x , y )
p ( y )
p( x , y )
Y
k
=
X
i
=
∑ i k ,
∑ i k
k
i
Liczby p ( x )
X
i
- wyznaczają rozkład brzegowy prawdopodobieństwa zmiennej losowej X.
Liczby p ( y )
Y
k
- wyznaczają rozkład brzegowy prawdopodobieństwa zmiennej losowej Y.
Zostały one określone jako odpowiednie sumy prawdopodobieństw p( x , y ) i
k
dwuwymiarowej zmiennej
losowej ( X, Y ).
Znając rozkład dwuwymiarowej zmiennej losowej ( X, Y ), możemy zawsze wyznaczyć dla niej 2 rozkłady brzegowe:
- brzegowy rozkład prawdopodobieństwa zmiennej losowej X,
- brzegowy rozkład prawdopodobieństwa zmiennej losowej Y.
Rozumowanie odwrotne nie jest prawdziwe, tzn. znając rozkłady brzegowe, na ogół, nie można jednoznacznie wyznaczyć rozkładu prawdopodobieństwa dwuwymiarowego.
Zmienne losowe niezależne
Definicja:
Dana jest zmienna losowa dwuwymiarowa ( X, Y ). Zmienne losowe X i Y nazywamy niezależnymi jeśli zachodzą relacje:
- dla zmiennych losowych typu skokowego:
F ( x, y) = F ( x) ⋅ F ( y)
∧
{ p( x , y ) = p ( x ) ⋅ p ( y
∧
X
Y
lub
)}
i
k
X
i
Y
k
x, y
x , y
i
k
- dla zmiennych losowych typu ciągłego:
f ( x, y) = f ( x) ⋅ f ( y)
∧
X
Y
x, y
Przykład 2:
Rozpatrzmy dwuwymiarową zmienną losową ( X, Y ) typu skokowego przyjmującą skończoną liczbę wartości ( x , y )
i
k
i = 1, 2, ..., r k = 1, 2, ..., m z prawdopodobieństwami p( x , y ) = P( X = x , Y = y ) i
k
i
k
.
Przedstawmy naszą dwuwymiarową zmienną losową ( X, Y ) za pomocą tabeli: Y
Rozkłady brzegowe zm. l.
y
y
...
y
X
1
2
m
X
x
p( x , y ) = p
p( x , y ) = p
p( x , y ) = p
p
1
1
1
11
1
2
12 ...
1
m
m
1
.
1
x
p( x , y ) = p
p( x , y ) = p
p( x , y ) = p
p
2
2
1
21
2
2
22
2
m
2 m
.
2
.
.
.
...
.
.
.
.
.
...
.
.
x
p( x , y ) = p
p( x , y ) = p
p
r
r
1
1
r
r
2
r 2 ...
r.
p( x , y ) = p
r
m
rm
Rozkłady
p
p
...
p
∑ p
p
k = ∑ i = 1
brzegowe zm.
.1
2
.
. m
.
.
l. Y
k
i
gdzie: p = p
+ p + ... + p
1.
11
12
m
1
p
= p + p + ... + p
.
2
21
22
2 m
p . = p 1 + p
+ ...
2
+ p
r
r
r
rm - rozkłady brzegowe zmiennej losowej X,
p = p
+ p + ... + p
.1
11
21
r 1
p
= p + p + ... + p
.2
12
22
r 2
+ ...
2
+ p
m
m
m
rm - rozkłady brzegowe zmiennej losowej Y.
r
m
p( x , y )
1
i
k
=
Oczywiście, zachodzi: ∑ ∑
i =1
k =1
Zmienne losowe typu skokowego X i Y są niezależne, jeśli zachodzi: p = p ⋅ p
∧
ik
i.
. k
i, k
Znając rozkłady brzegowe zmiennych losowych X i Y , możemy z nich łatwo wyznaczyć wartości oczekiwane i wariancje tych zmiennych losowych:
r
m
EX = ∑ x p
EY =
y p
i
i. ,
∑ k . k
i
k
r
m
2
2
= ∑
−
2
2
= ∑
−
E( X )
x p
( EX )
V ( Y )
y p
( EY )
i
i.
,
k
. k
i
k
Dla dwuwymiarowej zmiennej losowej z przykładu 1, rozkłady brzegowe będą następujące: Y
0
1
rozkł. brzeg. zm. l. Y
X
1
1/12
1/12
p .
1 = 1/6
2
1/12
1/12
p .
2 = 1/6
3
1/12
1/12
p .
3 = 1/6
4
1/12
1/12
p .
4 = 1/6
5
1/12
1/12
p .
5 = 1/6
6
1/12
1/12
p .
6 = 1/6
rozkł. brzeg. zm. l. X p
p
1
. = 1/2
.2 =1/2
1
Zadania
1. Dwuwymiarowa zmienna losowa (X, Y) ma rozkład prawdopodobieństwa: Y 0
1
X
1
1/6
1/6
2
2/6
2/6
Zbadać, czy zmienne losowe X oraz Y są niezależne.
2. Dwuwymiarowa zmienna losowa (X, Y) ma rozkład prawdopodobieństwa: Y 1
2
3
X
0
0,3
0,2
0,1
1
0,2
0,1
0,1
a) Obliczyć wartość oczekiwaną i wariancję zmiennej losowej : Z = 2 X + Y .
b) Sprawdzić, czy zmienne losowe X i Y są niezależne?
3. Dwuwymiarowa zmienna losowa (X, Y) ma rozkład prawdopodobieństwa: Y 0
1
X
1
1/8
p 12
2
p 21
1/4
gdzie: p 21 = prawdopodobieństwu wypadnięcia liczby parzystej przy rzucie kostką.
Obliczyć współczynnik korelacji ρ XY zmiennych losowych X i Y.
4. Wyznaczyć stałą c tak, aby funkcja:
c dla | x <| ,1| y <|1
f ( x, y) =
0 poza tymobszarem
a) była funkcją gęstości prawdopodobieństwa zmiennej losowej (X, Y) typu ciągłego, b) obliczyć prawdopodobieństwo: P( X > ,
0 Y > )
0 .
5. Zmienna losowa X ma rozkład normalny N( 2 ; 1 ), zaś zmienna losowa Y ma rozkład normalny N( 1 ; 2 ). Zmienne losowe X i Y są zależne, a współczynnik korelacji między nimi wynosi 0,4.
Obliczyć wartość oczekiwaną i wariancję zmiennej losowej Z = 2 X − 3 Y − 10 .
6. Zmienna losowa X ma rozkład normalny o wartości oczekiwanej 10 i wariancji 4.
a) Obliczyć kwantyl rzędu ¼ w tym rozkładzie.
b) Obliczyć wartość oczekiwaną i wariancję zmiennej losowej Y = 3
− X + 20 .
7. Sprzedawca zatrudniony w sklepie komputerowym dostaje miesięczną stałą pensję w wysokości 500,- zł, a do tego 10,- zł za każdy sprzedany komputer i 20,- zł za każdy sprzedany zestaw oprogramowania. W ciągu miesiąca udaje mu się sprzedać średnio 40 komputerów oraz 20
zestawów oprogramowania z odchyleniem standardowym odpowiednio 10 i 5. Współczynnik korelacji pomiędzy liczbą sprzedanych komputerów i liczbą sprzedanych zestawów oprogramowania wynosi 0,5.
Obliczyć średnie miesięczne wynagrodzenie tego sprzedawcy oraz odchylenie standardowe miesięcznego wynagrodzenia.
8. Pewna firma budowlana prowadzi działalność w Warszawie oraz poza Warszawą. Badania dotyczące działalności firmy w ciągu ostatnich lat pokazały, że rozkład prawdopodobieństwa liczby inwestycji prowadzonych jednocześnie w Warszawie oraz poza Warszawą można przedstawić tabelarycznie:
Poza Warszawą
0
1
2
W Warszawie
0
0,1
0,3
0,2
1
0,2
0,1
0,1
a) Czy liczby inwestycji prowadzonych jednocześnie w Warszawie i poza są niezależne?
b) Czy liczby inwestycji w Warszawie i poza są skorelowane i w jakim stopniu?
c) Jaka jest wartość oczekiwana i wariancja łącznej liczby inwestycji prowadzonych jednocześnie w Warszawie i poza Warszawą?