dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 1
5. Rozkład funkcji zmiennej losowej
i dwuwymiarowe zmienne losowe
5.1. Rozkład funkcji zmiennej losowej
• Mówimy, że g jest funkcją borelowską, jeśli dla każdego a∈ℝ zbiór
{ x : g ( x)< a} jest zbiorem borelowskim (elementem σ -ciała generowanego przez zbiory otwarte).
• W szczególności każda funkcja ciągła na pewnym przedziale jest w tym przedziale funkcją borelowską.
• Niech zmienna losowa Y będzie pewną funkcją zmiennej losowej X, tzn. dla każdego ω∈Ω mamy Y (ω)= g ( X (ω)) , gdzie g jest funkcją borelowską.
• Znając rozkład prawdopodobieństwa zmiennej losowej X, możemy wyznaczyć rozkład prawdopodobieństwa zmiennej losowej Y.
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 2
Przykład 5.1.
Niech Y = X 2+1, gdzie X jest zmienną losową o rozkładzie 1
1
1
P( X =−1)= , P ( X =0)= , P ( X =1)=
.
4
4
2
Znaleźć rozkład zmiennej losowej Y i obliczyć EY.
Rozkład zmiennej losowej Y:
1
P( Y =1)= P ( X =0)= ,
4
1 1 3
P( Y =2)= P( X =−1∨ X =1)= + = .
4 2
4
1
3 7
EY =1⋅ +2⋅ =
lub
4
4 4
1
1
1
7
EY = E ( X 2+1)= EX 2+1=(−1)2⋅ +02⋅ +12⋅ +1= .
4
4
2
4
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 3
Twierdzenie 5.1.
Jeżeli X jest zmienną losową ciągłą o gęstości f X skoncentrowanej na przedziale ( a , b) oraz y= g ( x) jest funkcją ściśle monotoniczną klasy C 1 o pochodnej g ' ( x)≠0 w tym przedziale, przy czym x= h( y) jest funkcją odwrotną do funkcji y= g ( x) , to gęstość f Y zmiennej losowej ciągłej Y = g ( X ) wyraża się wzorem f ( y )= f ( h( y))∣ h ' ( y)∣
Y
X
dla y∈( c , d ) oraz f Y ( y )=0 dla pozostałych y, gdzie c= min( c d
d
g
g
1,
1) , d = max ( c 1,
1) , c 1= lim
( x) , d
( x).
x → a+
1=lim x→ b-
Przykład 5.2.
Niech X będzie zmienną losową typu ciągłego o gęstości f X przyjmującą wartości z przedziału (−∞ , +∞). Wyznaczyć gęstość zmiennej losowej Y = aX + b , a≠0.
Funkcja liniowa y= g ( x)= ax+ b spełnia założenia twierdzenia 5.1. (dla a > 0 funkcja jest rosnąca, dla a < 0 funkcja jest malejąca).
1
1
Funkcja odwrotna x= h( y)= ( y− b) , x ' = h' ( y)=
a
a
Zatem f ( y )= f
, y∈ℝ .
Y
X ( y− b ) 1
a
∣ a∣
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 4
Zauważmy, że wzór ten możemy także uzyskać w następujący sposób.
W przypadku a > 0 mamy
y
F
− b
Y ( y )= P ( Y ≤ y )= P ( aX + b≤ y )= P ( X ≤
)= F
)
a
X ( y− b
a
Ponieważ funkcja F
,
X jest różniczkowalna w punktach ciągłości
f X więc w tych
punktach
d
d
1
f ( y )=
F ( y)=
F
f
Y
)=
)
dy Y
dy
X ( y− b
a
a X ( y− b
a
W przypadku a < 0 mamy
y
F
− b
( y)= P ( Y ≤ y )= P ( aX + b≤ y)= P
Y
( X≥ )=1− F
)
a
X ( y− b
a
d
d
1
f
F
f
Y ( y )=
(1− F
) =−
)
dy Y ( y)= dy
X ( y− b
a
a X ( y− b
a
1
Zatem otrzymujemy, że f ( y )=
f
Y
).
∣ a∣ X ( y− b
a
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 5
5.2. Dwuwymiarowe zmienne losowe
• Niech (Ω , Α , P) będzie przestrzenią probabilistyczną, w której jest określonych n zmiennych losowych X X
1,
2, , X n
X :
i Ω → R , i=1, 2, , n .
• Wówczas dla każdego ∈ możemy rozpatrywać układ
X = X 1 , X 2 , , X n
• Układ ten nazywamy wektorem losowym ( n-wymiarowym).
• Dystrybuantą wektora losowego
X = X X
1,
2, , X n nazywamy funkcję
F : Rn R daną wzorem:
F x x , x = P
x , X x , , X x
1,
2,
n
{∈ : X 1
1
2
2
n
n } .
• Wektor losowy X = X X
1,
2, , X n nazywamy wektorem losowym o rozkładzie
dyskretnym jeśli przyjmuje skończoną bądź przeliczalną liczbę wartości.
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 6
• Wektor losowy X = X X
1,
2, , X n nazywamy wektorem losowym o rozkładzie
(absolutnie) ciągłym, jeśli istnieje nieujemna funkcja n zmiennych f x , x 1
2, , xn
taka, że
x
x
x
1
2
n
F x x
f
, t ,
dt
.
1,
2, , x n=∫ ∫ ∫
t 1 2 ,tn dt 1 2 dtn
−∞ −∞
−∞
• Niech X , Y będzie dwuwymiarową zmienną losową dyskretną (skokową), czyli zmienne losowe X i Y mają skończony lub przeliczalny zbiór wartości.
• Rozkładem łącznym dyskretnej zmiennej dwuwymiarowej X , Y nazywa się zbiór prawdopodobieństw:
P X = x ,Y
i
= y j= pij dla i=1,2,…( r) , , j=1,2,…( s).
• Prawdopodobieństwa pij spełniają warunek: ∑ ∑ pij=1 .
i
j
• Dystrybuantę dwuwymiarowej zmiennej losowej dyskretnej określa się wówczas wzorem:
F x , y= P X x ,Y y= ∑ ∑ pij .
x x y y
i
j
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 7
• Rozkład dwuwymiarowej zmiennej losowej dyskretnej zwykle jest zapisywany w postaci tablicy, nazywanej tablicą korelacyjną.
y
y
1
2
ys
∑
x
p
p
p
1
11
12
p 1s
1⋅
x
p
p
p
2
21
22
p 2s
2⋅
⋮
⋮
⋮
⋮
⋮
⋮
x
p
p
p
r
r1
r2
prs
r⋅
∑
p
p
1
⋅1
⋅2
p⋅ s
• Rozkładem brzegowym dyskretnej zmiennej losowej X nazywamy rozkład s
prawdopodobieństwa : P( X = x
p , dla i
i )= pi =∑
=1, 2, , r .
⋅
ij
j=1
• Podobnie rozkładem brzegowym dyskretnej zmiennej losowej Y nazywamy rozkład r
prawdopodobieństwa: P Y = y
p dla j
j = p
=1, 2, , s .
⋅ j=∑
ij
i=1
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 8
• Rozkładem warunkowym zmiennej losowej dyskretnej X pod warunkiem Y = y , j
j=1, 2,… , s , nazywamy rozkład prawdopodobieństwa:
P( X = x ,Y = y
p
P( X = x
i
j)
ij
i∣ Y = y j )=
=
, dla i=1, 2,… , r .
P ( Y = y )
p
j
⋅ j
• Rozkładem warunkowym zmiennej losowej dyskretnej Y pod warunkiem X = x , i
i=1, 2,… , r , nazywamy rozkład prawdopodobieństwa:
P( X = x ,Y = y
p
P( Y = y
i
j)
ij
j∣ X = xi )=
=
, dla j=1,2,… , s .
P ( X = x )
p
i
i⋅
• Zmienne losowe dyskretne X i Y są niezależne jeżeli P X = x ,Y
i
= y j= P X = xi⋅ P Y = y j , czyli pij= pi⋅ p
⋅
⋅ j ,
dla wszystkich i=1, 2, , r , j=1,2, , s .
• Jeżeli zmienne losowe X i Y są niezależne, to oczywiście P X = xi∣ Y = y j = P X = xi= pi , dla i
⋅
=1, 2, , r .
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 9
• Niech teraz dwuwymiarowa zmienna losowa X , Y będzie zmienną losową ciągłą.
• Funkcja gęstości
f x , y dwuwymiarowej zmiennej losowej ciągłej X , Y
łącznego rozkładu jest funkcją spełniającą warunki:
∞
∞
f x , y0 , ∫ ∫ f ( x , y) dxdy=1 .
−∞ −∞
• Dystrybuantą dwuwymiarowej zmiennej losowej ciągłej X , Y nazywamy funkcję określoną za pomocą wzoru:
x
y
F x , y= P X x ,Y y =∫ ∫ f s ,t dsdt .
−∞ −∞
• Rozkładami brzegowymi f 1 x , f 2 y ciągłych zmiennych losowych X i Y
∞
∞
nazywa się następujące funkcje: f
f
f
1 x = ∫
x , y dy , f 2 y=∫ x , y dx .
−∞
−∞
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 10
• Warunkowe funkcje gęstości zmiennych losowych ciągłych X i Y są określone f ( x , y)
wzorami: f ( x∣ y )=
,
f
dla f
( y)
2 ( y )>0
2
f ( x , y)
oraz f ( y∣ x )=
,
f
dla f
( x)
1( x )>0 .
1
• Zmienne losowe ciągłe X i Y są niezależne jeżeli: f x , y= f 1 x⋅ f 2 y , dla każdej pary liczb rzeczywistych x , y .
• Oczywiście dla dowolnych niezależnych zmiennych losowych X i Y mamy: F
x , y = P X x , Y y = P X x ⋅ P Y y = F
X ,Y
X x ⋅ F Y y .
• Momenty zwykłe dwuwymiarowej zmiennej losowej X , Y definiujemy następująco: α rs= E ( X r Y s) , gdzie liczby r , s∈ℕ.
• Jeżeli X , Y jest zmienną losową dyskretną, to: α
xr ys p .
rs=∑ ∑
i
j
ij
i
j
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 11
• Jeżeli X , Y jest zmienną losową ciągłą o funkcji gęstości prawdopodobieństwa
∞
∞
f ( x , y) , to α =∫ ∫ xr ys f ( x , y) dxdy .
rs
−∞ −∞
• Najczęściej wykorzystuje się momenty zwykłe rzędu pierwszego (α10= E ( X 1 Y 0)= EX , α01= E ( X 0 Y 1)= EY ) oraz momenty zwykłe rzędu drugiego (α20= E ( X 2 Y 0)= EX 2 , α11= E ( X 1 Y 1)= E ( XY ) , α02= E ( X 0 Y 2)= EY 2)
• Momenty centralne definiujemy w następujący sposób:
μ rs= E( X − EX ) r( Y − EY ) s .
• W szczególności μ20= E ( X − EX )2= D 2 X , μ02= E ( Y − EY )2= D 2 Y.
• Kowariancja zmiennych losowych X , Y jest określona za pomocą wzoru: Cov ( X , Y )=μ = E (( X − EX )( Y − EY ))= E ( XY )− EX⋅ EY
11
.
• Zauważmy, ze dla niezależnych zmiennych losowych X i Y kowariancja wynosi 0.
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 12
• Ponadto Cov X , X = VarX , Var X Y = VarX VarY 2Cov X , Y .
• Współczynnik korelacji liniowej między zmiennymi X i Y jest określony wzorem: Cov ( X , Y )
ρ=ρ( X , Y )=
.
σ X σ Y
• Zachodzi nierówność: −1 X , Y 1
• Współczynnik korelacji mierzy „siłę” zależności liniowej między zmiennymi losowymi X i Y.
• Jeżeli ρ( X ,Y )=0, czyli gdy Cov ( X ,Y )=0, to zmienne losowe X i Y nazywamy nieskorelowanymi.
• Oczywiście zmienne losowe niezależne są nieskorelowane (nie są skorelowane).
• Jeżeli ρ( X ,Y )=1, to zmienne losowe X i Y związane są funkcyjnie, a zależność między nimi ma charakter liniowej funkcji rosnącej.
• Jeżeli ρ( X ,Y )=−1, to zmienne losowe X i Y związane są funkcyjnie, a zależność między nimi ma charakter liniowej funkcji malejącej.
• Jeżeli 0<∣ρ( X ,Y )∣<1, to istnieje współzależność między zmiennymi losowymi X i Y, ale nie ma ona charakteru funkcyjnego. Im współzależność ta jest silniejsza, tym ρ( X ,Y ) bardziej odbiega od zera.