K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
1
MPiS30 W05: ZMIENNE LOSOWE II
1.
Zmienna losowa typu ciągłego
2.
Definicja i własności gęstości prawdopodobieństwa
Przykład 1
3.
Gęstość a dystrybuanta i zastosowanie gęstości
4.
Charakterystyki funkcyjne i parametry
5.
Przykłady rozkładów
6.
Funkcja kwantylowa i jej zastosowania
7.
Funkcja borelowska
8.
Twierdzenie o dystrybuancie przekształconej zm. l.
Przykład 2, Przykład 3
9.
Definicja i własności splotu dystrybuant
Przykład 4
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
2
1. Zmienna losowa typu ciągłego
Zm. l. X o wartościach w R nazywamy
zm. l.
typu
ciągłego
(
continuous random variable
), jeśli jej CDF F jest funkcją ab-
solutnie ciągłą, tj. istnieje taka funkcja f
≥
0, że dla każdego
x
∈
R
∫
∞
−
=
x
du
u
f
x
F
)
(
)
(
.
Zm. l. typu ciągłego przyjmuje nieprzeliczalnie wiele war-
tości, a prawd. zdarzenia, że przyjmie szczególną wartość x
(dla dowolnego x
∈
R) wynosi zero, tj. P(X
=
x)
=
0.
Zm. l. typu ciągłego jest często modelem pomiaru wielkości
fizycznej.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
3
2. Definicja i własności gęstości prawdop.
Gęstością prawdop.
(krótko gęstością, ang.
probability
density function
−
PDF) zm. l. X ciągłej, nazywamy funkcję
f(x) całkowalną w sensie Lebesque’a, która występuje pod
znakiem całki określającej jej dystrybuantę.
Krzywą gęstości
nazywamy wykres gęstości prawd. f(x).
Jeżeli gęstość jest różna od zera na zbiorze W, to mówimy, że
rozkład jest skoncentrowany na tym zbiorze.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
4
Własności.
Funkcja f(x) jest gęstością pewnej ciągłej zm. l.
wtedy i tylko wtedy, gdy ma dwie własności:
1. f (x)
≥
0 dla x
∈
R
−
jest nieujemna,
2.
1
)
(
=
∫
+∞
∞
−
dx
x
f
−
jest unormowana.
Przykład 1. Sprawdzić, czy funkcja
]
1
,
0
[
]
1
,
0
[
dla
dla
0
)
1
(
)
(
∉
∈
−
=
x
x
x
cx
x
f
, gdzie c jest pewną stałą.
jest gęstością pewnej zm. l. Jeżeli jest gęstością, to wyznaczyć
CDF. Sporządzić wykresy funkcji PDF i CDF.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
5
Rozwiązanie.
Aby podana funkcja była gęstością pewnej zm.
l. potrzeba i wystarcza, by miała dwie podane własności.
Własność nieujemności posiada dla stałej c > 0. Stałą c wy-
znaczamy z własności unormowania
6
0
1
3
2
)
(
)
1
(
)
(
1
3
2
1
0
2
1
0
c
x
x
c
dx
x
x
c
dx
x
x
c
dx
x
f
=
−
=
−
=
−
=
=
∫
∫
∫
∞
+
∞
−
.
Tylko dla c
=
6 podana funkcja jest PDF pewnej zm. l.
CDF wyznaczymy z definicji zm. l. typu ciągłego.
Rozważamy trzy przedziały:
I. Dla x
≤
0, oczywiście F(x)
=
0,
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
6
II. Dla x
∈
[0, 1],
3
2
3
2
0
0
2
3
0
3
2
6
)
1
(
6
)
(
)
(
x
x
x
u
u
du
u
u
du
u
f
x
F
x
x
−
=
−
=
−
=
=
∫
∫
.
III. Dla x > 1, F(x)
=
1.
Stąd
,
.
1
]
1
,
0
(
,
0
dla
dla
dla
1
2
3
0
)
(
3
2
>
∈
≤
−
=
x
x
x
x
x
x
F
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
7
3. Gęstość a dystrybuanta i zastosowanie gęstości
Jeżeli istnieje gęstość f dla ciągłej zm. l. X o dystrybuancie
F, to w punktach różniczkowalności F
dx
x
dF
x
f
)
(
)
(
=
.
Zastosowanie gęstości.
Jeżeli zm. l. X ma PDF f, to dla każ-
dego przedziału (a, b)
⊆
R można obliczyć prawdop. zdarzeń
a < X < b, a
≤
X < b, a < X
≤
b, a
≤
X
≤
b, jako całkę
dx
x
f
b
a
∫
)
(
.
Graficzną interpretacją tej całki jest pole obszaru ograniczo-
nego wykresem funkcji f(x), osią odciętych i prostymi x
=
a, b.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
8
4. Charakterystyki funkcyjne i parametry
Charakterystyką funkcyjną
zm. l. X nazywamy każdą
funkcję w pełni charakteryzującą jej rozkład. Należą do nich
CDF i PMF dla zm. l. typu dyskretnego oraz CDF i PDF dla
zm. l. typu ciągłego.
Parametrem rozkładu
zm. l. X nazywamy wielkość stałą
od której zależy jej rozkład. Najczęściej stosowane rozkłady
zależą od jednego lub dwóch parametrów rzeczywistych.
Zapis
α∈
J, gdzie J
⊆
R oznacza, że parametr
α
jest do-
wolną stałą ze zbioru J.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
9
Jeśli CDF F(x) i PDF (lub PMF) f (x) zm. l. X zależą od
parametrów
α
i
β
, to piszemy
F(x
α
,
β
) i f (x
α
,
β
),
z podaniem zakresów wartości parametrów.
Zapis ten podkreśla, że funkcje CDF, PDF i PMF są rodzina-
mi funkcji zależnymi od parametrów.
Ustalenie wartości parametrów jest zadaniem statystyki ma-
tematycznej.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
10
5. Przykłady rozkładów
a)
PMF
rozkładu dwumianowego
ma postać
,
)
1
(
)
,
(
x
n
x
p
p
x
n
p
n
x
f
−
−
=
dla x
=
0, 1,..., n oraz n
∈
N, 0 < p < 1.
Jeżeli zm. l. X ma rozkład dwumianowy (binomial distribu-
tion), to stosujemy oznaczenie X~B(n; p). Rozkład ten jest
dwuparametrowym rozkładem typu dyskretnego.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
11
b)
PMF
rozkładu hipergeometrycznego:
−
−
=
n
N
x
n
M
N
x
M
n
M
N
x
f
)
,
,
(
dla x
=
max{0, n
−
(N
−
M)},…, min{M, n}
oraz N
∈
N; M
=
0, 1,…, N; n
=
1, 2,…, N.
c) PMF
rozkładu Poissona
:
!
)
(
x
e
x
f
x
λ
−
λ
=
λ
dla x
=
0, 1, 2,... oraz
λ
> 0
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
12
d) PDF
rozkładu normalnego
ma postać
σ
−
−
π
σ
=
σ
2
2
2
)
(
exp
2
1
)
,
(
m
x
m
x
f
, dla x
∈
R oraz m
∈
R,
σ
>0;
Zapis X~N(m,
σ
) oznacza, ze zm. l. X ma rozkład normalny z
parametrami m i
σ
.
e) CDF
rozkładu wykładniczego
ma postać
0
0
dla
dla
,
0
,
1
)
(
<
≥
−
=
λ
λ
−
x
x
e
x
F
x
(gdzie
λ
> 0)
Zapis X~Exp(
λ
) oznacza, że zm. l. X ma rozkład wykładniczy
z parametrem
λ
.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
13
6. Funkcja kwantylowa i jej zastosowania
Niech F będzie CDF zm. l. X. Funkcją kwantylową (ICDF)
nazywamy funkcję F
−
1
określoną dla p
∈
(0, 1) wzorem
F
−
1
(p)
=
inf {x
∈
R: F(x)
≥
p}.
Jeżeli F jest funkcją ciągłą i rosnącą, to F
−
1
jest funkcją od-
wrotną w zwykłym sensie (inverse cumulative distribution
function) i dla danego p funkcja kwantylowa podaje wartość x
spełniającą warunek:
P(X
≤
x)
=
p.
Wartość x
=
F
−
1
(p) oznaczamy x
p
i nazywamy kwantylem
rzędu p zm. l. X.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
14
Kwantyle rzędów 0,25; 0,50 i 0,75 nazywamy kwartylami,
przy czym kwantyl x
0,5
nazywamy kwartylem środkowym lub
medianą (ang. median), natomiast kwantyle x
0,25
i x
0,75
odpo-
wiednio kwartylem dolnym i górnym.
Zastosowania:
1. Kwantyle rozkładów zm. l. mają zastosowanie w statystyce
m. in. do konstrukcji przedziałów ufności dla nieznanych pa-
rametrów oraz do wyznaczania obszarów krytycznych przy
testowaniu hipotez statystycznych.
2. Jeżeli F jest ciągłą dystrybuantą, to zm. l. U
=
F(X) ma
rozkład jednostajny U(0, 1).
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
15
Jeżeli F(y) jest silnie rosnącą dystrybuantą dla 0 < F(y) < 1,
ponadto jeżeli zm. l. U ma rozkład jednostajny na [0; 1], to
Y
=
F
−
1
(U)
ma rozkład o dystrybuancie F(y). Stąd do symulacji zm. l. z
daną dystrybuantą F wystarczy wyznaczyć wartości
Y
=
F
−
1
(RND), gdzie
RND jest generatorem liczb losowych z przedziału (0, 1).
7. Funkcja borelowska
Czy znając rozkład zm. l. X można znaleźć rozkład zm. l.
Y będącej funkcją zm. l. X ?
Tak, jeśli Y jest funkcją borelowską zm. l. X.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
16
Definicja.
Funkcję h: R → R nazywamy funkcją borelow-
ską, jeśli przeciwobraz dowolnego zbioru borelowskiego
B
∈
B(R) jest zbiorem borelowskim.
Rodzina B(R) zbiorów borelowskich na prostej jest gene-
rowana przez wszystkie
przedziały otwarte
(równoważnie:
domknięte) o końcach wymiernych.
Twierdzenie (o funkcji borelowskiej)
Niech dana będzie przestrzeń probabilistyczna (
Ω
, B, P).
Jeżeli funkcja X:
Ω
→
R jest zm. l., a funkcja h: R
→
R jest
funkcją borelowską, to zm. l. jest również złożenie funkcji
Y
=
h(X):
Ω
→
R, określone wzorem:
∀
ω∈Ω
Y(
ω
)
=
h(X(
ω
)).
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
17
Dowód.
Wystarczy zauważyć, że przeciwobraz zbioru bore-
lowskiego jest zdarzeniem. Niech A
∈
B(R), wówczas
(h
o
X)
−
1
(A)
=
{
ω∈Ω
: h(X(
ω
))
∈
A}
=
{
ω∈Ω
: X(
ω
)
∈
h
−
1
(A)}
Ale przeciwobraz h
−
1
(A) jest zbiorem borelowskim w R
n
,
więc przeciwobraz X
−
1
(h
−
1
(A))
∈
B, czyli jest zdarzeniem.
Spotykane w praktyce funkcje są na ogół funkcjami bore-
lowskimi. W szczególności borelowskimi są wszystkie funk-
cje ciągłe. Nazwa zbiorów borelowskich pochodzi od Borela
1
.
1
Émile Borel ( 1871
−
1956)
−
francuski matematyk.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
18
8. Tw. o dystrybuancie przekształconej zm. l.
Jeżeli F
X
jest dystrybuantą zm. l. X oraz Y
=
h(X), gdzie h jest
funkcją borelowską, to
F
Y
(y)
=
P(Y
≤
y)
=
P(h(X)
≤
y)
=
P(X
∈
h
−
1
(
−∞
, y]).
Wniosek 1.
Niech X będzie ciągłą zm. l., a h(x) silnie rosnącą
(lub silnie malejącą) funkcją określoną na zbiorze wartości
zm. l. X. Ponadto niech Y
=
h(X) oraz F
X
i F
Y
niech będą dys-
trybuantami zm. l. X i Y.
Wówczas zachodzi związek między nimi
F
Y
(y)
=
F
X
(h
−
1
(y)), (lub F
Y
(y)
=
1
−
F
X
(h
−
1
(y))).
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
19
Dowód.
Ponieważ h jest funkcją silnie rosnącą na wartościach
X, więc zdarzenia (X
≤
h
−
1
(y)) i (h(X)
≤
y) są równe.
Stąd otrzymujemy:
F
Y
(y)
=
P(Y
≤
y)
=
P(h(X)
≤
y)
=
P(X
≤
h
−
1
(y))
=
F
X
(h
−
1
(y)).
Jeżeli h(x) jest funkcją silnie malejącą na wartościach X, to
F
Y
(y)
=
P(Y
≤
y)
=
P(h(X)
≤
y)
=
1
−
P(X
≤
h
−
1
(y))
=
1
−
F
X
(h
−
1
(y)).
This completes the proof.
Wniosek 2.
Jeśli zm. l. X ma PDF/PMF, to Y
=
h(X) ma ją
również.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
20
Wniosek 3.
Jeżeli X jest zm. l. absolutnie ciągłą o gęstości f
X
oraz funkcja h: R
→
R jest funkcją ściśle monotoniczną i
różniczkowalną, to gęstość zmiennej losowej Y
=
h(X) jest
określona wzorem
f
Y
(y)
=
f
X
(h
−
1
(y))
⋅
dh
−
1
/dy .
Wniosek 4.
Twierdzenie i wnioski 1, 2, 3 informują jak wy-
znaczać analitycznie lub jak symulować komputerowo zm. l.
Y za pomocą zm. l. X o danej dystrybuancie, gęstości lub
funkcji prawdop.
Na przykład, jeżeli F
X
jest dystrybuantą zm. l. X oraz
Y
=
aX
+
b (a
≠
0), to
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
21
.
0
,
0
dla
dla
1
)
(
<
>
−
−
−
−
=
a
a
a
b
y
F
a
b
y
F
y
F
X
X
Y
Jeżeli zm. l. X jest absolutnie ciągła, to poprzez zróżniczko-
wanie dystrybuanty F
Y
(y) otrzymamy gęstość f
Y
zm. l. Y
.
,
1
)
(
R
∈
−
=
y
a
b
y
f
a
y
f
X
Y
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
22
Dowód.
Jeżeli a > 0, to
F
Y
(y)
=
P(Y
≤
y)
=
P(aX
+
b
≤
y)
−
=
−
≤
=
a
b
y
F
a
b
y
X
X
P
.
Natomiast jeśli a < 0, to
F
Y
(y)
=
P(Y
≤
y)
=
P(aX
+
b
≤
y)
−
−
−
=
−
<
−
=
−
≥
=
a
b
y
F
a
b
y
X
a
b
y
X
X
1
P
1
P
.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
23
Przykład 2. Wyznaczyć rozkład zm. l . Y
=
2X
−
1, jeżeli:
a)
Rozkład zm. l. X dany jest poprzez PMF
=
p
q
f
X
1
0
.
b)
Zm. l. X ma rozkład jednostajny na przedziale (0, 1).
c)
Zm. l. X ma rozkład normalny, tj. X~N(m,
σ
).
Rozwiązanie.
a) Zm. l. Y przyjmuje tylko dwie wartości
−
1 i
1, stąd PMF dla Y
−
=
p
q
f
Y
1
1
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
24
c)
CDF zm. l. X o rozkładzie jednostajnym na (0, 1):
,
1
,
1
0
,
0
dla
dla
dla
,
1
,
,
0
)
(
≥
<
≤
<
=
x
x
x
x
x
F
X
więc
,
.
1
1
1
,
1
dla
dla
dla
,
1
,
2
/
)
1
(
,
0
2
1
)
(
≥
<
≤
−
−
<
+
=
+
=
y
y
y
y
y
F
y
F
X
Y
Czyli Y ma rozkład jednostajny na przedziale (
−
1, 1).
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
25
c) Ponieważ X~N(m,
σ
), więc PDF f
X
dla x
∈
R ma postać
0
,
,
2
)
(
exp
2
1
)
,
;
(
2
2
>
σ
∈
σ
−
−
π
σ
=
σ
R
m
m
x
m
x
f
X
.
Z zależności
R
∈
+
=
y
y
f
y
f
X
Y
,
2
1
2
1
)
(
,
otrzymujemy
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
26
σ
−
+
−
π
σ
=
2
2
2
2
1
exp
2
1
2
1
)
(
m
y
y
f
Y
(
)
σ
−
−
−
π
σ
=
2
2
)
2
(
2
)
1
2
(
exp
2
2
1
m
y
.
Stąd przyjmując podstawienia m
1
=
2m
−
1,
σ
1
=
2
σ
,
0
,
,
2
)
(
exp
2
1
)
,
;
(
1
1
2
1
2
1
1
1
1
>
σ
∈
σ
−
−
π
σ
=
σ
R
m
m
y
m
y
f
Y
,
czyli Y~N(2m
−
1, 2
σ
).
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
27
Przykład 3. Niech F
X
będzie dystrybuantą rzeczywistej zm. l.
X typu ciągłego. Wyznaczyć dystrybuantę zm. l. Y
=
X
2
.
Rozwiązanie.
F
Y
(y)
=
P(X
2
≤
y).
Jeżeli y < 0, to P(X
2
≤ y)
=
0, więc F
Y
(y)
=
0, jeśli y < 0.
Jeżeli y ≥ 0, to P(X
2
≤
y)
=
P(X
≤√
y)
=
P(
−√
y
≤
X
≤
√
y),
więc F
Y
(y)
=
F
X
(
√
y)
−
F
X
(
−√
y), jeśli y
≥
0.
Wniosek. Jeśli chcemy znaleźć rozkład zm. l. związanej funk-
cyjnie ze zm. l. o danej dystrybuancie, powinniśmy wyzna-
czyć jej dystrybuantę.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
28
Szczególnym przypadkiem uogólnienia funkcji wielu zm. l.
jest ich suma. Poświęcamy jej ostatni punkt tego wykładu.
9. Definicja i własności splotu dystrybuant
Niech F
X
i F
Y
będą CDF niezależnych zm. l. X i Y. Funkcję
∫
∞
∞
−
−
=
)
(
)
(
)
(
y
dF
y
z
F
z
H
Y
X
nazywamy splotem dystrybuant F
X
i F
Y
i oznaczamy F
X
∗
F
Y
.
Dystrybuanta F
Z
sumy dwóch niezależnych zm. l. X i Y
jest splotem dystrybuant F
X
i F
Y
tj. jeśli Z
=
X
+
Y, to
F
Z
=
F
X
∗
F
Y
.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
29
Własności splotu:
1.
Splot dystrybuant jest przemienny, tj. F
X
∗
F
Y
=
F
Y
∗
F
Y
.
2.
Jeżeli zm. l. X i Y mają rozkłady ciągłe i dane PDF f
X
i f
Y
,
to Z
=
X
+
Y też ma rozkład ciągły o PDF
∫
∫
∞
∞
−
∞
∞
−
−
=
−
=
dx
x
f
x
z
f
dy
y
f
y
z
f
z
f
X
Y
Y
X
Z
)
(
)
(
)
(
)
(
)
(
Dowód własności 2. wynika z twierdzenia Fubiniego dla splo-
tu dystrybuant.
Przykład 4. (Całkowity czas oczekiwania). Pewni użytkow-
nicy publicznej komunikacji miejskiej w celu dotarcia do
miejsca przeznaczenia muszą podróżować dwoma środkami
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
30
lokomocji, dajmy na to autobusem i tramwajem. Użytkowni-
cy ci część tej podróży są zmuszeni spędzić na przystankach
w oczekiwaniu na przybycie tych pojazdów. Niech poszcze-
gólne czasy oczekiwania X i Y mają rozkłady wykładnicze z
dodatnimi parametrami
λ
1
i
λ
2
. Zakładając niezależność cza-
sów oczekiwania X i Y, wyznaczyć rozkład całkowitego czasu
oczekiwania na przystankach dla danej grupy użytkowników.
Rozwiązanie. Ponieważ zm. l. X i Y są niezależne, więc gę-
stość zm. l. Z
=
X
+
Y możemy wyznaczyć z równości
∫
∞
∞
−
−
=
dx
x
z
f
x
f
z
f
Y
X
Z
)
(
)
(
)
(
,
dla
0
,
)
(
1
1
≥
λ
=
λ
−
x
e
x
f
x
X
oraz
0
,
)
(
2
2
≥
λ
=
λ
−
y
e
y
f
y
Y
.
K. J. Andrzejczak, MPiS30 W05: Zmienne losowe II
31
Ponieważ f
X
(x) przyjmuje wartość zero dla ujemnych x, więc
.
)
(
)
(
0
1
1
dx
x
z
f
e
z
f
Y
x
Z
−
λ
=
∫
∞
λ
−
Ponieważ f
Y
(y) jest równe zeru dla ujemnych y, więc f
Y
(z
−
x)
ma wartość zero dla ujemnych z
−
x, czyli dla x większych od
z. Zatem dla
λ
1
=
λ
2
=
λ
, i z
≥
0, f
Z
(z
λ
)
=
λ
2
ze
−λ
z
, a dla
λ
1
≠λ
2
∫
∫
λ
−
λ
λ
−
−
λ
−
λ
−
λ
λ
=
λ
λ
=
λ
λ
z
x
z
x
z
z
x
Z
dx
e
e
dx
e
e
z
f
0
)
(
2
1
)
(
2
0
1
2
1
1
2
2
2
1
)
,
(
.
0
),
(
2
1
1
2
2
1
≥
−
λ
−
λ
λ
λ
=
λ
−
λ
−
z
e
e
z
z