ZMIENNE LOSOWE CIĄGŁE
Maciej Patan
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
Metody analizy danych
Zmienne losowe
Zmienne losowe ciągłe
- mogą przyjmować wartości z
nieskończonego i nieprzeliczalnego zbioru (np. przedział liczb
rzeczywistych)
Przykłady
:
I
prędkość samochodu na autostradzie,
I
średnia temperatura latem,
I
amplituda sygnału analogowego,
I
częstotliwość fali elektromagnetycznej,
I
czas przeżywalności po przeszczepie,
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
1
Metody analizy danych
Zmienne losowe
x
f x
X
( )
a
A
W
b
zdarzenie A Þ XÎBÌR
np. {aXb}
P (X ∈ B) =
Z
B
f
X
(x) dx,
∀B ⊂ R
w szczególności dla B = [a, b]:
P (a ¬ X ¬ b) =
Z
b
a
f
X
(x) dx
oraz B = a
P (X = a) =
Z
a
a
f
X
(x) dx = 0
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
2
Metody analizy danych
Zmienne losowe
Funkcja
gęstości rozkładu prawdopodobieństwa
f
X
(x):
∀x, f
X
(x) 0;
Z
∞
−∞
f
X
(x) dx = P (−∞ ¬ X ¬ ∞) = 1
Uwaga!
: Wartość f
X
(x) nie oznacza prawdopodobieństwa
żadnego szczególnego zdarzenia! W szczególności, może być
f
X
(x) > 1!
Przykład
: GRP może być dowolnie duża:
f
X
(x) =
1
2
√
x
,
0 < x ¬ 1
0,
w przeciwnym razie
Z
∞
−∞
f
X
(x) dx =
Z
1
0
1
2
√
x
dx =
√
x
1
0
= 1
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
3
Metody analizy danych
Zmienne losowe
Wartość oczekiwana
E(X) =
Z
∞
−∞
xf
X
(x) dx
Przykłady
:
1) Dla rozkładu f
X
(x) =
1
2
√
x
,
0 < x ¬ 1
0,
w przeciwnym razie
E(X) =
Z
1
0
x
2
√
x
dx =
1
3
x
3/2
1
0
=
1
3
2) Dla rozkładu f
X
(x) =
1
x
2
,
1 ¬ x
0,
x < 1
E(X) =
Z
∞
1
x
x
2
dx = ln(x)
∞
1
= ∞
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
4
Metody analizy danych
Zmienne losowe
Ogólnie
E[g(X)] =
Z
∞
−∞
g(x)f
X
(x) dx
Wariancja
var(X) = E
h
X − E(X)
2
i
=
Z
∞
−∞
(X − E(X))
2
f
X
(x) dx
1)
var(X) = E(X
2
) − (E(X))
2
> 0,
2)
E(aX + b) = a E(X) + b,
3)
var(X) = a
2
var(X).
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
5
Metody analizy danych
Zmienne losowe
Rozkłady zmiennej losowej ciągłej
I. Rozkład jednostajny (prostokątny, równomierny)
Przykład
: Hazardzista kręci kołem fortuny, wyskalowanym w
sposób ciągły między 0 a 1. Zakładając, że wszystkie
podprzedziały tej samej długości są jednakowo
prawdopodobne, mamy
f
X
(x) =
c,
gdy 0 ¬ x ¬ 1,
0,
w przeciwnym razie
Jak określić c?
1 =
Z
∞
−∞
f
X
(x) dx =
Z
1
0
c dx = c
Z
1
0
dx = c
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
6
Metody analizy danych
Zmienne losowe
Ogólnie:
f
X
(x) =
(
1
b−a
,
gdy a ¬ x ¬ b,
0,
w przeciwnym razie
a
b
0
1/(b−a)
E(X) =
Z
∞
−∞
xf
X
(x) dx =
Z
b
a
x
1
b − a
dx =
1
2(b − a)
x
2
b
a
=
a + b
2
E(X
2
) =
Z
b
a
x
2
b − a
dx =
1
3(b − a)
x
3
b
a
=
a
2
+ ab + b
2
3
var(X) = E(X
2
) − (E(X))
2
=
(b − a)
2
12
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
7
Metody analizy danych
Zmienne losowe
II. Rozkład wykładniczy (λ > 0)
f
X
(x) =
λe
−λx
,
x 0
0,
w przeciwnym razie
I
używany do modelowania czasu oczekiwania na
nastąpienie danego zjawiska (wystąpienia wypadku,
przepalenia się żarówki, rozpadu promieniotwórczego itd.)
Z
∞
−∞
f
X
(x) dx =
Z
∞
0
λe
−λx
dx = −e
−λx
∞
0
= 1
E(X) =
Z
∞
0
xλe
−λx
dx =
1
λ
,
var(X) =
1
λ
2
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
8
Metody analizy danych
Zmienne losowe
λ = 0,25
λ = 4
0
1
2
3
4
5
0.05
0.1
0.15
0.2
0.25
0
1
2
3
4
5
0
0.5
1
1.5
2
2.5
3
3.5
4
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
9
Metody analizy danych
Zmienne losowe
Przykład
: Czas do momentu, gdy mały meteoryt spadnie gdziekolwiek na
Saharze modeluje się z.l. o rozkładzie wykładniczym o średniej 10 dni. W
tej chwili jest północ. Jakie jest prawdopodobieństwo tego, że meteoryt
spadnie pomiędzy 6:00 a 18:00 pierwszego dnia?
1
λ
= 10 ⇒ λ = 0,1,
P (X a) = P (X > a) = e
−λa
P (
1
4
¬ X ¬
3
4
) = P (X
1
4
) − P (X >
3
4
) = e
−1/40
− e
−3/40
= 0,0476
A jakie jest prawdopodobieństwo, że meteoryt spadnie między 6:00 a
18:00 któregoś dnia?
∞
X
k=1
P (k −
3
4
¬ X ¬ k −
1
4
) =
∞
X
k=1
P (X k −
3
4
) − P (X >
1
4
)
=
∞
X
k=1
(e
(4k−3)/40
− e
(4k−1)/40
) = 0,4998
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
10
Metody analizy danych
Zmienne losowe
III. Rozkład normalny N (µ, σ)
f
X
(x) =
1
σ
√
2π
e
−
(x−µ)2
2σ2
I
rozkład o największym znaczeniu praktycznym,
reprezentujący najczęściej stosowany rozkład błędów
pomiarowych.
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
σ
=0.5
σ
=3
σ
=1
µ
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
11
Metody analizy danych
Zmienne losowe
Dystrybuanta rozkładu normalnego
Φ(x) = P (X < x) =
Z
x
−∞
1
σ
√
2π
e
−
(y−µ)2
2σ2
dy
nie ma postaci analitycznej =⇒ konieczna jest tabelaryzacja Φ.
0
0.25
0.5
0.75
1
σ
=0.5
σ
=1
σ
=3
µµ
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
12
Metody analizy danych
Zmienne losowe
Standaryzacja rozkładu normalnego N (0, 1):
X ∼ N (µ, σ) ⇒ Y =
x − µ
σ
∼ N (0, 1)
Przykład
: Temperatura średnia w pewnym mieście dana jest
rozkładem normalnym T ∼ N (15
◦
C, 2
◦
C). Jakie są szanse, że
przekroczy ona w danym dniu 20
◦
C?
P (T < 20) = P
T −15
2
<
20−15
2
= P (Y < 2,5) = Φ
Y
(2,5) = 0,993
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
13
Metody analizy danych
Zmienne losowe
Przykład
: Zamierzony termin wykonania pewnego procesu
produkcyjnego dany jest rozkładem normalnym X ∼ N (50, 5).
a)
Ile wynosi prawdopodobieństwo skończenia prac przed 46
dniem?
b)
Jaki jest maksymalny termin realizacji zadania na
poziomie ufności 97%?
a) P (X < 46) = Φ
46−50
5
= Φ(−0,8) = 1 − Φ(0,8)
= 1 − 0,788 = 0,212
b) P (Y < Y
max
) = 0, 97 ⇒ Y
max
= 1,88 =
X
max
− 50
5
⇒
⇒ X
max
= 50 + 1,88 · 5 = 59,4 dni
Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski
14