Przegląd rozkładów jednowymiarowych
1. Rozkłady dyskretne
1. Rozkład jednopunktowy:
Zmienna losowa X ma rozkład jednopunktowy skupiony w punkcie x0, jeśli SX = {x0} oraz P (X = x0) = 1.
Jest to najprostszy rozkład prawdopodobieństwa. Dystrybuanta tego rozkładu ma postać
0 , x 6 x
F (x) =
0
.
1 , x > x0
Uwaga. Jeśli X = a, gdzie a ∈ R, to X ma rozkład jednopunktowy skupiony w punkcie a.
Zatem każdą stałą można traktować jako zmienną losową o rozkładzie jednopunktowym.
2. Rozkład dwupunktowy:
X ma rozkład dwupunktowy, jeśli SX = {x1, x2} oraz P (X = x1) = p ∈ (0; 1), P (X = x2) = 1 − p.
Jeśli np. x1 < x2, to dystrybuanta tego rozkładu ma postać
0 , x 6 x1
F (x) =
p , x1 < x 6 x2 .
1
, x > x2
Jeśli SX = {0, 1}, to rozkład nazywamy zero-jedynkowym.
? Przykład modelu:
Rzucamy symetryczną monetą. Jeśli przyjmiemy, że
0 ,
gdy wypadnie orzeł
X =
,
1 ,
gdy wypadnie reszka
to funkcja prawdopodobieństwa rozkładu zmiennej losowej X będzie postaci 1
P (X = 0) = P (X = 1) =
.
2
To oznacza, że X ma rozkład zero-jedynkowy.
3. Rozkład Bernoulliego (dwumianowy):
X ma rozkład Bernoulliego z parametrami (n; p) (X ∼ B(n; p)), gdzie p ∈ (0, 1) i n ∈ N, jeśli SX = {0, 1, . . . , n} oraz
n
P (X = k) =
pk(1 − p)n−k.
k
Zmienną losową o rozkładzie dwumianowym można interpretoważ jako liczbę sukcesów w n doświadczeniach Bernoulliego, jeśli prawdopodobieństwo sukcesu w jednym doświadczeniu wynosi p.
1
X ma rozkład geometryczny z parametrem p ∈ (0, 1), jeśli SX = N oraz P (X = k) = (1 − p)k−1p.
? Przykład modelu:
2
Rzucamy monetą
P (O) =
. Niech X oznacza liczbę rzutów do momentu, aż pojawi się po 5
raz pierwszy orzeł. Wtedy
2 k−1 2
P (X = k) =
1 −
, k = 1, 2, . . . ,
5
5
2
to znaczy X ma rozkład geometryczny z parametrem p =
.
5
Zmienną losową o rozkładzie geometrycznym można interpretować jako liczbę prób do pier-wszego sukcesu w schemacie Bernoulliego.
Dla rozkładu geometrycznego spełniona jest własność "braku pamięci"(własność Markowa): Twierdzenie 1. Jeśli X ma rozkład geometryczny z parametrem p, to dla dowolnych n, m ∈ N
P (X > n + m| X > n) = (1 − p)m = P (X > m).
Dowód.
P (X > n + m ∧ X > n)
P (X > n + m)
P (X > n + m| X > n) =
=
=
P (X > n)
P (X > n)
∞
X
p(1 − p)k−1
k=n+m+1
p(1 − p)n+m
=
=
= (1 − p)m = P (X > m).
∞
p(1 − p)n
X
p(1 − p)k−1
k=n+1
5. Rozkład Poissona:
Zmienna losowa X ma rozkład Poissona z parametrem λ > 0 (X ∼ P (λ)), jeśli SX = N ∪ {0}
oraz
λk
P (X = k) = e−λ
.
k!
Wartości prawdopodobieństw dla rozkładu Poissona są stablicowane.
Zmienna losowa o rozkładzie Poissona może być interpretowana jako liczba awarii systemu, liczba klientów zgłaszających się do banku, liczba samochodów przejeżdżających przez określony punkt drogi w określonym przedziale czasowym, liczba cząstek emitowanych przez substancję radioaktywną w ustalonych odstępach czasu.
Rozkład Poissona ma związek z rozkładem Bernoulliego: Dla dużych n
n
λk
pk(1 − p)n−k ' e−λ ·
,
k
k!
gdzie λ = np.
Przybliżenie to jest dla celów praktycznych wystarczająco dokładne gdy n > 50, p 6 0, 1.
2
1. Rozkład jednostajny:
Zmienna losowa X ma rozkład jednostajny na przedziale [a; b] (X ∼ U [a; b]), jeśli jej funkcja gęstości oraz dystrybuanta mają postać
0
, x 6 a
(
1
, x ∈< a ; b >
x − a
f (x) =
b − a
,
F (x) =
, a < x 6 b .
0
, x /
∈< a ; b >
b − a
1
, x > b
Zmienną losową X o rozkładzie jednostajnym na przedziale [a; b] można interpretować jako wynik eksperymentu polegającego na losowym i "jednostajnym"wyborze wartości z odcinka
[a; b].
2. Rozkład normalny (Gaussa):
Zmienna losowa X ma rozkład normalny z parametrami m i σ2, gdzie m ∈ R oraz σ > 0
(X ∼ N (m, σ2)), jeśli jej funkcja gęstości jest postaci 1
(x − m)2
f (x) = √
exp
−
.
2π · σ
2σ2
Szczególny przypadek: Standardowy rozkład normalny Rozkład N (0, 1) nazywany jest standardowym rozkładem normalnym.
Jeśli X ∼ N (0, 1), to
1
x2
f (x) = √
exp
−
.
2π
2
Dystrybuantę rozkładu normalnego N (0, 1) oznaczać będziemy symbolem F (x): 1
Z
x
1
F (x) = √
exp
− t2 dt.
2π −∞
2
Wyznaczanie prawdopodobie/nstw dla zmiennych losowych o rozkładach N (m, σ2): Dystrybuanta rozkładu normalnego N (0, 1) jest stablicowana. Za jej pomocą można obliczyć wartości dystrybuanty dla dowolnej zmiennej losowej o rozkładzie N (m, σ2):
x − m
Jeśli X ∼ N (m, σ2), to FX(x) = F
.
σ
W szczególności, jeśli X ∼ N (m, σ2), to
b − m
P (X < b) = P (X 6 b) = F
;
σ
P (a < X < b) = P (a 6 X 6 b) = P (a < X 6 b) = P (a 6 X < b) = FX(b) − FX(a)
b − m
a − m
= F
− F
.
σ
σ
Często korzysta się z tablic funkcji Φ(x), gdzie Φ jest funkcją Laplace’a.
3
Definicja 1. Funkcją Lapalce’a nazywamy funkcję Φ taką, że x
Z
df
1
u2
Φ(x) = √
exp
−
du.
2π
2
0
Twierdzenie 2. Funkcja Laplace’a ma następujące własności: (a) Φ(x) jest funkcją nieparzystą;
(b) Dla każdego x ∈ R
0, 5 + Φ(x)
, x > 0
F (x) =
.
0, 5 − Φ(−x) , x < 0
Twierdzenie 3. (Reguła trzech sigm) Jeśli X ∼ N (m, σ2), to P (X /
∈ [m − 3σ, m + 3σ]) = 0, 0027.
Dowód. Jeśli X ∼ N (m, σ2), to
P (|X − m| 6 3σ) = P (X ∈ [m − 3σ , m + 3σ]) = FX(m + 3σ) − FX(m − 3σ) =
= F (3) − F (−3) = 2 · Φ(3) = 2 · 0.49865 = 0.9973.
Zatem
P (X /
∈ [m − 3σ, m + 3σ]) = 1 − 0.9973 = 0, 0027.
Z reguły trzech sigm wynika, że jeśli X ∼ N (m, σ2), to szansa przyjęcia przez zmienną losową X wartości poza przedziałem [m − 3σ, m + 3σ] jest bliska zeru.
4