PARAMETRY CHARAKTERYZUJĄCE ROZKŁAD ZMIENNEJ.
Zmienna losowa jest opisana w pełni przez swój rozkład prawdopodobieństwa. Względy
praktyczne dyktują jednak potrzebę znalezienia pewnych charakterystyk liczbowych
pozwalających porównać rozkłady miedzy sobą.
Wartość oczekiwana (średnia zmiennej losowej).
Definicja: Wartością oczekiwaną zmiennej losowej X o rozkładzie dyskretnym nazywamy
liczbę:
( )
i
i
i
ozn
p
x
X
E
m
∑
=
=
, gdzie x
i
- wartość zmiennej losowej,
(
)
i
i
x
X
P
p
=
=
, gdy szereg
i
i
i
p
x
∑
jest zbieżny. Jeżeli szereg
i
i
i
p
x
∑
rozbieżny to mówimy, że zmienna losowa nie
posiada wartości oczekiwanej.
Definicja: Wartością oczekiwaną zmiennej losowej o rozkładzie ciągłym nazywamy liczbę
( )
( )
dx
x
f
x
X
E
m
ozn
∫
∝
−∝
⋅
=
=
o ile
( )
dx
x
f
x
∫
∝
∝
−
⋅
jest zbieżna. Jeżeli całka jest rozbieżna to
mówimy, że wartość oczekiwana nie istnieje.
Przykład:
Wyznaczyć wartość oczekiwaną zmiennej losowej o rozkładzie dyskretnym, gdzie
x – liczba orłów w rzucie dwoma monetami.
1
4
1
2
2
1
1
4
1
0
=
⋅
+
⋅
+
⋅
=
= EX
m
.
Przykład:
Wyznaczyć wartość oczekiwaną zmiennej losowej X o rozkładzie ciągłym, gdzie
funkcja gęstości wyraża się wzorem:
( )
2
1
1
1
x
x
f
+
=
π
,
R
x ∈
.
[ ]
+∞
=
−
=
=
=
=
=
=
+
=
+
=
+
∞
→
∞
→
∞
→
∞
∞
∞
∞
−
∫
∫
∫
∫
0
1
1
1
2
0
2
2
1
ln
ln
lim
1
ln
lim
1
1
1
lim
1
2
1
1
2
1
1
1
k
t
dt
t
t
dt
dt
xdx
t
x
dx
x
x
dx
x
x
k
k
k
k
k
π
π
π
π
π
π
.
Wartość oczekiwana nie istnieje.
x
i
0
1
2
p
i
4
1
4
2
4
1
Przykład: Weźmy dwa rozkłady zmiennych losowych X i Y.
X:
0
3
1
1
3
1
0
3
1
1
=
⋅
+
⋅
+
⋅
−
=
EX
Y:
0
3
1
100
3
1
0
3
1
100
=
⋅
+
⋅
+
⋅
−
=
EY
Uwaga:
Jeżeli zmienna losowa Y jest funkcją zmiennej losowej X tzn.
( )
X
g
Y =
i znamy rozkład
zmiennej X, to możemy znaleźć EY przy założeniu, że ta wartość istnieje.
1)
jeżeli zmienna X jest zmienną o rozkładzie dyskretnym przyjmującą wartości
,...
,
2
1
x
x
z
prawdopodobieństwami
(
)
i
i
p
x
X
P
=
=
oraz
( )
i
i
i
p
x
g
∑
jest zbieżny bezwzględnie, to
( )
i
i
i
p
x
g
EY
∑
=
.
2)
jeżeli X jest zmienną losową o rozkładzie ciągłym i funkcją gęstości f i
( )
X
g
Y =
oraz
( ) ( )
dx
x
f
x
g
∫
∝
∝
−
jest bezwzględnie zbieżna, to wartość oczekiwana
( ) ( )
dx
x
f
x
g
EY
∫
∝
∝
−
=
.
Twierdzenie: Jeżeli istnieje wartość oczekiwana EX, to dla dowolnych
R
b
a
∈
,
zachodzi
wzór:
(
)
b
aEX
b
aX
E
+
=
+
.
Dowód: Weźmy
( )
b
ax
x
g
+
=
.
(
)
(
)
b
aEX
p
b
p
x
a
bp
p
ax
p
b
ax
b
aX
E
i
i
i
EX
i
i
i
i
i
i
i
i
i
i
+
=
+
=
+
=
+
=
+
∑
∑
∑
∑
∑
1
. ■
Wnioski:
(
)
b
EX
b
X
E
+
=
+
dla a=1,
(
)
aEX
aX
E
=
dla b=0,
( )
b
b
E
=
dla a=0.
Uwaga:
x
i
-1 0
1
p
i
3
1
3
1
3
1
y
i
-100 0 100
p
i
3
1
3
1
3
1
Jeżeli zmienne X i Y są określone na tej samej przestrzeni zdarzeń i EX i EY istnieją, to
(
)
EY
EX
Y
X
E
+
=
+
.
Definicja:
Liczbę
( )
k
k
X
E
m =
nazywamy k-tym momentem zwykłym lub momentem zwykłym k-tego
rzędu.
Definicja
Liczbę
(
)
(
)
k
k
c
X
E
−
=
'
µ
nazywamy momentem rzędu k względem stałej c.
Jeżeli
EX
m
c
=
=
1
, to momenty te nazywamy k-tymi momentami centralnymi lub
momentami centralnymi k-tego rzędu.
Momenty centralne oznaczamy:
(
)
(
)
(
)
(
)
k
k
k
EX
X
E
m
X
E
−
=
−
=
1
µ
.
Definicja:
Wariancją zmiennej losowej X nazywamy liczbę
( )
( )
(
)
(
)
2
2
2
2
µ
σ
=
−
=
=
X
E
X
E
X
D
.
Wariancja to średnia odchyleń kwadratów od wartości oczekiwanej.
1) X – rozkład dyskretny
(
)
i
i
i
i
i
m
i
p
m
x
p
EX
x
X
D
2
2
2
∑
∑
−
=
⋅
−
=
EX
m =
.
2) X – rozkład ciągły
(
) ( )
dx
x
f
m
x
X
D
∫
∝
∝
−
−
=
2
2
.
Twierdzenie:
(
)
2
2
2
EX
EX
X
D
−
=
.
Dowód:
(
)
(
)
(
)
(
)
(
)
(
)
(
)
=
+
⋅
−
=
−
⋅
−
=
−
=
2
2
2
2
2
2
2
2
EX
E
X
EX
E
EX
EX
X
EX
X
E
EX
X
E
X
D
(
)
(
)
2
2
2
2
2
EX
EX
EX
EX
EX
EX
−
=
+
⋅
−
=
. ■
Uwaga: 1) X – ma rozkład dyskretny
∑
−
=
i
i
i
m
p
x
X
D
2
2
2
; 2) X – ma rozkład ciągły
( )
∫
∝
∝
−
−
=
2
2
2
m
dx
x
f
x
X
D
.
Przykład 1: X – rozkład liczby orłów w 2-krotnym rzucie monetą.
EX=1
2
1
4
2
1
4
1
4
4
2
1
4
1
0
1
2
2
=
=
−
⋅
+
⋅
+
⋅
=
−
=
∑
i
i
i
p
x
X
D
x
i
0
1
2
p
i
4
1
4
2
4
1
Przykład 2:
X:
0
3
1
1
3
1
0
3
1
1
=
⋅
+
⋅
+
⋅
−
=
EX
3
2
3
1
1
3
1
1
2
=
⋅
+
⋅
=
X
D
Y:
0
3
1
100
3
1
0
3
1
100
=
⋅
+
⋅
+
⋅
−
=
EY
3
20000
3
1
10000
3
1
10000
2
=
⋅
+
⋅
=
Y
D
.
Przykład 3: Niech zmienna losowa o rozkładzie ciągłym ma taką funkcję gęstości:
( )
≥
<
=
−
0
0
0
x
e
x
x
f
x
.
( )
∫
∫
∝
∝
−
∝
−
=
⋅
=
0
dx
xe
dx
x
f
x
EX
x
c
e
xe
dx
e
xe
e
v
e
v
u
x
u
dx
xe
x
x
x
x
x
x
x
+
−
−
=
+
−
=
−
=
=
=
=
=
−
−
−
−
−
−
−
∫
∫
'
1
'
.
(
)
[
]
1
1
1
lim
1
1
lim
1
lim
0
0
=
+
−
=
+
−
+
=
+
−
=
=
∫
∝
→∝
→∝
−
→∝
−
k
k
H
k
k
k
x
k
x
e
e
k
x
e
dx
xe
EX
( )
∫
∫
∝
∝
−
∝
−
=
=
0
2
2
2
dx
e
x
dx
x
f
x
EX
x
(
)
c
x
x
e
dx
xe
e
x
e
v
e
v
x
u
x
u
dx
e
x
x
x
x
x
x
x
+
+
+
−
=
+
−
=
−
=
=
=
=
=
−
−
−
−
−
−
∫
∫
2
2
2
'
2
'
2
2
2
2
2
2
2
2
lim
0
2
2
=
+
+
+
−
=
−
→∝
k
k
e
EX
k
k
1
1
2
2
2
2
2
=
−
=
−
=
m
EX
X
D
.
Przykład 4: Obliczyć wariancję zmiennej losowej o funkcji gęstości:
( )
<
≥
=
1
0
1
2
3
x
x
x
x
f
.
( )
( )
2
2
2
lim
2
lim
2
lim
2
0
1
1
2
1
3
=
+
−
=
−
=
=
⋅
=
∫
⋅
=
→∝
→∝
→∝
∝
∝
−∝
∫
∫
∫
∝
∝
−
k
x
dx
x
dx
x
x
dx
x
f
x
EX
k
k
k
k
k
dx
x
f
x
x
i
−1 0
1
p
i
3
1
3
1
3
1
x
i
−100 0 100
p
i
3
1
3
1
3
1
( )
[
]
+∞
=
−
=
=
=
⋅
=
=
→∝
→∝
→∝
∝
∝
−∝
∫
∫
∫
0
1
1
1
3
2
2
2
1
ln
2
ln
2
lim
ln
2
lim
2
lim
2
k
x
dx
x
dx
x
x
dx
x
f
x
EX
k
k
k
k
k
.
Definicja: Odchyleniem standardowym zmiennej losowej X nazywamy
X
D
2
=
σ
.
Własności wariancji:
1)
0
2
=
c
D
c-stała,
2)
(
)
( )
X
D
c
cX
D
2
2
2
=
,
3)
(
)
X
D
b
X
D
2
2
=
+
.
Dowód 1):
( )
( )
( )
(
)
0
2
2
2
2
2
=
−
=
−
=
c
c
c
E
c
E
c
D
.
Dowód 2):
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
X
D
c
EX
EX
c
EX
c
EX
c
cEX
EX
c
cX
E
X
c
E
cX
D
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
=
−
=
−
=
−
=
−
=
.
Dowód 3):
(
)
( )
(
)
(
)
(
)
(
)
( )
(
)
=
+
−
+
+
=
+
−
+
=
+
2
2
2
2
2
2
2
b
X
E
b
Xb
X
E
b
x
E
b
E
b
x
D
(
)
( )
(
)
(
)
(
)
X
D
EX
EX
bEX
b
EX
b
E
Xb
E
EX
b
bEX
2
2
2
2
2
2
2
2
2
2
=
−
=
+
+
−
+
+
=
.
■
Wartość medialna (MEDIANA) i wartość modalna (MODA, DOMINANTA) zmiennej
losowej.
Definicja:
Wartością medialną lub środkową ozn.
e
m
nazywamy tę wartość x, dla której spełnione są
dwie nierówności:
(
)
2
1
≥
≥ x
X
P
,
(
)
2
1
≥
≤ x
X
P
.
(
)
(
)
2
1
2
1
≥
≤
∧
≥
≥
⇔
=
x
X
P
x
X
P
x
m
e
.
Twierdzenie:
Jeżeli X na rozkład ciągły o dystrybuancie F, to
( )
2
1
=
⇔
=
x
F
x
m
e
.
Dowód:
(
)
(
)
2
1
2
1
≥
≤
∧
≥
≥
⇔
=
x
X
P
x
X
P
x
m
e
1)
(
)
(
)
( )
( )
2
1
2
1
1
2
1
1
2
1
≤
⇔
≥
−
⇔
≥
<
−
⇔
≥
≥
x
F
x
F
x
X
P
x
X
P
.
2)
(
)
(
)
(
)
( )
( )
2
1
2
1
)
(
2
1
2
1
0
≥
⇔
≥
=
+
⇔
≥
=
+
<
⇔
≥
≤
x
F
x
X
P
x
F
x
X
P
x
X
P
x
X
P
.
Z 1) i 2) mamy
( )
2
1
=
x
F
. ■
W przypadku zmiennej o rozkładzie ciągłym wygodniej jest posługiwać się dystrybuantą.
Przykład: X – rzut dwoma monetami (ilość orłów).
Przykład: Dany jest rozkład prawdopodobieństwa zmiennej losowej X typu dyskretnego
X:
x
i
0
1
2
3
4
p
i
0,15
0,2
0,1
0,25
0,3
>
≤
<
≤
<
≤
<
≤
<
≤
=
4
1
4
3
7
,
0
3
2
45
,
0
2
1
35
,
0
1
0
15
,
0
0
0
)
(
x
x
x
x
x
x
x
F
m
e
= 3
m
o
= 4
Definicja:
Wartością modalną (m
0
) lub dominantą lub modą zmiennej losowej X o rozkładzie
dyskretnym nazywamy tę jej wartość, której odpowiada największe prawdopodobieństwo.
Definicja:
Wartością modalną (m
0
) lub dominantą lub modą zmiennej losowej X o rozkładzie ciągłym
nazywamy tę jej wartość, której funkcja gęstości osiąga maximum.
i
x
0
1
2
i
p
4
1
4
2
4
1
Przykład: Zmienna losowa X ma rozkład ciągły o funkcji gęstości
≤
<
=
p.p.
w
0
0
dla
sin
2
1
)
(
π
x
x
x
f
⋮
.
Wyznaczyć wartość medialną i modalną.
1) Wartość medialna:
Wyznaczamy dystrybuantę:
dt
t
f
x
X
P
x
F
x
∫
∞
−
=
<
=
)
(
)
(
)
(
dt
x
F
x
x
∫
∞
−
=
=
≤
0
0
)
(
wtedy
0
( )
[
]
x
x
t
dt
t
dt
t
f
dt
t
f
x
F
x
x
x
x
x
cos
1
2
1
2
1
cos
2
1
cos
2
1
sin
2
1
)
(
)
(
wtedy
0
0
0
0
−
=
+
−
=
=
−
=
=
=
=
≤
<
∫
∫
∫
∞
−
π
( )
1
sin
2
1
)
(
wtedy
0
=
=
=
>
∫
∫
∞
−
dt
t
dt
t
f
x
F
x
x
x
π
[
]
>
≤
<
−
≤
=
π
π
x
x
x
x
x
F
1
0
cos
1
2
1
0
0
)
(
Mamy znaleźć taki x gdzie
( )
2
1
=
x
F
.
( )
(
)
2
0
cos
1
cos
1
2
1
cos
1
2
1
2
1
π
=
⇔
=
⇔
=
−
⇔
=
−
⇔
=
x
x
x
x
x
F
2
π
=
e
m
2) Wartość modalna:
π
π
<
<
=
⇔
=
⇔
=
x
gdy
x
x
x
f
0
2
0
cos
2
1
0
)
`(
3) Wyznaczamy wartość oczekiwaną:
[
]
[
]
(
)
2
sin
cos
2
1
cos
cos
2
1
cos
sin
`
1
`
sin
2
1
)
(
0
0
0
0
π
π
π
π
π
π
π
=
+
−
=
+
−
=
=
−
=
=
=
=
=
=
⋅
=
∫
∫
∫
∞
∞
−
x
xdx
x
x
x
v
x
v
u
x
u
xdx
x
dx
x
f
x
EX
Wartość EX = m
e
= m
0
. Taki rozkład nazywa się rozkładem symetrycznym.
Inne parametry zmiennych losowych jednowymiarowych.
Charakterystyki liczbowe zmiennej losowej dzielimy na 3 grupy:
1) miary położenia:
●
wartość oczekiwana
●
kwanty rzędu α ( w szczególności kwantyl dolny i górny oraz mediana )
●
moda
2) miary rozproszenia:
● wariancja
● odchylenie standardowe
●
odchylenie przeciętne
●
współczynnik zmienności
3) charakterystyki kształtu
●
współczynnik skośności (asymetrii)
●
współczynnik skupienia
Definicja:
Kwantylem rzędu α gdzie 0<α<1 zmiennej losowej X nazywamy liczbę q
α
zdefiniowaną
nierównością: F(q
α
) ≤ α ≤ F(q
α
+
).
Szczególnym przypadkiem kwantyla jest q
0,5
– mediana, q
0,25
– kwartyl dolny oraz
q
0,75
– kwartyl górny.
Kwantyl q
α
ma następującą interpretację:
α – masa prawdopodobieństwa zmiennej losowej X nie przekracza liczby q
α
Uwaga: Jeżeli zmienna losowa X ma rozkład ciągły, to
F(q
α
) = α
α
α
=
⇔
∫
∞
−
q
dx
x
f
)
(
Definicja: Odchyleniem przeciętnym (d) nazywamy liczbę:
i
i
i
p
m
x
d
∑
−
=
gdy X ma rozkład dyskretny
dx
x
f
m
x
d
)
(
∫
∞
∞
−
−
=
gdy X ma rozkład ciągły.
o ile szereg lub całka są zbieżne.
Zarówno odchylenie standardowe jak i przeciętne mówi -o ile przeciętnie różnią się wartości
zmiennej od wartości oczekiwanej m.
Wygodnie jest czasem scharakteryzować rozproszenie nie za pomocą odchylenia
standardowego lecz jego stosunku do wartości oczekiwanej.
Definicja: Stosunek odchylenia standardowego do wartości oczekiwanej nazywamy
współczynnikiem zmienności i oznaczamy:
1
2
)
(
)
(
)
(
m
x
E
x
x
V
µ
σ
=
=
.
Uwaga:
Współczynnik zmienności jest odchyleniem standardowym, gdy EX=1 , inaczej mówiąc
współczynnik zmienności jest miarą rozproszenia, gdy za jednostkę przyjmiemy wartość
oczekiwaną. Mówi on o zróżnicowaniu wartości zmiennej X względem wartości średniej.
Często wyrażany jest w %.
3) Parametry kształtu mówią o kształcie funkcji gęstości (w przypadku zmiennych
losowych o rozkładzie ciągłym) lub też kształtu funkcji masy prawdopodobieństwa (w
przypadku zmiennych losowych skokowych).
Wiadomo, że jeśli zmienna losowa ma rozkład symetryczny i skończoną wartość oczekiwaną,
to wartość oczekiwana jest środkiem symetrii. Wynika stąd, że dla rozkładu symetrycznego
momenty centralne rzędu nieparzystego są równe zeru. W przypadku rozkładów
niesymetrycznych potrzebne jest czasem ustalenie stopnia asymetrii układu.
Definicja: Liczba
(
)
=
=
−
=
3
2
3
3
3
3
3
µ
µ
σ
µ
γ
σ
γ
m
X
E
nazywa się współczynnikiem
asymetrii lub współczynnikiem skośności zmiennej losowej X.
Uwaga:
Dla rozkładu symetrycznego γ=0, jeśli γ>0, to mówimy, że rozkład jest prawoskośny lub ma
asymetrię dodatnią. Jeżeli zaś γ<0, to rozkład jest lewoskośny lub ma asymetrię ujemną.
•
Drugim parametrem kształtu jest kurtoza lub inaczej współczynnik spłaszczania lub
współczynnik stromości zmiennej losowej X.
Definicja: Liczbę
(
)
=
−
=
2
2
4
4
4
µ
µ
σ
η
m
x
E
nazywa się kurtozą zmiennej losowej X.
Im wyższa jest wartość η, tym większa jest wysmukłość rozkładu. Inaczej mówiąc: małe
wartości η określają rozkład spłaszczony i przyjmuje się, że dla rozkładu normalnego η=3,
dla spłaszczonego η<3, a dla wysmukłego η>3.
Przy porównaniu dwóch rozkładów stosowana jest miara spłaszczenia zwana ekscesem.
Wartość ekscesy jest równa wartości kurtozy pomniejszonej o 3. Jeśli η-3=0, to rozkład ma
kształt normalny, jeżeli η-3<0, to rozkład ma kształt spłaszczony w stosunku do normalnego,
jeśli zaś η-3>0, to rozkład ma kształt bardziej wysmukły w stosunku do normalnego.
Eksces informuje, czy koncentracja wokół zmiennej jest mniejsza lub większa niż dla
rozkładu normalnego.