Zmienne losowe i ich
rozkłady
Zmienna losowa: liczba
przyporządkowana zdarzeniu
Dystrybuanta:
F(x)=P(yx)
Gęstość prawdopodobieństwa:
f(x)=dP(x)/dx
Funkcja zmiennej losowej jest też
zmienną losową.
Rozkład prawdopodobieństwa i dystrybuanta rozkładu
prawdopodobieństwa liczby oczek w pojedynczym rzucie
kostką symetryczną
Momenty rozkładu
n
1
i
i
i
n
1
i
i
i
x
x
P
x
H
)
x
(
H
E
x
x
P
x
})
x
({
E
dx
x
f
x
H
x
H
E
dx
x
xf
xˆ
}
x
{
E
Dla zmiennych
ciągłych:
Jeżeli H(x)=(x-x
c
)
n
to E{H(X)} nazywa się n-
tym momentem x względem c; jeżeli c=
to E
jest n-tym momentem centralnym,
n
({x}).
xˆ
Użyteczne momenty
centralne
Wariancja
dx
x
f
xˆ
x
x
x
2
2
2
Skrzywienie
dx
x
f
xˆ
x
x
1
x
x
x
3
3
2
/
3
2
3
Kurtoza
3
dx
x
f
xˆ
x
x
1
3
x
x
x
4
4
2
2
4
Obliczanie momentów
centralnych z próby
3
ˆ
3
2
1
1
2
)
1
(
ˆ
1
1
1
ˆ
1
1
1
ˆ
4
1
4
3
1
3
2
1
1
2
1
2
2
1
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
x
x
n
n
n
n
n
n
n
x
x
n
x
n
x
n
x
x
n
x
n
x
Przykłady momentów
centralnych paru rozkładów
Mediana i kwantyle
1.0
0.5
0.2
x
0.5
x
0.2
x
f(x)
median
a
q
x
q
q
dx
x
f
x
F
Rozkład dwóch zmiennych i
kowariancja
y
x
y
,
x
cov
y
,
x
y
,
x
cov
yˆ
y
xˆ
x
E
y
yˆ
y
E
x
xˆ
x
E
yˆ
y
E
xˆ
x
E
11
2
2
02
2
2
20
01
10
Rozkład normalny
x
erf
,
;
x
F
2
x
exp
2
1
0
,
1
;
u
f
2
x
exp
2
1
,
;
x
f
2
2
2
u : zmienna
stadardyzowana
Centralne twierdzenie
graniczne
Jeżeli x jest zmienną losową o wartości
średniej a i wariancji b
2
, to zmienna
n
i
i
n
x
n
1
lim
1
Ma rozkład normalny o wartości średniej a i
wariancji b
2
/n.
Pobieranie próby
Populacja generalna: zbiór wyników
wszystkich możliwych doświadczeń
określonego typu.
Próba n-wymiarowa: zbiór n wyników
doświadczeń.
Wyniki j-tej próby przedstawiamy w
postaci n-wymiarowej zmiennej losowej
x
(j)
=(x
1(j)
,x
2(j)
,...,x
n(j)
). Wektor ten ma rozkład
prawdopodobieństwa g(x)=g(x
1
,x
2
,...,x
n
).
Pobieranie losowe
1. g(x)=g
1
(x
1
)g
2
(x
2
)...g
n
(x
n
)
(prawdopodobieństwa pobrania
poszczególnych elementów próby są
niezależne od siebie),
2. g
1
(x)=g
2
(x)=...=g
n
(x)=f(x)
(poszczególne rozkłady muszą być
identyczne z rozkładem gęstości dla
populacji).
Dystrybuanta empiryczna (rozkład w
próbie)
W
n
(x)=n
x
/n
n
x
– liczba elementów próby takich że
x
j
x.
W
n
(x) dąży do prawdziwej dystrybuanty
F(x) dla n
Przedstawianie rozkładów z
próby
• Wykresy liniowe (jednowymiarowe)
• Histogramy
– Wykresy schodkowe
– Wykresy słupkowe
– Wykresy impulsowe
Konstrukcja histogramu
h(x)=n(x<yx+x)
h(x
1
,x
2
,...,x
n
)=n(x
1
<y
1
x
1
+x
1
,x
2
<y
2
x
2
+x
2
,..., x
n
<y
n
x
n
+x
n
)
Przedstawienie wyników pomiarów
oporu 100 pojedynczych oporników
• Wykres liniowy
• Histogram – wykres słupkowy
• Histogram – wykres schodkowy
• Histogram – wykres z zaznaczonymi
przedziałami błędów
Zależność postaci histogramów
z próby dla czterech różnych
szerokości przedziałów
Statystyki i estymatory
Statystyka: funkcja określona na elementach
próby, np. średnia.
n
x
x
x
n
x
2
1
1
Estymator: przybliżona wartość parametru
rozkładu prawdopodobieństwa wyznaczona z
próby. S=S(x
1
,x
2
,...,x
n
)
Estymator jest nieobciążony jeżeli jego wartość
oczekiwana nie zależy od liczby elementów
próby.
Estymator jest zgodny jeżeli jego wariancja
dąży do zera wraz ze wzrostem liczby
elementów próby.
Estymator wartości średniej rozkładu
)
(
1
)
ˆ
(
)
ˆ
(
)
ˆ
(
1
)
ˆ
(
)
ˆ
(
)
ˆ
(
1
ˆ
1
)
(
)
(
ˆ
)
(
)
(
)
(
1
)
(
2
2
2
2
2
1
2
2
2
1
2
2
2
1
2
2
2
1
x
n
x
x
x
x
x
x
E
n
x
x
x
x
x
x
E
n
x
x
x
x
n
E
x
E
x
E
x
x
x
E
x
E
x
E
n
x
E
n
n
n
n
Estymator wartości średniej jest zatem
estymatorem nieobciążonym i zgodnym.
Estymator wariancji rozkładu (nieobciążony i
zgodny)
1
2
)
var(
)
(
)
(
1
)
(
1
1
)
)
ˆ
((
)
)
ˆ
((
1
1
)
ˆ
(
)
ˆ
)(
ˆ
(
2
)
ˆ
(
1
1
)]
ˆ
(
)
ˆ
[(
1
1
)
(
)
(
)
(
1
1
)
(
)
(
)
(
)
(
1
1
4
2
2
2
2
2
2
1
2
2
1
2
1
2
2
2
2
1
2
2
2
2
2
1
2
n
s
n
n
n
n
x
x
E
x
x
E
n
x
x
x
x
x
x
x
x
E
n
x
x
x
x
E
n
x
x
x
x
x
x
E
n
s
E
x
x
x
x
x
x
n
s
n
i
i
i
n
i
i
n
i
i
n
n
x
x
x
Estymator wariancji wartości średniej:
n
i
i
x
x
n
n
x
s
n
x
s
1
2
2
2
1
1
1
Estymator odchylenia standardowego wartości
średniej:
1
2
n
s
s
n
i
i
x
x
n
n
x
s
1
2
2
1
1
Estymator błędu ochylenia standardowego:
Estymatory nieobciążone i zgodne
skośności i kurtozy
3
ˆ
3
2
1
1
2
)
1
(
ˆ
4
1
4
3
1
3
n
i
i
n
i
i
x
x
n
n
n
n
n
E
n
n
x
x
n
E
Obliczanie mediany z serii pomiarów
wielkości prostej
n
x
x
x
2
1
1. Sortujemy wyniki pomiarów od najmniejszego do
największego,
2. Jeżeli liczba pomiarów (n) jest nieparzysta to
mediana (x
m
) jest środkowym wynikiem pomiaru o
numerze (n+1)/2
3. Jeżeli liczba pomiarów jest parzysta to mediana jest
średnią arytmetyczną największego wyniku z
“lewej” i najmniejszego z “prawej” połowy.
2
/
1
n
m
x
x
2
/
1
2
/
1
2
/
n
n
m
x
x
x
Wielowymiarowy rozkład
normalny
x
A
x
x
x
a
x
f
x
x
x
f
T
n
n
i
n
j
j
j
i
i
ij
n
n
2
1
exp
2
)
det(
2
1
exp
2
)
det(
)
(
)
,...,
,
(
2
/
1
1
2
/
2
1
A
A
Przenoszenie błędów
(rachunek błędów)
Niech x=(x
1
,x
2
,...,x
n
) będzie n-wymiarową
zmienną losową złożoną z niezależnych
składników o rozkładach normalnych z
wariancjami
1
2
,
2
2
,...,
n
2
. Wtedy funkcja
skalarna y=f(x) tej zmiennej losowej jest
zmienną losową opisywaną w przybliżeniu
rozkładem normalnym o następującej
wariancji:
2
x
2
n
2
x
2
2
2
x
2
1
2
y
n
2
1
x
f
x
f
x
f
Jeżeli elementy x są skorelowane to we wzorze
występuje pełna macierz wariancji-kowariancji
j
i
j
i
i
x
x
x
x
n
1
i
i
1
j
j
i
2
x
2
n
1
j
i
j
i
n
1
i
j
n
1
j
i
2
y
r
x
f
x
f
2
x
f
)
x
,
x
cov(
x
f
x
f
Szacowanie błędu “z góry”
n
x
n
x
x
y
r
x
f
r
x
f
r
x
f
r
2
1
2
1
gdzie r
y
jest oszacowanym maksymalnym błędem
wielkości y a r
xi
jest oszacowanym maksymalnym
błędem wielkości x
i
.
Rozkład wariancji z próby (rozkład
2
)
Pobieramy próbę x
1
,x
2
,...,x
n
z rozkładu
normalnego o a=0 i =1. Dystrybuanta
rozkładu zmiennej x
2
=x
1
2
+x
2
2
+...+x
n
2
jest
dana następującą funkcją:
du
u
u
n
F
n
n
2
1
exp
2
2
1
1
)
(
2
0
1
2
1
2
gdzie (y) jest funkcją gamma Eulera (silnią
uogólnioną na liczby rzeczywiste).
0
)
1
(
dt
e
t
x
t
x
u
2
1
exp
u
2
n
2
1
1
)
(
f
1
n
2
1
n
2
Zatem sam rozkład wariancji jest dany następującą
funkcją