Pobieranie próby
Populacja generalna: zbiór wyników
wszystkich możliwych doświadczeń
określonego typu.
Próba n-wymiarowa: zbiór n wyników
doświadczeń.
Wyniki j-tej próby przedstawiamy w
postaci n-wymiarowej zmiennej losowej
x
(j)
=(x
1(j)
,x
2(j)
,...,x
n(j)
). Wektor ten ma rozkład
prawdopodobieństwa g(x)=g(x
1
,x
2
,...,x
n
).
Pobieranie losowe
1. g(x)=g
1
(x
1
)g
2
(x
2
)...g
n
(x
n
)
(prawdopodobieństwa pobrania
poszczególnych elementów próby są
niezależne od siebie),
2. g
1
(x)=g
2
(x)=...=g
n
(x)=f(x)
(poszczególne rozkłady muszą być
identyczne z rozkładem gęstości dla
populacji).
Dystrybuanta empiryczna (rozkład w
próbie)
W
n
(x)=n
x
/n
n
x
– liczba elementów próby takich że
x
j
x.
W
n
(x) dąży do prawdziwej dystrybuanty
F(x) dla n
Przedstawianie rozkładów z
próby
• Wykresy liniowe (jednowymiarowe)
• Histogramy
– Wykresy schodkowe
– Wykresy słupkowe
– Wykresy impulsowe
Konstrukcja histogramu
h(x)=n(x<yx+x)
h(x
1
,x
2
,...,x
n
)=n(x
1
<y
1
x
1
+x
1
,x
2
<y
2
x
2
+x
2
,..., x
n
<y
n
x
n
+x
n
)
Przedstawienie wyników pomiarów
oporu 100 pojedynczych oporników
• Wykres liniowy
• Histogram – wykres słupkowy
• Histogram – wykres schodkowy
• Histogram – wykres z zaznaczonymi
przedziałami błędów
Zależność postaci histogramów
z próby dla czterech różnych
szerokości przedziałów
Statystyki i estymatory
Statystyka: funkcja określona na elementach
próby, np. średnia.
n
x
x
x
n
x
2
1
1
Estymator: przybliżona wartość parametru
rozkładu prawdopodobieństwa wyznaczona z
próby. S=S(x
1
,x
2
,...,x
n
)
Estymator jest nieobciążony jeżeli jego wartość
oczekiwana nie zależy od liczby elementów
próby.
Estymator jest zgodny jeżeli jego wariancja
dąży do zera wraz ze wzrostem liczby
elementów próby.
Obliczanie momentów
centralnych zbioru punktów
3
)
1
(
ˆ
)
1
(
ˆ
1
1
1
ˆ
1
1
1
ˆ
4
1
4
3
1
3
2
1
1
2
1
2
2
1
n
x
x
n
x
x
x
n
x
n
x
x
n
x
n
x
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
Estymator wartości średniej rozkładu
)
(
1
2
)
ˆ
(
)
ˆ
(
)
ˆ
(
1
)
ˆ
(
)
ˆ
(
)
ˆ
(
1
1
ˆ
)
(
)
(
ˆ
)
(
)
(
)
(
1
)
(
2
2
2
2
2
1
2
2
2
1
2
2
2
1
2
2
2
1
x
x
n
n
x
x
x
x
x
x
E
n
x
x
x
x
x
x
E
n
x
x
x
n
x
E
x
E
x
E
x
x
x
E
x
E
x
E
n
x
E
n
n
n
n
Estymator wartości średniej jest zatem
estymatorem nieobciążonym i zgodnym.
Dygresja: błądzenie przypadkowe
(random walk)
start
stop
N
D
D
X
X
D
D
X
X
X
X
D
X
X
X
X
X
X
X
X
X
X
X
X
X
X
D
X
X
X
X
D
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
M
M
N
N
2
2
0
2
2
1
0
1
2
0
1
2
0
2
1
2
0
1
2
0
1
2
1
1
0
1
1
2
1
2
1
2
1
Estymator wariancji rozkładu (nieobciążony i
zgodny)
1
2
)
var(
)
(
)
(
1
)
(
1
1
)
)
ˆ
((
)
)
ˆ
((
1
1
)
ˆ
(
)
ˆ
)(
ˆ
(
2
)
ˆ
(
1
1
)]
ˆ
(
)
ˆ
[(
1
1
)
(
)
(
)
(
1
1
)
(
)
(
)
(
)
(
1
1
4
2
2
2
2
2
2
1
2
2
1
2
1
2
2
2
2
1
2
2
2
2
2
1
2
n
s
n
n
n
n
x
x
E
x
x
E
n
x
x
x
x
x
x
x
x
E
n
x
x
x
x
E
n
x
x
x
x
x
x
E
n
s
E
x
x
x
x
x
x
n
s
n
i
i
i
n
i
i
n
i
i
n
n
x
x
x
Estymator wariancji wartości średniej:
n
i
i
x
x
n
n
x
s
n
x
s
1
2
2
2
1
1
1
Estymator odchylenia standardowego wartości
średniej:
1
2
n
s
s
n
i
i
x
x
n
n
x
s
1
2
2
1
1
Estymator błędu ochylenia standardowego:
Obliczanie mediany z serii pomiarów
wielkości prostej
n
x
x
x
2
1
1. Sortujemy wyniki pomiarów od najmniejszego do
największego,
2. Jeżeli liczba pomiarów (n) jest nieparzysta to
mediana (x
m
) jest środkowym wynikiem pomiaru o
numerze (n+1)/2
3. Jeżeli liczba pomiarów jest parzysta to mediana jest
średnią arytmetyczną największego wyniku z
“lewej” i najmniejszego z “prawej” połowy.
2
/
1
n
m
x
x
2
/
1
2
/
1
2
/
n
n
m
x
x
x
Przenoszenie błędów
(rachunek błędów)
Niech x=(x
1
,x
2
,...,x
n
) będzie n-wymiarową
zmienną losową złożoną z niezależnych
składników o rozkładach normalnych z
wariancjami
1
2
,
2
2
,...,
n
2
. Wtedy funkcja
skalarna y=f(x) tej zmiennej losowej jest
zmienną losową opisywaną w przybliżeniu
rozkładem normalnym o następującej
wariancji:
2
x
2
n
2
x
2
2
2
x
2
1
2
y
n
2
1
x
f
x
f
x
f
Jeżeli elementy x są skorelowane to we wzorze
występuje pełna macierz wariancji-kowariancji
j
i
j
i
i
x
x
x
x
n
1
i
i
1
j
j
i
2
x
2
n
1
j
i
j
i
n
1
i
j
n
1
j
i
2
y
r
x
f
x
f
2
x
f
)
x
,
x
cov(
x
f
x
f
Szacowanie błędu “z góry”
n
x
n
x
x
y
r
x
f
r
x
f
r
x
f
r
2
1
2
1
gdzie r
y
jest oszacowanym maksymalnym błędem
wielkości y a r
xi
jest oszacowanym maksymalnym
błędem wielkości x
i
.
Rozkład wariancji z próby (rozkład
2
)
Pobieramy próbę x
1
,x
2
,...,x
n
z rozkładu
normalnego o a=0 i =1. Dystrybuanta
rozkładu zmiennej x
2
=x
1
2
+x
2
2
+...+x
n
2
jest
dana następującą funkcją:
du
u
u
n
F
n
n
2
1
exp
2
2
1
1
)
(
2
0
1
2
1
2
gdzie (y) jest funkcją gamma Eulera (silnią
uogólnioną na liczby rzeczywiste).
0
)
1
(
dt
e
t
x
t
x
u
2
1
exp
u
2
n
2
1
1
)
(
f
1
n
2
1
n
2
Zatem sam rozkład wariancji jest dany następującą
funkcją
Zasada największej wiarygodności
(Maximum Likelihood Principle)
Mamy próbę (x
1
,x
2
,...,x
n
)
f(x,): funkcja określająca rozkład gęstości
prawdopodobieństwa, gdzie jest
zestawem parametrów rozkładu.
Zasada największej wiarygodności: najlepsze
maksymalizuje prawdopodobieństwo
wystąpienia próby.
Ta zasada jest podstawą wszystkich metod
estymowania parametrów rozkładu
prawdopodobieństwa (a zatem i modelu
matematycznego) z próby danych.
Ponieważ poszczególne elementy próby są
niezależne
dx
x
f
dP
j
j
)
,
(
)
(
)
(
λ
N
j
j
dx
x
f
dP
1
)
(
)
;
(
λ
)
(
)
(
)
;
(
)
;
(
2
1
1
2
)
(
1
1
)
(
λ
λ
λ
λ
L
L
x
f
x
f
Q
N
j
j
N
j
j
iloraz wiarygodności
N
j
j
N
j
j
x
f
L
x
f
L
1
)
(
1
)
(
)
;
(
ln
)
;
(
λ
λ
funkcja
wiarygodności
Przykład jakościowego porównywania dwu
modeli poprzez obliczenie ilorazu
wiarygodności
Rzucamy monetą asymetryczną.
Przypuszczamy, że albo prawdopodobieństwo
wyrzucenia reszki jest 2 razy większe niż
prawdopobobieństwo wyrzucenia orła (A) albo
odwrotnie (B). Przypuśćmy, że w 5 rzutach
otrzymaliśmy 1 raz orła i 4 razy reszkę. Wtedy:
8
,
3
2
3
1
,
3
2
3
1
4
4
B
A
B
A
L
L
Q
L
L
Przykład zastosowania zasady największej
wiarygodności: obliczanie wartości średniej przy
założeniu, że rozkład prawdopodobieństwa jest
rozkładem normalnym
N
j
j
N
j
j
j
N
j
j
j
N
j
j
j
N
j
j
j
j
N
j
j
j
j
j
j
x
x
d
d
x
N
L
x
L
dx
x
dx
x
f
1
2
1
2
)
(
*
1
2
*
)
(
1
2
2
)
(
1
2
2
)
(
1
2
2
)
(
)
(
1
0
2
)
(
2
1
ln
)
2
ln(
2
ln
)
(
2
)
(
exp
2
1
2
)
(
exp
2
1
)
;
(
*
)
(
''
)
(
)
(
''
)
(
)
(
'
)
(
'
0
)
;
(
)
;
(
'
)
(
'
*
*
*
*
*
1
)
(
)
(
*
*
N
j
j
j
x
f
x
f
Właściwości asymptotyczne funkcji
wiarygodności
Dla dużych prób
2
2
*
2
2
*
*
2
*
2
'
)
(
)
(
'
1
)
(
)
(
*
2
)
(
exp
)
(
2
1
)
(
)
(
/
1
)
(
'
)
;
(
)
;
(
'
)
;
(
)
;
(
'
)
(
''
*
*
b
k
L
b
b
NE
x
f
x
f
NE
x
f
x
f
j
j
N
j
j
j
Obszary ufności w przestrzeni
parametrów
Obszar ufności definiujemy jako taki obszar w
otoczeniu wartości oczekiwanej wektora parametrów i
ograniczony powierzchnią o stałej gęstości
prawdopodobieństwa, że prawdopodobieństwo
znalezienia w nim prawdziwych wartości parametrów
jest nie mniejsze niż zadana wartość (kwantyl). W
jednym wymiarze mówimy o przedziale ufności.
1
2
P=g
1
2
*
99
.
0
3
;
683
.
0
)
1
(
)
erf(
2
)
(
)
(
)
(
2
)
(
exp
)
(
*
2
2
*
P
P
g
d
L
d
L
P
kg
k
L
W jednym wymiarze
01439
.
0
,
03734
.
0
,
09020
.
0
19875
.
0
,
39347
.
0
,
68269
.
0
2
1
,
2
)
exp(
)
(
1
)
,
(
2
,
2
)
;
(
6
5
4
3
2
1
0
1
0
2
2
W
W
W
W
W
W
n
P
W
dt
t
t
a
x
a
P
g
n
P
d
n
f
W
n
x
a
g
Ogólnie dla wielowymiarowego rozkładu
Gaussa