Metody probabilistyczne i statystyka Wykład
8
Estymacja przedziałowa
Dr Joanna Banaś
Zakład Matematyki Stosowanej
Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej Wydział Informatyki Zachodniopomorskiego Uniwersytetu Technologicznego w Szczecinie
Metody probabilistyczne i statystyka Wykład 8
22. Estymacja przedziałowa
Estymacja przedziałowa – metoda wyznaczenia takiego przedziału liczbowego, aby z prawdopodobieństwem bliskim 1 można było oczekiwać, że prawdziwa wartość interesującego nas parametru rozkładu cechy X znajduje się wewnątrz tego przedziału
θ – nieznany parametr zmiennej losowej X, ( X ,…, X ) – próba losowa 1
n
Jeżeli α
α ∈
∈ (
0 ,
1 )
i
U n =
=
U
n
(
X
1
, . . . ,
X n )
o
r
a
z
U
n =
=
U n (
X 1
, . .
. ,
X
n
) są
dwiema statystykami takimi, że
U
U
n
< n oraz
(22.1)
P ( U n < θ < U n ) = 1− α
to przedział losowy
(22.2)
( U n , U n )
nazywamy przedziałem ufnoś ci dla parametru θ na poziomie ufności 1−α
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Realizacja przedziału ufności
(22.3) Uwagi
a)
Jeżeli ( x ,…, x ) jest próbk
1
n
ą wartości cechy X i obliczymy wartości
statystyk
un = U n ( 1
x ,..., xn ) oraz un = U n ( 1
x ,..., xn ),
to
t o
tr
t zy
z m
y a
m m
a y
m
y prze
z d
e zi
z a
i ł
a
ł r
ze
z c
e z
c y
z w
y is
i ty
t
y
( u n, un )
n
,
u
n
) , k
tó
t ry
y j
es
e t
t j
ed
e ną
z wielu realizacji przedziału ufności (22.2) Liczby
u
u
n
i n nazywamy odpowiednio ocenami dolną i górną parametru θ
b)
Dla różnych próbek wartości cechy X będziemy otrzymywać różne realizacje przedziałów ufności, lecz np. dla α = 0.01 parametr będzie do nich należał w 99 przypadkach na 100 próbek Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 8
Przedziały ufności dla wartości oczekiwanej
– model 1
(22.4) Wartość oczekiwana
Model 1 (rozkład normalny, znana wariancja)
X – zmienna losowa o rozkładzie normalnym N( m,σ), wariancja σ2 = D 2 X jest znana
Średnia z próby
X
= 1 X +
+ X
N ( ,
m σ n ),
n (
X
1
+ . . .
+
X n ) ma rozkład N ( ,
m σ
Średnia z próby ma rozkład
)
zatem statystyka
X − m
X − m
U =
=
n
σ
σ
n
f ( x)
ma rozkład N(0,1) i dla dowolnego α∈(0,1)
N (0,1)
istnieje u takie,
α
α
2
α
że
2
1 0−.1α
P( u
− α < U < uα ) = 1− α
− u
0
u
α
α
Rys.22.1. Gęstość rozkładu N(0,1)
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedziały ufności dla wartości oczekiwanej
– model 1
Dalej dostajemy
Φ( u ) = 1 α
−
α
,
2
zatem u jest kwantylem rozkładu normalnego N(0,1) α
rzędu , odc
1 α
−
zytywanym z tablic, który będziemy
2
oznaczać pr
zez u (1 α
(1− 2 )
W rezultacie
X − m
1− α = P − u(1 α
− ) <
< u(1 α
− )
2
σ
2
n
P ( u(1 α) σ
X
m
u(1 α ) σ
=
−
−
<
−
<
−
2
2
n
n )
P ( X u(1 α) σ
m
X
u(1 α ) σ
=
−
−
<
<
+
−
2
2
n
n )
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedziały ufności dla wartości oczekiwanej
– model 1
Otrzymujemy przedział ufności dla wartości oczekiwanej na poziomie ufności 1−α
( X u(1 α) σ , X u(1 α) σ
−
−
+
−
2
2
n
n )
z realizacją dla próbki ( x ,…, x )
1
n
( x − u(1 α
(1 − ) σ
)
, x + u(1 α
(1− ) σ
−
−
+
−
(
)
2
2
n
n )
Przykład (do modelu 1)
Dokonano 100 pomiarów ciśnienia wody pewnym przyrządem
Wielkość pomiaru to zmienna losowa X o rozkładzie normalnym N( m,σ), gdzie odchylenie standardowe σ jest dla tego przyrządu znane i wynosi 2.1
Przyrząd mierzy bez błędu systematycznego, tzn. EX = m
Średnia z próbki wynosi 2.21
Oszacować nieznane średnie ciśnienie wody przedziałem ufności na poziomie ufności 0.95
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 8
Przedziały ufności dla wartości oczekiwanej
– model 2
Model 2 (rozkład normalny, wariancja nieznana)
X – zmienna losowa o rozkładzie normalnym N( m,σ), wariancja σ2 = D 2 X nie jest znana n
Jeśli
X
= X +
+ X
S = ∑
X − X
n (
. . .
n
) i i
,
n
i 1
= (
)2
2
1
1
1
to statystyka
X − m
t =
n −1
S
ma rozkład Studenta z n – 1 stopniami swobody Obszar ufności jest konstruowany
f ( x)
analogicznie do Modelu 1
t
α
Z tablic kwantyli rozkładu Studenta z n – 1
α
2
2
1 0−.1α
stopniami swobody odczytujemy kwantyl
α
α
t(1 α
− , n −1) rzędu
1
α
− taki, że
− t(1− , n −1)
0
t(1− , n −1)
2
2
2
2
Rys.22.2. Gęstość rozkładu t
P ( t(1 α , n 1) t t(1 α
−
−
−
< <
− , n −1) = 1− α
2
2
)
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedziały ufności dla wartości oczekiwanej
– model 2
Po przekształceniach otrzymujemy przedział ufności dla wartości oczekiwanej na poziomie ufności 1−α
( X − t(1 α
− , n −1) S , X + t(1 α
− , n −1) S
2
2
n 1
−
n 1
− )
z realizacją dla próbki ( x ,…, x )
1
n
( x − t(1 α
(1− , n −1) s
1)
, x + t(1 α
(1 − , n −1) s
(
1)
2
2
n 1
−
n 1
− )
2
2
n 1
−
n 1
−
Przykład (do modelu 2)
Przeprowadzono 10 niezależnych pomiarów wartości przyspieszenia ziemskiego w pewnym punkcie, otrzymując (w cm/s2): 980,1 978,9 977,3 979,2 978,2
981,0 980,5 976,9 979,3 978,6
Wielkość pomiaru to zmienna losowa o rozkładzie normalnym N( m,σ)
Przyrząd pomiarowy mierzy bez błędu systematycznego
Wyznaczyć 99 % realizację przedziału ufności dla wartości przeciętnej przyspieszenia ziemskiego
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedziały ufności dla wartości oczekiwanej
– model 3
Model 3 (rozkład nieznany, duża próba n ≥ 100 ) X – zmienna losowa o nieznanym rozkładzie, istnieją wartość oczekiwana EX = m i wariancja σ2 = D 2 X > 0
Jeśli próba jest duża ( n ≥ 100 ), to statystyka X − m
U =
n
σ
ma rozkład w przybliżeniu normalny N(0,1)
n
Ponieważ próba jest duża, przyjmujemy σ ≈ S = ∑
−
= ( X
X
i
n
i
)2
2
2
1
1
Powtarzając przekształcenia analogicznie do Modelu 1, otrzymujemy na poziomie ufności przedział
( X u(1 α) S , X u(1 α
−
−
+
− ) S
2
2
n
n )
z realizacją
( x u(1 α) s , x u(1 α
−
−
+
− ) s
2
2
n
n )
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 8
Przedziały ufności dla wariancji
i odchylenia standardowego – model 1
(22.5) Wariancja i odchylenie standardowe
Model 1 (rozkład normalny, parametry nieznane)
X – zmienna losowa o rozkładzie normalnym N( m,σ), parametry m i σ nie są znane
n
Jeś
e li
l
i
S
2
=
1
∑ X − X
n ∑
i
,
i 1
= (
X
−
X )2
2
1
) to
t s
ta
t t
a y
t s
y ty
t k
y a
2
2
nS
χ =
2
σ
f ( x)
2
χ
ma rozkład χ2 z n – 1 stopniami swobody
Dla dowolnego α∈(0,1) istnieją kwantyle
α
1− α
α
2
rzędu
α i
1
α
− rozkładu χ2 z n – 1
2
2
2
stopniami swobody takie, że
2
2
0
( α
χ
, n −1)
(1 α
χ
− , n −1)
2
x
2
P ( 2 α
2
2
( , n 1)
(1 α
χ
−
< χ < χ
− , n −1) = 1− α
Rys.22.3. G
2
2
)
ęstość rozkładu χ2
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedziały ufności dla wariancji
i odchylenia standardowego – model 1
Dalej dostajemy
2
2
nS
2
1− α = P χ (α , n −1) <
< χ (1 α
− , n −1)
2
2
2
σ
2
1
σ
1
σ
= P
<
<
2
2
2
χ (1 α
− , n −1)
nS
χ ( α , n −1)
2
2
2
2
nS
2
nS
= P
< σ <
2
2
χ (1 α
− , n −1)
χ ( α , n −1)
2
2
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedziały ufności dla wariancji
i odchylenia standardowego – model 1
W rezultacie otrzymujemy przedział ufności dla wariancji 2
2
nS
nS
,
2
α
2
χ (1− , n −1) χ ( α , n −1)
2
2
i dla odchylenia standardowego na poziomie ufności 1−α
2
2
nS
n
nS
nS
,
2
α
2
(1
, n 1)
( α , n 1)
χ
−
−
χ
−
2
2
Przykład (do modelu 1)
W celu oszacowania dokładności przyrządu pomiarowego, dokonano nim 9
niezależnych pomiarów pewnej wielkości fizycznej
Otrzymano odchylenie standardowe z próbki 0.5
Wielkość pomiaru to zmienna losowa o rozkładzie normalnym N( m,σ) Na poziomie ufności 0.9 oszacować przedziałem ufności odchylenie standardowe, które przyjmujemy za miarę dokładności przyrządu
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedziały ufności dla wariancji
i odchylenia standardowego – model 2
Model 2 (rozkład normalny, parametry nieznane, duża próba n ≥ 50) X – zmienna losowa o rozkładzie normalnym N( m,σ), parametry m i σ nie są znane
Jeśli próba jest duża ( n ≥ 50 ), to statystyka 2
2
nS
n
S
2χ =
2
=
2 n
2
σ
σ
ma w przybliżeniu rozkład normalny N ( 2 n − 3, ) 1 ,
a więc statystyka
2
U =
2χ − 2 n − 3
ma rozkład normalny N(0,1)
Wtedy dla α∈(0,1) otrzymujemy
P (
2
u(1 α )
2
2 n 3
u(1 α
−
−
<
χ −
− <
− ) = 1− α
2
2
)
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedziały ufności dla wariancji
i odchylenia standardowego – model 2
Dalej dostajemy
S
1− α = P 2 n − 3 − u(1 α
− ) <
2 n < 2 n − 3 + u(1 α
− )
2
2
σ
3
u(1 α
− )
S
3
u(1 α
− )
2
2
= P 1−
−
<
< 1−
+
2 n
2 n
σ
2 n
2 n
0
S
S
P
≈
< σ <
u (1 α )
u (1 α
−
− )
2
2
1+
1−
2 n
2 n
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedziały ufności dla wariancji
i odchylenia standardowego – model 1
W rezultacie otrzymujemy przedział ufności dla
odchylenia standardowego
S
S
α
,
u (1
( − )
u (1 α
−
( −
1
)
2
2
2
1+
1−
2 n
2 n
i dla wariancji na poziomie ufności 1−α
2
2
S
S
α
,
u (1
)
u (1 α
−
− )
2
2
1+
1−
2 n
2 n
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedział ufności dla wskaźnika struktury
(22.6) Wskaźnik struktury
Model (rozkład 0-1, parametr p nieznany, duża próba n ≥ 100) X – zmienna losowa o rozkładzie 0-1, parametr p nie jest znany Jeśli próba jest duża ( n ≥ 100 ), to statystyka M
p = n
gdzie M oznacza zmienną losową, której wartościami są liczby wyróżnionych elementów w n-elementowej próbce, ma w przybliżeniu rozkład normalny N (
(1− )
p,
p
p
n
)
Wtedy statystyka
M − p
n
U =
p (1− p)
ma rozkład N(0,1)
n
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedział ufności dla wskaźnika struktury
Dla α∈(0,1) otrzymujemy
M − p
1− α = P u
− (1 α
− )
n
<
< u(1 α
− )
2
2
p (1− p)
n
P (
p (1
( −
1 p)
p (1
( −
1 p)
M
α
M
α
=
− u(1− )
< p <
+ u(1−
(
=
−
−
<
<
+
)
n
2
n
n
2
n
)
Końce przedziału zależą od p, które nie jest znane, ale wobec n ≥ 100, można dla uproszczenia przyjąć
p
≈
m
n
Otrzymujemy realizację przedziału ufności dla próbki ( x ,…, x ) 1
n
m
(1 m
− )
m (1 m
− )
m
− u(1 α
− ) n
n
m
< p <
+ u(1 α
− ) n
n
n
2
n
n
2
n
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład 8
Przedział ufności dla wskaźnika struktury
Przykład
350 losowo wybranych wyrobów
Znaleziono 31 wyrobów wadliwych
Wykorzy
z stując
ą
c w
y
w nik b
ad
a an
a ia
a k
ontrolneg
e o
podać 99 % realizację przedziału ufności dla
frakcji wyrobów dobrych w całej partii
produkowanych wyrobów
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka Wykład
8
Dziękuję za uwagę
Opracowała Joanna Banaś