Estymacja przedziałowa parametrów zbiorowości generalnej
1
Estymację dzielimy na punktową i przedziałową. Ogólna idea estymacji polega na konstrukcji tzw. estymatorów,
które możliwie dobrze przybliżają wartość nieznanego parametru dla całej zbiorowości generalnej. Estymatorem jest
pewna statystyka z próby, której rozkład zależy od szacowanego parametru. Spośród możliwych estymatorów wybiera
się ten, który jest najbardziej optymalny, a dokładniej – spełnia własności zgodności, nieobciążoności, efektywności i
wystarczalności.
Konstrukcja przedziałów ufności jest związana z procedurą estymacji przedziałowej. Celem jest tutaj znalezienie
takiego przedziału, do którego z prawdopodobieństwem 1-
α należy nieznana wartość szacowanego parametru.
Parametr oznaczamy
θ, zaś estymator T
n
. Ogólnie przedział ufności zapisać można jako:
f
1
(T
n
) <
θ < f
2
(T
n
),
a prawdopodobieństwo:
P{f
1
(T
n
) <
θ < f
2
(T
n
)} = 1-
α.
1-
α jest miarą zaufania, współczynnikiem ufności;
Im większą przyjmuje wartość tym większe zaufania, ale jednocześnie tym szerszy przedział ufności. W praktyce
najczęściej 1-
α jest równe 0,9; 0,99; 0,95. α - nazywamy poziomem istotności.
Z rozpiętością przedziału wiąże się precyzja oszacowania – im węższy przedział tym większa precyzja. Precyzję
oznaczamy przez d (jest to połowa rozpiętości przedziału ufności). Im większa wiarygodność tym mniejsza precyzja i
odwrotnie.
Estymacja przedziałowa parametrów zbiorowości generalnej
2
Przedziały ufności dla wartości oczekiwanej.
Konstrukcja przedziału ufności dla wartości oczekiwanej E(X)=m jest uzależniona od typu rozkładu
badanej zmiennej X, od znajomości wariancji w populacji generalnej oraz od liczebności próby n.
Estymatorem T
n
nieznanego parametru
θ=m
jest średnia arytmetyczna z próby
x
. Estymator ten na
rozkład normalny
)
,
(
n
m
N
σ
. Rozważamy trzy przypadki:
1. Próbę losową prostą otrzymano z populacji generalnej o rozkładzie N(m,
σ), przy czym m- nie jest znane, zaś
σ - jest znane. Przedział ufności dla parametru m przyjmuje postać:
α
σ
σ
α
α
−
=
⎭
⎬
⎫
⎩
⎨
⎧
+
<
<
−
1
n
u
x
m
n
u
x
P
u
α
- odczytujemy z tablic dystrybuanty rozkładu normalnego standaryzowanego zgodnie z przyjętym
poziomem istotności
α, tak aby
2
1
)
(
α
α
−
=
Φ u
.
Estymacja przedziałowa parametrów zbiorowości generalnej
3
2. Próbę losową prostą otrzymano z populacji generalnej o rozkładzie N(m,
σ), przy czym oba parametry są nieznane a próba
jest mało liczna. Przedział ufności dla parametru m ma postać:
α
α
α
−
=
⎭
⎬
⎫
⎩
⎨
⎧
−
+
<
<
−
−
1
1
1
n
s
t
x
m
n
s
t
x
P
, gdzie
∑
−
−
=
n
i
i
x
x
n
s
1
2
)
(
1
.
t
α
- odczytujemy z tablic wartości krytycznych rozkładu Studenta dla n-1 stopni swobody (boczek tablicy) i przyjętego
poziomu istotności
α (główka tablicy).
3. W przypadku dużej próby losowej (n>30) otrzymanej z populacji o nieznanym rozkładzie z nieznanym parametrem
σ
przedział ufności dla parametru m przyjmuje postać:
α
α
α
−
=
⎭
⎬
⎫
⎩
⎨
⎧
+
<
<
−
1
n
s
u
x
m
n
s
u
x
P
Estymacja przedziałowa parametrów zbiorowości generalnej
4
Przedział ufności dla frakcji.
Wskaźnik struktury wyraża stosunek
n
k
, gdzie k oznacza liczbę elementów z wyróżnioną cechą, zaś n – liczebność próby.
Obliczony z próby wskaźnik struktury
n
k
jest estymatorem nieznanego odsetka p z populacji generalnej. Estymator ten dla dużych
prób (n>100) ma rozkład asymptotycznie normalny
n
p
p
p
N
)
1
(
,
(
−
).
Przedział ufności dla nieznanego parametru
θ=p
przyjmuje postać:
α
α
α
−
=
⎪
⎪
⎭
⎪⎪
⎬
⎫
⎪
⎪
⎩
⎪⎪
⎨
⎧
⎟
⎠
⎞
⎜
⎝
⎛ −
+
<
<
⎟
⎠
⎞
⎜
⎝
⎛ −
−
1
1
1
n
n
k
n
k
u
n
k
p
n
n
k
n
k
u
n
k
P
.
Estymacja przedziałowa parametrów zbiorowości generalnej
5
Przedział ufności dla odchylenia standardowego.
Zmienna losowa X ma rozkład N(m,
σ), przy czym oba parametry są nieznane ale wylosowano dużą próbę (n≥30).
Przedział ufności dla odchylenia standardowego
σ ma wówczas postać:
α
σ
α
α
−
=
⎪
⎪
⎭
⎪⎪
⎬
⎫
⎪
⎪
⎩
⎪⎪
⎨
⎧
−
<
<
+
1
2
1
2
1
n
u
s
n
u
s
P
.
Przedział ufności dla wariancji
Zmienna losowa X ma w populacji generalnej rozkład N(m,
σ), przy czym oba parametry są nieznane a wylosowana próba
mała (n<30). Przedział ufności dla wariancji
σ
2
na postać:
α
σ
−
=
⎪⎭
⎪
⎬
⎫
⎪⎩
⎪
⎨
⎧
<
<
1
1
2
2
2
2
c
ns
c
ns
P
.
Wartości c
1
i c
2
odczytujemy z tablic wartości krytycznych rozkładu chi – kwadrat dla przyjętego poziomu istotności
α, n-
1 stopni swobody (boczek tablicy) i w główce tablicy dla c
1
:
2
1
α
−
(P{
χ
2
≥c
1
}=1-
α/2) oraz dla c
2:
2
α
(P{
χ
2
≥c
2
}=
α/2).
Estymacja przedziałowa parametrów zbiorowości generalnej
6
Wyznaczanie niezbędnej liczebności próby.
1. W przypadku rozkładu normalnego N(m,
σ), σ - znane, bądź zbliżonego do normalnego, niezbędną liczebność próby dla
oszacowania nieznanej wartości parametru m populacji generalnej wyznaczamy ze wzoru:
1
2
2
2
+
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
=
d
u
n
σ
α
gdzie d – oznacza dopuszczalny, ustalony z góry, maksymalny błąd szacunku średniej m (czyli połowę długości przedziału
ufności).
2. Jeżeli populacja ma rozkład normalny N(m,
σ), σ - nieznane, ale znana jest wartość s obliczona na podstawie małej próby
(wstępnej) o liczebności n
0
elementów, wówczas:
1
1
2
2
2
+
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
+
=
d
s
t
n
α
Jeżeli n
≤n
0
to liczebność próby n
0
jest wystarczająca, w przeciwnym wypadku należy do próby dolosować jeszcze n-n
0
elementów.
3. W przypadku, gdy populacja generalna ma rozkład dwupunktowy z parametrem p i szacujemy ten właśnie parametr, tak by
przy współczynniku ufności 1-
α maksymalny błąd szacunku wskaźnika struktury nie przekroczył zadanej wartości d,
wówczas:
2
2
)
1
(
d
p
p
u
n
−
=
α
, gdy znamy rząd wielkości p
2
2
4d
u
n
α
=
,
gdy nie znamy rzędu wielkości p