W przypadku szacowania proporcji populacji najlepszym estymatorem jest względna częstość występowania wyróżnionych w próbie elementów. W celu określenia ryzyka błędu, jaki można popełnić podczas estymacji struktury populacji na podstawie danych z próby, oblicza się błąd standardowy proporcji.
Estymacja przedziałowa. Estymacja przedziałowa wymaga określenia dwóch punktów, między którymi, zależnie od przyjętego poziomu ufności, znajduje się szacowany parametr populacji. Przedział otrzymuje się przez odłożenie w obu kierunkach od estymatora punktowego wielokrotności błędu standardowego, odpowiadającej wybranemu poziomowi ufności. Punkty skrajne przedziału ufności to:
.V - Z(,g(a)— punkt skrajny lewy,
x + Z(,o(a)— punkt skrajny prawy,
gdzie:
— liczba jednostek błędu standardowego dla wymaganego poziomu ufności,
o(.v) — standardowy błąd średniej arytmetycznej.
Poziom ufności wynosi 68% wówczas, gdy Z= 1,0; 90%, gdy Z =1,65, a 95%, gdy Z= 1,96. Standardowy błąd średniej arytmetycznej g(a) jest standardowym odchyleniem średnich z pobranych prób od średniej z badanej populacji. Oblicza się go, dzieląc wartość standardowego odchylenia populacji przez pierwiastek z wielkości próby. Przy próbach większych od 30 standardowe odchylenie populacji można zastąpić standardowym odchyleniem próby.
Załóżmy, że chcemy oszacować średnią liczbę pracowników zatrudnionych w firmach zagranicznych w Polsce w 2000 roku na podstawie 225-elcmcntowej próby, z której obliczona średnia x = 140 zatrudnionych, a odchylenie standardowe jss 150. Standardowy błąd średniej wynosi więc:
a(.v) =
s
W celu obliczenia poszukiwanych przedziałów ufności dla dwóch poziomów ufności (68% i 95%) odpowiednie wartości błędów standardowych umieszczamy wokół szacowanej średniej M:
P(.v - Zaa(x)) < M< (a + Z„G(a)) = I -a, (5.3)
skąd dla 68-procentowego poziomu ufności otrzymujemy:
x ± 1,0g(a) = 140 ± 1,0(10)= 130- 150
oraz dla 95-procentowego poziomu ufności mamy:
a ± 1,96g(a) = 140 ± 1.96(10)= 120,4- 159,6.
287