populacji nic zmienia się, różne mogą być średnie obliczane z prób, różne więc może być położenie przedziału ufności otaczającego te średnie. Niekiedy zdarza się, że (z małym prawdopodobieństwem a) przedział ufności, jak to pokazano na rysunku 4.3 nie pokrywa rzeczywistej wartości estymowanego parametru.
Załóżmy, że elementy populacji generalnej można podzielić na dwie grupy np. „A” i „nic A". Oznaczmy przez n prawdopodobieństwo (częstość) wystąpienia elementu grupy A i przez (1 — n) prawdopodobieństwo wystąpienia elementu z grupy „nie AAby oszacować nieznaną wartość n losujemy z populacji generalnej próbę o liczebności n elementów. Przez r oznaczymy liczbę elementów grupy A w próbie. Spodziewamy się, że obliczona z próby frakcja
r
będzie estymatorem nieznanej wielkości n z populacji generalnej. I tak jest rzeczywiście. Teoria mówi nam, że wartość oczekiwana statystyki /; jest równa n.
(4.7)
E(p) = n
wariancja p wynosi
°łW«n'(1H-n) (4.8)
zaś sama zmienna p (a właściwie zmienna r = n p) ma rozkład dwumianowy. W miarę jak rośnie wielkość próby n, rozkład p zmierza do normalnego.
Przy określaniu przedziału ufności dla częstości FI w populacji wykorzystujemy na ogól tę ostatnią własność, pamiętając jednak, że próba musi być duża. Wyznaczenie przedziału ufności dla częstości n z małej próby nie jest sprawą prostą. Trzeba korzystać z własności i postaci rozkładu dwumianowego lub ze specjalnych tablic (np.: Tablice statystyczne, pod red. W. Sadowskiego). Tutaj zagadnienie to nie będzie poruszane.
Załóżmy, że rozpatrywana populacja generalna ma rozkład dwupunktowy z parametrem n, który nie jest zbyt mały (II > 0,05). Z populacji wylosowano dużą próbę (/i > 100), przy czym wyznaczona z próby frakcja wynosi p. Jeżeli ani n ■ p ani n - (1 -p) nie są zbyt małe (są większe niż 10). to można oszacowywać przybliżony przedział ufności dla częstości n zgodnie z poniższym zapisem:
45