Estymacja przedziałowa:
Estymacja - procedura szacowania parametrów populacji generalnej lub rozkładów zmiennych losowych tych populacji generalnych, pozwala na minimalizowanie błędów, które powstają podczas wyciągania wniosków o populacji generalnej na podstawie badań próby.
Estymator to wielkość wyznaczona na podstawie próby losowej, służąca do oceny wartości nieznanych parametrów populacji generalnej. W celu uzyskania dobrej precyzji szacunku (małego błędu estymacji) należy:
prawidłowo wylosować próbę
dobrać możliwie najlepszy estymator dla szacowanego parametru
Własności dobrego estymatora:
nieobciążoność - wartość oczekiwana jest dokładnie równa wartości szacowanego parametru.
Obciążoność oznacza, że oszacowania dostarczone przez taki estymator są obarczone błędem systematycznym.
zgodność: - dla dostatecznie dużej próby błąd w ocenie parametru przez estymator jest mniejszy od dowolnie małej (z góry ustalonej) liczby.
efektywność: Estymator jest tym efektywniejszy, im mniejsza jest jego wariancja przy danej liczności próby n.
Przykłady estymatorów:
Estymatorem średniej (wartości oczekiwanej) w populacji generalnej jest średnia arytmetyczna z próby n-elementowej - zgodny, nieobciążony i najefektywniejszy, mediana, która jest estymatorem nieobciążonym, ale mniej efektywnym od średniej arytmetycznej. Estymatorem frakcji w populacji generalnej jest frakcja z próby p=m/n, gdzie: m - liczba jednostek statystycznych z wyróżnioną cechą a n - liczebność próby - zgodny, nieobciążony i najefektywniejszy.
Estymatorem wariancji populacji generalnej jest wariancja z próby. zgodny, ale obciążony. uzyskuje się wartości systematycznie zaniżone.
ESTYMACJA PUNKTOWA: polega na przyjęciu jednej konkretnej liczby otrzymanej z wyników próby losowej za ocenę nieznanej wartości parametru Q w populacji.
ESTYMACJA PRZEDZIAŁOWA:polega na konstruowaniu przedziału liczbowego na podstawie wartości uzyskanych z próby pobranej z badanej populacji generalnej, który (z określonym z góry bliskim jedności prawdopodobieństwem) będzie zawierał nieznaną wartość szacowanego parametru Q. Taki przedział nazywamy przedziałem ufności
Współczynnik ufności prawdopodobieństwo że przedział ufności o końcach a i b obejmuje jedną szukaną wartość parametru wynosi 1-α.
Im wyższy, tym większe jest prawdopodobieństwo, że natrafimy na przedział ufności z szukanym parametrem, ufności określa nam zaś pewność oszacowania
Jeżeli obierzemy współczynnik ufności 0,95 i zbudujemy 100 przedziałów ufności dla pewnego parametru to w 95 takich przedziałach ufności będzie znajdowała się wartość szukanego parametru, natomiast w 5 tego parametru nie będzie.
Poziom istotności jest to prawdopodobieństwo popełnienia błędu I rodzaju (odrzucenia sprawdzanej hipotezy, gdy jest ona prawdziwa). Określa tym samym maksymalne ryzyko błędu, jakie badacz jest skłonny zaakceptować.
Długość przedziału ufności - różnica między górną i dolną granicą przedziału ufności. Jest ona miarą precyzji estymacji przedziałowej. Im krótszy jest przedział ufności, tym precyzyjniejsza jest estymacja przedziałowa.
PRZEDZIAŁY UFNOŚCI DLA WARTOŚCI OCZEKIWANEJ:
Budowa przedziału ufności dla średniej (wartości oczekiwanej) m=E(X) rozkładu populacji jest uzależniona od założeń dotyczących:
typu rozkładu cechy X w populacji generalnej
znajomości wariancji (odchylenia standardowego) w populacji generalnej
wielkości próby
1.Przedział ufności dla średniej m populacji normalnej ze znanym odchyleniem standardowym:
Jeżeli zmienna losowa X (z próby) ma rozkład normalny o parametrach X: N (
, σ), to estymator - średnia arytmetyczna z próby ma rozkład normalny, a jej wartość standaryzowana ma rozkład normalny o parametrach 0, 1.
ZAŁOŻENIA: rozkład normalny cechy X w populacji generalnej, odchylenie standardowe σ jest znane
2.Przedział ufności dla średniej m w populacji normalnej z nieznanym odchyleniem standardowym:
Jeżeli cecha X w populacji generalnej ma rozkład normalny o parametrach X: N (
, σ), to zmienna losowa t (dla próby dużej) ma rozkład t-studenta o n-1 stopniach swobody.
ZAŁOŻENIA: rozkład normalny cechy X w populacji generalnej, nie znamy odchylenia standardowego σ
3.Przedział ufności dla średniej m w populacji o nieznanym rozkładzie:
Jeżeli zmienna losowa X ma w populacji generalnej dowolny, ale nie za bardzo silnie asymetryczny rozkład o średniej arytmetycznej
i odchylenia standardowym σ, to zmienna losowa ma rozkład normalny standaryzowany o parametrach 0,1, jeśli tylko liczebność próby jest dostatecznie duża (n co najmniej 100). Wartość σ, jeśli jej nie znamy, możemy zastąpić odchyleniem standardowym z próby.
PRZEDZIAŁ UFNOŚCI DLA FRAKCJI: Próba duża (0,15<p<0,85 - liczebność próby musi wynosić co najmniej 100, p<0,15 lub p>0,85 - liczebność próby musi wynosić kilkaset), to zmienna losowa ma rozkład normalny standaryzowany.