Estymacja
wykład 3
We wnioskowaniu statystycznym interesuje nas
POPULACJA
Wykorzystujemy próbę do uzyskania informacji na
temat populacji
POPULACJA
P2
P1 P3 Pn
x s
ź 1
Estymacja
Z prób reprezentatywnych obliczamy
wielkości statystyk, które są
estymatorami określonych parametrów
populacji
Przykładowo średnia arytmetyczna z próby
jest dobrym estymatorem wartości
oczekiwanej (wartości przeciętnej)
populacji
Wyróżnia się dwa rodzaje estymacji:
estymację punktową:
czyli metodę szacunku, za pomocą której jako
wartość parametru zbiorowości generalnej
przyjmuje się konkretną wartość estymatora
wyznaczonego na podstawie n-elementowej próby
(zakładamy, że wartość statystki z próby leży blisko wartości
parametru populacji)
estymację przedziałową:
za pomocą której wyznacza się przedział liczbowy,
który z ustalonym prawdopodobieństwem zawiera
nieznaną wartość szacowanego parametru
zbiorowości generalnej.
Statystki z próby jako estymatory
parametrów populacji
Parametr populacji, lub po prostu parametr,
to liczbowa charakterystyka populacji
Statystyka z próby, lub po prostu statystyka,
to liczbowa charakterystyka z próby
Estymatory punktowe
Estymator (statystyka z Parametr
próby) populacji
X ź
S
P p
Własności estymatorów:
Estymator jest nieobciążony, jeżeli jego wartość
oczekiwana jest równa parametrowi populacji, do
oszacowania której służy
Estymatora jest efektywny, jeżeli ma niewielką
wariancję (a tym samym niewielkie odchylenie
standardowe)
Estymator jest zgodny, jeżeli
prawdopodobieństwo, że jego wartość będzie
bliska wartości szacownego parametru, wzrasta
wraz ze wzrostem liczebności próby
Rozkłady z próby
Rozkład statystyki z próby jest rozkładem
prawdopodobieństwa wszystkich możliwych
wartości, jakie ta statystyka może przyjąć, jeśli
obliczamy je na podstawie losowych prób o tych
samych rozmiarach, pobranych z określonej
populacji
Zatem rozkład średniej z próby, to rozkład prawd.
wszystkich wartości, jakie może przybrać losowa
zmienna, gdy próba o liczebności n jest pobierana
z określonej populacji
Przykład
zbiór: (1, 2, 3, ..., 8)
prawdopodobieństwo wylosowania
każdej liczby = 1/8
losujemy dwie liczby ze zwracaniem
(kolejność ważna)
obliczamy ich średnią arytmetyczną
jaki jest rozkład tych średnich?
Obliczymy średnią i odchylenie
ź = 4,5
standardowe z populacji:
= 2,29
Natomiast wartość oczekiwana i
x = 4,5
odchylenie zmiennej losowej Xśr
=1,62
x
Zauważymy, że oczekiwana
x = ź
wartość jest równa średniej z
= / n
populacji, natomiast odchylenie x
standardowe
Centralne twierdzenie graniczne
Jeżeli pobieramy próbę z populacji o średniej ź i
skończonym odchyleniu standardowym , to rozkład
średniej z próby X , dąży do rozkładu normalnego o
/ n
średniej ź i odchyleniu , gdy liczebność próby
wzrasta nieograniczenie, czyli dla dostatecznie
dużych n
Co natomiast oznacza stwierdzenie
dostatecznie duże n ?
Twierdzenie mówi, że rozkład staje się
normalny , gdy n zmierza do nieskończoności
Prędkość, z jaką ten rozkład zmierza do
rozkładu normalnego zależy od kształtu
rozkładu w macierzystej populacji
Na rysunku poniżej pokazano kilka rozkładów w
macierzystych populacjach i wynikające stąd
rozkłady , dla prób o różnej liczebności.
normalny jednostajny prawoskośny
Rozkład
macierzystej
populacji
Rozkład Xśr
n=2
n=2
n=10
n=10
n=30
n=30
Estymacja
przedziałowa
- Dlaczego?
- Co to jest?
- Przedział ufności?
Przykład wyznaczania przedziału ufności dla
średniej arytmetycznej
ą = 0,05
ź -1,96
ź +1,96
n
n
Średnia
populacji
ź
Średnia
z próbki
x
1
x -1,96
1 Ten przedział ufności obejmuje
średnią populacji ź
n
x +1,96
1
n
x
2
Ten przedział ufności nie obejmuje
średniej populacji ź
x -1,96 x +1,96
2 2
Przy ą=0,05 zdarza się 5 razy na 100
n n
Podobna interpretacja dotyczy innych
statystyk, np. frakcji, odchylenia
standardowego itp.
Należy zwrócić uwagę, że do obliczania
przedziału ufności dla średniej arytmetycznej
stosuje się różne wzory w zależności od tego
jak liczna jest próbka i czy odchylenie
standardowe jest obliczone z próbki czy też
jest dane
Przedział ufności dla ź przy (1-ą) poziomie ufności, gdy
jest znane, a próba została pobrana z populacji normalnej
lub jest dużą próbą , wyznacza wzór:
x ą zą / 2
n
zą / 2
z1-ą / 2
ą / 2
ą / 2
Przypuśćmy że pobieramy próbę z populacji o rozkł.
normalnym.
Niech liczebność próby wynosi: n = 25
Obliczono średnią: xśr = 122
Odchylenie standardowe: 20
Zbudujmy 95% oraz 80% przedział ufności dla wartości
oczekiwanej:
95% przedział ufności: [114,16; 129,84]
80% przedział ufności: [116,88; 127,84]
Widać, że przedział 80% jest węższy
DLACZEGO?
ź +1,96 / n
ź -1,96 / n
Miara pola
Dla poziomu ufności
= 0,95
80%
kwantyl zą/2=1,28
x
x
ź
x
x
około 2,5%
x
około 2,5% wartości
x
wartości
x
x
x
x
x
x
Rozmiar przedziału dla różnej wielkości próby przy
takim samym poziomie ufności 80%
x = 122
121,49
122,51
przedział odpowiadający
próbie o liczebności 2500
x =122
127,12
116,88
przedział odpowiadający
próbie o liczebności 25
Przedział ufności dla średniej w populacji, gdy
odchylenie standardowe nie jest znane
Przedział ufności dla ź przy (1-ą) poziomie ufności,
gdy nie jest znane, a próba została pobrana z
populacji normalnej lub jest małą próbą , wyznacza
wzór:
s
x ą tą / 2
n
Gdzie tą/2 jest wartością z rozkładu t-Studenta o n-1
stopniach swobody, która odcina pod krzywą gęstości
pole o mierze ą/2 z prawej strony
Przedziały ufności dla wariancji w
populacji
W wielu sytuacjach interesuje nas wariancja lub
odchylenie standardowe w populacji. Tak jest np. w
analizie procesu produkcyjnego, w badaniach
procesów masowej obsługi. Jak już mówiliśmy
nieobciążonym estymatorem wariancji w populacji,
2 jest wariancja z próby S2.
Do wyznaczenia przedziału ufności dla wariancji w
populacji musimy poznać nowy rozkład, tzw. rozkład
chi-kwadrat lub 2 .
Rozkład chi-kwadrat
Rozkład ten podobnie jak rozkład t, charakteryzuje się
liczba stopni swobody, df ( df=n-1 )
W przeciwieństwie do rozkładu t, rozkład chi-kwadrat nie
jest symetryczny
df = 10
df = 30
df = 50
Rozkład chi-kwadrat
Rozkład chi-kwadrat jest rozkładem
prawdopodobieństwa sumy kwadratów
niezależnych, standaryzowanych, normalnych
zmiennych losowych.
Średnia rozkładu jest równa liczbie stopni
swobody df
Wariancja zaś jest równa liczbie stopni
swobody pomnożonej przez dwa.
Przedziały ufności dla wariancji w populacji
2
(1-ą )100% przedział ufności dla wariancji w populacji, , gdy rozkład w
populacji jest normalny, wyznacza wzór:
2 2
Ą# ń#
(n - 1)S (n -1)S
;
ó# Ą#
2 2
ą1-ą/2 1-ą 2 Ś#
Ł# / 2
ą/2
ą/2/
1-ą/2
2
gdzie: ą / 2 jest wartością zmiennej w rozkładzie chi-kwadrat o n-1 stopniach
2
swobody, która odcina pole o mierze ą / 2 z prawej strony; 1-ą / 2 jest wartością
zmiennej w rozkładzie chi-kwadrat, która odcina pole o mierze ą / 2 lewej strony
(a tym samym 1-ą / 2 z prawej strony).
Wyznaczanie liczebności próby
pobierz tak liczną próbę na jaka możesz sobie
pozwolić
koszty, czas..
Pytania:
Jakiego przybliżenia domagamy się od oceny
parametru na podstawie próby +/-B?
Jakiego poziomu ufności oczekujemy od
stwierdzenia, że odchylenie oceny na podstawie
próby od parametru populacji nie przekroczy B?
Jaka jest ocena wariancji populacji na
podstawie naszej próby?
1) Minimalna wymagana liczebność próby
do oszacowania średniej w populacji:
2 2
uą / 2 "
n =
B2
2) Minimalna wymagana liczebność próby do
oszacowania frakcji w populacji:
2
uą / 2 pq
n =
B2
uwaga:
zauważymy, że iloczyn pq gra analogiczną
rolę jak 2 w równaniu (1)
jak oszacować p?
można pobrać próbę pilotażową
lub przyjąć wartość p=0,5 tak aby
maksymalizować iloczyn pq (mamy
pewność, że liczebność próby jest
minimalną wymaganą)
Wyszukiwarka
Podobne podstrony:
sdz statystyka wyklad 4Statystyka wyklad 7Statystyka wyklad 4Statystyka wyklad4nowyStatystyka wykładyStatystyka wyklad5Statystyka wyklad 8Statystyka wyklad 3Statystyka wyklad 9Statystyka1st Wyklad2Statystyka wyklad 6Statystyka WykładyStatystyka1st Wyklad6 Regresja20151012 MichalTrzesiok Statystyka wyklad2 miary statystyczne handoutStatystyka wykladyStatystyka wykładyStatystyka1st Wyklad1więcej podobnych podstron