MP 6 estymacja punktowa


Metody probabilistyczne
Estymacja podstawowych parametrów populacji
Estymacja punktowa
1
Problemy teorii estymacji - podstawowe pojęcia
W praktyce najczęściej brak informacji obejmujących wszystkie
jednostki zbiorowości  stąd konieczność prowadzenia badań
częściowych na podstawie próby spośród jednostek zbiorowości.
Dobór losowy prosty jest najprostszym sposobem doboru próby do
badań.
l Polega na bezpośrednim doborze jednostek badania do próby
statystycznej wprost z populacji generalnej i bez ograniczeń.
Dobór losowy
prosty
Niezależny Zależny
ze zwracaniem bez zwracania
2
1
Dobór losowy prosty
l Dobór losowy prosty niezależny
l teoretycznie najprostszy schemat losowania, na którym opiera
się cała teoria prawdopodobieństwa i statystyka matematyczna.
l dobór jednostek polega na bezpośrednim i nieograniczonym
wyborze jednostek z całej populacji generalnej do próby
i zwracaniu jednostki ponownie do populacji,
l stąd jednostka może być wybrana wielokrotnie.
l Dobór losowy prosty zależny
l intuicyjnie bardziej naturalny i w praktyce częściej stosowany.
l dobór jednostek polega na bezpośrednim i nieograniczonym
wyborze jednostek z całej populacji generalnej do próby, lecz
przy niezwracaniu jednostki ponownie do populacji.
l każda jednostka wylosowana nie uczestniczy w dalszym
losowaniu.
3
Inne sposoby doboru próby:
l losowanie za pomocą urny,
l losowanie za pomocą tablic liczb losowych,
l dobór losowy systematyczny,
l interwał losowania,
l dobór losowy warstwowy,
l dobór warstwowy proporcjonalny,
l dobór warstwowy nieproporcjonalny,
l dobór warstwowy optymalny,
l dobór losowy zespołowy,
l dobór zespołowy z jednakowymi lub różnymi p-stwami wyboru,
l dobór zespołowy wielostopniowy,
l dobór zespołowy wielofazowy,
l dobór kwotowy,
l dobór jednostek typowych,
l dobór przez eliminację,
l dobór celowy,
l dobór przypadkowy,
l dobór wygodny,
l dobór sieciowy,
4
l metoda kuli śniegowej.
2
Próba statystyczna
Próba statystyczna prosta (losowa)
l jest prawidłowym odbiciem zbiorowości wtedy, gdy struktura tej próby ze
względu na interesujące nas jest zbliżona do zbiorowości generalnej,
l jest wynikiem przeprowadzenia losowania - wyboru  n elementów z
populacji o liczebności  N
X  zmienna losowa (cecha),
która w populacji ma określony rozkład.
Przykład:
X  czas dojazdu pracowników, czas trwania rozmowy telefonicznej.
l Ciąg { x1, x2, . . . , xn} nazywamy próbą statystyczną prostą dokonaną na
zmiennych losowych X1, X2, . . . , Xn .
5
Próba statystyczna
Przestrzeń prób losowych
- zbiór wszystkich możliwych do wylosowania prób.
N
l Zbiór ten jest równy kombinacji podzbiorów ć


n-elementowych ze zbioru N-elementowego, czyli:
n
Ł ł
l Jeżeli losowanie z populacji generalnej będzie powtarzane, to za
każdym razem otrzymamy inny zbiór wartości {x1, x2, & xn}.
l W każdym tak wylosowanym zbiorze zmienna losowa X będzie
miała taki sam rozkład prawdopodobieństwa, charakterystyczny
dla danej populacji.
l Przy wnioskowaniu o parametrach populacji generalnej na
podstawie próby losowej posługujemy się funkcjami zmiennych
losowych tworzących próbę: X1, X2, & Xn.
Funkcje te noszą nazwę statystyki.
6
3
Statystyka
l Statystyką nazywamy zmienną losową Zn , która jest funkcją
borelowskich zmiennych losowych X1, X2, & , Xn
Zn = g(X1, X2,L, Xn)
l Statystyka jako zmienna losowa posiada pewien rozkład, który
nazywamy rozkładem statystyki z próby. Zależy on przede
wszystkim od rozkładu populacji, z której pochodzi próba oraz od
liczebności próby.
l Ze względu na liczebność próby rozkłady statystyk dzielimy na:
l dokładne  rozkłady p-stwa wyznaczone dla dowolnej liczby
naturalnej n, będącej liczebnością próby. Są one wykorzystywane
dla małych prób,
l graniczne - rozkład p-stwa statystyki, który otrzymuje się przy
założeniu nieograniczenie dużej próby, n".
l nie ma jednej określonej wartości n, od której uznajemy próbę
za dużą.
l w niektórych przypadkach rozkład dokładny już dla n>30
niewiele różni się od rozkładu granicznego, w innych
7
przypadkach potrzebujemy n>100.
Przykłady statystyk
n
l Średnia z próby
1
X = Xi

n
i=1
l Wariancja z próby
n
1 2
2
l gdy n > 30
S = - X )
(Xi
n
i=1
n
1 2
2
l gdy n d" 30
S* = (Xi - X )

n -1
i=1
l Częstość (frakcja, odsetek) z próby
w = m n
m  liczba zdarzeń sprzyjających
n  liczebność próby
8
4
Estymacja parametrów w populacji
na podstawie próby
l Estymacja  szacowanie (ocenianie) wartości nieznanych
parametrów rozkładu cechy statystycznej w populacji generalnej
(estymacja parametryczna) i postaci rozkładu badanych cech
(estymacja nieparametryczna) na podstawie próby losowej.
Rodzaje estymacji
parametrycznej
Estymacja punktowa Estymacja przedziałowa
wyznaczana jest jedna wyznaczany jest przedział wartości
wartość tzw. przedział ufności
9
Estymator
l Estymator nieznanego parametru Ś jest określoną statystyką z
próby służącą oszacowaniu nieznanej wartości parametru populacji.
l Rozkład prawdopodobieństw statystyki będącej estymatorem
parametru nosi nazwę rozkładu estymatora.
Mogą nim być rozkłady t-Studenta, chi-kwadrat, F-Snedecora i inne
zw. rozkładami z próby.
l Konkretną wartość, jaką przyjmuje estymator, gdy podstawimy do
funkcji określony układ obserwacji (wylosowanej próby), będziemy
nazywać oceną parametru.
  wartość nieznanego parametru Ś w populacji,
Zn  estymator nieznanego parametru Ś w populacji
(wzory średniej, wariancji lub wzór na częstość),
zn  wartość liczbowa estymatora nieznanego parametru w populacji
(liczba)  ocena nieznanego parametru Ś,
10
5
Estymator
Do oszacowania parametru Ś wykorzystuje się wyniki z próby losowej.
Zatem:
l Istnieje możliwość popełnienia błędu,
l Błędem szacunku nazywamy różnicę między estymatorem a
wartością parametru: Zn  Ś
2
l Miara błędu:
D = E(Zn - Q) = D2(Zn)
l Standardowy błąd szacunku: D(Zn)
l Współczynnik zmienności:
D(Zn)
V(Zn)=
Zn
11
Własności estymatorów
l Estymatory powinny spełniać kryteria określające
pożądane własności estymatora:
l Zgodność
l Nieobciążoność
l Efektywność
l Dostateczność
l Odporność.
12
6
Zgodność estymatora
Estymator parametru Ś nazywamy zgodnym, jeżeli jest stochastycznie
(w sensie prawdopodobieństwa) zbieżny do szacowanego parametru
limP{ Zn - Q < e}= 1 e 0

Interpretacja:
l ze wzrostem liczności próby wzrasta dokładność oszacowania
parametru Ś,
l gdy używa się estymatora zgodnego parametru wówczas stosowanie
dużych prób losowych (n>30) zwiększa dokładność szacunku tego
parametru,
l zgodność i nieobciążoność jest związana z prawem wielkich liczb.
13
Nieobciążoność estymatora
Estymator Zn jest nieobciążony, jeżeli
dla każdego n
E(Zn)= Q
tzn. estymator szacuje parametr bez błędu systematycznego
Obciążenie estymatora:
Ć Ć
Bn(Q)= E(Q)- Q
Estymatorem Zn jest asymptotycznie nieobciążony
Ć
lim E((Q)- Q)= 0

Interpretacja:
l Własność nieobciążoności oznacza, że przy wielokrotnym losowaniu próby
średnia z wartości przyjmowanych przez estymator nieobciążony równa się
wartości szacowanego parametru.
l Własność ta gwarantuje otrzymanie za jego pomocą ocen wolnych od błędu
systematycznego.
14
7
Zgodność i nieobciążoność estymatora
Współzależność pomiędzy własnościami zgodności i
nieobciążoności:
l Jeżeli estymator Zn parametru Ś jest zgodny, to równocześnie jest
asymptotycznie nieobciążony; twierdzenie odwrotne nie jest
prawdziwe.
l Jeżeli estymator Zn parametru Ś jest nieobciążony (lub
asymptotycznie nieobciążony) oraz, jeżeli jego wariancja w miarę
wzrostu liczebności próby zmierza do zera, to estymator Zn jest
estymatorem zgodnym.
15
Efektywność estymatora
l Efektywność jest związana z wielkością rozrzutu wartości
estymatora dookoła wartości jego wartości oczekiwanej.
Stosowanie praktyce estymatora efektywnego oznacza
popełnienie (in plus lub in minus) małego błędu średniego
szacunku D2(Zn) , który jest pierwiastkiem kwadratowym z
wariancji estymatora nieobciążonego. Jest to miara określająca
wielkość błędu przypadkowego (losowego).
l Najwyższa efektywność estymatora Zn występuje wtedy, gdy
jego wariancja
2
D2(Zn) = E[Zn - E(Zn)]
jest najmniejsza spośród wariancji dla wszystkich innych
estymatorów parametru Ś.
Taki estymator nazywa się estymatorem efektywnym.
16
8
Dostateczność estymatora
l Estymator jest dostateczny (wystarczający), jeżeli wykorzystuje
wszystkie informacje o parametrze zawarte w próbie i żaden inny
estymator nie może dać dodatkowych informacji o szacowanym
parametrze
Np.
n
1
X = Xi

n
i=1
ale nie
Xmax - Xmin
X =
2
17
Odporność estymatora
l Odporność estymatora  ma znaczenie przy występowaniu
obserwacji nietypowych (wątpliwych, rzadkich, odstających), które
wpływają na wynik estymacji.
l Wśród parametrów położenia estymatorami odpornymi są oparte
na charakterystykach pozycyjnych  moda i mediana.
18
9
Metody wyznaczania estymatorów
l Metoda momentów
- estymatory zgodne, ale przeważnie obciążone i mało efektywne,
l Metoda największej wiarygodności
- estymatory zgodne, asymptotycznie nieobciążone i asymptotycznie
efektywne,
l Metoda najmniejszych kwadratów
(estymacja parametrów wyrażających różne zależności między zmiennymi
losowymi)
- estymatory zgodne, nieobciążone, najefektywniejsze w klasie estymatorów
liniowych.
19
ESTYMACJA PUNKTOWA
20
10
Estymacja punktowa
Estymacja punktowa polega na szacowaniu wartości nieznanego
parametru Ś w populacji za pomocą estymatora Zn (wzoru).
l Liczba zn uzyskana na podstawie próby za pomocą estymatora
(wzoru) jest oceną nieznanego parametru Ś w populacji i jest
efektem estymacji punktowej.
l Aby uzyskać mały błąd szacunku należy zapewnić:
l losowy dobór próby,
l dostateczną jej liczebność,
l dobór możliwie najlepszego estymatora.
21
Estymacja wartości średniej w populacji generalnej
Niech cecha X ma w populacji rozkład normalny, ze średnią ź
i odchyleniem standardowym .
l Z populacji pobierana jest n-elementowa próba losowa prosta. Dowodzi
się, że przy podanych założeniach średnia z próby , będąca zmienną
X
E(X)= m
losową, ma rozkład normalny ze średnią
s
X Nć m;s
D(X)=
i odchyleniem standardowym , czyli
n
n Ł ł
X
l Rozkład średniej z próby jest więc zależny od:
l wartości parametrów ź i  rozkładu cechy w populacji oraz
l liczebności próby.
l W rozważaniach można posługiwać się standaryzowaną zmienną
X - m X - m
losową postaci:
U = = n
D(X) s
l Warto pamiętać, że E(U)=0 oraz D2(U)=1, czyli zmienna U ma rozkład
22
normalny U ~ N(0,1).
11
Estymacja wartości średniej  model 1
Model 1
l Cecha X w populacji ma rozkład N(ź,),
l   znane,
l z populacji pobieramy próbę n-elementową (x1, x2, & , xn).
Statystyka
X - m X - m
l
U = = n
s
D(X)
n
1
X = Xi

Estymator średniej w populacji:
n
i=1
s
D(X )=
Średni błąd szacunku:
n
ć s
Średnia z próby jest zmienną losową i ma rozkład
X
N m,
n
Ł ł
23
Estymacja wartości średniej  model 2
Model 2
l Cecha X w populacji ma rozkład N(ź,),
l   nieznane,
l próba mała n d" 30,
Statystyka
X - m
X - m
T = n -1
T = n
S
S*
n
n
1 2
1 2
l gdzie:
S = (Xi - X )
S* = (Xi - X )

n -1
i=1 n
i=1
l Zmienna t ma rozkład t-Studenta z n-1 stopniami swobody
(n-1 to liczba niezależnych obserwacji)
n
Estymator
1
X = Xi

n
i=1
l Nieobciążony, zgodny i najefektywniejszy parametru ź
24
12
Estymacja wartości średniej  model 3
Model 3
l Cecha X w populacji ma rozkład dowolny,
l   nieznane,
l Próba duża n > 30.
Statystyka
n
l 1 2
X - m
S = (Xi - X )

U = n
n i=1
S
l ma rozkład N(0,1)
Estymator
n
1
X = Xi

n
i=1
l Nieobciążony, zgodny i najefektywniejszy parametru ź
25
Estymacja wariancji
Model 1
l Cecha X w populacji ma rozkład N(ź,),
l ź  znane,   nieznane,
l z populacji pobieramy próbę n-elementową (X1, X2, & , Xn).
Statystyka
l
2
2
n n n
- nS2 (n -1)*S*
2
2 2
c = = = - m) = =

Ui ć Xis m 1 (Xi
2 2
s s
i=1 i=1 Ł łi s 2 i=1
l ma rozkład 2 z n-1 stopniami swobody,
l Rozkład 2 jest rozkładem jednoparametrycznym (parametrem  liczba
stopni swobody), prawostronnie asymetrycznym, z asymetrią malejącą
ze wzrostem liczby stopni swobody,
26
13
Estymacja wariancji  model 1
Model 1
l Cecha X w populacji ma rozkład N(ź,),
l ź i   nieznane,
l z populacji pobieramy próbę n-elementową (X1, X2, & , Xn).
l próba mała n d" 30
Statystyka
2 2
l (n -1)*S*
nS
2
2
c =
c =
2
2
s
s
Estymator wariancji
l
n n
2
1 2 1
2 2
S = (Xi - X ) S* = (Xi - X)

n n -1
i=1 i=1
l ma rozkład 2 z n-1 stopniami swobody ma rozkład 2 z n-1 stopniami swobody
zgodny, nieobciążony, asymptotycznie
l zgodny, obciążony, najbardziej
najefektywniejszy parametru 2,
efektywny parametru 2
27
Estymacja wariancji  model 2
Model 2
l Cecha X w populacji ma rozkład N(ź,),
l ź i   nieznane,
l Populacja generalna ma rozkład normalny N(ź,) lub zbliżony do
normalnego,
l Próba duża n > 30.
Statystyka
S -s
l
U = 2n gdzie S N(s ,s/ 2n)
s
l Statystyka U ma rozkład asymptotycznie N(0,1)
Estymator wariancji 2
n
l wariancja z próby
2
1
2
S = (Xi - X)

n
i=1
28
14
Estymacja wskaznika struktury
l Populacja badana ze wzgl. na cechę jakościową.
Często niezbędne jest oszacowanie prawdopodobieństwa p traktowanego
jako wskaznik struktury populacji.
l Niech zbiorowość generalna ma rozkład zero-jedynkowy z parametrem p.
Na podstawie próby szacujemy wskaznik struktury zgodnie ze wzorem:
m
Ć
p =
n
l jest estymatorem nieznanego wskaznika struktury w populacji,
gdzie: m liczba sukcesów (wyróżnionych elementów), które wystąpiły
w n-elementowej próbie,
l p^ ma rozkład asymptotycznie normalny ć
p *(1- p)

Ć
p = N p,

n
Ł ł
Ć* Ć
Ć
p (1- p)
l Średni błąd szacunku:
Ć
Ć
D(p)=
n
29
Estymacja wskaznika struktury  model 1
Model 1
l Cecha X w populacji ma rozkład zero-jedynkowy z parametrem p,
l Próba duża n > 100.
m
Statystyka
- p
Ć
p - p
n
l
U = =
Ć Ć Ć Ć
p(1- p) p(1- p)
n n
l Statystyka U ma rozkład N(0,1)
m
Estymator wskaznika struktury
Ć
p =
l n
l Zgodny, nieobciążony najbardziej efektywny parametru p
30
15
Estymacja wskaznika struktury  model 2
Model 1
l Cecha X w populacji ma rozkład zero-jedynkowy z parametrem p,
l Próba mała n d" 100.
Statystyka
l specjalne tablice dla przedziałów ufności
31
16


Wyszukiwarka

Podobne podstrony:
MP 6 estymacja przedzialowa
estymacja punktowa
estymacja punktowa
Estymatory Estymacja punktowa i przedziałowa
Stymulus Zestaw6 STP MP Gesundheitswesen
(1) Estymacja
MUTACJA PUNKTOWA
bibliografia mp
Kunce A Antropologia punktów Rozważania przy tekstach R Kapuscińskiego
estymacja wzory
Stymulus Zestaw@ STP MP Berlin
Punktowe testy skórne
Wnioskowanie statystyczne estymacja zadania przykładowe
MP logika rozmyta

więcej podobnych podstron