PiS15 W05 Estymacja i weryfikacja parametrow populacji

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

1

PiS15 W05: ESTYMACJA I WERYFIKACJA

PARAMETRÓW POPULACJI

1. Estymacja punktowa, estymator, jego ocena i własno-

ści

2. Estymator wartości oczekiwanej

Przykład 1

3. Estymator wariancji populacji

Przykład 2

4. Estymator wskaźnika struktury
5. Estymacja przedziałowa, przedział ufności i poziom

ufności

Przykład 3

6. Hipotezy statystyczne i ich podział

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

2

7. Weryfikacja hipotezy statystycznej
8. Testy parametryczne

Przykład 4

Przykład projektu zaliczeniowego cz. 3

Tablice statystyk:

http://www.statsoft.com/textbook/sttable.html#chi

ZAŁĄCZNIKI:

1. Modele przedziałów ufności dla wartości oczekiwanej, wa-

riancji i wskaźnika struktury przy jednej populacji

2. Modele przedziałów ufności dla wartości oczekiwanych, wa-

riancji i wskaźników struktury przy dwóch populacjach

3. Testy dotyczące wartości oczekiwanej, wariancji i wskaźnika

struktury w jednej populacji.

4.

Testy dotyczące wartości oczekiwanej, wariancji i wskaźnika
struktury w dwóch populacjach

.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

3

1. Estymacja punktowa, estymator, jego ocena i
własności

Estymacja punktowa

(

point estimation

), to grupa metod

statystycznych, służąca do punktowego oszacowania wartości
nieznanego parametru rozkładu cechy w populacji.

Badany rozkład cechy X w populacji zależy od nieznanego

parametru θ i parametr ten jest szacowany na podstawie pro-
stej próby losowej X

n

.

W szczególności, estymować można wartość oczekiwaną,

wariancję i wskaźnik struktury badanych cech w populacji.

W przypadku badania populacji ze względu na dwie cechy

estymować można współczynnik korelacji.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

4

Estymatorem

U

n

nieznanego parametru

populacji gene-

ralnej nazywamy statystykę U

n

h(X

n

) służącą do jego osza-

cowania.

Oceną parametru

nazywamy każdą realizację u

n

esty-

matora U

n

. Ocena parametru prawie zawsze różni się od rze-

czywistej wartości parametru θ.

Miarą błędu estymacji jest różnica d

U

n

θ.

Własności dobrego estymatora

Nieobciążoność. Estymator U

n

nazywamy

estymatorem

nieobciążonym

, jeśli:

E(U

n

)

.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

5

Jeśli E(U

n

)

b(U

n

), to estymator nazywamy

estymato-

rem obciążonym

, zaś samą różnicę nazywamy

obciążeniem

estymatora

(

bias of an estimator)

.

Asymptotyczna nieobciążoność. Estymator nazywamy

asymptotycznie nieobciążonym

, jeśli obciążenie estymatora

dąży do zera przy rosnącej liczebności próby, tj.

0

)

(

lim

n

n

U

b

.

Zgodność. Estymator nazywamy

zgodnym

, jeśli jest stocha-

stycznie zbieżny do szacowanego parametru, tj.

1

)

P(

lim

n

n

U

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

6

W konsekwencji zwiększając liczebność próby, zmniejszamy
ryzyko błędu.

Efektywność. Spośród zbioru wszystkich nieobciążonych
estymatorów U

1,n

, U

2,n

,…, U

r

,

n

estymatorem najefektyw-

niejszym

nazywamy estymator o najmniejszej wariancji.

Definicja efektywności jest bardzo niewygodna, ponieważ do
wyznaczenia najefektywniejszego estymatora potrzebna jest
znajomość wariancji wszystkich estymatorów nieobciążonych
danego parametru. W praktyce korzysta się z

nierówności

Rao-Cramera.



background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

7

2. Estymator wartości oczekiwanej

Średnia arytmetyczna jest

estymatorem nieobciążonym

i

jednocześnie

estymatorem największej wiarygodności

warto-

ści oczekiwanej

zm. l.

, jeżeli przynajmniej:

liczba obserwacji jest dostatecznie duża (zob.

CTG

),

rozkład badanej cechy jest normalny.

Średnia dla

szeregu szczegółowego

(

średnia nieważona

):

n

i

i

x

n

1

1

x

Jeżeli dane są pogrupowane w klasy w postaci

szeregu

rozdzielczego

, stosujemy wzór ważony (

średnia ważona

):

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

8

i

m

i

i

n

k

n

1

1

x

gdzie k

i

to liczba reprezentująca i-tą klasę, zaś n

i

to liczebność

i-tej klasy (i = 1, 2,…, m).
Przykład 1. Wyniki 130 pomiarów (wyrażonych w [j.u.])
pewnej wielkości losowej X są zestawione w tabeli.

Tabela

danych pogrupowanych

Przedziały klasowe

dla wartości zm. X

Liczba

obserwacji

co najwyżej 3,6

2

(3,6

4,2]

8

(4,2

4,8]

35

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

9

(4,8

5,4]

43

(5,4

6,0]

22

(6,0

6,6]

15

ponad 6,6

5

Wyznaczyć:

a) szereg rozdzielczy,
b) średnią arytmetyczną.

Rozwiązanie.

a) Szereg rozdzielczy

Numer i przedziału

klasowego

Reprezentant klasy

1

k

i

Liczba obserwacji

n

i

1

3,3

2

2

2

3,9

8

1

Tutaj środek przedziału klasowego.

2

Wartość przyjęta umownie.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

10

3

4,5

35

4

5,1

43

5

5,7

22

6

6,3

15

7

6,9

3

5

b) Ponieważ dane są w postaci szeregu rozdzielczego, więc
wyznaczamy średnią arytmetyczną ważoną

]

.

.

[

15

,

5

)

5

9

,

6

...

8

9

,

3

2

3

,

3

(

130

1

1

1

u

j

n

k

n

i

m

i

i

x

Średnia uzyskanych pomiarów wynosi 5,15 [j.u.].

3

Wartość przyjęta umownie.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

11

3. Estymator wariancji populacji

Wariancję

2

X

w populacji X można oceniać wariancją

empiryczną s

2

(x). Dla szeregu szczegółowego:

n

i

i

x

n

s

1

2

2

1

1

)

(

x

x

gdzie

x

i

kolejne wartości próby losowej,

x

średnia arytmetyczna

z próby,

n

liczba elementów w próbie.

Dla danych w postaci

szeregu rozdzielczego

:

m

i

i

i

k

n

n

s

1

2

2

1

1

)

(

x

x

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

12

Przykład 2. Dla danych z przykładu 1 wyznacz wariancję z próby.

Tablica. Obliczenia pomocnicze.

i

n

i

k

i

x

(k

i

x

)

2

n

i

(k

i

x

)

2

1

2

1,85 3,4225

6,8450

2

8

1,25 1,5625

12,5000

3

35

0,65 0,4225

14,7875

4

43

0,05 0,0025

0,1075

5

22

0,55

0,3025

6,6550

6

15

1,15

1,3225

19,8375

7

5

1,75

3,0625

15,3125

= 130

= 76,045

Stąd wariancja i odch. std. z próby wynoszą:

589496124

,

0

)

(

2

x

s

[j.u.]

2

, s(x) = 0,767786509 [j.u.].

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

13

4. Estymator wskaźnika struktury

Wskaźnikiem struktury

nazywamy parametr p w populacji

X ~ B(p), tj. prawdop. zaobserwowania wyróżnionej cechy.

Estymatorem wskaźnika p jest częstość z próby X

1

,…, X

n

:

n

X

P

i

n

,

gdzie K

X

i

jest liczbą elementów próby, które posiadają

wyróżnioną cechę, a n jest liczebnością próby.

Zastosowanie CTG do estymacji wskaźnika struktury.

Je-

żeli liczebność próby n wzrasta, to rozkład estymatora

n

P

, dą-

ży do rozkładu N(p,

n

p

p

/

)

1

(

).

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

14

5. Estymacja przedziałowa, przedział ufności i po-
ziom ufności

Estymacja przedziałowa

to grupa metod

statystycznych

służących do oszacowania parametrów rozkładu cechy w

po-

pulacji generalnej

. W metodach estymacji przedziałowej oce-

ną parametru nie jest konkretna wartość, ale pewien przedział,
który z określonym prawdop. pokrywa nieznaną wartość pa-
rametru. Podstawowym pojęciem estymacji przedziałowej jest

przedział ufności

.

Niech cecha X ma rozkład w populacji z nieznanym parame-

trem θ. Z populacji wybieramy

próbę losową

(X

1

, X

2

, ..., X

n

).

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

15

Przedziałem ufności

nazywamy taki przedział (θ

θ

1

, θ +

θ

2

), który spełnia warunek:

P(θ

1

< θ < θ

2

) = 1 − α,

gdzie θ

1

i θ

2

są statystykami wyznaczonymi z próby losowej.

Pojęcie przedziału ufności zostało wprowadzone do staty-

styki przez

Jerzego Spławę-Neymana

4

,

4

Jerzy Spława-Neyman (1894 - 1981) – polski matematyk. Studiował matematykę w

Charkowie. W 1921 wrócił do Polski, gdzie prowadził badania i wykłady. Od 1938 przebywał w USA. Zo-
stał profesorem Uniwersytetu w Berkeley. W swych pracach zajmował się głównie statystyką oraz teorią
mnogości i i rachunkiem prawdopodobieństwa. Wprowadził pojęcie

przedziału ufności

.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

16

Jako kryterium wyboru najlepszych przedziałów ufności

przyjmujemy te statystyki dla których otrzymamy najkrótsze
przedziały.

Wielkość 1



nazywamy poziomem ufności.

Poziom uf-

ności

jest to prawdop., że wartość szacowanego parametru θ

znajduje się w wyznaczonym przedziale ufności. Im większa
wartość tego współczynnika, tym szerszy przedział ufności, a
więc mniejsza dokładność estymacji parametru. Im mniejsza
wartość 1

α, tym większa dokładność estymacji, ale jedno-

cześnie tym większe prawdop. popełnienia błędu. Wybór od-
powiedniego współczynnika jest więc kompromisem pomię-
dzy dokładnością estymacji a ryzykiem błędu. W praktyce
przyjmujemy zazwyczaj wartości: 0,99; 0,95 lub 0,90.


background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

17

Przykład 3. W pewnym zakładzie zbadano 500 urządzeń
spośród nowo wyprodukowanej partii i otrzymano następują-
cy rozkład liczby usterek:

Liczba usterek

0

1

2 3 4 5 6

Liczba urządzeń 112 168 119 63 28 9

1

a) Ocenić wartość oczekiwaną i odchylenie standardowe

liczby usterek w każdym z produkowanych urządzeń.
Ocenić wskaźnik struktury urządzeń bez usterek.

b) Na poziomie ufności 0,95 wyznaczyć przedział ufności

dla przeciętnej liczby usterek.

c) Na poziomie ufności 0,99 wyznaczyć przedział ufności

dla odchylenia stand. liczby usterek.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

18

d) Na poziomie ufności 0,90 wyznaczyć przedział ufności

dla wskaźnika produkowanych urządzeń bez usterek.

Rozwiązanie.

Niech X oznacza liczbę usterek w badanej po-

pulacji urządzeń, tj. w każdym z produkowanych urządzeń. W
rozwiązaniach korzystamy z CTG, więc musimy założyć, że
istnieje skończona wariancja zm. l. X o nieznanym rozkładzie.
Próba jest bardzo duża, n = 500, więc można z tego twierdze-
nia skorzystać.

a) Dane dotyczące liczby usterek są podane w postaci szeregu
rozdzielczego, więc obliczamy średnią arytmetyczną ważoną.
Obliczone z próby wartości statystyk wynoszą:

52

,

1

x

,

24

,

1

s

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

19

Stąd oceny nieznanych parametrów:

52

,

1

ˆ

x

X

m

,

24

,

1

ˆ

s

X

,

224

,

0

500

112

ˆ

n

x

p

p

i

n

b) Rozkład populacji oraz odchylenie standardowe populacji
są nieznane. Próba jest duża, więc końce przedziału wyzna-
czamy ze wzoru:

n

s

z

2

/

1

x

Dane i obliczenia pomocnicze: n = 500,

52

,

1

x

, s = 1,24, 1

= 0,95, kwantyl z

0,975

rozkładu N(0, 1) odczytany z tablic

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

20

lub wyznaczony za pomocą programu komputerowego wyno-
si z

0,975

= 1,96. Stąd otrzymujemy

.

500

24

,

1

96

,

1

52

,

1

Wniosek:

Przedział (1,41; 1,6395) jest 95

procentową reali-

zacją przedziału ufności dla przeciętnej liczby usterek.

c) Próba jest bardzo duża, więc korzystamy z granicznego
rozkładu statystyki S, tj. z rozkładu normalnego. Przedział uf-
ności dla odchylenia standardowego

jest postaci:

n

z

s

n

z

s

2

1

1

2

1

1

2

/

1

2

/

1

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

21


Dane i obliczenia pomocnicze:

n = 500, s = 1,24, 1

= 0,99,

kwantyl z

0,995

rzędu 0,995 standardowego rozkładu normalne-

go wynosi 2,5758. Stąd otrzymujemy oszacowanie

1000

576

,

2

1

24

,

1

1000

576

,

2

1

24

,

1

.

Wniosek:

99 procentową realizacją przedziału ufności dla

nieznanego odchylenia standardowego liczby usterek produ-
kowanych urządzeń jest przedział (1,15; 1,35).

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

22

d) Badana cecha ma rozkład B(p), gdzie p jest nieznanym
wskaźnikiem bezusterkowości. Próba jest duża, więc do wy-
znaczenia końców przedziału ufności dla p korzystamy z:

n

p

p

z

p

n

)

1

(

2

/

1

Dane: n = 500,

224

,

0

n

p

, 1

= 0,90, z

0,95

= 1,645, stąd

03067

,

0

22400

,

0

500

776

,

0

224

,

0

645

,

1

224

,

0

.

Wniosek:

90 procentową realizacją przedziału ufności dla

wskaźnika p jest przedział (0,19333; 0,25467).

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

23

6. Hipotezy statystyczne i ich podział

Weryfikację hipotez statystycznych ograniczamy tylko do
klasycznej teorii J. Neymana i E. Pearsona, dotyczącej

testów

istotności

(test of significance).

Hipoteza statystyczna

(statistical hypothesis) to dowolne

przypuszczenie dotyczące rozkładu cech w populacji, tj. po-
staci funkcyjnej lub wartości parametru rozkładu.

Przykłady hipotez statystycznych

:

czas dojazdu do pracy pracowników firmy A ma rozkład

N(25, 5) (min),

zawartości szkodliwych związków w spalinach samocho-

dów z katalizatorem i bez katalizatora różnią się,

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

24

Formułowanie hipotezy statystycznej rozpoczynamy od

zebrania informacji na temat określonej cechy w badanej po-
pulacji i jej możliwego rozkładu. Dzięki temu możliwe jest
zbudowanie

zbioru hipotez dopuszczalnych

, czyli zbioru roz-

kładów, które mogą charakteryzować badaną cechę (lub ce-
chy) w populacji.

Formalnie, hipotezą statystyczną nazywamy każdy pod-

zbiór zbioru hipotez dopuszczalnych.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

25

Hipotezy statystyczne dzielimy na:

hipotezy parametryczne

(parametric hypothesis)

dotyczą

wartości parametru rozkładu badanej cechy,

hipotezy nieparametryczne

dotyczą postaci funkcyjnej

rozkładu, niezależności, losowości.

Według innego kryterium podział przebiega następująco:

hipotezy proste

(simple hypothesis)

hipoteza jedno-

znacznie określa rozkład danej populacji, czyli odpowiada-
jący jej podzbiór zbioru

zawiera dokładnie jeden ele-

ment (rozkład),

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

26

hipotezy złożone

(composite hypothesis)

hipoteza określa

całą grupę rozkładów, zaś odpowiadający jej podzbiór
zbioru

zawiera więcej niż jeden element.

Stwierdzenie: „wzrost badanej populacji jest określony roz-

kładem normalnym o parametrach m

1,75m i σ

10” jest

hipotezą parametryczną, ponieważ określa wartość parame-
trów rozkładu oraz hipotezą prostą, bo jednoznacznie definiu-
je rozkład.

Stwierdzenie: „wzrost badanej populacji jest określony roz-

kładem normalnym” jest hipotezą nieparametryczną

nie do-

tyczy wartości parametrów rozkładu i złożoną

określa wię-

cej niż jeden możliwy rozkład.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

27

7. Weryfikacja hipotezy statystycznej

Weryfikacją hipotezy (hypothesis testing) nazywamy

sprawdzanie sądów o populacji, sformułowanych bez zbada-
nia jej całości. Przeprowadzamy ją na podstawie próby loso-
wej X pobranej z populacji X, której hipoteza dotyczy. Prze-
bieg procedury weryfikacyjnej przebiega w 5. krokach.

Krok 1: Sformułowanie hipotez: zerowej i alternatywnej
Hipoteza zerowa
H

0

(null hypothesis)

jest to hipoteza pod-

dana procedurze weryfikacyjnej. Przykładowo, wnioskując o
pewnym parametrze rzeczywistym w dwóch populacjach, hi-
poteza zerowa (ozn. H

0

) może mieć jedną z trzech postaci:

H

0

: θ

1

θ

2

(hipoteza prosta),

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

28

H

0

: θ

1

θ

2

(hipoteza lewostronna),

H

0

: θ

1

θ

2

, (hipoteza prawosytronna),

gdzie

R jest daną wartością.

Hipoteza alternatywna H

1

(alternative hypothesis)

hipoteza

przeciwstawna do hipotezy zerowej:

H

1

: θ

1

θ

2

(hipoteza dwustronna),

H

1

: θ

1

θ

2

>

(hipoteza prawostronna),

H

1

: θ

1

θ

2

<

(hipoteza lewostronna).

Na przykład, założeniu symetryczności monety odpowiada
prosta hipoteza zerowa H

0

: p = ½. Natomiast hipoteza złożona

H

1

: p

½, odpowiada założeniu o braku symetryczności.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

29

Krok 2 (opcjonalny): Przyjęcie poziomu istotności α

Przyjmujemy a priori dopuszczalne prawdop. popełnienia

błędu I rodzaju (error of first kind), który polega na odrzuce-
niu hipotezy zerowej wtedy, gdy jest ona prawdziwa. Praw-
dop. to oznaczamy symbolem α i nazywamy przyjętym po-
ziomem istotności
(significance level) testu. Ryzyko popeł-
nienia błędu

winno być jak najmniejsze, więc zwykle za-

kładamy, że poziom istotności α ≤ 0,1.

Nie odrzucenie fałszywej hipotezy H

0

nazywamy błędem

II rodzaju. Prawdop. popełnienia tego błędu oznaczamy

.

Prawdop. (1



) nazywamy mocą testu.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

30

Krok 3: Wybór testu i obliczenia

Statystycy budują różne statystyki U, które są funkcjami

prób losowych U = h(X

n

) i wyznaczają ich rozkłady przy za-

łożeniu, że odpowiednie hipotezy H

0

są prawdziwe.

Odpowiednią statystykę U zastosowaną do weryfikacji hi-

potezy H

0

nazywamy statystyką testową

lub testem hipotezy

H

0

. Wyboru testu dokonujemy na podstawie spełnianych za-

łożeń.

Wyniki próby opracowujemy tak, aby można z cząstko-

wych obliczeń wyznaczyć wartość u

0

odpowiedniej statystyki

testowej U. Najczęściej stosowane statystyki testowe mają
dokładny lub graniczny rozkład normalny, rozkład t-Studenta,
rozkład chi-kwadrat lub rozkład Snedecora.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

31

Krok 4: Wyznaczenie obszaru krytycznego

Obszar krytyczny (critical region)

podzbiór R

zbioru

wartości statystyki testowej dla których hipoteza H

0

jest od-

rzucana. Obszar ten znajduje się zawsze na krańcach rozkładu
statystyki. Wielkość obszaru krytycznego zależy od poziomu
istotności α, natomiast jego położenie określane jest przez hi-
potezę H

1

.

Wartości graniczne obszaru krytycznego nazywamy war-

tościami krytycznymi. Wartości krytyczne są odczytywane z
tablic kwantyli lub są obliczane komputerowo przy danym α,
tak aby spełniona była relacja zależna od sposobu sformuło-
wania hipotezy H

1

:

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

32

gdy H

1

typu ≠, to obszar krytyczny dwustronny

R

{u

R: u < u

/2

u > u

1



/2

}, ,

gdy H

1

typu >, to obszar krytyczny prawostronny

R

{u

R: u > u

1



},

gdy H

1

typu <, to obszar krytyczny lewostronny

R

{u

R: u < u

}, ,

gdzie u

jest kwantylem rzędu

rozkładu statystyki U.



background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

33

Krok 5: Podjęcie decyzji

Sprawdzamy, czy obliczona z próby wartość statystyki u

0

na-

leży do obszaru krytycznego R

.

Jeżeli wartość statystyki znajdzie się w obszarze krytycz-
nym, to na przyjętym poziomie istotności odrzucamy hipo-
tezę
H

0

, jako mało prawdop., na rzecz hipotezy H

1

.

Jeżeli wartość statystyki znajdzie się poza obszarem kry-
tycznym, to stwierdzamy brak podstaw do odrzucenia hi-
potezy zerowej
(jako bardzo prawdop.). Nie odrzucenie hi-
potezy zerowej nie oznacza, że jest ona prawdziwa.


background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

34

8. Testy parametryczne

Służą do weryfikacji

hipotez parametrycznych

, odnoszą-

cych się do parametrów rozkładu badanej cechy w jednej,
dwóch lub kilku

populacjach generalnych

. Najczęściej wery-

fikowane są sądy dotyczące takich parametrów populacji jak:

wartość oczekiwana

,

wariancja

,

wskaźnik struktury

i współ-

czynnik korelacji.

Wyróżniamy dwie podstawowe grupy testów parame-

trycznych.

I. Testy dotyczące parametrów (np.: m, p,

2

,

) w jednej po-

pulacji.

II. Testy porównywania parametrów w dwóch populacjach.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

35

Przykład 4. Dla danych z przykładu 3 (Przedziały ufności)
dotyczących liczby usterek w produkowanych urządzeniach
(populacja X), zweryfikować podane hipotezy parametryczne,
na poziomie istotności

= 0,05.

a) przeciętna liczba usterek wynosi 2,

b) przeciętna liczba usterek jest większa od 1,

c) wariancja liczby usterek wynosi 2,

d) odchylenie standardowe liczby usterek jest więk-

sze od 1,2,

e) wskaźnik urządzeń bez usterek wynosi 20%,

f) wskaźnik urządzeń bez usterek jest większy od

20%.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

36

Rozwiązanie. Rozkład cechy w populacji X jest nieznany, ale
próba jest bardzo duża (n = 500) i możemy skorzystać
z twierdzeń granicznych. Wszystkie hipotezy dotyczą para-
metrów jednej populacji. Parametrami tymi są: m,

, p.

a) Hipoteza przeciętna liczba usterek wynosi 2” jest para-
metryczną hipotezą prostą, dotyczącą cechy X

liczby uste-

rek w produkowanych urządzeniach. Hipotezę tę ustawiamy
jako hipotezę zerową:

H

0

: m = 2,

jako hipotezę alternatywną przyjmujemy hipotezę złożoną:

H

1

: m

2.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

37

Rozkład badanej cechy jest nieznany, a próba jest bardzo du-
ża, więc korzystamy z testu 3 (zestawienie testów dla jednej
populacji)
:

n

s

m

z

0

x

.

Dane:

52

1,

x

, m

0

= 2, s = 1,24, n = 500,

= 0,05.

66

,

8

500

24

,

1

2

52

,

1

0

z

Hipoteza alt. jest dwustronna, więc dla danego

wyznacza-

my dwustronny obszar krytyczny

)

,

(

)

,

(

2

/

1

2

/



z

z

R

,

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

38

gdzie z

p

jest kwantylem p-tego rzędu rozkładu N(0, 1). W tym

przykładzie p = 0,025 i p = 0,975.

Odczytane z tablic kwantyle wynoszą:

z

0,025

=

1,960, z

0,975

= 1,960.

Stąd obszar krytyczny:

)

,

96

,

1

(

)

96

,

1

,

(

05

,

0



R

.

Decyzja: Ponieważ

)

,

96

,

1

(

)

96

,

1

,

(

66

,

8

0



z

, więc

na poziomie istotności 0,05, odrzucamy hipotezę zerową na
rzecz hipotezy alt. i stwierdzamy, że: przeciętna liczba uste-
rek istotnie różni się od
2.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

39

b) Hipoteza „przeciętna liczba usterek jest większa od 1” jest
parametryczną hipotezą bez przypadku m

1, więc ustawia-

my ją jako hipotezę alt. Uzupełniamy hipotezę zerową zgod-
nie z normą, czyli

H

0

: m

1 (obejmuje hip. prostą m

1),

H

1

: m > 1.

Statystyka jest ta sama co w punkcie a). Wśród danych zmie-
nia się wartość m

0

. Teraz m

0

= 1. Obliczamy statystykę

377

,

9

500

24

,

1

1

52

,

1

0

z

.

Hipoteza alt. jest prawostronna, więc dla

= 0,05 wyznacza-

my prawostronny obszar krytyczny

)

,

65

,

1

(

)

,

(

05

,

0

05

,

0

z

R

.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

40

Decyzja. Ponieważ obliczona statystyka należy do obszaru
krytycznego

,

więc odrzucamy H

0

rzecz hipotezy alt. Czyli

przeciętna usterkowość jest istotnie większa od 1.

c) Hipoteza

wariancja liczby usterek wynosi 2”

jest parame-

tryczną hipotezą prostą dotyczącą wariancji badanej cechy.
Ustawiamy ja jako hipotezę zerową H

0

:

2

= 2.

Jako przeciwstawną przyjmujemy dwustronną hipotezę alt.

H

1

:

2

2

Stosujemy statystykę chi-kwadrat z modelu 4

2

0

2

2

)

1

(

S

n

Dane: n = 500,

2

2
0

, s = 1,24,

= 0,05, stąd

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

41

63

,

383

2

5376

,

1

499

2

0

Obszar krytyczny

)

,

(

)

,

0

(

2

1

,

2

/

1

2

1

,

2

/

n

n

R

. Wielkości

2

499

;

05

,

0

2

499

;

95

,

0

są kwantylami rzędu 0,025 i 0,975 rozkła-

du chi-kwadrat z 499 stopniami swobody.
Uwaga. Tablice kwantyli rozkładu chi-kwadrat są sporządza-
ne zwykle od 1 do 30 stopni swobody. Jeżeli nie możemy
skorzystać z komputerowego obliczenia, to korzystamy z wła-
sności granicznej

(*)

)

)

1

(

2

,

1

(

~

)

1

(

2

0

2

2

n

n

N

S

n

n

a po standaryzacji statystyki (*) otrzymujemy statystykę

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

42

(**)

)

1

(

2

)

1

(

2

n

n

Z

,

która dla dużych n ma w przybliżeniu rozkład N(0, 1).
Obliczamy wartość tej statystyki

65

,

3

998

499

63

,

383

0

z

Obszar krytyczny

)

,

96

,

1

(

)

96

,

1

,

(

05

,

0



R

Decyzja. Ponieważ z

0

R

0,05

, więc odrzucamy hipotezę zero-

wą i stwierdzamy, że wariancja usterkowości istotnie różni się
od 2.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

43

d) Hipoteza „odchylenie standardowe liczby usterek jest
większe od
1,2” jest hipotezą złożoną i ustawiamy ją jako hi-
potezę alt. Uzupełniamy hipotezę zerową, czyli

H

0

:

1,2 oraz H

1

:

> 1,2

Zwykle modele są podawane dla wariancji, więc powyższe
hipotezy przekształcamy na równoważne hipotezy dotyczące
wariancji, tj.

H

0

:

2

1,44 oraz H

1

:

2

> 1,44

Ponieważ n

500, więc stosujemy statystykę (**)

z

0

1,07.

Obszar krytyczny jednostronny:

)

,

65

,

1

(

05

,

0

R

.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

44

Decyzja. Obliczona statystyka nie należy do obszaru krytycz-
nego
, więc na poziomie istotności

0,05, nie mamy pod-

staw do odrzucenia hipotezy zerowej, że odchylenie standar-
dowe liczby usterek wynosi 1,2.


e) Hipoteza „wskaźnik urządzeń bez usterek wynosi 20%” jest
hipotezą prostą dotyczącą wskaźnika p. Ustawiamy ją jako
hipotezę zerową. Dobieramy dwustronną hipotezę alt.:

H

0

: p = 0,2

H

1

: p

0,2

Badana cecha ma rozkład Bernoulliego. Próba jest bardzo du-
ża, więc korzystamy z granicznej statystyki o rozkładzie nor-
malnym:

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

45

n

p

p

p

p

z

n

)

1

(

0

0

0

Dane: p

0

= 0,2, n = 500,

x

i

=112, stąd

224

,

0

500

112

n

x

p

i

n

.

Obliczamy wartość z

0

statystyki Z

34

,

1

500

8

,

0

2

,

0

200

,

0

224

,

0

0

z

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

46

Hipoteza alt. jest dwustronna, więc obszar krytyczny

)

,

(

)

,

(

2

/

1

2

/



z

z

R

.

Z tablic kwantyli otrzymujemy

)

,

96

,

1

(

)

96

,

1

,

(

05

,

0



R

.

Decyzja. Ponieważ obliczona statystyka z

0

1,34 nie należy

do obszaru krytycznego, więc na przyjętym poziomie istotno-
ści, nie mamy podstaw do odrzucenia hipotezy zerowej, że
wskaźnik urządzeń bez usterek wynosi 20%.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

47

f) Hipotezę „wskaźnik urządzeń bez usterek jest większy od
20%” ustawiamy jako alternatywną hipotezę prawostronną i
uzupełniamy złożoną hipotezę zerową, czyli

H

0

: p

0,2,

H

1

: p > 0,2.

Statystyka jest ta sama jak w e), więc u

0

1,34.

Obszar krytyczny prawostronny

)

,

(

1

z

R

. Stąd

)

,

65

,

1

(

)

,

(

95

,

0

05

,

0

z

R

.

Decyzja. Ponieważ obliczona statystyka nie należy do obsza-
ru krytycznego
, więc nie mamy podstaw do odrzucenia hipo-
tezy zerowej, że wskaźnik urządzeń bez usterek wynosi co
najwyżej 20%.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

48

Przykład projektu zaliczeniowego cz. 3

Uwaga. Należy przytaczać wzory i składnie funkcji wykorzystywanych w
rozwiązaniach. Udzielać pełnych odpowiedzi. Sporządzić tabelę ocen
według wzoru. W przypadku braku rozwiązania punktu, pod jego nume-
rem, w polu „uzyskano” wpisać „0”.

Punkt

1 2 3 Łącznie

do uzyskania 2 4 4

10

uzyskano

Długość X (w mm) detalu produkowanego na pewnego typu automacie
ma rozkład normalny, tj. X ~ N(m,

) o nieznanych parametrach. Norma

długości detali jest określona jako przedział (19,6; 20,4) [mm]. Parame-
try rozkładu oraz wskaźnik spełniania normy są przedmiotem badania.
W tym celu wylosowano prostą próbę detali produkowanych na tym au-
tomacie i zmierzono ich długości.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

49

Otrzymano następujące wyniki pomiarów w [mm]:
i) 20,019; 20,157; 19,840; 19,924; 20,149; 20,118; 20,827; 20,199;

20,611; 20,626; 20,259; 19,616; 20,120; 19,913, 20,393.

ii) wygenerować próbę o liczności 40 według rozkładu N(19,9; 0,25).

1. Na podstawie otrzymanych wyników pomiarów długości detali
ocenić:

a)

wartość oczekiwaną długości detalu,

b)

wariancję i odchylenie standardowe długości detalu,

c)

wskaźnik spełniania normy długości.

Ponadto wyznaczyć

d)

wartości minimalną i maksymalną oraz rozstęp.

background image

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji

50

2. Wyznaczyć 95-procentowe przedziały ufności dla:

a)

oczekiwanej długości detalu,

b)

wariancji długości detalu,

c)

wskaźnika spełniania normy długości.

3. Na poziomie istotności

0,05 zweryfikować hipotezy:

a) oczekiwana długość detalu wynosi 20[mm],

b) wariancja długości detalu jest większa od 0,04[mm

2

],

c) wskaźnik spełniania normy wynosi co najmniej 0,95.



Wyszukiwarka

Podobne podstrony:
estymatory, Nieznany parametr populacji
MPiS30 W10 Estymacja parametrów populacji
Temat- Parametry populacji, Konspekt lekcji Parametry populacji. Krzywa przeżywania i struktura wiek
Temat- Parametry populacji, Karta parcy krzywe przeżywania i struktura wiekowa cz.2
PARAMETRY POPULACYJNE
KOLOKWIUM ESTYMACJA I WERYFIKACJA A, Semestr II, Statystyka matematyczna
KOLOKWIUM ESTYMACJA I WERYFIKACJA G, Semestr II, Statystyka matematyczna
KOLOKWIUM ESTYMACJA I WERYFIKACJA F, Semestr II, Statystyka matematyczna
Temat- Parametry populacji, Karta parcy krzywe przeżywania i struktura wiekowa cz.1, Imię i nazwisko
Temat- Parametry populacji, Folia krzywe przeżywania piramida wikeu, Krzywe przeżywania mówią o tym,
Zadania na estymację i weryfikację hipotez - repetytorium, PBiMAS, Frątczak, PBIMAS, PBiMAS cw123, P
wyklady z ekonometrii, Estymacja i weryfikacja liniowych jednorównaniowych modeli ekonometrycznych
ESTYMACJA I WERYFIKACJA - wzory - repetytorium, PBiMAS, Frątczak, PBIMAS, PBiMAS cw123, PBiMAS cw123
estymacja i weryfikacja modelu, Ekonometria
materialy estymacja przedzialowa parametrow, AGH, Semestr VIII, Statystyka
ESTYMACJA WERYFIKACJA 1

więcej podobnych podstron