background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

PiS15 W05: ESTYMACJA I WERYFIKACJA  

PARAMETRÓW POPULACJI  

1.  Estymacja  punktowa,  estymator,  jego  ocena  i  własno-

ści 

2.  Estymator wartości oczekiwanej  

Przykład 1  

3.  Estymator wariancji populacji  

Przykład 2  

4.  Estymator wskaźnika struktury  
5.  Estymacja  przedziałowa,  przedział  ufności  i  poziom 

ufności  

Przykład 3  

6.  Hipotezy statystyczne i ich podział  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

7.  Weryfikacja hipotezy statystycznej  
8.  Testy parametryczne  

Przykład 4 

Przykład projektu zaliczeniowego cz. 3 

Tablice statystyk: 

http://www.statsoft.com/textbook/sttable.html#chi

  

ZAŁĄCZNIKI:  

1. Modele  przedziałów  ufności  dla  wartości  oczekiwanej,  wa-

riancji i wskaźnika struktury przy jednej populacji  

2. Modele  przedziałów  ufności  dla  wartości  oczekiwanych,  wa-

riancji i wskaźników struktury przy dwóch populacjach  

3. Testy  dotyczące  wartości  oczekiwanej,  wariancji  i  wskaźnika 

struktury w jednej populacji.  

4. 

Testy dotyczące wartości oczekiwanej, wariancji i wskaźnika 
struktury w dwóch populacjach

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

1.  Estymacja  punktowa,  estymator,  jego  ocena  i 
własności  

Estymacja  punktowa

  (

point  estimation

),  to  grupa  metod 

statystycznych, służąca do punktowego oszacowania wartości 
nieznanego parametru rozkładu cechy w populacji.  

Badany rozkład cechy X w populacji zależy od nieznanego 

parametru θ i parametr ten jest szacowany na podstawie pro-
stej próby losowej X

n

.  

W  szczególności,  estymować  można  wartość  oczekiwaną, 

wariancję i wskaźnik struktury badanych cech w populacji.  

W przypadku badania populacji ze względu na dwie cechy 

estymować można współczynnik korelacji.  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

Estymatorem

  U

n

  nieznanego  parametru 

  populacji  gene-

ralnej nazywamy statystykę U

n

 

 h(X

n

) służącą do jego osza-

cowania.  

Oceną  parametru

 

  nazywamy  każdą  realizację  u

n

  esty-

matora U

n

. Ocena parametru prawie zawsze różni się od rze-

czywistej wartości parametru θ.  

Miarą błędu estymacji jest różnica d 

 U

n

 

 θ.  

Własności dobrego estymatora  

 

Nieobciążoność.  Estymator  U

n

  nazywamy 

estymatorem 

nieobciążonym

, jeśli: 

E(U

n

 

.  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

Jeśli E(U

n

 

 

 b(U

n

), to estymator nazywamy 

estymato-

rem  obciążonym

,  zaś  samą  różnicę  nazywamy 

obciążeniem 

estymatora 

(

bias of an estimator)

.  

 

Asymptotyczna  nieobciążoność.  Estymator  nazywamy 

asymptotycznie  nieobciążonym

,  jeśli  obciążenie  estymatora 

dąży do zera przy rosnącej liczebności próby, tj. 

0

)

(

lim

n

n

U

b

 

Zgodność. Estymator nazywamy 

zgodnym

, jeśli jest stocha-

stycznie zbieżny do szacowanego parametru, tj.  

1

)

P(

lim

n

n

U

  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

W konsekwencji zwiększając liczebność próby, zmniejszamy 
ryzyko błędu. 

 

Efektywność.  Spośród  zbioru  wszystkich  nieobciążonych 
estymatorów  U

1,n

,  U

2,n

,…,  U

r

,

n

 

estymatorem  najefektyw-

niejszym 

nazywamy estymator o najmniejszej wariancji.  

Definicja efektywności jest bardzo niewygodna, ponieważ do 
wyznaczenia  najefektywniejszego  estymatora  potrzebna  jest 
znajomość wariancji wszystkich estymatorów nieobciążonych 
danego  parametru.  W  praktyce  korzysta  się  z 

nierówności 

Rao-Cramera

  

 
 
 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

2. Estymator wartości oczekiwanej  

Średnia  arytmetyczna  jest 

estymatorem  nieobciążonym

  

jednocześnie 

estymatorem  największej  wiarygodności

 

warto-

ści oczekiwanej

 

zm. l.

, jeżeli przynajmniej:  

 liczba obserwacji jest dostatecznie duża (zob. 

CTG

),  

 rozkład badanej cechy jest normalny.  

Średnia dla 

szeregu szczegółowego

 (

średnia nieważona

):  

n

i

i

x

n

1

1

x

 

Jeżeli  dane  są  pogrupowane  w  klasy  w  postaci 

szeregu 

rozdzielczego

, stosujemy wzór ważony (

średnia ważona

):  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

i

m

i

i

n

k

n

1

1

x

  

gdzie k

i

 to liczba reprezentująca i-tą klasę, zaś n

i

 to liczebność 

i-tej klasy (= 1, 2,…, m).  
Przykład  1.  Wyniki  130  pomiarów  (wyrażonych  w  [j.u.]) 
pewnej wielkości losowej X są zestawione w tabeli.  

Tabela 

danych pogrupowanych 

Przedziały klasowe 

dla wartości zm. 

Liczba  

obserwacji 

co najwyżej 3,6 

(3,6 

 4,2] 

(4,2 

 4,8] 

35 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

(4,8 

 5,4] 

43 

(5,4 

 6,0] 

22 

(6,0 

 6,6] 

15 

ponad 6,6 

Wyznaczyć:  

a) szereg rozdzielczy,   
b) średnią arytmetyczną.   

Rozwiązanie.

 a) Szereg rozdzielczy  

Numer i przedziału  

klasowego 

Reprezentant klasy

1

 

k

i

  

Liczba obserwacji  

n

i

 

3,3

2

 

3,9 

                                                           

1

  

Tutaj środek przedziału klasowego.  

2

  Wartość przyjęta umownie.  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

10 

4,5 

35 

5,1 

43 

5,7 

22 

6,3 

15 

6,9

3

 

b)  Ponieważ  dane  są  w  postaci  szeregu  rozdzielczego,  więc 
wyznaczamy średnią arytmetyczną ważoną 

]

.

.

[

 

15

,

5

)

5

9

,

6

...

8

9

,

3

2

3

,

3

(

130

1

1

1

u

j

n

k

n

i

m

i

i

x

 

Średnia uzyskanych pomiarów wynosi 5,15 [j.u.].  

 

                                                           

3

  Wartość przyjęta umownie. 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

11 

3. Estymator wariancji populacji  

Wariancję 

2

X

  w  populacji  X  można  oceniać  wariancją 

empiryczną s

2

(x). Dla szeregu szczegółowego:   

n

i

i

x

n

s

1

2

2

1

1

)

(

x

x

 

gdzie  

  x

i

   

 kolejne wartości próby losowej,  

 

x

  

 

średnia arytmetyczna

 z próby,  

  n   

 liczba elementów w próbie.  

Dla danych w postaci 

szeregu rozdzielczego

:   

m

i

i

i

k

n

n

s

1

2

2

1

1

)

(

x

x

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

12 

Przykład 2. Dla danych z przykładu 1 wyznacz wariancję z próby.  

Tablica. Obliczenia pomocnicze. 

n

i

 

k

x

  (k

x

)

n

i

 (k

x

)

1,85  3,4225 

  6,8450 

1,25  1,5625 

12,5000 

35 

0,65  0,4225 

14,7875 

43 

0,05  0,0025 

  0,1075 

22 

0,55 

0,3025 

  6,6550 

15 

1,15 

1,3225 

19,8375 

1,75 

3,0625 

15,3125 

 

 = 130 

 

 

= 76,045 

Stąd wariancja i odch. std. z próby wynoszą:   

589496124

,

0

)

(

2

x

s

 [j.u.]

2

s(x) = 0,767786509 [j.u.]. 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

13 

4. Estymator wskaźnika struktury  

 

Wskaźnikiem struktury

 nazywamy parametr p w populacji 

B(p), tj. prawdop. zaobserwowania wyróżnionej cechy.  

Estymatorem wskaźnika jest częstość z próby X

1

,…, X

n

:  

n

X

P

i

n

gdzie  

 

X

i

  jest  liczbą  elementów  próby,  które  posiadają 

wyróżnioną cechę, a jest liczebnością próby.  

Zastosowanie CTG do estymacji wskaźnika struktury.

 Je-

żeli liczebność próby n wzrasta, to rozkład estymatora 

n

P

, dą-

ży do rozkładu N(p

n

p

p

/

)

1

(

).  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

14 

5. Estymacja przedziałowa, przedział ufności i po-
ziom ufności  

Estymacja  przedziałowa

  to  grupa  metod 

statystycznych

 

służących do oszacowania parametrów rozkładu cechy 

po-

pulacji generalnej

W metodach estymacji przedziałowej oce-

ną parametru nie jest konkretna wartość, ale pewien przedział, 
który  z  określonym  prawdop. pokrywa  nieznaną  wartość  pa-
rametru. Podstawowym pojęciem estymacji przedziałowej jest 

przedział ufności

.  

Niech  cecha  X  ma  rozkład  w  populacji  z  nieznanym  parame-

trem θ. Z populacji wybieram

próbę losową

 (X

1

X

2

, ..., X

n

).  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

15 

Przedziałem ufności

 nazywamy taki przedział (θ 

 θ

1

, θ + 

θ

2

), który spełnia warunek: 

P(θ

1

 < θ < θ

2

) = 1 − α,  

gdzie θ

1

 i θ

2

 są statystykami wyznaczonymi z próby losowej.  

Pojęcie przedziału ufności zostało wprowadzone do staty-

styki prze

Jerzego Spławę-Neymana

4

                                                           

4

 

 

Jerzy  Spława-Neyman  (1894  -  1981)  –  polski  matematyk.  Studiował  matematykę  w 

Charkowie. W 1921 wrócił do Polski, gdzie prowadził badania i wykłady. Od  1938 przebywał w USA. Zo-
stał  profesorem  Uniwersytetu  w  Berkeley.  W  swych  pracach  zajmował  się  głównie  statystyką  oraz  teorią 
mnogości i i rachunkiem prawdopodobieństwa. Wprowadził pojęcie 

przedziału ufności

. 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

16 

Jako  kryterium  wyboru  najlepszych  przedziałów  ufności 

przyjmujemy  te  statystyki  dla  których  otrzymamy  najkrótsze 
przedziały.  

Wielkość  1



  nazywamy  poziomem  ufności. 

Poziom  uf-

ności

  jest  to  prawdop.,  że  wartość  szacowanego  parametru  θ 

znajduje się w  wyznaczonym  przedziale ufności. Im większa 
wartość tego współczynnika, tym szerszy przedział ufności, a 
więc  mniejsza  dokładność  estymacji  parametru.  Im  mniejsza 
wartość 1 

 α, tym większa dokładność estymacji, ale jedno-

cześnie tym większe prawdop. popełnienia błędu. Wybór od-
powiedniego  współczynnika  jest  więc  kompromisem  pomię-
dzy  dokładnością  estymacji  a  ryzykiem  błędu.  W  praktyce 
przyjmujemy zazwyczaj wartości: 0,99; 0,95 lub 0,90.  

                                                                                                                                                                                                                                                                                       
 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

17 

Przykład  3.  W  pewnym  zakładzie  zbadano  500  urządzeń 
spośród nowo wyprodukowanej partii i otrzymano następują-
cy rozkład liczby usterek:  

Liczba usterek 

0   

1   

2    3    4    5    6   

Liczba urządzeń  112  168  119  63  28  9 

a)  Ocenić  wartość  oczekiwaną  i  odchylenie  standardowe 

liczby  usterek  w  każdym  z  produkowanych  urządzeń. 
Ocenić wskaźnik struktury urządzeń bez usterek. 

b)  Na poziomie ufności 0,95 wyznaczyć przedział ufności 

dla przeciętnej liczby usterek. 

c)  Na poziomie ufności 0,99 wyznaczyć przedział ufności 

dla odchylenia stand. liczby usterek.  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

18 

d)  Na poziomie ufności 0,90 wyznaczyć przedział ufności 

dla wskaźnika produkowanych urządzeń bez usterek.   

Rozwiązanie.

 Niech  X oznacza liczbę usterek w badanej po-

pulacji urządzeń, tj. w każdym z produkowanych urządzeń. W 
rozwiązaniach  korzystamy  z  CTG,  więc  musimy  założyć,  że 
istnieje skończona wariancja zm. l. X o nieznanym rozkładzie. 
Próba jest bardzo duża, = 500, więc można z tego twierdze-
nia skorzystać.  

a) Dane dotyczące liczby usterek są podane w postaci szeregu 
rozdzielczego, więc obliczamy średnią arytmetyczną ważoną. 
Obliczone z próby wartości statystyk wynoszą:  

52

,

1

x

24

,

1

s

  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

19 

Stąd oceny nieznanych parametrów:  

52

,

1

ˆ

x

X

m

24

,

1

ˆ

s

X

224

,

0

500

112

ˆ

n

x

p

p

i

n

 

b)  Rozkład  populacji  oraz  odchylenie  standardowe  populacji 
są  nieznane.  Próba  jest  duża,  więc  końce  przedziału  wyzna-
czamy ze wzoru:  

n

s

z

2

/

1

x

 

Dane i obliczenia pomocnicze: = 500, 

52

,

1

x

= 1,24, 1 

 

 = 0,95, kwantyl z

0,975

 rozkładu  N(0, 1) odczytany z tablic 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

20 

lub wyznaczony za pomocą programu komputerowego wyno-
si z

0,975

 = 1,96. Stąd otrzymujemy  

.

500

24

,

1

96

,

1

52

,

1

 

Wniosek:

  Przedział  (1,41;  1,6395)  jest  95

procentową reali-

zacją przedziału ufności dla przeciętnej liczby usterek.  

c)  Próba  jest  bardzo  duża,  więc  korzystamy  z  granicznego 
rozkładu statystyki S, tj. z rozkładu normalnego. Przedział uf-
ności dla odchylenia standardowego 

 jest postaci:  

n

z

s

n

z

s

2

1

1

2

1

1

2

/

1

2

/

1

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

21 

 
Dane i obliczenia pomocnicze:  

n = 500, = 1,24, 1 

 

 = 0,99, 

kwantyl z

0,995 

rzędu 0,995 standardowego rozkładu normalne-

go wynosi 2,5758. Stąd otrzymujemy oszacowanie 

1000

576

,

2

1

24

,

1

1000

576

,

2

1

24

,

1

Wniosek:

  99  procentową  realizacją  przedziału  ufności  dla 

nieznanego  odchylenia  standardowego  liczby  usterek  produ-
kowanych urządzeń jest przedział (1,15;  1,35).  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

22 

d)  Badana  cecha  ma  rozkład  B(p),  gdzie  p  jest  nieznanym 
wskaźnikiem bezusterkowości. Próba jest duża,  więc do wy-
znaczenia końców przedziału ufności dla korzystamy z:  

n

p

p

z

p

n

)

1

(

2

/

1

 

Dane: = 500, 

224

,

0

n

p

, 1 

 

 = 0,90, z

0,95 

= 1,645, stąd  

03067

,

0

22400

,

0

500

776

,

0

224

,

0

645

,

1

224

,

0

.  

Wniosek:

  90  procentową  realizacją  przedziału  ufności  dla 

wskaźnika p jest przedział (0,19333; 0,25467).  

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

23 

6. Hipotezy statystyczne i ich podział  

Weryfikację  hipotez  statystycznych  ograniczamy  tylko  do 
klasycznej teorii J. Neymana i E. Pearsona, dotyczącej 

testów 

istotności

 (test of significance).  

Hipoteza  statystyczna

  (statistical  hypothesis)  to  dowolne 

przypuszczenie  dotyczące  rozkładu  cech  w  populacji,  tj.  po-
staci funkcyjnej lub wartości parametru rozkładu.  

Przykłady hipotez statystycznych

 czas  dojazdu  do  pracy  pracowników  firmy  A  ma  rozkład 

N(25, 5) (min),  

 zawartości  szkodliwych  związków  w  spalinach  samocho-

dów z katalizatorem i bez katalizatora różnią się,  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

24 

Formułowanie  hipotezy  statystycznej  rozpoczynamy  od 

zebrania informacji na temat określonej cechy w badanej po-
pulacji  i  jej  możliwego  rozkładu.  Dzięki  temu  możliwe  jest 
zbudowanie 

zbioru hipotez dopuszczalnych

, czyli zbioru roz-

kładów,  które  mogą  charakteryzować  badaną  cechę  (lub  ce-
chy) w populacji.  

Formalnie,  hipotezą  statystyczną  nazywamy  każdy  pod-

zbiór zbioru hipotez dopuszczalnych.  

 

 

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

25 

Hipotezy statystyczne dzielimy na: 

 

hipotezy parametryczne

 (parametric hypothesis) 

 dotyczą 

wartości parametru rozkładu badanej cechy,  

 

hipotezy  nieparametryczne 

  dotyczą  postaci  funkcyjnej 

rozkładu, niezależności, losowości.  

 

Według innego kryterium podział przebiega następująco: 

 

hipotezy  proste

  (simple  hypothesis

  hipoteza  jedno-

znacznie określa rozkład danej populacji, czyli odpowiada-
jący  jej  podzbiór  zbioru 

  zawiera  dokładnie  jeden  ele-

ment (rozkład),  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

26 

 

hipotezy złożone

 (composite hypothesis

 hipoteza określa 

całą  grupę  rozkładów,  zaś  odpowiadający  jej  podzbiór 
zbioru 

 zawiera więcej niż jeden element.  

Stwierdzenie:  „wzrost  badanej  populacji jest  określony  roz-

kładem normalnym o  parametrach m 

  1,75m  i  σ 

  10”  jest 

hipotezą  parametryczną,  ponieważ  określa  wartość  parame-
trów rozkładu oraz hipotezą prostą, bo jednoznacznie definiu-
je rozkład.  

Stwierdzenie:  „wzrost  badanej  populacji jest  określony  roz-

kładem normalnym” jest hipotezą nieparametryczną 

 nie do-

tyczy wartości parametrów rozkładu i złożoną 

 określa wię-

cej niż jeden możliwy rozkład.  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

27 

7. Weryfikacja hipotezy statystycznej  

Weryfikacją  hipotezy  (hypothesis  testing)  nazywamy 

sprawdzanie  sądów  o  populacji,  sformułowanych  bez  zbada-
nia jej całości. Przeprowadzamy ją na podstawie próby loso-
wej  X  pobranej  z populacji  X,  której  hipoteza dotyczy.  Prze-
bieg procedury weryfikacyjnej przebiega w 5. krokach.  

Krok 1: Sformułowanie hipotez: zerowej i alternatywnej  
Hipoteza zerowa
 H

0

 (null hypothesis

 jest to hipoteza pod-

dana  procedurze  weryfikacyjnej.  Przykładowo,  wnioskując  o 
pewnym parametrze rzeczywistym w dwóch populacjach, hi-
poteza zerowa (ozn. H

0

) może mieć jedną z trzech postaci:  

 H

0

: θ

1

 

 θ

 

 (hipoteza prosta),  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

28 

 H

0

: θ

1

 

 θ

 

 (hipoteza lewostronna),  

 H

0

: θ

1

 

 θ

 

, (hipoteza prawosytronna),   

gdzie 

 

 R jest daną wartością.   

Hipoteza alternatywna H

1

 (alternative hypothesis

 hipoteza 

przeciwstawna do hipotezy zerowej:  

 H

1

: θ

1

 

 θ

 

 (hipoteza dwustronna), 

 H

1

: θ

1

 

 θ

 (hipoteza prawostronna), 

 H

1

: θ

1

 

 θ

 (hipoteza lewostronna). 

Na  przykład,  założeniu  symetryczności  monety  odpowiada 
prosta hipoteza zerowa H

0

p = ½. Natomiast hipoteza złożona 

H

1

p 

 ½, odpowiada założeniu o braku symetryczności.  

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

29 

Krok 2 (opcjonalny): Przyjęcie poziomu istotności α  

Przyjmujemy  a  priori  dopuszczalne  prawdop.  popełnienia 

błędu I rodzaju (error of first kind), który polega na odrzuce-
niu  hipotezy  zerowej  wtedy,  gdy  jest  ona  prawdziwa.  Praw-
dop.  to  oznaczamy  symbolem  α  i  nazywamy  przyjętym  po-
ziomem  istotności
  
(significance  level)  testu.  Ryzyko  popeł-
nienia  błędu 

  winno  być  jak  najmniejsze,  więc  zwykle  za-

kładamy, że poziom istotności α ≤ 0,1.   

Nie  odrzucenie  fałszywej  hipotezy  H

0

  nazywamy  błędem 

II  rodzaju.  Prawdop.  popełnienia  tego  błędu  oznaczamy 

Prawdop. (1



) nazywamy mocą testu.  

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

30 

Krok 3: Wybór testu i obliczenia  

Statystycy  budują  różne  statystyki  U,  które  są  funkcjami 

prób losowych U = h(X

n

) i wyznaczają ich rozkłady przy za-

łożeniu, że odpowiednie hipotezy H

0

 są prawdziwe.  

Odpowiednią statystykę U zastosowaną do weryfikacji hi-

potezy  H

0

  nazywamy  statystyką  testową

 

lub  testem  hipotezy

 

H

0

. Wyboru testu dokonujemy na podstawie spełnianych za-

łożeń.  

Wyniki  próby  opracowujemy  tak,  aby  można  z  cząstko-

wych obliczeń wyznaczyć wartość u

odpowiedniej statystyki 

testowej  U.  Najczęściej  stosowane  statystyki  testowe  mają 
dokładny lub graniczny rozkład normalny, rozkład t-Studenta, 
rozkład chi-kwadrat lub rozkład Snedecora.   

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

31 

Krok 4: Wyznaczenie obszaru krytycznego  

Obszar  krytyczny  (critical  region) 

  podzbiór  R

  zbioru 

wartości  statystyki  testowej  dla  których  hipoteza  H

0

  jest  od-

rzucana. Obszar ten znajduje się zawsze na krańcach rozkładu 
statystyki. Wielkość obszaru krytycznego  zależy od poziomu 
istotności α, natomiast jego położenie określane jest przez hi-
potezę H

1

.  

Wartości  graniczne  obszaru  krytycznego  nazywamy  war-

tościami krytycznymi. Wartości krytyczne są odczytywane z 
tablic kwantyli lub są obliczane komputerowo przy danym α, 
tak  aby  spełniona  była  relacja  zależna  od  sposobu sformuło-
wania hipotezy H

1

:  

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

32 

 gdy H

typu ≠, to obszar krytyczny dwustronny  

R

 

 {u

Ru

/2 

 u

1



/2

}, , 

 gdy H

typu >, to obszar krytyczny prawostronny  

R

 

 {u

Ru

1



}, 

 gdy H

typu <, to obszar krytyczny lewostronny  

R

 

 {u

Ru

}, , 

gdzie u

 jest kwantylem rzędu 

 rozkładu statystyki U.  

 
 
 

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

33 

Krok 5: Podjęcie decyzji  

Sprawdzamy, czy obliczona z próby wartość statystyki u

0

 na-

leży do obszaru krytycznego R

.  

 

Jeżeli  wartość statystyki znajdzie się w obszarze krytycz-
nym, to na przyjętym poziomie istotności odrzucamy hipo-
tezę
 H

0

, jako mało prawdop., na rzecz hipotezy H

1

.  

 

Jeżeli  wartość  statystyki  znajdzie  się  poza  obszarem  kry-
tycznym,  to  stwierdzamy  brak  podstaw  do  odrzucenia  hi-
potezy zerowej
 (jako bardzo prawdop.). Nie odrzucenie hi-
potezy zerowej nie oznacza, że jest ona prawdziwa. 

 
 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

34 

8. Testy parametryczne  

Służą  do  weryfikacji 

hipotez  parametrycznych

,  odnoszą-

cych  się  do  parametrów  rozkładu  badanej  cechy  w  jednej, 
dwóch lub kilku 

populacjach  generalnych

Najczęściej wery-

fikowane są sądy dotyczące takich parametrów populacji jak: 

wartość  oczekiwana

wariancja

, 

wskaźnik  struktury

  i  współ-

czynnik korelacji.  

Wyróżniamy  dwie  podstawowe  grupy  testów  parame-

trycznych.  

I. Testy dotyczące parametrów (np.: mp

2

) w jednej po-

pulacji.  

II. Testy porównywania parametrów w dwóch populacjach.  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

35 

Przykład  4.  Dla  danych  z  przykładu  3  (Przedziały  ufności) 
dotyczących  liczby  usterek  w  produkowanych  urządzeniach 
(populacja X), zweryfikować podane hipotezy parametryczne, 
na poziomie istotności 

 = 0,05.  

a)  przeciętna liczba usterek wynosi 2, 

b)  przeciętna liczba usterek jest większa od 1, 

c)  wariancja liczby usterek wynosi 2, 

d)  odchylenie standardowe liczby usterek jest więk-

sze od 1,2, 

e)  wskaźnik urządzeń bez usterek wynosi 20%, 

f)  wskaźnik urządzeń bez usterek jest większy od 

20%. 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

36 

Rozwiązanie. Rozkład cechy w populacji jest nieznany, ale 
próba  jest  bardzo  duża  (n  =  500)  i  możemy  skorzystać 
z twierdzeń  granicznych.  Wszystkie  hipotezy  dotyczą  para-
metrów jednej populacji. Parametrami tymi są: m

p.  

a)  Hipoteza  przeciętna  liczba  usterek  wynosi  2”  jest  para-
metryczną  hipotezą  prostą,  dotyczącą  cechy  

  liczby  uste-

rek  w  produkowanych  urządzeniach.  Hipotezę  tę  ustawiamy 
jako hipotezę zerową:  

H

0

m = 2,  

jako hipotezę alternatywną przyjmujemy hipotezę złożoną:  

H

1

m 

 2.  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

37 

Rozkład badanej cechy jest nieznany, a próba jest bardzo du-
ża, więc korzystamy z testu 3  (zestawienie testów dla jednej 
populacji)
:  

n

s

m

z

0

x

.  

Dane: 

52

1,

x

m

= 2, s = 1,24, n = 500, 

 = 0,05.  

66

,

8

500

24

,

1

2

52

,

1

0

z

 

Hipoteza  alt.  jest  dwustronna,  więc  dla  danego 

  wyznacza-

my dwustronny obszar krytyczny  

)

,

(

)

,

(

2

/

1

2

/



z

z

R

,  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

38 

gdzie z

p

 jest kwantylem p-tego rzędu rozkładu N(0, 1). W tym 

przykładzie p = 0,025 i p = 0,975.  

Odczytane z tablic kwantyle wynoszą:  

z

0,025

 = 

1,960, z

0,975

 = 1,960.  

Stąd obszar krytyczny:  

)

,

96

,

1

(

)

96

,

1

,

(

05

,

0



R

Decyzja:  Ponieważ 

)

,

96

,

1

(

)

96

,

1

,

(

66

,

8

0



z

,  więc 

na  poziomie  istotności  0,05,  odrzucamy  hipotezę  zerową  na 
rzecz  hipotezy  alt.  i  stwierdzamy,  że:  przeciętna  liczba  uste-
rek istotnie różni się od
 2.  
 
 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

39 

b) Hipoteza „przeciętna liczba usterek jest większa od 1” jest 
parametryczną hipotezą bez przypadku m 

  1,  więc  ustawia-

my ją jako hipotezę alt. Uzupełniamy hipotezę zerową zgod-
nie z normą, czyli  

H

0

m 

 1  (obejmuje hip. prostą m 

 1),  

H

1

m > 1.  

Statystyka jest ta sama co w punkcie a). Wśród danych zmie-
nia się wartość m

0

. Teraz m

0

 = 1. Obliczamy statystykę  

377

,

9

500

24

,

1

1

52

,

1

0

z

Hipoteza alt. jest prawostronna, więc dla 

 = 0,05 wyznacza-

my prawostronny obszar krytyczny 

)

,

65

,

1

(

)

,

(

05

,

0

05

,

0

z

R

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

40 

Decyzja.  Ponieważ  obliczona  statystyka  należy  do  obszaru 
krytycznego

,

  więc  odrzucamy  H

0

  rzecz  hipotezy  alt.  Czyli 

przeciętna usterkowość jest istotnie większa od 1.  

c) Hipoteza 

wariancja liczby usterek wynosi 2”

 jest parame-

tryczną  hipotezą  prostą  dotyczącą  wariancji  badanej  cechy. 
Ustawiamy ja jako hipotezę zerową H

0

2

 = 2.   

Jako przeciwstawną przyjmujemy dwustronną hipotezę alt.  

H

1

2

 

 2  

Stosujemy statystykę chi-kwadrat z modelu 4 

2

0

2

2

)

1

(

S

n

 

Dane: n = 500, 

2

2
0

= 1,24, 

 = 0,05, stąd  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

41 

63

,

383

2

5376

,

1

499

2

0

 

Obszar  krytyczny 

)

,

(

)

,

0

(

2

1

,

2

/

1

2

1

,

2

/

n

n

R

.  Wielkości 

2

499

;

05

,

0

 

2

499

;

95

,

0

 są kwantylami rzędu 0,025 i 0,975 rozkła-

du chi-kwadrat z 499 stopniami swobody.  
Uwaga. Tablice kwantyli rozkładu chi-kwadrat są sporządza-
ne  zwykle  od  1  do  30  stopni  swobody.  Jeżeli  nie  możemy 
skorzystać z komputerowego obliczenia, to korzystamy z wła-
sności granicznej  

(*) 

)

)

1

(

2

,

1

(

~

)

1

(

2

0

2

2

n

n

N

S

n

n

 

a po standaryzacji statystyki (*) otrzymujemy statystykę  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

42 

 

(**) 

)

1

(

2

)

1

(

2

n

n

Z

która dla dużych n ma w przybliżeniu rozkład N(0, 1).  
Obliczamy wartość tej statystyki 

65

,

3

998

499

63

,

383

0

z

 

Obszar krytyczny 

)

,

96

,

1

(

)

96

,

1

,

(

05

,

0



R

 

 

Decyzja.  Ponieważ  z

0

R

0,05

,  więc  odrzucamy  hipotezę  zero-

wą i stwierdzamy, że wariancja usterkowości istotnie różni się 
od 2.  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

43 

d)  Hipoteza  „odchylenie  standardowe  liczby  usterek  jest 
większe od
 1,2” jest hipotezą złożoną i ustawiamy ją jako hi-
potezę alt. Uzupełniamy hipotezę zerową, czyli  

H

0

 

 1,2 oraz H

1

 > 1,2  

Zwykle  modele  są  podawane  dla  wariancji,  więc  powyższe 
hipotezy  przekształcamy  na  równoważne  hipotezy  dotyczące 
wariancji, tj. 

H

0

2

 

 1,44 oraz H

1

2

 > 1,44  

Ponieważ 

 500, więc stosujemy statystykę (**)  

z

0

 

 1,07. 

Obszar krytyczny jednostronny: 

)

,

65

,

1

(

05

,

0

R

.  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

44 

Decyzja. Obliczona statystyka nie należy do obszaru krytycz-
nego
,  więc  na  poziomie  istotności 

 

  0,05,  nie  mamy  pod-

staw do odrzucenia hipotezy zerowej, że odchylenie standar-
dowe liczby usterek wynosi 1,2.  

 
e) Hipoteza „wskaźnik urządzeń bez usterek wynosi 20%” jest 
hipotezą  prostą  dotyczącą  wskaźnika  p.  Ustawiamy  ją  jako 
hipotezę zerową. Dobieramy dwustronną hipotezę alt.:   

H

0

= 0,2  

H

1

 0,2  

Badana cecha ma rozkład Bernoulliego. Próba jest bardzo du-
ża, więc korzystamy z granicznej statystyki o rozkładzie nor-
malnym:  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

45 

  

n

p

p

p

p

z

n

)

1

(

0

0

0

 

Dane: p

0

 = 0,2, n = 500, 

x

i

 =112, stąd  

224

,

0

500

112

n

x

p

i

n

Obliczamy wartość z

0

 statystyki Z  

34

,

1

500

8

,

0

2

,

0

200

,

0

224

,

0

0

z

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

46 

Hipoteza alt. jest dwustronna, więc obszar krytyczny  

)

,

(

)

,

(

2

/

1

2

/



z

z

R

.  

Z tablic kwantyli otrzymujemy  

)

,

96

,

1

(

)

96

,

1

,

(

05

,

0



R

Decyzja.  Ponieważ  obliczona  statystyka  z

0

 

  1,34  nie  należy 

do obszaru krytycznego, więc na przyjętym poziomie istotno-
ści,  nie  mamy  podstaw  do  odrzucenia  hipotezy  zerowej,  że 
wskaźnik urządzeń bez usterek wynosi 20%.  
 

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

47 

f)  Hipotezę  „wskaźnik  urządzeń  bez  usterek  jest  większy  od 
20%”  ustawiamy  jako  alternatywną  hipotezę  prawostronną  i 
uzupełniamy złożoną hipotezę zerową, czyli  

H

0

 0,2,   

H

1

> 0,2.  

Statystyka jest ta sama jak w e), więc u

0

 

1,34.  

Obszar krytyczny prawostronny 

)

,

(

1

z

R

. Stąd  

)

,

65

,

1

(

)

,

(

95

,

0

05

,

0

z

R

Decyzja. Ponieważ obliczona statystyka nie należy do obsza-
ru krytycznego
, więc nie mamy podstaw do odrzucenia hipo-
tezy  zerowej,  że  wskaźnik  urządzeń  bez  usterek  wynosi  co 
najwyżej 20%.  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

48 

Przykład projektu zaliczeniowego cz. 3 

 

Uwaga. Należy przytaczać wzory i składnie funkcji wykorzystywanych w 
rozwiązaniach.  Udzielać  pełnych  odpowiedzi.  Sporządzić  tabelę  ocen 
według wzoru. W przypadku braku rozwiązania punktu, pod jego nume-
rem, w polu „uzyskano” wpisać „0”.  

Punkt 

1  2  3  Łącznie 

do uzyskania  2  4  4 

10 

uzyskano 

 

 

 

 

Długość X (w mm) detalu produkowanego na pewnego typu automacie 
ma rozkład normalny, tj. ~ N(m

) o nieznanych parametrach. Norma 

długości detali jest określona jako przedział (19,6; 20,4) [mm]. Parame-
try  rozkładu  oraz  wskaźnik  spełniania  normy  są  przedmiotem  badania. 
W tym celu wylosowano prostą próbę detali produkowanych na tym au-
tomacie i zmierzono ich długości.  

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

49 

Otrzymano następujące wyniki pomiarów w [mm]:  
i) 20,019; 20,157; 19,840; 19,924; 20,149; 20,118; 20,827; 20,199; 

20,611; 20,626; 20,259; 19,616; 20,120; 19,913, 20,393. 

ii) wygenerować próbę o liczności 40 według rozkładu N(19,9; 0,25).  

1.  Na  podstawie  otrzymanych  wyników  pomiarów  długości  detali 
ocenić:   

a) 

wartość oczekiwaną długości detalu, 

b) 

wariancję i odchylenie standardowe długości detalu,  

c) 

wskaźnik spełniania normy długości.  

Ponadto wyznaczyć  

d) 

wartości minimalną i maksymalną oraz rozstęp.  

 

 

background image

 

Karol J. Andrzejczak, PiS15 W05: Estymacja i weryfikacja parametrów populacji 

 

50 

2. Wyznaczyć 95-procentowe przedziały ufności dla: 

a) 

oczekiwanej długości detalu,  

b) 

wariancji długości detalu,  

c) 

wskaźnika spełniania normy długości.  

3. Na poziomie istotności 

 

 0,05 zweryfikować hipotezy:  

a) oczekiwana długość detalu wynosi 20[mm], 

b) wariancja długości detalu jest większa od 0,04[mm

2

],  

c) wskaźnik spełniania normy wynosi co najmniej 0,95.