Biostatystyka – Wykład 6

Wybrane metody wnioskowania statystycznego

1. Estymacja

• Punktowa
• Przedziałowa

2. Weryfikowanie hipotez

POPULACJA

P1 P2 P3

μ
б

x
s

We wnioskowaniu statystycznym interesuje nas
POPULACJA
Wykorzystujemy próbę do uzyskania informacji na temat
populacji

Estymacja

• Z prób reprezentatywnych obliczamy wielkości

statystyk

, które są

estymatorami

określonych

parametrów

populacji

• Przykładowo średnia arytmetyczna z próby jest

dobrym estymatorem wartości oczekiwanej
(wartości przeciętnej) populacji

• estymację punktową:

– czyli metodę szacunku, za pomocą której jako wartość

parametru zbiorowości generalnej przyjmuje się

konkretną wartość estymatora wyznaczonego na

podstawie n-elementowej próby (zakładamy, że wartość

statystki z próby leży blisko wartości parametru

populacji)

• estymację przedziałową:

– za pomocą której wyznacza się przedział liczbowy, który z

ustalonym prawdopodobieństwem zawiera nieznaną

wartość szacowanego parametru zbiorowości generalnej.

Wyróżnia się dwa rodzaje estymacji:

Statystki z próby jako estymatory parametrów populacji

• Parametr populacji

, lub po prostu parametr,

to liczbowa charakterystyka populacji

• Statystyka z próby

, lub po prostu statystyka,

to liczbowa charakterystyka z próby

Estymatory punktowe

Estymator (statystyka

z próby)

Parametr

populacji

Przykład

• zbiór: (1, 2, 3, ..., 8)
• prawdopodobieństwo wylosowania

każdej liczby = 1/8

• losujemy dwie liczby ze zwracaniem

(ważna kolejność) i obliczamy ich
średnią arytmetyczną

• jaki jest rozkład tych średnich?

Obliczymy średnią i odchylenie

standardowe z populacji X:







Natomiast wartość oczekiwana

i odchylenie zmiennej losowej X

śr





Zauważymy, że oczekiwana

wartość jest równa średniej z

populacji, natomiast

odchylenie standardowe





x = μ

Poniżej na rysunku pokazano krzywą Gaussa dla populacji i krzywe normalne
dla zm.los. średniej , dla różnych liczebności prób.

rozkład normalny

(w populacji)

rozkład zmiennej

Xśr przy n=2

rozkład zmiennej

Xśr przy n=4

rozkład zmiennej

Xśr przy n=16

Z rysunku widać, że jeśli liczebność próby wzrasta, to

odchylenie standardowe zmiennej maleje, dzięki czemu

zbliżenie się wartości średniej do staje się coraz bardziej

prawdopodobne. I tak doszliśmy do jednego z głównych

twierdzeń w teorii statystyki:

centralnego twierdzenia

granicznego

, które mówi:

Jeżeli pobieramy próbę z populacji o średniej μ i

skończonym odchyleniu standardowym σ , to rozkład

średniej z próby , dąży do rozkładu normalnego o

średniej μ i odchyleniu , gdy liczebność próby

wzrasta nieograniczenie, czyli dla „dostatecznie dużych n



Na rysunku poniżej pokazano kilka rozkładów w macierzystych
populacjach i wynikające stąd rozkłady , dla prób o różnej liczebności.

Rozkład

macierzystej

populacji

normalny

prawoskośny

jednostajny

Rozkład Xśr

n=2

n=10

n=30

W ogólnym przypadku próbę uważa się za

dostatecznie dużą, by stosowane były reguły
tw. granicznego, jeśli zawiera ona 30 i więcej
elementów











Przedział ufności dla μ przy (1-α) poziomie ufności,
gdy σ jest znane, a próba została pobrana z populacji
normalnej lub jest „dużą próbą”, wyznacza wzór:

gdzie t

α/2

- jest wartością z rozkładu t-

Studenta
o n-1 stopniach swobody, która
odcina

pod krzywą gęstości pole o

mierze α/2 z prawej strony

Przedział ufności dla μ przy (1-α) poziomie ufności, gdy σ
nie jest znane, a próba została pobrana z populacji
normalnej lub jest „małą próbą”, wyznacza wzór:

• Przykład
• Chcemy oszacować średni wiek pielęgniarek

zatrudnionych w wiejskich ośrodkach
zdrowia. W tym celu ze zbiorowości tych
pielęgniarek wylosowano próbę liczącą 121
osób i otrzymano następujące wyniki: średnia
wieku pielęgniarek pracujących w wiejskich
ośrodkach zdrowia wynosi 45 lat oraz
odchylenie wynosi 13,5 lat. Oszacować średni
wiek pielęgniarek pracujących w wiejskich
ośrodkach zdrowia.

• Dane: n=121, M=45 lat, SD= 13,5 lat
Otrzymujemy następujący przedział ufności:
(45 – 1,96*13,5/121^0,5; 45 +

1,96*13,5/121^0,5)

po wyliczeniu mamy około:(42; 48 lat)

Przedziały ufności dla wariancji w populacji

• W wielu sytuacjach interesuje nas wariancja lub odchylenie

standardowe w populacji. Tak jest np. w analizie procesu

produkcyjnego, w badaniach procesów masowej obsługi.

Jak już mówiliśmy nieobciążonym estymatorem wariancji w

populacji, 

jest wariancja z próby S

• Do wyznaczenia przedziału ufności dla wariancji w

populacji musimy poznać nowy rozkład, tzw. rozkład

chi-

kwadrat

lub



Rozkład chi-kwadrat

• Rozkład ten podobnie jak rozkład t, charakteryzuje się

liczba stopni swobody, df ( df=n-1 )

• W przeciwieństwie do rozkładu t, rozkład chi-kwadrat nie

jest symetryczny

df = 10

df = 30

df = 50

Rozkład chi-kwadrat

• Rozkład chi-kwadrat

jest rozkładem

prawdopodobieństwa sumy kwadratów niezależnych,
standaryzowanych, normalnych zmiennych losowych.

– Średnia rozkładu

jest równa liczbie stopni swobody df

– Wariancja

zaś jest równa liczbie stopni swobody

pomnożonej przez dwa.

Przedziały ufności dla wariancji w populacji

(1-



)100% przedział ufności dla wariancji w populacji,



, gdy rozkład w

populacji jest normalny, wyznacza wzór:





)

(

;

)

(





gdzie:





jest wartością zmiennej w rozkładzie chi-kwadrat o n-1 stopniach

swobody, która odcina pole o mierze



z prawej strony;







jest wartością

zmiennej w rozkładzie chi-kwadrat, która odcina pole o mierze



lewej strony

(a tym samym 1-



z prawej strony).

Weryfikowanie hipotez

statystycznych

Weryfikowanie hipotez

statystycznych

• Podobnie jak testy w życiu codziennym, test

statystyczny też ma jednobitowy wynik:
„

jest OK albo nie jest OK”

– Wąchamy wczorajszą wędlinkę i kierujemy ją na stół

albo pod stół (do kosza;-)

– Nie ma trzeciej drogi, chyba że mamy psa, który nam

się opatrzył.

• Zwróćmy przy okazji uwagę na to, że przy

testowaniu możemy popełnić dwa rodzaje błędów:

– możemy wyrzucić dobrą szynkę

• jest to błąd pierwszego rodzaju

– albo zjeść zepsutą

• błąd drugiego rodzaju

• Kalkulacja ekonomiczna kosztu tych błędów jest bardzo

ważna przy projektowaniu testu, aczkolwiek może ona nie

być łatwa do przeprowadzenia

• W zarządzaniu jakością często stawiane jest pytanie

– czy wartość określonej statystyki uzyskana z próbki losowej

(szczególnie jeśli próbka ma małą liczność), pozwala sądzić, że

odpowiada ona wartości wymaganej (spodziewanej)

– lub też, czy uzyskana w wyniku działań doskonalących

poprawa jest tylko pozorna – wynika z małej liczby pomiarów

sprawdzających – czy rzeczywista

• Odpowiedzi na tak i podobnie postawione pytanie

uzyskuje się w tzw. testach statystycznych

Przykładowo:

Stosuje się dwie grupy testów:

• parametryczne i nieparametryczne

– stosowanie pierwszych wymaga przyjęcia założeń o

postaci rozkładu testowanej zmiennej losowej oraz
znajomości wybranych statystyk

– testy nieparametryczne

takich założeń nie wymagają,

ale nie są tak mocne jak parametryczne

Hipotezy statystyczne

• Hipoteza statystyczna to każde

przypuszczenie dotyczące rozkładu
zmiennej losowej weryfikowane na
podstawie n-krotnej realizacji tej
zmiennej

– Wyróżniamy:

• Hipotezy

– parametryczne i nieparametryczne
– proste i złożone

Weryfikowanie hipotez

• Hipotezą zerową

, oznaczoną przez H

, jest hipoteza

w wartości jednego z parametrów populacji (lub
wielu)

–

Tę hipotezę traktujemy jako prawdziwą, dopóki nie uzyskamy
informacji

statystycznych dostatecznych do zmiany naszego

stanowiska

• Hipotezą alternatywną

, oznaczoną przez H

, jest

hipoteza przypisująca parametrowi (parametrom)
populacji wartość inną niż podaje to hipoteza zerowa

• Hipoteza zerowa:

– często opisuje sytuację, która istniała do tej pory

lub jest wyrazem naszego przekonania, które
chcemy sprawdzić

• Sprawdzenia dokonuje się

korzystając z informacji
zawartej w próbie losowej

• Sprawdzianem lub statystyką testu

– nazywamy statystkę z próby, której wartość obliczona

na podstawie wyników obserwacji jest wykorzystywana
do ustalenia czy możemy hipotezę zerową odrzucić czy
jej odrzucić nie możemy

Przykład 1:

Firma rozwożąca paczki zapewnia, że
średni czas dostarczenia przesyłki od drzwi
klienta do odbiorcy wynosi 28 minut. By
sprawdzić to stwierdzenie pobrano próbę
n=100 przesyłek i obliczono średni czas
dostawy 31,5 minut oraz odchylenie
standardowe 5 minut.

Test dla średniej

: µ = 28

: µ  28

zbudujmy 95% przedział ufności dla średniej:

]

;

[

100













Jeżeli mamy 95% ufności, że średni czas dostawy zawiera się
w przedziale [30.52; 32.48] minuty, to mamy 95% zaufania,
że czas ten nie znajdzie się poza tym przedziałem.
Wartość sprawdzana: 28 minut, leży poza tym przedziałem,
zatem odrzucamy hipotezę zerową.

1- = 0,95
 = 5

Czego się nauczyliśmy z przykładu?

Po pierwsze:

przy weryfikowaniu testów można

budować przedział ufności wokół wartości

statystyki z próby i sprawdzać, czy weryfikowana

wartość parametru należy do przedziału

31,5

30,52

32,48

95% przedział ufności



Z drugiej strony:

Można jako centrum traktować średnią populacji i
sprawdzać wartość statystyki z próby względem
przedziału ufności wokół parametru populacji

]

;

[

100











Wartość średnia z próby =31,5, zatem nie należy
do przedziału ufności. Hipotezę zerową odrzucamy.

31,5

30,52

32,48

95% przedział ufności



28,98

27,02

95%

obszar

przyjęcia

Średnia z próby
znajduje się poza
obszarem
przyjęcia

Interpretacja graficzna



rozkład populacji

Pytanie: Czy ta średnia
może pochodzić z populacji
o średniej 

i odchyleniu ?

Jeśli średnia z próby
leży powyżej granicy, to
przypuszczenie że
populacja ma średnią 

musi zostać odrzucone

Standaryzowana forma testu statystycznego



rozkład standaryzowany

Standaryzujemy średnią
z próby, czyli obliczamy

statystykę (sprawdzian)

Jeżeli obliczona wartość
statystyki leży poniżej
granicy u

/2

, to nie ma

podstaw do odrzucenia
hipotezy zerowej

obszar nieodrzucenia

obszar

odrzucenia

obszar

odrzucenia

-1,96

1,96

Miara pola = 0,025

Miara pola = 0,95

z = 7,0

wartość
sprawdzianu
znajduje się w
polu odrzucenia

: µ = 28

: µ  28

100







Obszar krytyczny:

R = (-; -1,96)  (1,96; +)

Wracając do przykładu:

Prawdopodobieństwo odrzucenia/przyjęcia hipotezy

)

falszywa

nieodrzuco

(

)

prawdziwa

odrzucona

(









Hipoteza

Decyzja

Prawdziwa

Fałszywa

Przyjąć

Właściwe

postępowani

1-α

Błąd II-go

rodzaju

Odrzucić

Błąd I-go

rodzaju

Właściwe

postępowani

1-β

ponieważ założyliśmy, że hipoteza zerowa
odzwierciedla nasze przekonanie, to chcemy śledzić
pradwopodobieńswto I-go rodzaju

świadomość, że istnieje małe prawdopodobieństwo
popełnienia błędu I-go rodzaju, czyli odrzucenia
hipotezy zerowej, gdy nie powinna być ona
odrzucona,

czyni odrzucenie hipotezy zerowej

wnioskiem stanowczym

Nie można tego powiedzieć o akceptowaniu (czyli
nie odrzuceniu) hipotezy zerowej

Jeżeli akceptujemy hipotezę zerową (nie
odrzucamy jej) czujemy tylko, że

nie mamy

podstaw do jej odrzucenia

Przykład 2:

Przypuszcza się, że przeciętny czas jaki potrzebuje

komputer do wykonania pewnego zadania wynosi 3,24

sekundy.
Grupa naukowców z Bell Laboratories testowała

algorytmy, które mogłyby zmienić czas obliczeń.

Przeprowadzono badania: wybrano losowo próbę 200

cykli obliczeń komputera według nowych algorytmów i

otrzymano średni czas obliczeń 3,48 s przy odchyleniu 2,8

sekundy.
Jaki wniosek wyciągną naukowcy przy poziomie istotności

0,05?

: µ = 3,24

: µ  3,24

200







Obszar krytyczny:



0 05

= (-; -1,96)  (1,96; +)

Obszar krytyczny:



0 1

= (-; -1,65)  (1,65; +)

Otrzymana wartość u nie należy do obszaru krytycznego.

Zatem nie ma podstaw do odrzucenia hipotezy zerowej.
Oznacza to jedynie, że na przyjętym poziomie istotności

nie mamy dostatecznych powodów do odrzucenia H

Test dwustronny dla średniej w populacji dla dużej
próby

: = 

:  ≠ 

Poziom istotności:





(zazwyczaj przyjmowany: 0,05; 0,01)

Statystyka testu:





Obszar krytyczny: R



= (-; -u

/2

)  (u

/2

; +)

Reguła decyzyjna: hipotezę zerową odrzucić, jeśli
statystyka u należy do R



Test dwustronny dla średniej w populacji dla małej
próby

: = 

:  ≠ 

Poziom istotności:





(zazwyczaj przyjmowany: 0,05; 0,01)

Statystyka testu:





Obszar krytyczny: R



= (-;

-t

/2

)  (t

/2

; +)

Reguła decyzyjna: hipotezę zerową odrzucić, jeśli
statystyka u należy do R



ma rozkład t o n-1 stopniach swobody

Test dla porównania dwóch wartości oczekiwanych dwóch
populacji przy dużych próbach

: 

= 

: 



≠ 



Poziom istotności:





(zazwyczaj przyjmowany: 0,05; 0,01)

Statystyka testu:

2
2







Obszar krytyczny: R



= (-; -u

/2

)  (u

/2

; +)

Reguła decyzyjna: hipotezę zerową
odrzucić, jeśli
statystyka u należy do R



dwie badane populacje mają
rozkład normalny N(

, 

) oraz

N(

, 

)

Test dla porównania dwóch wartości oczekiwanych dwóch
populacji przy małych próbach

: 



= 



: 



≠ 



Poziom istotności:





(zazwyczaj przyjmowany: 0,05; 0,01)

Statystyka testu:























2
2

)

(

)

(

Obszar krytyczny: R



= (-; -u

/2

)  (u

/2

; +)

Reguła decyzyjna: hipotezę zerową odrzucić,
jeśli
statystyka u należy do R



dwie badane populacje mają
rozkład normalny N(

, 

) oraz

N(

, 

), nieznane odchylenia

Test hipotezy o frakcji w populacji w przypadku dużej próby





: p= p

: p ≠ p

jeśli próba jest duża, to rozkład
frakcji w próbie jest rozkładem
normalnym o średniej p i
odchyleniu pq/n

Poziom istotności:





(zazwyczaj przyjmowany: 0,05; 0,01)

Statystyka testu:

Obszar krytyczny: R



= (-; -u

/2

)  (u

/2

; +)

Reguła decyzyjna: hipotezę zerową
odrzucić, jeśli
statystyka u należy do R



Testy jednostronne

• Wybór rodzaju testu podyktowany jest potrzebą działania
• Jeżeli działanie (np. korygujące) będzie podjęte, gdy

parametr przekroczy pewną wartość a, to stosujemy test
prawostronny:

: μa

: μ>a

• Jeżeli działanie będzie podjęte, gdy parametr przyjmie

wartość mniejszą niż a, to stosujemy test lewostronny:

: μa

: μ<a

: μa

: μ>a

: μ=a

: μa

Test hipotezy o wariancji populacji

• bardzo często chcemy dowiedzieć się czegoś o wariancji

w populacji 

• np. czy wariancja liczby sztuk wyrobu nie

przekroczyła pewnej granicy?

• np. o wariancji czasu obróbki na linii (powinna

być niewielka, aby nie tworzyły się przestoje)

• z reguły obawiamy się, że wariancja w populacji

przekroczy pewien poziom

• dlatego z reguły stosujemy test prawostronny

Test hipotezy o wariancji w populacji

)

(









: 





 > 

Poziom istotności:





(zazwyczaj przyjmowany: 0,05; 0,01)

Statystyka testu:

Obszar krytyczny: R



= (



; +)

Reguła decyzyjna: hipotezę zerową
odrzucić, jeśli
statystyka 

należy do R



Prawdopodobieństwo błędu II-go rodzaju

• w testach zakładamy błąd 
• co z błędem ?

Stan rzeczy

Decyzje

słuszna

decyzja





słuszna

decyzja

bład I-go rodzaju jest poważniejszy

niewinna
H

: winna

Prawdopodobieństwo błędu II-go rodzaju

• niestety prawdopodobieństwo  jest trudne do

wyznaczenia „a priori”

• zależy ono od tego, którą z możliwych wartości

przyjmie inetersujący nas parametr

• przykładowo dla testów dotyczących  błąd 

jest funkcją : 

Przykład wyznaczania :

= 60

= 65

Mamy do czynienia z hipoteza prostą. Albo dojdziemy do
wniosku, że średnia populacji jest równa 60, albo że jest
równa 65.
W praktyce takie sytuacje zdarzają się rzadko.

n = 100
 = 20

 = 0,05













63,29

645











Jakie jest prawdopodobieństwo ?

)

(













)

(













 z góry ustalamy, zatem :

1963

)

855

(

)

(

)

(





































Zatem prawdopodobieństwo  przyjęcia błędnej hipotezy, że

średnia w populacji jest 60, podczas gdy w rzeczywistości wynosi
65, jest równe 0,1963.
Przeprowadzony test dopuszcza 5% ryzyko odrzucenia Ho gdy
jest ona prawdziwa i 19,63% ryzyko przyjęcia Ho gdy jest ona
fałszywa.

Moc testu

Mocą testu hipotezy statystycznej jest
prawdopodobieństwo odrzucenia hipotezy zerowej,
gdy jest ona fałszywa.

moc testu = 1-

W przykładzie: moc testu=1-0,1963=0,8037
Mamy 80,37% szans, że odrzucimy Ho gdy
średnia populacji jest równa 65, a nie 60.

Dla testów złożonych

przykładowo w przypadku testu jednostronnego

 60

> 60

Jak zdefiniować moc testu w takiej sytuacji?

Moc testu = P( odrzucenia Ho/ Ho jest fałszywa )

W przykładzie Ho może być fałszywa na nieskończenie
wiele sposobów: 61, 62, 67, 72.893 itd...

Moc testu dla wybranych wartości 





Moc=1-

61
62
63
64
65
66
67
68
69

0,8739
0,7405
0,5577
0,3613
0,1963
0,0877
0,0318
0,0092
0,0021

0,1262
0,2595
0,4423
0,6387
0,8037
0,9123
0,9682
0,9908
0,9979

załóżmy liczebność próby n=100, s=20, a=0.05

Własności mocy testu:

Moc zależy od odległości między wartością
parametru zakładaną w hipotezie zerowej a
prawdziwą wartością parametru. Im większa
odległość tym większa moc.

Moc zależy od wielkości odchylenia standardowego
w populacji. Im mniejsze odchylenie tym większa
moc.

Moc zależy od liczebności próby. Im liczniejsza
próba, tym większa moc.

Moc zależy od poziomu istotności testu. Im niższy
poziom istotności tym mniejsza moc testu.

nie możemy kontrolować punktu 1 i 2
kształtujemy jedynie pkt. 3 i 4

Podsumowując:

• w przypadku prowadzenia testu statystycznego dla

parametru populacji posługiwaliśmy się:

– przedziałem ufności (wokół 

lub x

śr

)

– standaryzowanym przedziałem

• Istnieje 3 droga: wyznaczanie wartości

prawdopodobieństwa na prawo/lewo od wartości

sprawdzianu

Wartość p – co to takiego?

to najniższy poziom istotności, przy którym hipoteza

zerowa mogłaby być odrzucona przy otrzymanej

wartości sprawdzianu

to prawdopodobieństwo otrzymania takiej wartości

sprawdzianu, jaką otrzymaliśmy przy założeniu, że

hipoteza zerowa jest prawdziwa

Wartość p – co to takiego?

rozkład Z

Wartość sprawdzianu u=2,5

Wartość p = miara pola na prawo od u
p = 0.0062

: 

 60

: 



> 60

 = 0.01
stąd u

kryt

=2,326

u=2,326

Interpretacja:

• jeśli otrzymana wartość sprawdzianu jest mało

prawdopodobna przy założeniu, że Ho jest
prawdziwa, to hipoteza Ho powinna być odrzucona

• jeśli otrzymana wartość sprawdzianu jest dosyć

prawdopodobna (większa od 0.05; 0.1) to
powinniśmy przyjąć hipotezę Ho

Wartość p

Jest czymś w rodzaju zindywidualizowanego
poziomu istotności

Załóżmy, że wartość p dla
wyznaczonego sprawdzianu
wynosi 0.0002

Informacja dla użytkownika
testu:

Ho musiałaby być odrzucona
przy a=0.01

Ho musiałaby być odrzucona
przy a=0.001 i przy wszystkich
poziomach aż do 0.0002!!

Informacja zawarta w p=0.0002 jest bogatsza niż w stwierdzeniu,
że Ho odrzucona na poziome =0.05

Dziękuję za uwagę

Document Outline

Slide 1
Slide 2
Slide 3
Slide 4
Slide 5
Slide 6
Slide 7
Slide 8
Slide 9
Slide 10
Slide 11
Slide 12
Slide 13
Slide 14
Slide 15
Slide 16
Slide 17
Slide 18
Slide 19
Slide 20
Slide 21
Slide 22
Slide 23
Slide 24
Slide 25
Slide 26
Slide 27
Slide 28
Slide 29
Slide 30
Slide 31
Slide 32
Slide 33
Slide 34
Slide 35
Slide 36
Slide 37
Slide 38
Slide 39
Slide 40
Slide 41
Slide 42
Slide 43
Slide 44
Slide 45
Slide 46
Slide 47
Slide 48
Slide 49
Slide 50
Slide 51
Slide 52
Slide 53
Slide 54
Slide 55
Slide 56
Slide 57
Slide 58
Slide 59
Slide 60
Slide 61
Slide 62
Slide 63
Slide 64
Slide 65
Slide 66