Biostatystyka – Wykład 6
Biostatystyka – Wykład 6
2
Wybrane metody wnioskowania statystycznego
Wybrane metody wnioskowania statystycznego
1. Estymacja
• Punktowa
• Przedziałowa
2. Weryfikowanie hipotez
3
POPULACJA
P1 P2 P3
Pn
μ
б
x
s
We wnioskowaniu statystycznym interesuje nas
POPULACJA
Wykorzystujemy próbę do uzyskania informacji na temat
populacji
4
Estymacja
Estymacja
• Z prób reprezentatywnych obliczamy wielkości
statystyk
, które są
estymatorami
określonych
parametrów
populacji
• Przykładowo średnia arytmetyczna z próby jest
dobrym estymatorem wartości oczekiwanej
(wartości przeciętnej) populacji
5
• estymację punktową:
– czyli metodę szacunku, za pomocą której jako wartość
parametru zbiorowości generalnej przyjmuje się
konkretną wartość estymatora wyznaczonego na
podstawie n-elementowej próby (zakładamy, że wartość
statystki z próby leży blisko wartości parametru
populacji)
• estymację przedziałową:
– za pomocą której wyznacza się przedział liczbowy, który z
ustalonym prawdopodobieństwem zawiera nieznaną
wartość szacowanego parametru zbiorowości generalnej.
Wyróżnia się dwa rodzaje estymacji:
Wyróżnia się dwa rodzaje estymacji:
6
Statystki z próby jako estymatory parametrów populacji
Statystki z próby jako estymatory parametrów populacji
• Parametr populacji
, lub po prostu parametr,
to liczbowa charakterystyka populacji
• Statystyka z próby
, lub po prostu statystyka,
to liczbowa charakterystyka z próby
7
Estymatory punktowe
Estymatory punktowe
Estymator (statystyka
z próby)
Parametr
populacji
X
S
P
μ
σ
p
8
Przykład
Przykład
• zbiór: (1, 2, 3, ..., 8)
• prawdopodobieństwo wylosowania
każdej liczby = 1/8
• losujemy dwie liczby ze zwracaniem
(ważna kolejność) i obliczamy ich
średnią arytmetyczną
• jaki jest rozkład tych średnich?
9
Obliczymy średnią i odchylenie
standardowe z populacji X:
29
,
2
5
,
4
Natomiast wartość oczekiwana
i odchylenie zmiennej losowej X
śr
62
,
1
5
,
4
x
x
Zauważymy, że oczekiwana
wartość jest równa średniej z
populacji, natomiast
odchylenie standardowe
n
x
/
x = μ
10
Poniżej na rysunku pokazano krzywą Gaussa dla populacji i krzywe normalne
dla zm.los. średniej , dla różnych liczebności prób.
Poniżej na rysunku pokazano krzywą Gaussa dla populacji i krzywe normalne
dla zm.los. średniej , dla różnych liczebności prób.
rozkład normalny
(w populacji)
rozkład zmiennej
Xśr przy n=2
rozkład zmiennej
Xśr przy n=4
rozkład zmiennej
Xśr przy n=16
11
Z rysunku widać, że jeśli liczebność próby wzrasta, to
odchylenie standardowe zmiennej maleje, dzięki czemu
zbliżenie się wartości średniej do staje się coraz bardziej
prawdopodobne. I tak doszliśmy do jednego z głównych
twierdzeń w teorii statystyki:
centralnego twierdzenia
granicznego
, które mówi:
Jeżeli pobieramy próbę z populacji o średniej μ i
skończonym odchyleniu standardowym σ , to rozkład
średniej z próby , dąży do rozkładu normalnego o
średniej μ i odchyleniu , gdy liczebność próby
wzrasta nieograniczenie, czyli dla „dostatecznie dużych n
X
n
/
12
Na rysunku poniżej pokazano kilka rozkładów w macierzystych
populacjach i wynikające stąd rozkłady , dla prób o różnej liczebności.
Rozkład
macierzystej
populacji
normalny
prawoskośny
jednostajny
Rozkład Xśr
n=2
n=10
n=30
13
W ogólnym przypadku próbę uważa się za
dostatecznie dużą, by stosowane były reguły
tw. granicznego, jeśli zawiera ona 30 i więcej
elementów
14
2
/
2
/
2
/
z
2
/
1
z
n
z
x
2
/
Przedział ufności dla μ przy (1-α) poziomie ufności,
gdy σ jest znane, a próba została pobrana z populacji
normalnej lub jest „dużą próbą”, wyznacza wzór:
15
gdzie t
α/2
- jest wartością z rozkładu t-
Studenta
o n-1 stopniach swobody, która
odcina
pod krzywą gęstości pole o
mierze α/2 z prawej strony
Przedział ufności dla μ przy (1-α) poziomie ufności, gdy σ
nie jest znane, a próba została pobrana z populacji
normalnej lub jest „małą próbą”, wyznacza wzór:
16
• Przykład
• Chcemy oszacować średni wiek pielęgniarek
zatrudnionych w wiejskich ośrodkach
zdrowia. W tym celu ze zbiorowości tych
pielęgniarek wylosowano próbę liczącą 121
osób i otrzymano następujące wyniki: średnia
wieku pielęgniarek pracujących w wiejskich
ośrodkach zdrowia wynosi 45 lat oraz
odchylenie wynosi 13,5 lat. Oszacować średni
wiek pielęgniarek pracujących w wiejskich
ośrodkach zdrowia.
17
• Dane: n=121, M=45 lat, SD= 13,5 lat
Otrzymujemy następujący przedział ufności:
(45 – 1,96*13,5/121^0,5; 45 +
1,96*13,5/121^0,5)
po wyliczeniu mamy około:(42; 48 lat)
18
Przedziały ufności dla wariancji w populacji
Przedziały ufności dla wariancji w populacji
• W wielu sytuacjach interesuje nas wariancja lub odchylenie
standardowe w populacji. Tak jest np. w analizie procesu
produkcyjnego, w badaniach procesów masowej obsługi.
Jak już mówiliśmy nieobciążonym estymatorem wariancji w
populacji,
2
jest wariancja z próby S
2
• Do wyznaczenia przedziału ufności dla wariancji w
populacji musimy poznać nowy rozkład, tzw. rozkład
chi-
kwadrat
lub
2
19
Rozkład chi-kwadrat
Rozkład chi-kwadrat
• Rozkład ten podobnie jak rozkład t, charakteryzuje się
liczba stopni swobody, df ( df=n-1 )
• W przeciwieństwie do rozkładu t, rozkład chi-kwadrat nie
jest symetryczny
df = 10
df = 30
df = 50
20
Rozkład chi-kwadrat
Rozkład chi-kwadrat
• Rozkład chi-kwadrat
jest rozkładem
prawdopodobieństwa sumy kwadratów niezależnych,
standaryzowanych, normalnych zmiennych losowych.
– Średnia rozkładu
jest równa liczbie stopni swobody df
– Wariancja
zaś jest równa liczbie stopni swobody
pomnożonej przez dwa.
21
Przedziały ufności dla wariancji w populacji
Przedziały ufności dla wariancji w populacji
(1-
)100% przedział ufności dla wariancji w populacji,
2
, gdy rozkład w
populacji jest normalny, wyznacza wzór:
2
2
/
1
2
2
2
/
2
)
1
(
;
)
1
(
S
n
S
n
gdzie:
2
2
/
jest wartością zmiennej w rozkładzie chi-kwadrat o n-1 stopniach
swobody, która odcina pole o mierze
2
/
z prawej strony;
2
2
/
1
jest wartością
zmiennej w rozkładzie chi-kwadrat, która odcina pole o mierze
2
/
lewej strony
(a tym samym 1-
2
/
z prawej strony).
Weryfikowanie hipotez
statystycznych
Weryfikowanie hipotez
statystycznych
23
• Podobnie jak testy w życiu codziennym, test
statystyczny też ma jednobitowy wynik:
„
jest OK albo nie jest OK”
– Wąchamy wczorajszą wędlinkę i kierujemy ją na stół
albo pod stół (do kosza;-)
– Nie ma trzeciej drogi, chyba że mamy psa, który nam
się opatrzył.
24
• Zwróćmy przy okazji uwagę na to, że przy
testowaniu możemy popełnić dwa rodzaje błędów:
– możemy wyrzucić dobrą szynkę
• jest to błąd pierwszego rodzaju
– albo zjeść zepsutą
• błąd drugiego rodzaju
• Kalkulacja ekonomiczna kosztu tych błędów jest bardzo
ważna przy projektowaniu testu, aczkolwiek może ona nie
być łatwa do przeprowadzenia
25
• W zarządzaniu jakością często stawiane jest pytanie
– czy wartość określonej statystyki uzyskana z próbki losowej
(szczególnie jeśli próbka ma małą liczność), pozwala sądzić, że
odpowiada ona wartości wymaganej (spodziewanej)
– lub też, czy uzyskana w wyniku działań doskonalących
poprawa jest tylko pozorna – wynika z małej liczby pomiarów
sprawdzających – czy rzeczywista
• Odpowiedzi na tak i podobnie postawione pytanie
uzyskuje się w tzw. testach statystycznych
Przykładowo:
26
Stosuje się dwie grupy testów:
Stosuje się dwie grupy testów:
• parametryczne i nieparametryczne
– stosowanie pierwszych wymaga przyjęcia założeń o
postaci rozkładu testowanej zmiennej losowej oraz
znajomości wybranych statystyk
– testy nieparametryczne
takich założeń nie wymagają,
ale nie są tak mocne jak parametryczne
27
Hipotezy statystyczne
Hipotezy statystyczne
• Hipoteza statystyczna to każde
przypuszczenie dotyczące rozkładu
zmiennej losowej weryfikowane na
podstawie n-krotnej realizacji tej
zmiennej
– Wyróżniamy:
• Hipotezy
– parametryczne i nieparametryczne
– proste i złożone
28
Weryfikowanie hipotez
Weryfikowanie hipotez
• Hipotezą zerową
, oznaczoną przez H
0
, jest hipoteza
w wartości jednego z parametrów populacji (lub
wielu)
–
Tę hipotezę traktujemy jako prawdziwą, dopóki nie uzyskamy
informacji
statystycznych dostatecznych do zmiany naszego
stanowiska
• Hipotezą alternatywną
, oznaczoną przez H
1
, jest
hipoteza przypisująca parametrowi (parametrom)
populacji wartość inną niż podaje to hipoteza zerowa
29
• Hipoteza zerowa:
– często opisuje sytuację, która istniała do tej pory
lub jest wyrazem naszego przekonania, które
chcemy sprawdzić
• Sprawdzenia dokonuje się
korzystając z informacji
zawartej w próbie losowej
30
• Sprawdzianem lub statystyką testu
– nazywamy statystkę z próby, której wartość obliczona
na podstawie wyników obserwacji jest wykorzystywana
do ustalenia czy możemy hipotezę zerową odrzucić czy
jej odrzucić nie możemy
31
Przykład 1:
Przykład 1:
Firma rozwożąca paczki zapewnia, że
średni czas dostarczenia przesyłki od drzwi
klienta do odbiorcy wynosi 28 minut. By
sprawdzić to stwierdzenie pobrano próbę
n=100 przesyłek i obliczono średni czas
dostawy 31,5 minut oraz odchylenie
standardowe 5 minut.
32
Test dla średniej
Test dla średniej
H
0
: µ = 28
H
1
: µ 28
zbudujmy 95% przedział ufności dla średniej:
]
48
,
32
;
52
,
30
[
100
5
96
,
1
5
,
31
n
u
x
2
/
Jeżeli mamy 95% ufności, że średni czas dostawy zawiera się
w przedziale [30.52; 32.48] minuty, to mamy 95% zaufania,
że czas ten nie znajdzie się poza tym przedziałem.
Wartość sprawdzana: 28 minut, leży poza tym przedziałem,
zatem odrzucamy hipotezę zerową.
1- = 0,95
= 5
33
Czego się nauczyliśmy z przykładu?
Czego się nauczyliśmy z przykładu?
Po pierwsze:
przy weryfikowaniu testów można
budować przedział ufności wokół wartości
statystyki z próby i sprawdzać, czy weryfikowana
wartość parametru należy do przedziału
28
31,5
30,52
32,48
95% przedział ufności
0
x
34
Z drugiej strony:
Z drugiej strony:
Można jako centrum traktować średnią populacji i
sprawdzać wartość statystyki z próby względem
przedziału ufności wokół parametru populacji
]
98
,
28
;
02
,
27
[
100
5
96
,
1
28
n
s
96
,
1
0
Wartość średnia z próby =31,5, zatem nie należy
do przedziału ufności. Hipotezę zerową odrzucamy.
35
28
31,5
30,52
32,48
95% przedział ufności
0
=2
8
x
28,98
27,02
95%
obszar
przyjęcia
Średnia z próby
znajduje się poza
obszarem
przyjęcia
x
36
Interpretacja graficzna
Interpretacja graficzna
0
rozkład populacji
x
Pytanie: Czy ta średnia
może pochodzić z populacji
o średniej
0
i odchyleniu ?
n
σ
u
2
/
α
Jeśli średnia z próby
leży powyżej granicy, to
przypuszczenie że
populacja ma średnią
0
musi zostać odrzucone
37
Standaryzowana forma testu statystycznego
Standaryzowana forma testu statystycznego
n
/
σ
μ
x
0
0
rozkład standaryzowany
Standaryzujemy średnią
z próby, czyli obliczamy
statystykę (sprawdzian)
Jeżeli obliczona wartość
statystyki leży poniżej
granicy u
/2
, to nie ma
podstaw do odrzucenia
hipotezy zerowej
2
/
α
u
38
obszar nieodrzucenia
obszar
odrzucenia
obszar
odrzucenia
0
-1,96
1,96
Miara pola = 0,025
Miara pola = 0,025
Miara pola = 0,95
z = 7,0
wartość
sprawdzianu
znajduje się w
polu odrzucenia
u
H
0
: µ = 28
H
1
: µ 28
7
100
/
5
28
5
,
31
u
Obszar krytyczny:
R = (-; -1,96) (1,96; +)
Wracając do przykładu:
39
Prawdopodobieństwo odrzucenia/przyjęcia hipotezy
Prawdopodobieństwo odrzucenia/przyjęcia hipotezy
)
falszywa
H
/
na
nieodrzuco
H
(
P
)
prawdziwa
H
/
odrzucona
H
(
P
0
0
0
0
Hipoteza
Decyzja
Prawdziwa
Fałszywa
Przyjąć
Właściwe
postępowani
e
1-α
Błąd II-go
rodzaju
β
Odrzucić
Błąd I-go
rodzaju
α
Właściwe
postępowani
e
1-β
40
ponieważ założyliśmy, że hipoteza zerowa
odzwierciedla nasze przekonanie, to chcemy śledzić
pradwopodobieńswto I-go rodzaju
świadomość, że istnieje małe prawdopodobieństwo
popełnienia błędu I-go rodzaju, czyli odrzucenia
hipotezy zerowej, gdy nie powinna być ona
odrzucona,
czyni odrzucenie hipotezy zerowej
wnioskiem stanowczym
41
Nie można tego powiedzieć o akceptowaniu (czyli
nie odrzuceniu) hipotezy zerowej
Jeżeli akceptujemy hipotezę zerową (nie
odrzucamy jej) czujemy tylko, że
nie mamy
podstaw do jej odrzucenia
42
Przykład 2:
Przykład 2:
Przypuszcza się, że przeciętny czas jaki potrzebuje
komputer do wykonania pewnego zadania wynosi 3,24
sekundy.
Grupa naukowców z Bell Laboratories testowała
algorytmy, które mogłyby zmienić czas obliczeń.
Przeprowadzono badania: wybrano losowo próbę 200
cykli obliczeń komputera według nowych algorytmów i
otrzymano średni czas obliczeń 3,48 s przy odchyleniu 2,8
sekundy.
Jaki wniosek wyciągną naukowcy przy poziomie istotności
0,05?
43
H
0
: µ = 3,24
H
1
: µ 3,24
21
,
1
200
/
8
,
2
24
,
3
48
,
3
u
Obszar krytyczny:
R
0 05
= (-; -1,96) (1,96; +)
Obszar krytyczny:
R
0 1
= (-; -1,65) (1,65; +)
Otrzymana wartość u nie należy do obszaru krytycznego.
Zatem nie ma podstaw do odrzucenia hipotezy zerowej.
Oznacza to jedynie, że na przyjętym poziomie istotności
nie mamy dostatecznych powodów do odrzucenia H
0
.
44
Test dwustronny dla średniej w populacji dla dużej
próby
Test dwustronny dla średniej w populacji dla dużej
próby
H
0
: =
0
H
1
: ≠
0
Poziom istotności:
(zazwyczaj przyjmowany: 0,05; 0,01)
Statystyka testu:
n
σ
μ
x
u
0
Obszar krytyczny: R
= (-; -u
/2
) (u
/2
; +)
Reguła decyzyjna: hipotezę zerową odrzucić, jeśli
statystyka u należy do R
45
Test dwustronny dla średniej w populacji dla małej
próby
Test dwustronny dla średniej w populacji dla małej
próby
H
0
: =
0
H
1
: ≠
0
Poziom istotności:
(zazwyczaj przyjmowany: 0,05; 0,01)
Statystyka testu:
n
s
μ
x
t
0
Obszar krytyczny: R
= (-;
-t
/2
) (t
/2
; +)
Reguła decyzyjna: hipotezę zerową odrzucić, jeśli
statystyka u należy do R
ma rozkład t o n-1 stopniach swobody
46
Test dla porównania dwóch wartości oczekiwanych dwóch
populacji przy dużych próbach
Test dla porównania dwóch wartości oczekiwanych dwóch
populacji przy dużych próbach
H
0
:
1
=
2
H
1
:
≠
Poziom istotności:
(zazwyczaj przyjmowany: 0,05; 0,01)
Statystyka testu:
2
2
2
1
2
1
2
1
n
σ
n
σ
x
x
u
Obszar krytyczny: R
= (-; -u
/2
) (u
/2
; +)
Reguła decyzyjna: hipotezę zerową
odrzucić, jeśli
statystyka u należy do R
dwie badane populacje mają
rozkład normalny N(
1
,
1
) oraz
N(
2
,
2
)
47
Test dla porównania dwóch wartości oczekiwanych dwóch
populacji przy małych próbach
Test dla porównania dwóch wartości oczekiwanych dwóch
populacji przy małych próbach
H
0
:
=
H
1
:
≠
Poziom istotności:
(zazwyczaj przyjmowany: 0,05; 0,01)
Statystyka testu:
2
1
2
1
2
2
2
2
1
1
2
1
n
1
n
1
2
n
n
s
)
1
n
(
s
)
1
n
(
x
x
t
Obszar krytyczny: R
= (-; -u
/2
) (u
/2
; +)
Reguła decyzyjna: hipotezę zerową odrzucić,
jeśli
statystyka u należy do R
dwie badane populacje mają
rozkład normalny N(
1
,
1
) oraz
N(
2
,
2
), nieznane odchylenia
48
Test hipotezy o frakcji w populacji w przypadku dużej próby
Test hipotezy o frakcji w populacji w przypadku dużej próby
n
/
q
p
p
p
u
0
0
0
H
0
: p= p
0
H
1
: p ≠ p
0
jeśli próba jest duża, to rozkład
frakcji w próbie jest rozkładem
normalnym o średniej p i
odchyleniu pq/n
Poziom istotności:
(zazwyczaj przyjmowany: 0,05; 0,01)
Statystyka testu:
Obszar krytyczny: R
= (-; -u
/2
) (u
/2
; +)
Reguła decyzyjna: hipotezę zerową
odrzucić, jeśli
statystyka u należy do R
49
Testy jednostronne
Testy jednostronne
• Wybór rodzaju testu podyktowany jest potrzebą działania
• Jeżeli działanie (np. korygujące) będzie podjęte, gdy
parametr przekroczy pewną wartość a, to stosujemy test
prawostronny:
H
0
: μa
H
1
: μ>a
• Jeżeli działanie będzie podjęte, gdy parametr przyjmie
wartość mniejszą niż a, to stosujemy test lewostronny:
H
0
: μa
H
1
: μ<a
50
H
0
: μa
H
1
: μ>a
H
0
: μ=a
H
1
: μa
51
Test hipotezy o wariancji populacji
Test hipotezy o wariancji populacji
• bardzo często chcemy dowiedzieć się czegoś o wariancji
w populacji
2
:
• np. czy wariancja liczby sztuk wyrobu nie
przekroczyła pewnej granicy?
• np. o wariancji czasu obróbki na linii (powinna
być niewielka, aby nie tworzyły się przestoje)
• z reguły obawiamy się, że wariancja w populacji
przekroczy pewien poziom
• dlatego z reguły stosujemy test prawostronny
52
Test hipotezy o wariancji w populacji
Test hipotezy o wariancji w populacji
2
0
2
2
s
)
1
n
(
H
0
:
0
H
1
:
>
0
Poziom istotności:
(zazwyczaj przyjmowany: 0,05; 0,01)
Statystyka testu:
Obszar krytyczny: R
= (
; +)
Reguła decyzyjna: hipotezę zerową
odrzucić, jeśli
statystyka
2
należy do R
53
Prawdopodobieństwo błędu II-go rodzaju
Prawdopodobieństwo błędu II-go rodzaju
• w testach zakładamy błąd
• co z błędem ?
Stan rzeczy
Decyzje
H
0
H
1
H
0
H
1
słuszna
decyzja
słuszna
decyzja
bład I-go rodzaju jest poważniejszy
H
0
:
niewinna
H
1
: winna
54
Prawdopodobieństwo błędu II-go rodzaju
Prawdopodobieństwo błędu II-go rodzaju
• niestety prawdopodobieństwo jest trudne do
wyznaczenia „a priori”
• zależy ono od tego, którą z możliwych wartości
przyjmie inetersujący nas parametr
• przykładowo dla testów dotyczących błąd
jest funkcją :
55
Przykład wyznaczania :
Przykład wyznaczania :
H
0
= 60
H
1
= 65
Mamy do czynienia z hipoteza prostą. Albo dojdziemy do
wniosku, że średnia populacji jest równa 60, albo że jest
równa 65.
W praktyce takie sytuacje zdarzają się rzadko.
n = 100
= 20
= 0,05
60
0
65
1
63,29
29
63
645
1
0
,
n
,
C
56
Jakie jest prawdopodobieństwo ?
Jakie jest prawdopodobieństwo ?
)
/
C
X
(
P
0
)
/
C
X
(
P
1
z góry ustalamy, zatem :
1963
,
0
)
855
,
0
U
(
P
)
n
/
C
n
/
X
(
P
)
/
C
X
(
P
1
1
1
Zatem prawdopodobieństwo przyjęcia błędnej hipotezy, że
średnia w populacji jest 60, podczas gdy w rzeczywistości wynosi
65, jest równe 0,1963.
Przeprowadzony test dopuszcza 5% ryzyko odrzucenia Ho gdy
jest ona prawdziwa i 19,63% ryzyko przyjęcia Ho gdy jest ona
fałszywa.
57
Moc testu
Moc testu
Mocą testu hipotezy statystycznej jest
prawdopodobieństwo odrzucenia hipotezy zerowej,
gdy jest ona fałszywa.
moc testu = 1-
W przykładzie: moc testu=1-0,1963=0,8037
Mamy 80,37% szans, że odrzucimy Ho gdy
średnia populacji jest równa 65, a nie 60.
58
Dla testów złożonych
Dla testów złożonych
przykładowo w przypadku testu jednostronnego
H
0
60
H
1
> 60
Jak zdefiniować moc testu w takiej sytuacji?
Moc testu = P( odrzucenia Ho/ Ho jest fałszywa )
W przykładzie Ho może być fałszywa na nieskończenie
wiele sposobów: 61, 62, 67, 72.893 itd...
59
Moc testu dla wybranych wartości
1
Moc testu dla wybranych wartości
1
1
Moc=1-
61
62
63
64
65
66
67
68
69
0,8739
0,7405
0,5577
0,3613
0,1963
0,0877
0,0318
0,0092
0,0021
0,1262
0,2595
0,4423
0,6387
0,8037
0,9123
0,9682
0,9908
0,9979
załóżmy liczebność próby n=100, s=20, a=0.05
60
Własności mocy testu:
Własności mocy testu:
1.
Moc zależy od odległości między wartością
parametru zakładaną w hipotezie zerowej a
prawdziwą wartością parametru. Im większa
odległość tym większa moc.
2.
Moc zależy od wielkości odchylenia standardowego
w populacji. Im mniejsze odchylenie tym większa
moc.
3.
Moc zależy od liczebności próby. Im liczniejsza
próba, tym większa moc.
4.
Moc zależy od poziomu istotności testu. Im niższy
poziom istotności tym mniejsza moc testu.
nie możemy kontrolować punktu 1 i 2
kształtujemy jedynie pkt. 3 i 4
61
Podsumowując:
Podsumowując:
• w przypadku prowadzenia testu statystycznego dla
parametru populacji posługiwaliśmy się:
– przedziałem ufności (wokół
0
lub x
śr
)
– standaryzowanym przedziałem
• Istnieje 3 droga: wyznaczanie wartości
prawdopodobieństwa na prawo/lewo od wartości
sprawdzianu
62
Wartość p – co to takiego?
Wartość p – co to takiego?
to najniższy poziom istotności, przy którym hipoteza
zerowa mogłaby być odrzucona przy otrzymanej
wartości sprawdzianu
to prawdopodobieństwo otrzymania takiej wartości
sprawdzianu, jaką otrzymaliśmy przy założeniu, że
hipoteza zerowa jest prawdziwa
63
Wartość p – co to takiego?
0
rozkład Z
Wartość sprawdzianu u=2,5
Wartość p = miara pola na prawo od u
p = 0.0062
H
0
:
60
H
1
:
> 60
= 0.01
stąd u
kryt
=2,326
u=2,326
64
Interpretacja:
Interpretacja:
• jeśli otrzymana wartość sprawdzianu jest mało
prawdopodobna przy założeniu, że Ho jest
prawdziwa, to hipoteza Ho powinna być odrzucona
• jeśli otrzymana wartość sprawdzianu jest dosyć
prawdopodobna (większa od 0.05; 0.1) to
powinniśmy przyjąć hipotezę Ho
65
Wartość p
Wartość p
Jest czymś w rodzaju zindywidualizowanego
poziomu istotności
Załóżmy, że wartość p dla
wyznaczonego sprawdzianu
wynosi 0.0002
Informacja dla użytkownika
testu:
1)
Ho musiałaby być odrzucona
przy a=0.01
2)
Ho musiałaby być odrzucona
przy a=0.001 i przy wszystkich
poziomach aż do 0.0002!!
Informacja zawarta w p=0.0002 jest bogatsza niż w stwierdzeniu,
że Ho odrzucona na poziome =0.05
Dziękuję za uwagę
Dziękuję za uwagę