Weryfikacja hipotez
statystycznych
PROCEDURA
Procedura weryfikacji odbywa się przy
wykorzystaniu narzędzi statystycznych
zwanych testami. Szczególnie miejsce wśród
nich zajmują testy istotności. Procedura
tych testów pozwala, na podstawie wyników
uzyskanych z próby losowej, na podjęcie
jednej z dwóch alternatywnych decyzji:
• o odrzuceniu hipotezy sprawdzanej,
• o stwierdzeniu braku podstaw do jej
odrzucenia.
2
RODZAJE BŁĘDÓW
• Błąd pierwszego rodzaju – odrzucenie
hipotezy pomimo, iż jest ona
prawdziwa
• Błąd drugiego rodzaju – przyjęcie
hipotezy fałszywej
3
Procedura postępowania
• Postawienie hipotez (hipotezy sprawdzanej
i konkurencyjnej wobec niej)
• Przyjmujemy poziom istotności α
• z populacji generalnej losowana jest próba
statystyczna i na podstawie wyników z tej
próby ustalana jest wartość statystyki
empirycznej t
emp
• dla przyjętego poziomu istotności – z
odpowiednich tablic – odczytywana jest
wartość statystyki teoretycznej t
t
określanej
również mianem wartości krytycznej,
4
Procedura c.d.
• porównujemy wartości statystyki
empirycznej i teoretycznej i w przypadku:
Test dwustronny:
- jeżeli odrzucamy hipotezę
zerową
- jeżeli brak podstaw do
odrzucenia hipotezy zerowej
5
t
emp
t
t
t
emp
t
t
Test prawostronny:
- jeżeli odrzucamy hipotezę
zerową
- jeżeli brak podstaw do
odrzucenia hipotezy zerowej
Test lewostronny:
- jeżeli odrzucamy hipotezę zerową
- jeżeli brak podstaw do
odrzucenia hipotezy zerowej
6
t
emp
t
t
t
emp
t
t
t
emp
t
t
t
emp
t
t
Weryfikacja hipotezy
dla wartości średniej
7
Procedura
• Postawienie hipotez
H
0
: E(x) = E
0
(x)
H
1
: E(x) ≠E
0
(x)
H
1
: E(x) >E
0
(x)
H
1
: E(x)< E
0
(x)
• Założenie poziomu istotności α
• Wylosowanie z populacji generalnej
próby – może to być próba mała ( n≤
30) bądź próba duża (n> 30)
8
Próba mała
• Ustalamy dla próby średnią arytmetyczną oraz
odchylenie standardowe
• z tablic rozkładu t Studenta odczytujemy
wartość statystyki teoretycznej według reguły
- w przypadku testu dwustronnego: dla k= n-1
oraz założonego poziomu istotności α
- dla testu jednostronnego: dla k = n-1 oraz 2·α
• Zgodnie z zasadami porównanie obu statystyk
9
1
·
0
n
x
s
x
E
x
t
emp
Próba duża
• Pobranie z populacji dużej próby i
ustalenie dla niej średniej arytmetycznej i
S(x)
• Odczytanie z tablic dystrybuanty statystyki
teoretycznej:
- dla testu obustronnego
- dla testu jednostronnego dla 0,5 – α
• Porównanie obu statystyk
10
n
x
s
x
E
x
t
emp
·
0
2
5
,
0
Przykład 1
Zakłada się, że średni czas przepisywania na
komputerze jednej strony tekstu wynosi 5,8
minuty. W celu sprawdzenia założenia do
próby pobrano 29 maszynistek i zebrano
informacje o czasie przepisywania tekstu.
Informacje te przedstawia poniższy szereg.
Hipotezę zweryfikować przyjmując poziom
istotności 0,01.
11
x
n
<3,8 – 4,4)
5
<4,4 - 5,0)
10
<5,0 – 5,6)
12
<5,6 -6,2)
2
12
Przykład 2
Zakłada się, że średnia waga
tabliczki czekolady w całej populacji
jest mniejsza od 100 g. W celu
zweryfikowania hipotezy do próby
pobrano w sposób losowy 70
tabliczek czekolady , których średnia
waga wyniosła 93 g z odchyleniem
standardowym 1 g. Przy
weryfikowaniu hipotezy przyjąć
poziom istotności 0,05.
13
Weryfikacja hipotezy
dla dwóch średnich
14
Procedura
• Postawienie hipotez
• Założenie poziomu istotności
• Wylosowanie z obu populacji prób dużych,
albo małych
15
x
E
x
E
H
2
1
0
:
x
E
x
E
H
2
1
1
:
x
E
x
E
H
2
1
1
:
x
E
x
E
H
2
1
1
:
Mała próba
• Losujemy z obu populacji próby (małe próby) i
ustalamy dla nich wartości średnie z
odchyleniami standardowymi
• Odczytujemy z tablic rozkładu studenta
statystykę teoretyczną
- test dwustronny: dla k= n
1
+n
2
-2 oraz α
- test jednostronny: dla k= n
1
+n
2
-2 oraz 2 α
• Porównujemy obie statystyki
16
2
1
2
1
2
2
2
2
1
1
2
1
1
1
2
n
n
n
n
x
s
n
x
s
n
x
x
t
emp
Duża próba
• Z obu populacji losujemy duże próby dla
których ustalamy średnie arytmetyczne
oraz odchylenia standardowe
• Odczytujemy z tablic dystrybuanty rozkładu
normalnego statystykę teoretyczną
- test dwustronny dla
- test jednostronny dla 0,5 - α
• Porównujemy obie statystyki
17
2
2
2
1
2
1
2
1
n
x
s
n
x
s
x
x
t
emp
2
5
,
0
Przykład 3
Wysunięto hipotezę, kobiety uzyskują
lepsze oceny z egzaminów z matematyki
niż mężczyźni. Na I roku UE wylosowano do
próby 14 mężczyzn i 18 kobiet i uzyskano
dla obu prób następujące informacje:
próba mężczyzn: średnia ocena 3,2 z S(x)
= 0,9
próba kobiet: średnia ocena 3,8 z S(x) =
0,6
Hipotezę zweryfikować przy poziomie
istotności 0,1.
18
Przykład
Rozkład tygodniowego czasu
poświęconego na naukę poza uczelnią jest
cechą o rozkładzie normalnym. Zakłada
się, że studenci drugiego roku UE
poświęcają więcej czasu na naukę niż
studenci roku 3. W celu zweryfikowania
hipotezy pobrano z obu populacji próby
liczące odpowiednio: II rok próba równa 40
osób i III rok próba licząca 50 osób.
Uzyskano dla nich następujące informacje
o czasie poświęcanym na naukę poza
uczelnią
19
Studenci II roku
Studenci III roku
20
X
2
(w h)
n
2
<0-6)
11
<6-12)
14
<12-18)
12
<18-24)
6
X
1
(w h)
n
1
<0- 7)
9
<7-14)
22
<14-21)
7
Weryfikacja hipotezy
dla współczynnika
korelacji
21
Procedura
• Postawienie hipotez
• Założenie poziomu istotności
• Pobranie z populacji generalnej małej
próby i ustalenie dla niej współczynnika
korelacji liniowej Pearsona
22
0
:
0
H
0
:
1
H
0
:
1
H
0
:
1
H
• Wyznaczenie statystyki teoretycznej
• Odczytanie z tablic rozkładu t studenta
statystyki teoretycznej:
- w przypadku testu dwustronnego: dla k = n-
2 oraz α
- w przypadku testu jednostronnego: dla k= n-
2 oraz 2
α
• Porównanie obu statystyk
23
2
·
1
2
n
r
r
t
P
P
emp
Przykład 5
Zakłada się, że istnieje dodatnia zależność
pomiędzy stażem pracy a wysokością
uzyskanej kwartalnej premii. W celu
zweryfikowania hipotezy do próby pobrano
15 pracowników pewnego
przedsiębiorstwa i zebrano od nich
informacje o stażu pracy (cecha x w
latach) oraz wysokości uzyskanej
kwartalnej premii (cecha y w tys. złotych).
Przy weryfikacji hipotezy przyjąc poziom
istotności 0,01.
24
25
lp
x( lat)
y (tys. zł)
1
20
2,5
2
11
1,6
3
5
0,7
4
10
1,2
5
26
2,5
6
20
1,7
7
13
1,0
8
15
0,9
9
22
2,3
10
20
1,9
11
25
2,6
12
28
3,0
13
15
1,4
14
13
0,8
15
10
1,1
Test niezależności
2
Procedura
• Sformułowanie i postawienie hipotez
• Założenie poziomu istotności
• Pobranie z populacji generalnej dużej
próby i zebranie informacji o wartościach
dwóch cech (informacje zestawia się w
tablicy korelacyjnej)
27
j
i
ij
f
f
f
H
·
:
0
j
i
ij
f
f
f
H
·
:
1
j
i
j
i
j
i
ij
emp
f
f
N
f
f
N
n
t
,
2
·
·
·
·
• Odczytanie z tablic rozkładu dla
oraz α statystyki
teoretycznej
• Porównanie obu statystyk i podjecie
decyzji odnośnie hipotezy zerowej
28
2
1
·
1
s
l
k
Przykład
Dla losowej próby bezrobotnych
zarejestrowanych w Powiatowym Urzędzie
Pracy w „K” zebrano informacje dotyczące
ich poziomu wykształcenia (X) oraz czasu
pozostawania bez pracy (Y). Wyniki
badania ujęto w poniższej tablicy
korelacyjnej. Na poziomie istotności 0,05
zweryfikować hipotezę o niezależności
czasu pozostawania bez pracy od poziomu
wykształcenia bezrobotnych.
29
30
CZAS
POZOSTAWANIA
BEZ PRACY W
MIESIĄCACH
POZIOM WYKSZTAŁCENIA
podstawowe średnie
wyższe
do 6
15
15
15
45
6 - 12
25
25
10
60
12 - 24
30
15
10
55
70
55
35
16
0
i
n
j
n