PARAMETRYCZNE
• dotyczą parametrów populacji (np. średniej, wariancji)
• rozkład badanej cechy w populacji musi mieć rozkład
normalny
przy małych próbach określenie normalności rozkładu
jest problematyczne
• są silniejsze od testów nieparametrycznych
• stosuje się je do danych w skali ilorazowej i
interwałowej
NIEPARAMETRYCZNE
• dotyczą rozkładu cech w populacji (nie parametrów populacji)
• można ich używać do danych w skali nominalnej i porządkowej
• stosujemy je gdy:
• chcemy porównać rozkłady cech, a nie parametry rozkładów
•
rozkład badanej cechy wyraźnie odbiega od rozkładu normalnego
• liczebność próby jest mała
Próby muszą być losowe i niezależne -
każdy element
populacji musi mieć taka samą szansę znalezienia się w próbie i
wybór jednego elementu nie zmienia szansy wylosowania innego
elementu
TESTY
PARAMERTYCZNE
skala interwałowa,
ilorazowa,
TESTY
NIEPARAMERTYCZNE
skala interwałowa,
ilorazowa, porządkowa
TESTY DLA
DWÓCH
PRÓB
TESTY DLA
WIĘCEJ NIŻ
DWÓCH
PRÓB
t-Studenta dla par niezależnych
t-Studenta dla par zależnych
Cochrana-Coxa
test dla 2 wsp. zmienności
test dla 2 wsk. różnorodności
test dla 2 wsp. korelacji
test F (Fishera), Levena
Lilleforsa, Shapiro-Wilka
U Manna-Whitneya
Wilcoxona,
test znaków,
Walda-Wolfowitza (test serii)
Kołgomorowa-Smirnowa
test mediany dla dwóch prób
ANOVA i testy post hoc:
• Tukeya (Spjotvolla i Stolinea)
• Newman-Keulsa
• Duncana
• Scheffego
• Dunetta
Kruskala-Wallisa i testy post hoc:
• Duna
test mediany dla wielu prób
test Friedmana
TESTY DLA
SKALI
NOMINALNEJ
test
2,
test
2
z poprawka Yatesa
dokładny Fishera
Mc Nemara
TESTY DLA PRÓB ZALEŻNYCH
dotyczą sytuacji, gdy porównuje się dwa pomiary
wykonane na tym samym elemencie próby, np. przed i
po eksperymencie lub szuka się różnic miedzy
elementami sparowanymi w określony sposób.
TESTY DLA PRÓB NIEZALEŻNYCH
dotyczą sytuacji, gdy porównuje się dwie grupy pomiarów
wykonanych niezależnie od siebie.
Przykład:
•Porównanie ciśnienia krwi przed i po podaniu lekarstwa
•Porównanie siły lewej i prawej ręki
(para pomiarów u tej samej osoby)
Przykład:
•Porównanie wielkości zniesienia u wróbla i sikory
•Porównanie ilości dni z opadami w dwóch sezonach badawczych
TESTY DLA PRÓB ZALEŻNYCH I NIEZALEŻNYCH
Przykład: pomiar siły lewej i prawej ręki u kobiet w 20 roku życia
Zmierzono dynamometrem
siłę lewej i prawej ręki u
100 losowo wybranych
kobiet w wieku 20 lat. Dla
każdej osoby obliczono
różnicę w sile lewej i prawej
ręki. W przypadku
silniejszej lewej ręki różnicy
przypisywano znak ujemny.
Otrzymane w ten sposób
wyniki przeanalizowano
odpowiednim testem
statystycznym.
Losowo wybrano 200
kobiet w wieku 20 lat. U
pierwszych 100 zmierzono
siłę lewej, a u następnych
100 prawej ręki. Obliczono
średnią siłę lewej i prawej
ręki w badanych próbach.
Różnicę miedzy średnimi
wartościami
przeanalizowano
odpowiednim testem
statystycznym.
Badamy którą rękę mają
silniejszą 20 letnie kobiety,
prawą czy lewą.
Badamy która ręka, prawa
czy lewa, jest silniejsza u 20
letnich kobiet.
TESTY DLA PRÓB ZALEŻNYCH I NIEZALEŻNYCH
Przykład: określenie wpływu stosowania środków owadobójczych na
biomasę części nadziemnych roślin łąkowych
Na łące wylosowano 30 par
przylegających do siebie
poletek o powierzchni 2 m
2
każde. Na jednym z nich
stosowano środek owadobójczy,
na drugim nie. Po określonym
czasie zebrano wszystkie części
nadziemne roślin, wysuszono je
i zważono. Obliczono różnice w
obrębie każdej z par poletek.
Otrzymane w ten sposób wyniki
przeanalizowano odpowiednim
testem statystycznym.
Na łące wylosowano 60 poletek o
powierzchni 2 m
2
każde. Losowo
wyznaczono 30, na których
stosowano środek owadobójczy.
Po określonym czasie zebrano
wszystkie części nadziemne
roślin, wysuszono je i zważono.
Obliczono średni plon na
poletkach eksperymentalnych i
kontrolnych. Różnicę miedzy
średnimi wartościami
przeanalizowano odpowiednim
testem statystycznym.
Jeśli łąka wydaje się nam bardzo zróżnicowana pod względem
warunków siedliskowych, to stosujemy test dla par wiązanych. Wtedy
zmienność warunków siedliskowych w obrębie pary sąsiadujących
poletek będzie mniejsza niż pomiędzy losowo wybranymi poletkami
znajdującymi się w różnych częściach łąki.
TESTY NIEPARAMETRYCZNE czyli NIEZALEŻNE OD ROZKŁADU
TESTY PARAMETRYCZNE
Ich stosowanie wymaga by spełnione były założenia dotyczące
rozkładów zmiennych w badanych populacjach, np. zgodności
rozkładu z rozkładem normalnym (tzw. normalność rozkładu) lub
równości wariancji w testowanych próbach.
Na podstawie testów parametrycznych wnioskujemy o parametrach
populacji, np. o średniej arytmetycznej lub o wariancji.
•Ich stosowanie nie wymaga spełnienia założeń koniecznych przy
stosowaniu testów parametrycznych.
•Warunki do ich stosowania są łatwiejsze do spełnienia niż w
przypadku testów parametrycznych.
•Jeśli są spełnione wymagania dotyczące stosowania testów
parametrycznych, to test nieparametryczny będzie zawsze testem
słabszym niż jego parametryczny odpowiednik.
Na podstawie testów nieparametrycznych wnioskujemy najczęściej o
postaci rozkładu, a nie o jego parametrach.
W praktyce stosujemy je gdy nie są spełnione założenia wymagane
przez testy parametryczne, lub gdy z powodu małej liczebności
próby nie można tych założeń sprawdzić.
FORMUŁOWANIE HIPOTEZY ZEROWEJ
Hipoteza zerowa zawsze zakłada brak
istotnych różnic między badanymi próbami
H
0
: średni ciężar zięb i wróbli nie różni się istotnie
H
A
: średni ciężar zięb i wróbli różni się istotnie
Test dwukierunkowy (dwustronny)
H
A
: średni ciężar zięb jest większy niż średni ciężar wróbli
H
0
: średni ciężar zięb nie jest większy niż ciężar wróbli
Test jednokierunkowy (jednostronny)
PODAWANIE WYNIKÓW TESTU
• nazwa stosowanego testu,
• wartość testu,
• prawdopodobieństwo popełnienia błędu I rodzaju
test t-Studenta; t=1,01; p=0,12
ANOVA; F
2,48
=4,40;
p=0,02
Podawanie dokładnego prawdopodobieństwa
test Wilcoxona; T=12,15; p<0,001
test 2,
; 2
=2,90; p>0,05
ANOVA; F
2,48
=4,40;
p<0,05
Podawanie przybliżonego prawdopodobieństwa
Ocena zgodności rozkładu z rozkładem normalnym
Test Lillieforsa
Test Shapiro-Wilka
Najbardziej polecany test do oceny normalności rozkładu. Może on
jednak dawać błędne wyniki przy liczebności próby większej niż 2
tysiące
Odmiana testu Kołmogorowa-Smirnowa. Można go stosować do prób
przekraczających 2 tysiące elementów
Procedury statystyczne są odporne na nieznaczne
odstępstwa analizowanych zmiennych od rozkładu
normalnego.
W praktyce najczęściej wystarcza ocena oparta na tzw.
wykresie normalności.
Ocena zgodności rozkładu z rozkładem normalnym
Przykład 1
Test Shapiro-Wilka
W=0,89; p<0,0001
Skośność=0,40
Kurtoza=-0,04
Histogram z
dopasowanym rozkładem
normalnym
Rozkład normalności
W a r to ś c i o b s e r w o w a n e
O
cz
ek
iw
an
y
ro
zk
ła
d
no
rm
al
ny
p r _ s k o s : S W - W = 0 , 7 7 7 7 0 2 1 6 1 , p = 0 , 0 0 0 0 0 0 3
O
cz
ek
iw
an
y
ro
zk
ła
d
no
rm
al
ny
W a r to ś c i o b s e r w o w a n e
Rozkład prawoskośny z
dopasowaną krzywą normalną
O
cz
ek
iw
an
y
ro
zk
ła
d
no
rm
al
ny
W a r to ś c i o b s e r w o w a n e
Rozkład bimodalny z
dopasowaną krzywą normalną
Test t-studenta (test t)
- teoria
Obie próby powinny mieć rozkład normalny i być próbami losowymi o
równych wariancjach. W praktyce jednak okazało się, że test ten jest
stosunkowo odporny na odstępstwa od powyższych wymagań (oprócz
losowości próby)
Jeśli próby pochodzą z populacji odbiegających rozkładem od rozkładu
normalnego, to zaleca się stosować poziom istotności mniejszy niż
0,01
Jeśli wariancje obu prób nie są równe, to prawdopodobieństwo
popełnienia błędu I rodzaju ma tendencję wzrostową ale przy
większych próbach (n>100) i dla poziomu istotności 0,01 nie ma to
większego znaczenia pod warunkiem, że liczebności prób różnią się
najwyżej o 10%.
Jeżeli jednak większa wariancja dotyczy próby o mniejszej liczebności,
a mniejsza wariancja bardziej licznej próby - prawdopodobieństwo
popełnienia błędu I rodzaju wzrasta. W takiej sytuacji należy stosować
zamiast klasycznego testu t-Studenta jego odmianę dostosowaną do
prób o nierównych wariancjach (statystyka t’ zamiast t) lub
nieparametryczny test Manna-Whitneya
Odmiana testu t-studenta dla nierównych wariancji w obu próbach
(statystyka t') nazywany jest
testem
Cochrana-Coxa
lub
testem t z
oddzielną oceną wariancji
Liczebność prób nie powinna mniejsza niż 10. Przy tak małych
próbach sprawdzenie założeń testu jest problematyczne
Test t-studenta –
przykład 2
H
0
: Młode i dorosłe łęczaki nie różnią się istotnie średnią długością
skrzydła
Sprawdzanie założenia o zgodności rozkładów z rozkładem
normalnym
N
ad
=379
N
juv
=384
ad
=128,1 mm
juv
=128,7
mm
x
x
H
A
: Młode i dorosłe łęczaki różnią się istotnie średnią długością
skrzydła
Przykład 2 cd.
Sprawdzanie jednorodności wariancji (równości wariancji w obu
próbach)
s
ad
= 3,21
s
juv
= 3,18
s
2
ad
=10,30
s
2
juv
=10,11
test F
; F=1,02; p=0,866
test Levena
; F=0,03; p=0,871
Wybór
testu
•
Oba rozkłady tylko nieznacznie odbiegają od rozkładu normalnego
• Próby są bardzo liczne (n>100)
• Nie ma istotnej różnicy między wariancjami obu prób
test t-Studenta dla zmiennych niezależnych
test t-Studenta; t=2,20; p=0,028
Młode łęczaki mają istotnie dłuższe skrzydło niż ptaki dorosłe
Odrzucamy H
0
o równości obu średnich, przyjmujemy H
A
.
Przykład 2 cd.
116
120
124
128
132
136
[mm]
młode
dorosłe
Maks
Min
X ± SD
X
384
379
Test t-studenta –
przykład 3
H
0
: Średnia liczba jaj w gniazdach wróbla i mazurka nie różni się
istotnie
H
0
: Średnia liczba jaj w gniazdach wróbla i mazurka różni się
istotnie
N
wr
=68
N
maz
=83
wr
=4,8
maz
=4,2
s
2
=0,93 s
2
=0,54
x
x
test F
; F=1,71; p<0,03
Ocena zgodności rozkładów z rozkładem normalnym
test Shapiro-Wilka
; W=0,89; p<0,001
test Shapiro-Wilka
; W=0,79; p<0,001
3
4
5
6
0
1 0
2 0
3 0
4 0
5 0
6 0
2
[ N ]
7
Przykład 3 cd.
Wybór testu
•
Oba rozkłady nie różnią się bardzo od rozkładu normalnego
• Próby są liczne (n>30)
• Istotna różnica między wariancjami obu prób
test Cochrana-Coxa
test Cochrana-Coxa; t’=4,07; p=0,000083
Średnia liczba jaj w gniazdach
mazurka i wróbla różni się istotnie
H
0
odrzucamy
Na badanym terenie mazurki i
składały istotnie mniej jaj niż
wróble
Wróbel
Mazurek
3,0
4,0
5,0
6,0
7,0
[N]
Testuje hipotezę, że dwie próby pochodzą z populacji o takim samym
współczynniku zmienności
H
0
: V
1
=V
2
H
A
: V
1
V
2
Oblicza się statystykę Z wg wzoru
:
Wartości krytyczne Z można odczytać z ostatniej linijki tablicy
wartości krytycznych rozkładu t-Studenta
2
2
2
1
2
1
1
5
,
0
*
1
1
p
p
p
V
n
V
n
V
V
V
Z
1
1
*
1
*
1
2
1
2
2
1
1
n
n
V
n
V
n
V
p
Dane powinny pochodzić z populacji o rozkładzie normalnym
Przykład 4
Badano zmienność ciężaru mężczyzn i kobiet. Dysponowano próbami
o liczebnościach 10 i 11. Współczynniki zmienności wynosiły
odpowiednio:
V
1
=0,0739
V
2
= 0,0457
Vp
2
=0,00349
46415
,
1
00349
,
0
5
,
0
*
1
11
00349
,
0
1
10
00349
,
0
0457
,
0
0739
,
0
Z
1
11
1
10
0457
,
0
*
1
11
0739
,
0
*
1
10
p
V
Vp=0,00591
0,1
0,05
0,01
0,001
1
6,314
12,706
63,657 636,619
2
2,920
4,303
9,925
31,598
3
2,353
3,182
5,841
12,941
....
....
....
....
....
1,645
1,960
2,326
3,291
df
Poziom istotności dla testu dwustronnego
Nie ma podstaw do odrzucenia hipotezy zerowej o
braku różnic między dwoma współczynnikami
zmienności
Tablica z wartościami krytycznymi rozkładu t-Studenta
0
1,96
-1,96
X
1,46
Z=1,464
15
1,960
),
2
(
05
,
0
)
2
(
05
,
0
t
Z
Hutcheson (1970)
Statystyka t liczona jest wg wzoru:
Wariancję każdego z dwóch wskaźników oblicza się wg wzoru:
2
1
'
'
2
1
'
'
H
H
S
H
H
t
gdzie:
2
'
2
'
2
'
'
1
2
1
H
H
H
H
s
s
S
2
2
2
'
2
log
*
log
*
1
n
n
f
f
f
f
s
H
Liczba stopni swobody związana ze statystyką
t
:
Otrzymaną wartość testu porównuje się z wartościami
krytycznymi rozkładu t-Studenta.
2
2
'
2
1
2
'
2
2
'
2
'
2
2
1
2
1
n
s
n
s
s
s
df
H
H
H
H
Przykład 5
H0: Różnorodność gatunkowa drzew na dwóch
powierzchniach leśnych jest taka sama
H
A
: Różnorodność gatunkowa drzew na dwóch
powierzchniach leśnych nie jest taka sama
gatune
k
f
f*log
f
f*log
2
f
Dąb
46
76,5 127,2
Jarząb 35
54,0
83,4
Klon
5
3,5
2,4
Brzoz
a
2
0,6
0,2
Jesion
1
0
0
Powierzchnia I
n
1
= 89;
n*logn=173,5
fi*logfi = 134,6
fi*log
2
fi = 213,2
4367
,
0
89
6262
,
134
4957
,
173
'
1
H
gatun
ek
f f*log
f
f*log
2
f
Sosn
a
83 159,3 305,7
Dąb
12 13,0
14,0
Świe
rk
3
1,4
0,7
Jarzą
b
2
0,6
0,2
Jesio
n
2
0,6
0,2
Powierzchnia II
n
2
= 102;
n*logn=204,9
fi*logfi = 174,9
fi*log
2
fi = 320,7
2942
,
0
102
8691
,
174
8772
,
207
'
2
H
Powierzchnia I
n
1
= 89;
n*logn=173,5
fi*logfi = 134,6
fi*log
2
fi = 213,2
4367
,
0
'
1
H
Powierzchnia II
n
2
= 102;
n*logn=204,9
fi*logfi = 174,9
fi*log
2
fi = 320,7
2942
,
0
'
2
H
0,001213
log
*
log
*
2
2
2
'
2
1
n
n
f
f
f
f
s
H
0,002009
log
*
log
*
2
2
2
'
2
2
n
n
f
f
f
f
s
H
0,05676
2
'
2
'
2
'
'
1
2
1
H
H
H
H
s
s
S
2,51056
'
'
2
1
'
'
2
1
H
H
S
H
H
t
185
2
2
'
2
1
2
'
2
2
'
2
'
2
2
1
2
1
n
s
n
s
s
s
df
H
H
H
H
1,9725
185
)
2
(
05
,
0
t
Odrzucamy H
0
. Oba wskaźniki różnią się istotnie
Test mediany dla dwóch prób
porównuje mediany dwóch prób niezależnych
1. Połączyć obie próby
2. Wyznaczyć medianę
3. Policzyć ile pomiarów w każdej z prób leży powyżej, a
ile poniżej mediany obliczonej dla dwóch połączonych
prób (pomija się pomiary równe medianie)
4. Ułożyć czteropolową tabelę kontyngencji
5. Istotność różnic testujemy testem Chi-kwadrat lub
testem dokładnym Fishera
Test mediany jest testem stosunkowo słabym
(konserwatywnym) i stąd niezbyt często używanym.
Test serii Walda-Wolfowitza
Seria – ciągła sekwencja elementów jednej próby
ograniczona elementami drugiej próby lub końcem
(początkiem rozkładu):
AAAAA
BBBBBB
– 2 serie
AA
BB
AA
BB
– 4 serie
AAAAA
BBBB
AA
B
A
BBBBBBBBB
– 6 serii
AAAAAAAAAA
BBBBBBBBBBBBB
– układ nielosowy
A
B
A
B
A
B
A
B
A
B
A
B
A
B
A
B
A
B
A
– układ losowy
H
0
: Rozkład serii jest losowy (przypadkowy)
H
A
: Rozkład serii nie jest losowy
Test serii jest testem stosunkowo słabym
(konserwatywnym). Zamiast niego zaleca się stosowanie
testu Manna-Whitneya.
Przykład 6
Badano kolejność chwytania samców i samic bogatki w
pułapkę z przynętą. Należy sprawdzić czy kolejność ta jest
przypadkowa.
M M
F F
M M
F F F F
M M M
F F F F
M M
F F F
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
N
M
= 9
N
F
= 13
Liczba serii = 8
Z = -1,64598; p = 0,099778
Nie ma podstaw do odrzucenia hipotezy zerowej o
przypadkowej kolejności chwytania samców i samic
bogatek.
Gdy suma liczebności obu prób jest mniejsza od 20
stosuje się skorygowaną wartość Z (poprawka Siegla)
Test Manna-Whitneya (U-test)
• Nieparametryczny odpowiednik testu t-Studenta dla dwóch prób
niezależnych.
• Weryfikuje hipotezę, że obie próby pochodzą z tej samej populacji,
tzn. nie różnią się rozkładem badanej cechy.
• Należy go stosować w sytuacjach, gdy nie spełnione są warunki
dla testu t.
• Może być używany do prób o małych liczebnościach, gdy nie jest
możliwe oszacowanie zgodności rozkładu danej cechy z rozkładem
normalnym.
• Może być stosowany także do danych w skali porządkowej.
• Gdy liczebności obu prób są mniejsze od 20 obliczana jest statystyka
U
• Dla bardziej licznych prób stosuje się statystykę
z
• Gdy występują rangi wiązane konieczne jest obliczenie poprawki
Obliczenia w teście Manna-Whitneya są wykonywane w oparciu o rangi pomiarów, a nie
o ich wartości. W praktyce test ten weryfikuje hipotezę o równości median w dwóch
próbach.
Przykład 7
JEZIORO: A
0
5
10
15
20
25
N
90 100110120130140150160170180190 mm
JEZIORO: C
90100110120130140150160170180190mm
0
5
10
15
20
25
N
Porównanie długości liści pewnej rośliny wodnej z dwóch jezior
Rozkłady długości liści pewnej rośliny wodnej w jeziorze A i C
N=101
N=50
Przykład 7 cd.
Wyniki testu Manna-Whitneya
Rozkłady długość liści u danego gatunku rośliny w obu jeziorach
różnią się istotnie (test Manna-Whitneya; z = 4,41; p<0,001)
Min-Maks.
25%-75%
Mediana
J EZIORO
80
100
120
140
160
180
200
A
C
101
50
[mm]
Liście w jeziorze C są
przeciętnie dłuższe niż w
jeziorze A
•Średnia ranga dla jeziora A
(6560,5/101)=
65,0
•Średnia ranga dla jeziora C
(4915,5/50)=
98,3
Przykład 8 – test Manna-Whitneya
Porównanie długości skrzydła dorosłych i młodych biegusów
zmiennych
Dorosłe (mm): 110, 111, 112, 112, 114, 114, 114, 115, 117;
N=9
Młode (mm): 113, 114, 114, 116, 116, 116, 117, 117, 119; 121
N=10
x
=113,2 mm
x
=116,3 mm
Ptaki dorosłe mają istotnie krótsze skrzydło niż ptaki młode (test Manna-
Whitneya; U=16; p=0,02)
Wariancje w obu próbach nie różnią się istotnie (test F; F=1,23; p=0,78)
Uzyskane rozkłady mają podobne kształt (K-S test; d=0,59; p>0,05)
Test Kołmogorowa-Smirnowa (K-S test)
• Weryfikuje hipotezę, że obie próby pochodzą z populacji o
takim samym rozkładzie.
• W odróżnieniu od testu t-Studenta dla prób niezależnych
lub testu Manna-Whitneya, które dotyczą odpowiednio
różnic między średnimi lub rangami dwóch prób, test ten
jest również wrażliwy na różnice ogólnych kształtów
rozkładów w dwóch próbach (tj. różnice w dyspersji,
skośności, smukłości).
• Można stosować go do danych w skali interwałowej,
ilorazowej i porządkowej.
Test Kołmogorowa-Smirnowa występuje w dwóch odmianach:
• dla zmiennych ciągłych
• dla zmiennych skategoryzowanych
Przykład 9
1 2 3 4 5
0
10
20
30
40
50
+
1 2 3 4 5
+
N
0
10
20
30
40
50
N
Porównywano stopień pokrycia pewnej rośliny w dwóch siedliskach leśnych
Frekwencja stopni pokrycia badanego gatunku rośliny w dwóch
typach siedliskowych lasu (A i B)
A
B
N=60
N=60
Me
Me
Test Manna-Whitneya nie wykazał różnic między tymi siedliskami (z=-0,09, p=0,93)
Test K-S – przygotowanie danych do analizy za pomocą programów
komputerowych
1. Zamiana stopni pokrycia (+, 1, 2, 3, 4, 5) na kolejne wartości (1, 2, 3, 4, 5, 6)
2. Stworzenie bazy danych ze zmienną kodującą określająca typ lasu:
Typ
lasu
Stopie
ń
pokryc
ia
A
1
A
1
A
1
A
1
A
1
A
2
A
2
B
1
B
1
Wyniki testu Kołmogorowa-Smirnowa
d=0,317; p<0,005
Rozkład frekwencji pokrycia badanego gatunku rośliny w obu
siedliskach leśnych różni się istotnie (test K-S; d=0,317; p<0,005)
Wartość d otrzymuje się poprzez:
1.zamianę obu rozkładów na rozkłady
skumulowane,
2.podzielenie każdej wartości rozkładu
skumulowanego przez liczebność danej próby
3.odjęcie od siebie wartości obu tak
otrzymanych rozkładów skumulowanych,
4.statystyka
d
to największa bezwzględna
wartość z tak obliczonych różnic.
Test t-Studenta dla dwóch prób zależnych
Wymaga spełnienia następujących warunków:
1. Każdy pomiar (obserwacja) z pierwszego zbioru danych może być
powiązany z jednym i tylko jednym pomiarem z drugiego zbioru
danych
2. Rozkład różnic między powiązanymi obserwacjami jest zbliżony
do rozkładu normalnego
Przykład
10
Porównano liczbę nasion u pewnej rośliny u osobników rosnących
parami w doniczkach. Jeden z osobników był dodatkowo oświetlany
światłem sztucznym
H
0
: Liczba nasion u roślin doświetlanych światłem
sztucznym jest taka sama jak u roślin
niedoświetlanych
H
A
: Liczba nasion u roślin doświetlanych światłem
sztucznym
nie
jest taka sama jak u roślin
niedoświetlanych
bez św. 12 15 12 14 15 18 15 12 14 15 14 12 14 13 16 13 12 16
ze św. 14 17 12 16 16 19 17 14 15 17 18 15 17 15 18 13 16 16
różnica 2 2 0 2 1 1 2 2 1 2 4 3 3 2 2 0 4 0
Przykład 10 cd.
B e z ś w .
Z e ś w .
1 0
2 0
1 2
1 4
1 6
1 8
N
Różn.
N
t
p
Bez
św.
14,
0
Ze św.
15,
8
-1,8
18 -6,48 <0,0
01
x
Rozkład
różnic
Wyniki testu Shapiro-Wilka
W=0,903; p=0,07
Rośliny doświetlane produkują istotnie więcej nasion (test t-Studenta
dla par zależnych; t=-6,48; p<0,001)
0
1
2
3
4
0
1
2
3
4
5
6
7
8
9
[N ]
Test Wilcoxona
Nieparametryczny odpowiednik testu t-Studenta dla dwóch
prób zależnych
Analizowane zmienne muszą być zmierzone co najmniej w skali porządkowej
(Test kolejności par Wilcoxona)
Przykład
11
U pewnego gatunku ptaka porównywano termin przylotu samca i
samicy na lęgowisko. Notowano datę pierwszego stwierdzenia samca
i samicy w terytorium lęgowym. Należy sprawdzić czy w obrębie pary
lęgowej samce i samice przylatują w takim samym terminie.
H
0
: Termin przylotu samca i samicy tworzących parę
lęgową jest taki sam.
H
A
: Termin przylotu samca i samicy tworzących parę
lęgową
nie
jest taki sam.
Gdy liczba par jest większa niż 25 oblicza się statystykę Z,
natomiast dla mniejszej liczby par statystykę T
Rozkład różnic między pomiarami musi być symetryczny względem mediany
Przykład 11 cd.
Test Shapiro-Wilka; W=0,87; p<0,001
Rozkład różnic
Rozkład normalności
Rozkład różnic odbiega od rozkładu normalnego
r ó ż n ic a
M e = 1
W a r to ś c i o b s e r w o w a n e
O
cz
ek
iw
an
y
ro
zk
ła
d
no
rm
al
ny
Skośność=0,37
Kurtoza=2,58
Przykład 11 cd.
Wyniki testu Wilcoxona
N=40
T=39,0
Z=4,71
p<0,001
Samce badanego gatunku ptaka istotnie wcześniej
przylatują na legowiska niż samice (test Wilcoxona;
Z=4,71; p<0,001)
Test znaków
Stosowany jest zamiast testu Wilcoxona gdy nie jest spełnione
założenie o symetrycznym rozkładzie różnic wokół mediany
Przykład
12
U pliszki żółtej zmierzono długość skrzydła samcom i samicom z 36
par lęgowych. Należy sprawdzić która z płci w obrębie pary lęgowej
ma dłuższe skrzydło.
H
0
: Długość skrzydła samca i samicy pliszki żółtej
tworzących parę lęgową jest taka sama.
H
A
: Długość skrzydła samca i samicy pliszki żółtej
tworzących parę lęgową
nie
jest taka sama.
Test ten bierze pod uwagę jedynie znak różnicy w obrębie pary
wyników, a nie wielkość tej różnicy
Przykład 12 c.d.
2
3
4
5
6
7
8
0
2
4
6
8
1 0
1 2
1 4
1 6
1 8
2 0
1
[N ]
Rozkład
różnic
Me=3
Rozkład różnic odbiega od rozkładu normalnego –
nie można
stosować testu t-Studenta dla par zależnych
Rozkład różnic odbiega nie jest symetryczny względem mediany –
nie
można stosować testu Wicoxona
Przykład 12 c.d.
Wyniki testu znaków:
Z=5,83; p<0,001
S a m c e
S a m ic e
7 9
8 0
8 1
8 2
8 3
8 4
8 5
8 6
8 7
8 8
8 9
[m m ]
U pliszki żółtej samce mają istotnie dłuższe skrzydło niż będące z nimi
w parze samice