WYKLAD 2001 4 ppt

background image

background image

PARAMETRYCZNE

• dotyczą parametrów populacji (np. średniej, wariancji)

• rozkład badanej cechy w populacji musi mieć rozkład
normalny

przy małych próbach określenie normalności rozkładu
jest problematyczne

• są silniejsze od testów nieparametrycznych

• stosuje się je do danych w skali ilorazowej i
interwałowej

NIEPARAMETRYCZNE

• dotyczą rozkładu cech w populacji (nie parametrów populacji)

• można ich używać do danych w skali nominalnej i porządkowej

• stosujemy je gdy:

• chcemy porównać rozkłady cech, a nie parametry rozkładów

rozkład badanej cechy wyraźnie odbiega od rozkładu normalnego

• liczebność próby jest mała

Próby muszą być losowe i niezależne -

każdy element

populacji musi mieć taka samą szansę znalezienia się w próbie i
wybór jednego elementu nie zmienia szansy wylosowania innego
elementu

background image

TESTY

PARAMERTYCZNE

skala interwałowa,

ilorazowa,

TESTY

NIEPARAMERTYCZNE

skala interwałowa,

ilorazowa, porządkowa

TESTY DLA
DWÓCH
PRÓB

TESTY DLA
WIĘCEJ NIŻ
DWÓCH
PRÓB

t-Studenta dla par niezależnych
t-Studenta dla par zależnych
Cochrana-Coxa
test dla 2 wsp. zmienności
test dla 2 wsk. różnorodności
test dla 2 wsp. korelacji
test F (Fishera), Levena
Lilleforsa, Shapiro-Wilka

U Manna-Whitneya
Wilcoxona,
test znaków,
Walda-Wolfowitza (test serii)
Kołgomorowa-Smirnowa
test mediany dla dwóch prób

ANOVA i testy post hoc:

• Tukeya (Spjotvolla i Stolinea)

• Newman-Keulsa

• Duncana

• Scheffego

• Dunetta

Kruskala-Wallisa i testy post hoc:

• Duna
test mediany dla wielu prób
test Friedmana

TESTY DLA
SKALI
NOMINALNEJ

test

2,

test

2

z poprawka Yatesa

dokładny Fishera
Mc Nemara

background image

TESTY DLA PRÓB ZALEŻNYCH

dotyczą sytuacji, gdy porównuje się dwa pomiary
wykonane na tym samym elemencie próby, np. przed i
po eksperymencie lub szuka się różnic miedzy
elementami sparowanymi w określony sposób.

TESTY DLA PRÓB NIEZALEŻNYCH

dotyczą sytuacji, gdy porównuje się dwie grupy pomiarów
wykonanych niezależnie od siebie.

Przykład:

•Porównanie ciśnienia krwi przed i po podaniu lekarstwa

•Porównanie siły lewej i prawej ręki

(para pomiarów u tej samej osoby)

Przykład:

•Porównanie wielkości zniesienia u wróbla i sikory

•Porównanie ilości dni z opadami w dwóch sezonach badawczych

background image

TESTY DLA PRÓB ZALEŻNYCH I NIEZALEŻNYCH

Przykład: pomiar siły lewej i prawej ręki u kobiet w 20 roku życia

Zmierzono dynamometrem
siłę lewej i prawej ręki u
100 losowo wybranych
kobiet w wieku 20 lat. Dla
każdej osoby obliczono
różnicę w sile lewej i prawej
ręki. W przypadku
silniejszej lewej ręki różnicy
przypisywano znak ujemny.
Otrzymane w ten sposób
wyniki przeanalizowano
odpowiednim testem
statystycznym.

Losowo wybrano 200
kobiet w wieku 20 lat. U
pierwszych 100 zmierzono
siłę lewej, a u następnych
100 prawej ręki. Obliczono
średnią siłę lewej i prawej
ręki w badanych próbach.
Różnicę miedzy średnimi
wartościami
przeanalizowano
odpowiednim testem
statystycznym.

Badamy którą rękę mają
silniejszą 20 letnie kobiety,
prawą czy lewą.

Badamy która ręka, prawa
czy lewa, jest silniejsza u 20
letnich kobiet.

background image

TESTY DLA PRÓB ZALEŻNYCH I NIEZALEŻNYCH

Przykład: określenie wpływu stosowania środków owadobójczych na
biomasę części nadziemnych roślin łąkowych

Na łące wylosowano 30 par
przylegających do siebie
poletek o powierzchni 2 m

2

każde. Na jednym z nich
stosowano środek owadobójczy,
na drugim nie. Po określonym
czasie zebrano wszystkie części
nadziemne roślin, wysuszono je
i zważono. Obliczono różnice w
obrębie każdej z par poletek.
Otrzymane w ten sposób wyniki
przeanalizowano odpowiednim
testem statystycznym.

Na łące wylosowano 60 poletek o
powierzchni 2 m

2

każde. Losowo

wyznaczono 30, na których
stosowano środek owadobójczy.
Po określonym czasie zebrano
wszystkie części nadziemne
roślin, wysuszono je i zważono.
Obliczono średni plon na
poletkach eksperymentalnych i
kontrolnych. Różnicę miedzy
średnimi wartościami
przeanalizowano odpowiednim
testem statystycznym.

Jeśli łąka wydaje się nam bardzo zróżnicowana pod względem
warunków siedliskowych, to stosujemy test dla par wiązanych. Wtedy
zmienność warunków siedliskowych w obrębie pary sąsiadujących
poletek będzie mniejsza niż pomiędzy losowo wybranymi poletkami
znajdującymi się w różnych częściach łąki.

background image

TESTY NIEPARAMETRYCZNE czyli NIEZALEŻNE OD ROZKŁADU

TESTY PARAMETRYCZNE

Ich stosowanie wymaga by spełnione były założenia dotyczące
rozkładów zmiennych w badanych populacjach, np. zgodności
rozkładu z rozkładem normalnym (tzw. normalność rozkładu) lub
równości wariancji w testowanych próbach.

Na podstawie testów parametrycznych wnioskujemy o parametrach
populacji, np. o średniej arytmetycznej lub o wariancji.

•Ich stosowanie nie wymaga spełnienia założeń koniecznych przy

stosowaniu testów parametrycznych.

•Warunki do ich stosowania są łatwiejsze do spełnienia niż w

przypadku testów parametrycznych.

•Jeśli są spełnione wymagania dotyczące stosowania testów

parametrycznych, to test nieparametryczny będzie zawsze testem
słabszym niż jego parametryczny odpowiednik.

Na podstawie testów nieparametrycznych wnioskujemy najczęściej o
postaci rozkładu, a nie o jego parametrach.

W praktyce stosujemy je gdy nie są spełnione założenia wymagane
przez testy parametryczne, lub gdy z powodu małej liczebności
próby nie można tych założeń sprawdzić.

background image

FORMUŁOWANIE HIPOTEZY ZEROWEJ

Hipoteza zerowa zawsze zakłada brak

istotnych różnic między badanymi próbami

H

0

: średni ciężar zięb i wróbli nie różni się istotnie

H

A

: średni ciężar zięb i wróbli różni się istotnie

Test dwukierunkowy (dwustronny)

H

A

: średni ciężar zięb jest większy niż średni ciężar wróbli

H

0

: średni ciężar zięb nie jest większy niż ciężar wróbli

Test jednokierunkowy (jednostronny)

background image

PODAWANIE WYNIKÓW TESTU

• nazwa stosowanego testu,

• wartość testu,

• prawdopodobieństwo popełnienia błędu I rodzaju

test t-Studenta; t=1,01; p=0,12

ANOVA; F

2,48

=4,40;

p=0,02

Podawanie dokładnego prawdopodobieństwa

test Wilcoxona; T=12,15; p<0,001

test 2,

; 2

=2,90; p>0,05

ANOVA; F

2,48

=4,40;

p<0,05

Podawanie przybliżonego prawdopodobieństwa

background image

Ocena zgodności rozkładu z rozkładem normalnym

Test Lillieforsa

Test Shapiro-Wilka

Najbardziej polecany test do oceny normalności rozkładu. Może on
jednak dawać błędne wyniki przy liczebności próby większej niż 2
tysiące

Odmiana testu Kołmogorowa-Smirnowa. Można go stosować do prób
przekraczających 2 tysiące elementów

Procedury statystyczne są odporne na nieznaczne

odstępstwa analizowanych zmiennych od rozkładu

normalnego.

W praktyce najczęściej wystarcza ocena oparta na tzw.

wykresie normalności.

background image

Ocena zgodności rozkładu z rozkładem normalnym

Przykład 1

Test Shapiro-Wilka

W=0,89; p<0,0001

Skośność=0,40
Kurtoza=-0,04

Histogram z

dopasowanym rozkładem

normalnym

Rozkład normalności

W a r to ś c i o b s e r w o w a n e

O

cz

ek

iw

an

y

ro

zk

ła

d

no

rm

al

ny

background image

p r _ s k o s : S W - W = 0 , 7 7 7 7 0 2 1 6 1 , p = 0 , 0 0 0 0 0 0 3

O

cz

ek

iw

an

y

ro

zk

ła

d

no

rm

al

ny

W a r to ś c i o b s e r w o w a n e

Rozkład prawoskośny z
dopasowaną krzywą normalną

O

cz

ek

iw

an

y

ro

zk

ła

d

no

rm

al

ny

W a r to ś c i o b s e r w o w a n e

Rozkład bimodalny z
dopasowaną krzywą normalną

background image

background image

Test t-studenta (test t)

- teoria

Obie próby powinny mieć rozkład normalny i być próbami losowymi o
równych wariancjach. W praktyce jednak okazało się, że test ten jest
stosunkowo odporny na odstępstwa od powyższych wymagań (oprócz
losowości próby)

Jeśli próby pochodzą z populacji odbiegających rozkładem od rozkładu
normalnego, to zaleca się stosować poziom istotności mniejszy niż
0,01

Jeśli wariancje obu prób nie są równe, to prawdopodobieństwo
popełnienia błędu I rodzaju ma tendencję wzrostową ale przy
większych próbach (n>100) i dla poziomu istotności 0,01 nie ma to
większego znaczenia pod warunkiem, że liczebności prób różnią się
najwyżej o 10%.

Jeżeli jednak większa wariancja dotyczy próby o mniejszej liczebności,
a mniejsza wariancja bardziej licznej próby - prawdopodobieństwo
popełnienia błędu I rodzaju wzrasta. W takiej sytuacji należy stosować
zamiast klasycznego testu t-Studenta jego odmianę dostosowaną do
prób o nierównych wariancjach (statystyka t’ zamiast t) lub
nieparametryczny test Manna-Whitneya

Odmiana testu t-studenta dla nierównych wariancji w obu próbach
(statystyka t') nazywany jest

testem

Cochrana-Coxa

lub

testem t z

oddzielną oceną wariancji

Liczebność prób nie powinna mniejsza niż 10. Przy tak małych
próbach sprawdzenie założeń testu jest problematyczne

background image

Test t-studenta –

przykład 2

H

0

: Młode i dorosłe łęczaki nie różnią się istotnie średnią długością

skrzydła

Sprawdzanie założenia o zgodności rozkładów z rozkładem

normalnym

N

ad

=379

N

juv

=384

ad

=128,1 mm

juv

=128,7

mm

x

x

H

A

: Młode i dorosłe łęczaki różnią się istotnie średnią długością

skrzydła

background image

Przykład 2 cd.

Sprawdzanie jednorodności wariancji (równości wariancji w obu

próbach)

s

ad

= 3,21

s

juv

= 3,18

s

2

ad

=10,30

s

2

juv

=10,11

test F

; F=1,02; p=0,866

test Levena

; F=0,03; p=0,871

Wybór
testu

Oba rozkłady tylko nieznacznie odbiegają od rozkładu normalnego

• Próby są bardzo liczne (n>100)

• Nie ma istotnej różnicy między wariancjami obu prób

test t-Studenta dla zmiennych niezależnych

test t-Studenta; t=2,20; p=0,028

Młode łęczaki mają istotnie dłuższe skrzydło niż ptaki dorosłe

Odrzucamy H

0

o równości obu średnich, przyjmujemy H

A

.

background image

Przykład 2 cd.

116

120

124

128

132

136

[mm]

młode

dorosłe

Maks

Min

X ± SD

X

384

379

background image

Test t-studenta –

przykład 3

H

0

: Średnia liczba jaj w gniazdach wróbla i mazurka nie różni się

istotnie

H

0

: Średnia liczba jaj w gniazdach wróbla i mazurka różni się

istotnie

N

wr

=68

N

maz

=83

wr

=4,8

maz

=4,2

s

2

=0,93 s

2

=0,54

x

x

test F

; F=1,71; p<0,03

Ocena zgodności rozkładów z rozkładem normalnym

test Shapiro-Wilka

; W=0,89; p<0,001

test Shapiro-Wilka

; W=0,79; p<0,001

3

4

5

6

0

1 0

2 0

3 0

4 0

5 0

6 0

2

[ N ]

7

background image

Przykład 3 cd.

Wybór testu

Oba rozkłady nie różnią się bardzo od rozkładu normalnego

• Próby są liczne (n>30)

• Istotna różnica między wariancjami obu prób

test Cochrana-Coxa

test Cochrana-Coxa; t’=4,07; p=0,000083

Średnia liczba jaj w gniazdach

mazurka i wróbla różni się istotnie

H

0

odrzucamy

Na badanym terenie mazurki i

składały istotnie mniej jaj niż

wróble

Wróbel

Mazurek

3,0

4,0

5,0

6,0

7,0

[N]

background image

background image

Testuje hipotezę, że dwie próby pochodzą z populacji o takim samym
współczynniku zmienności

H

0

: V

1

=V

2

H

A

: V

1

V

2

Oblicza się statystykę Z wg wzoru

:

Wartości krytyczne Z można odczytać z ostatniej linijki tablicy
wartości krytycznych rozkładu t-Studenta

2

2

2

1

2

1

1

5

,

0

*

1

1

p

p

p

V

n

V

n

V

V

V

Z



 

1

1

*

1

*

1

2

1

2

2

1

1

n

n

V

n

V

n

V

p

Dane powinny pochodzić z populacji o rozkładzie normalnym

background image

Przykład 4

Badano zmienność ciężaru mężczyzn i kobiet. Dysponowano próbami
o liczebnościach 10 i 11. Współczynniki zmienności wynosiły
odpowiednio:

V

1

=0,0739

V

2

= 0,0457

Vp

2

=0,00349

46415

,

1

00349

,

0

5

,

0

*

1

11

00349

,

0

1

10

00349

,

0

0457

,

0

0739

,

0

Z

 

1

11

1

10

0457

,

0

*

1

11

0739

,

0

*

1

10

p

V

Vp=0,00591

background image

0,1

0,05

0,01

0,001

1

6,314

12,706

63,657 636,619

2

2,920

4,303

9,925

31,598

3

2,353

3,182

5,841

12,941

....

....

....

....

....

1,645

1,960

2,326

3,291

df

Poziom istotności dla testu dwustronnego

Nie ma podstaw do odrzucenia hipotezy zerowej o

braku różnic między dwoma współczynnikami

zmienności

Tablica z wartościami krytycznymi rozkładu t-Studenta

0

1,96

-1,96

X

1,46

Z=1,464
15

1,960

),

2

(

05

,

0

)

2

(

05

,

0

t

Z

background image

Hutcheson (1970)

background image

Statystyka t liczona jest wg wzoru:

Wariancję każdego z dwóch wskaźników oblicza się wg wzoru:

2

1

'

'

2

1

'

'

H

H

S

H

H

t

gdzie:

2

'

2

'

2

'

'

1

2

1

H

H

H

H

s

s

S

2

2

2

'

2

log

*

log

*

1

n

n

f

f

f

f

s

H

background image

Liczba stopni swobody związana ze statystyką

t

:

Otrzymaną wartość testu porównuje się z wartościami
krytycznymi rozkładu t-Studenta.

2

2

'

2

1

2

'

2

2

'

2

'

2

2

1

2

1

n

s

n

s

s

s

df

H

H

H

H

background image

Przykład 5

H0: Różnorodność gatunkowa drzew na dwóch
powierzchniach leśnych jest taka sama

H

A

: Różnorodność gatunkowa drzew na dwóch

powierzchniach leśnych nie jest taka sama

gatune
k

f

f*log

f

f*log

2

f

Dąb

46

76,5 127,2

Jarząb 35

54,0

83,4

Klon

5

3,5

2,4

Brzoz

a

2

0,6

0,2

Jesion

1

0

0

Powierzchnia I

n

1

= 89;

n*logn=173,5

fi*logfi = 134,6
fi*log

2

fi = 213,2

4367

,

0

89

6262

,

134

4957

,

173

'

1

H

background image

gatun
ek

f f*log

f

f*log

2

f

Sosn

a

83 159,3 305,7

Dąb

12 13,0

14,0

Świe

rk

3

1,4

0,7

Jarzą

b

2

0,6

0,2

Jesio

n

2

0,6

0,2

Powierzchnia II

n

2

= 102;

n*logn=204,9

fi*logfi = 174,9
fi*log

2

fi = 320,7

2942

,

0

102

8691

,

174

8772

,

207

'

2

H

background image

Powierzchnia I

n

1

= 89;

n*logn=173,5
fi*logfi = 134,6
fi*log

2

fi = 213,2

4367

,

0

'

1

H

Powierzchnia II

n

2

= 102;

n*logn=204,9
fi*logfi = 174,9
fi*log

2

fi = 320,7

2942

,

0

'

2

H

0,001213

log

*

log

*

2

2

2

'

2

1

n

n

f

f

f

f

s

H

0,002009

log

*

log

*

2

2

2

'

2

2

n

n

f

f

f

f

s

H

0,05676

2

'

2

'

2

'

'

1

2

1

H

H

H

H

s

s

S

2,51056

'

'

2

1

'

'

2

1

H

H

S

H

H

t

185

2

2

'

2

1

2

'

2

2

'

2

'

2

2

1

2

1

n

s

n

s

s

s

df

H

H

H

H

1,9725

185

)

2

(

05

,

0

t

Odrzucamy H

0

. Oba wskaźniki różnią się istotnie

background image

background image

Test mediany dla dwóch prób

porównuje mediany dwóch prób niezależnych

1. Połączyć obie próby
2. Wyznaczyć medianę
3. Policzyć ile pomiarów w każdej z prób leży powyżej, a

ile poniżej mediany obliczonej dla dwóch połączonych
prób (pomija się pomiary równe medianie)

4. Ułożyć czteropolową tabelę kontyngencji
5. Istotność różnic testujemy testem Chi-kwadrat lub

testem dokładnym Fishera

Test mediany jest testem stosunkowo słabym

(konserwatywnym) i stąd niezbyt często używanym.

background image

Test serii Walda-Wolfowitza

Seria – ciągła sekwencja elementów jednej próby
ograniczona elementami drugiej próby lub końcem
(początkiem rozkładu):

AAAAA

BBBBBB

– 2 serie

AA

BB

AA

BB

– 4 serie

AAAAA

BBBB

AA

B

A

BBBBBBBBB

– 6 serii

AAAAAAAAAA

BBBBBBBBBBBBB

– układ nielosowy

A

B

A

B

A

B

A

B

A

B

A

B

A

B

A

B

A

B

A

– układ losowy

H

0

: Rozkład serii jest losowy (przypadkowy)

H

A

: Rozkład serii nie jest losowy

Test serii jest testem stosunkowo słabym

(konserwatywnym). Zamiast niego zaleca się stosowanie

testu Manna-Whitneya.

background image

Przykład 6

Badano kolejność chwytania samców i samic bogatki w
pułapkę z przynętą. Należy sprawdzić czy kolejność ta jest
przypadkowa.

M M

F F

M M

F F F F

M M M

F F F F

M M

F F F

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

N

M

= 9

N

F

= 13

Liczba serii = 8

Z = -1,64598; p = 0,099778

Nie ma podstaw do odrzucenia hipotezy zerowej o
przypadkowej kolejności chwytania samców i samic
bogatek.

Gdy suma liczebności obu prób jest mniejsza od 20
stosuje się skorygowaną wartość Z (poprawka Siegla)

background image

Test Manna-Whitneya (U-test)

Nieparametryczny odpowiednik testu t-Studenta dla dwóch prób

niezależnych.

Weryfikuje hipotezę, że obie próby pochodzą z tej samej populacji,

tzn. nie różnią się rozkładem badanej cechy.

Należy go stosować w sytuacjach, gdy nie spełnione są warunki

dla testu t.

Może być używany do prób o małych liczebnościach, gdy nie jest

możliwe oszacowanie zgodności rozkładu danej cechy z rozkładem

normalnym.

Może być stosowany także do danych w skali porządkowej.

• Gdy liczebności obu prób są mniejsze od 20 obliczana jest statystyka

U

• Dla bardziej licznych prób stosuje się statystykę

z

• Gdy występują rangi wiązane konieczne jest obliczenie poprawki

Obliczenia w teście Manna-Whitneya są wykonywane w oparciu o rangi pomiarów, a nie

o ich wartości. W praktyce test ten weryfikuje hipotezę o równości median w dwóch

próbach.

background image

Przykład 7

JEZIORO: A

0

5

10

15

20

25

N

90 100110120130140150160170180190 mm

JEZIORO: C

90100110120130140150160170180190mm

0

5

10

15

20

25

N

Porównanie długości liści pewnej rośliny wodnej z dwóch jezior

Rozkłady długości liści pewnej rośliny wodnej w jeziorze A i C

N=101

N=50

background image

Przykład 7 cd.

Wyniki testu Manna-Whitneya

Rozkłady długość liści u danego gatunku rośliny w obu jeziorach
różnią się istotnie (test Manna-Whitneya; z = 4,41; p<0,001)

Min-Maks.
25%-75%
Mediana

J EZIORO

80

100

120

140

160

180

200

A

C

101

50

[mm]

Liście w jeziorze C są
przeciętnie dłuższe niż w
jeziorze A
•Średnia ranga dla jeziora A

(6560,5/101)=

65,0

•Średnia ranga dla jeziora C

(4915,5/50)=

98,3

background image

Przykład 8 – test Manna-Whitneya

Porównanie długości skrzydła dorosłych i młodych biegusów

zmiennych

Dorosłe (mm): 110, 111, 112, 112, 114, 114, 114, 115, 117;

N=9

Młode (mm): 113, 114, 114, 116, 116, 116, 117, 117, 119; 121

N=10

x

=113,2 mm

x

=116,3 mm

Ptaki dorosłe mają istotnie krótsze skrzydło niż ptaki młode (test Manna-
Whitneya; U=16; p=0,02)

Wariancje w obu próbach nie różnią się istotnie (test F; F=1,23; p=0,78)

Uzyskane rozkłady mają podobne kształt (K-S test; d=0,59; p>0,05)

background image

Test Kołmogorowa-Smirnowa (K-S test)

Weryfikuje hipotezę, że obie próby pochodzą z populacji o

takim samym rozkładzie.

W odróżnieniu od testu t-Studenta dla prób niezależnych

lub testu Manna-Whitneya, które dotyczą odpowiednio

różnic między średnimi lub rangami dwóch prób, test ten

jest również wrażliwy na różnice ogólnych kształtów

rozkładów w dwóch próbach (tj. różnice w dyspersji,

skośności, smukłości).

Można stosować go do danych w skali interwałowej,

ilorazowej i porządkowej.

Test Kołmogorowa-Smirnowa występuje w dwóch odmianach:

dla zmiennych ciągłych

dla zmiennych skategoryzowanych

background image

Przykład 9

1 2 3 4 5

0

10

20

30

40

50

+

1 2 3 4 5

+

N

0

10

20

30

40

50

N

Porównywano stopień pokrycia pewnej rośliny w dwóch siedliskach leśnych

Frekwencja stopni pokrycia badanego gatunku rośliny w dwóch

typach siedliskowych lasu (A i B)

A

B

N=60

N=60

Me

Me

Test Manna-Whitneya nie wykazał różnic między tymi siedliskami (z=-0,09, p=0,93)

background image

Test K-S – przygotowanie danych do analizy za pomocą programów

komputerowych

1. Zamiana stopni pokrycia (+, 1, 2, 3, 4, 5) na kolejne wartości (1, 2, 3, 4, 5, 6)
2. Stworzenie bazy danych ze zmienną kodującą określająca typ lasu:

Typ
lasu

Stopie
ń

pokryc

ia

A

1

A

1

A

1

A

1

A

1

A

2

A

2

B

1

B

1

Wyniki testu Kołmogorowa-Smirnowa

d=0,317; p<0,005

Rozkład frekwencji pokrycia badanego gatunku rośliny w obu
siedliskach leśnych różni się istotnie (test K-S; d=0,317; p<0,005)

Wartość d otrzymuje się poprzez:
1.zamianę obu rozkładów na rozkłady

skumulowane,

2.podzielenie każdej wartości rozkładu

skumulowanego przez liczebność danej próby

3.odjęcie od siebie wartości obu tak

otrzymanych rozkładów skumulowanych,

4.statystyka

d

to największa bezwzględna

wartość z tak obliczonych różnic.

background image

background image

Test t-Studenta dla dwóch prób zależnych

Wymaga spełnienia następujących warunków:

1. Każdy pomiar (obserwacja) z pierwszego zbioru danych może być

powiązany z jednym i tylko jednym pomiarem z drugiego zbioru
danych

2. Rozkład różnic między powiązanymi obserwacjami jest zbliżony

do rozkładu normalnego

Przykład
10

Porównano liczbę nasion u pewnej rośliny u osobników rosnących
parami w doniczkach. Jeden z osobników był dodatkowo oświetlany
światłem sztucznym

H

0

: Liczba nasion u roślin doświetlanych światłem

sztucznym jest taka sama jak u roślin
niedoświetlanych

H

A

: Liczba nasion u roślin doświetlanych światłem

sztucznym

nie

jest taka sama jak u roślin

niedoświetlanych

bez św. 12 15 12 14 15 18 15 12 14 15 14 12 14 13 16 13 12 16

ze św. 14 17 12 16 16 19 17 14 15 17 18 15 17 15 18 13 16 16

różnica 2 2 0 2 1 1 2 2 1 2 4 3 3 2 2 0 4 0

background image

Przykład 10 cd.

B e z ś w .

Z e ś w .

1 0

2 0

1 2

1 4

1 6

1 8

N

Różn.

N

t

p

Bez

św.

14,

0

Ze św.

15,

8

-1,8

18 -6,48 <0,0

01

x

Rozkład
różnic

Wyniki testu Shapiro-Wilka

W=0,903; p=0,07

Rośliny doświetlane produkują istotnie więcej nasion (test t-Studenta
dla par zależnych; t=-6,48; p<0,001)

0

1

2

3

4

0

1

2

3

4

5

6

7

8

9

[N ]

background image

background image

Test Wilcoxona

Nieparametryczny odpowiednik testu t-Studenta dla dwóch
prób zależnych

Analizowane zmienne muszą być zmierzone co najmniej w skali porządkowej

(Test kolejności par Wilcoxona)

Przykład
11

U pewnego gatunku ptaka porównywano termin przylotu samca i
samicy na lęgowisko. Notowano datę pierwszego stwierdzenia samca
i samicy w terytorium lęgowym. Należy sprawdzić czy w obrębie pary
lęgowej samce i samice przylatują w takim samym terminie.

H

0

: Termin przylotu samca i samicy tworzących parę

lęgową jest taki sam.

H

A

: Termin przylotu samca i samicy tworzących parę

lęgową

nie

jest taki sam.

Gdy liczba par jest większa niż 25 oblicza się statystykę Z,
natomiast dla mniejszej liczby par statystykę T

Rozkład różnic między pomiarami musi być symetryczny względem mediany

background image

Przykład 11 cd.

Test Shapiro-Wilka; W=0,87; p<0,001

Rozkład różnic

Rozkład normalności

Rozkład różnic odbiega od rozkładu normalnego

r ó ż n ic a

M e = 1

W a r to ś c i o b s e r w o w a n e

O

cz

ek

iw

an

y

ro

zk

ła

d

no

rm

al

ny

Skośność=0,37

Kurtoza=2,58

background image

Przykład 11 cd.

Wyniki testu Wilcoxona

N=40
T=39,0
Z=4,71
p<0,001

Samce badanego gatunku ptaka istotnie wcześniej

przylatują na legowiska niż samice (test Wilcoxona;

Z=4,71; p<0,001)

background image

Test znaków

Stosowany jest zamiast testu Wilcoxona gdy nie jest spełnione

założenie o symetrycznym rozkładzie różnic wokół mediany

Przykład
12

U pliszki żółtej zmierzono długość skrzydła samcom i samicom z 36
par lęgowych. Należy sprawdzić która z płci w obrębie pary lęgowej
ma dłuższe skrzydło.

H

0

: Długość skrzydła samca i samicy pliszki żółtej

tworzących parę lęgową jest taka sama.

H

A

: Długość skrzydła samca i samicy pliszki żółtej

tworzących parę lęgową

nie

jest taka sama.

Test ten bierze pod uwagę jedynie znak różnicy w obrębie pary

wyników, a nie wielkość tej różnicy

background image

Przykład 12 c.d.

2

3

4

5

6

7

8

0

2

4

6

8

1 0

1 2

1 4

1 6

1 8

2 0

1

[N ]

Rozkład
różnic

Me=3

Rozkład różnic odbiega od rozkładu normalnego –

nie można

stosować testu t-Studenta dla par zależnych

Rozkład różnic odbiega nie jest symetryczny względem mediany –

nie

można stosować testu Wicoxona

background image

Przykład 12 c.d.

Wyniki testu znaków:

Z=5,83; p<0,001

S a m c e

S a m ic e

7 9

8 0

8 1

8 2

8 3

8 4

8 5

8 6

8 7

8 8

8 9

[m m ]

U pliszki żółtej samce mają istotnie dłuższe skrzydło niż będące z nimi

w parze samice

background image


Document Outline


Wyszukiwarka

Podobne podstrony:
WYKLAD 2001 5 ppt
WYKLAD 2001 6 ppt
WYKLAD 2001 3 ppt
WYKLAD 2001 2 ppt
WYKLAD 2001 7 ppt
(7631) ck wyklad6id 1165 ppt
Wyklad 12 ppt
LOGISTYKA W17., Wykład 2001-03-05
02 wyklad3id 3850 ppt
Wyklad 6 elearning ppt
wyklad3id 19403 ppt
wyklad5id 19405 ppt
1 finanse wykladid 9239 ppt
0 Podstawy WT Organizacja wykładuid 1852 ppt

więcej podobnych podstron