Najczęściej wykorzystywane testy statystyczne II(6)


METODY STATYSTYCZNE W BIOLOGII
1. Wykład wstępny
2. Populacje i próby danych
3. Testowanie hipotez i estymacja parametrów
4. Planowanie eksperymentów biologicznych
5. Najczęściej wykorzystywane testy statystyczne I
6. Najczęściej wykorzystywane testy statystyczne II
7. Regresja liniowa
8. Regresja nieliniowa
9. Określenie jakości dopasowania równania regresji liniowej i nieliniowej
10. Korelacja
11. Elementy statystycznego modelowania danych
12. Porównywanie modeli
13. Analiza wariancji
14. Analiza kowariancji
15. Podsumowanie materiału, wspólna analiza przykładów, dyskusja
Copyright 2011, Joanna Szyda
WSTP
" Zakres stosowania
1. Test F
" Definicja
2. Test Kruskala-Wallisa
" Przykład
3. Test c2
Copyright 2011, Joanna Szyda
WSTP
TEST
HIPOTEZY PRÓBA DANYCH
Copyright 2011, Joanna Szyda
TEST F
TEST F - ZAKRES STOSOWANIA
1. Porównanie zmienności, różnice pomiędzy wieloma
próbami danych
2. Dane ciągłe
3. Rozkład normalny
4. Warianty testu:
2 2
" Analiza wariancji one-way ANOVA
H0 :s Ł se
A
" Regresja
Copyright 2011, Joanna Szyda
TEST F - ANALIZA WARIANCJI
PRÓBA DANYCH
1. Zawartość azotu w trzcinie
(% suchej masy)
2. 3 lokalizacje (A, B, C), pomiar
w 1996 r.
3. Flowermere, hrabstwo
Cambridge
A B C
3.06 3.41 2.92
2.60 3.23 2.88
2.55 3.93 3.25
2.42 3.74 2.64
2.35 3.18 3.28
Copyright 2010, Joanna Szyda
Copyright 2011, Joanna Szyda
TEST F - ANALIZA WARIANCJI
1. Określenie hipotez H0 i H1
H0: nie ma różnic w zawartości azotu pomiędzy lokalizacjami
H1: lokalizacje wpływają na zawartość azotu
2 2
s lok Ł se
H0: NA = NB = NC lub
2 2
H1: NA `" NB `" NC lub
slok > se
2. Ustalenie poziomu istotności
aMAX = 0.05
Ng
2
n (yi - y)
i
i=1
3. Wybór i obliczenie wartości
Ng -1
testu statystycznego:
F =
Ng ni
( )
yij - yi 2

i=1 j=1
N - Ng
Copyright 2011, Joanna Szyda
TEST F - ANALIZA WARIANCJI
3. Wybór i obliczenie wartości testu statystycznego
Ng
2
n (yi - y)
i
i=1
2.04
Ng -1
3 -1
F = = = 11.95
Ng ni
1.03
( )
yij - yi 2 15 - 3

i=1 j=1
N - Ng
~ FN -1,N-Ng
4. Określenie rozkładu testu:
g
at = 0.00139 Excel: przykład
5. Obliczenie wartości at:
6. Decyzja: at < amax H0 H1
lokalizacje wpływają na zawartość azotu w suchej masie
trzciny
Copyright 2011, Joanna Szyda
TEST F - ZAKRES STOSOWANIA
1. Porównanie zmienności, różnice pomiędzy wieloma
próbami danych
2. Dane ciągłe
3. Rozkład normalny
4. Warianty testu:
" Analiza wariancji
" Regresja regression H0: b = 0
Copyright 2011, Joanna Szyda
TEST F - REGRESJA
PRÓBA DANYCH
1. Masa ciała [kg] i grubość tkanki
MASA ZAW.
tłuszczowej [mm]
CIAAA TAUSZCZU
2. 10 osób dorosłych, różnej płci, tej
89 28
samej rasy
88 27
66 24
59 23
93 29
73 25
82 29
77 25
100 30
67 23
Copyright 2011, Joanna Szyda
TEST F - REGRESJA
1. Określenie hipotez H0 i H1
H0: grubość tkanki tłuszczowej nie zależy od masy ciała
H1: grubość tkanki tłuszczowej zależy od masy ciała
H0: b1 = 0
H1: b1 `" 0
2. Ustalenie poziomu istotności
aMAX = 0.05
N
2
( w - y)
i
3. Wybór i obliczenie wartości i=1
Nb -1
testu statystycznego:
F =
N
2
(w - yi )
i
i=1
N - Nb
Copyright 2011, Joanna Szyda
TEST F - REGRESJA
3. Wybór i obliczenie wartości testu statystycznego
N
2
(w - y)
i
i=1
58.25
Nb -1
2 -1
F = = = 51.3
N
9.08
2
(w - yi ) 10 - 2
i
i=1
N - Nb
~ FN -1,N -Nb
4. Określenie rozkładu testu:
b
Excel: przykład
5. Obliczenie wartości at:
at = 0.000096
6. Decyzja: at < amax H0 H1
grubość tkanki tłuszczowej zależy od masy ciała
Copyright 2011, Joanna Szyda
TEST KRUSKALA-WALLISA
TEST KRUSKALA-WALLISA - ZAKRES STOSOWANIA
1. Porównanie zmienności, różnice pomiędzy
wieloma próbami danych
2. Dane ciągłe lub porządkowe (rangi)
3. Dane nie pochodzą z rozkładu normalnego
4. Analiza wariancji
Copyright 2011, Joanna Szyda
TEST KRUSKALA-WALLISA
PRÓBA DANYCH
1. Wzrost dorosłych kobiet w USA
2. 3 przedziały wiekowe
20-29 30-39 40-49
161.925 164.465 173.990
173.355 171.450 175.260
158.115 173.355 167.640
170.815 175.260 166.370
179.705 164.465 168.910
Copyright 2011, Joanna Szyda
TEST KRUSKALA-WALLISA
1. Określenie hipotez H0 i H1
H0: wzrost kobiet jest jednakowy w każdym p. wiekowym
H1: wzrost kobiet różni się w zależności od p. wiekowego
2 2
s Ł se
H0:
wiek
2 2
H1:
s > se
wiek
2. Ustalenie poziomu istotności
aMAX = 0.05
3. Wybór i obliczenie wartości
N
liczba obserwacji
testu statystycznego:
NA liczba grup
N
A
12 2
2
H = (Ri - R) ~ cN -1 Ri śr. ranking obserwacji
n
i
A w grupie i
N(N +1)
i=1
śr. ranking wszystkich obs.
R
Copyright 2011, Joanna Szyda
TEST KRUSKALA-WALLISA
3. Wybór i obliczenie wartości testu statystycznego
N
A
12 2 12
2 2 2
H = (Ri
n - R) = 15(15 +1)5(7.2 - 8) + 5(8 - 8) + 5(8 -8) = 6.45
i
N(N +1)
i=1
2
4. Określenie rozkładu testu: ~ c3-1
at = 0.0398
5. Obliczenie wartości at: Excel: przykład
6. Decyzja: at < amax H0 H1
wzrost dorosłych kobiet różni się w poszczególnych
przedziałach wiekowych
Copyright 2011, Joanna Szyda
TEST c2
TEST c2 - ZAKRES STOSOWANIA
1. Testowanie liczebności poszczególnych kategorii
2. Dane w formie częstości  liczba obserwacji w danej
kategorii
LLL: %, średnia, prawdopodobieństwo
3. Dane podzielone na kategorie  nominalne, porządkowe
LLL: ciągłe
4. Nie należy stosować testu c2 gdy oczekiwana liczebność
dla kategorii jest mała (<5)
5. Warianty testu:
" Klasyfikacja jednoczynnikowa One-way classification
" Klasyfikacja dwuczynnikowa
Copyright 2012, Joanna Szyda
TEST c2 KLASYFIKACJA JEDNOCZYNNIKOWA
PRÓBA DANYCH
KOLOR CZSTOŚĆ
Biały Żółty
Żółty 8
1. Klasyfikacja danych wg
Żółty Czerwony
pojedynczego kryterium
Czerwony 5
2. Kolor kwiatów krokusa
Żółty Biały
Żółty 4
Żółty
Żółty SUMA
Czerwony 17
Biały
Czerwony
Żółty
Czerwony
Czerwony
Biały
Żółty
Biały
Copyright 2011 Joanna Szyda
TEST c2 KLASYFIKACJA JEDNOCZYNNIKOWA
1. Określenie hipotez H0 i H1
H0: częstości wystąpienia kolorów są jednakowe
H1: częstości wystąpienia kolorów są różne
H0: nB = nŻ = nC
H1: nB `" nŻ `" nC
2. Ustalenie poziomu istotności
aMAX = 0.05
3. Wybór i obliczenie wartości testu statystycznego
2 2 2 2
i bi bi żó żó cz cz
NK i
(nobs - nexp) (nobs - nexp) (nobs - nexp) (nobs - nexp)
2
c = = + +

i bi żó cz
nexp nexp nexp nexp
i=1
Copyright 2011, Joanna Szyda
TEST c2 KLASYFIKACJA JEDNOCZYNNIKOWA
3. Wybór i obliczenie wartości testu statystycznego
2 2 2
bi bi żó żó cz cz
NK
( )
nobs - nexp 2 (nobs - nexp) (nobs - nexp) (nobs - nexp)
2
c = = + +

bi żó cz
nexp nexp nexp nexp
i=1
2 2 2
(4 - 5.7) (8 - 5.7) (5 - 5.7)
= + + = 1.53
5.7 5.7 5.7
2
4. Określenie rozkładu testu: ~ cK -1=2
at = 0.47
5. Obliczenie wartości at:
Excel: przykład
6. Decyzja: at > amax H0 H1
częstości wystąpienia kolorów są jednakowe
Copyright 2011 Joanna Szyda
TEST c2 - ZAKRES STOSOWANIA
1. Testowanie liczebności poszczególnych kategorii
2. Dane w formie częstości  liczba obserwacji w danej
kategorii
LLL: %, średnia, prawdopodobieństwo
3. Dane podzielone na kategorie  nominalne, porządkowe
LLL: ciągłe
4. Nie należy stosować testu c2 gdy oczekiwana liczebność
dla kategorii jest mała (<5)
5. Warianty testu:
" Klasyfikacja jednoczynnikowa
" Klasyfikacja dwuczynnikowa Two-way classification
Copyright 2012, Joanna Szyda
TEST c2 KLASYFIKACJA DWUCZYNNIKOWA
PRÓBA DANYCH
1. Klasyfikacja danych wg dwu kryteriów
2. Liczebność słoni w Parku Narodowym Mikumi,
Tanzania
kategoria
grupa
samotny grupa grupa rodzinna +
samiec samców rodzinna samiec
sucha 43 4 196 7
Pora
deszczowa 92 17 195 8
Copyright 2011, Joanna Szyda
TEST c2 KLASYFIKACJA DWUCZYNNIKOWA
1. Określenie hipotez H0 i H1
H0: pora roku nie wpływa na zmiany liczebności słoni w
poszczególnych kategoriach (oba kryteria są niezależne)
H1: pora roku wpływa na zmiany liczebności słoni w
poszczególnych kategoriach (oba kryteria są zależne)
H0: nDi = nSi dla i=1& 4
H1: nDi `" nSi
2. Ustalenie poziomu istotności
aMAX = 0.05
3. Wybór i obliczenie wartości testu statystycznego
2 2 2
ij D _1 D _1 S _ S _
NK NM ij
(nobs - nexp) (nobs - nexp ) (nobs 4 - nexp4)
2
c = = +K+

ij D _1 S _
nexp nexp nexp4
i=1 j=1
Copyright 2011, Joanna Szyda
TEST c2 KLASYFIKACJA DWUCZYNNIKOWA
liczebność klasy oczekiwana dla H0
2
ij
NK NM ij
(nobs - nexp)
2
c =
NM NK NM
ij NK
nexp
. j i. . j
i=1 j=1 i.
n n n
obs obs obs
n
obs
j=1 i=1 j=1
ij
i=1
nexp = N =
N N N
grupa
grupa
grupa
grupa
samotn grupa rodzinn
samotn grupa rodzinn
samotn grupa rodzinn
samot rodzin
y grupa rodzinn a +
y grupa rodzinn a +
y grupa rodzinn a +
ny grupa grupa na +
samiec samców a samiec
samiec samców a samiec
samiec samców a samiec
samie samc rodzin samie
c ów na c suma
135*250 21*250
135*250
60.5 9.34 173.93 6.67
sucha
?
sucha 562 562
sucha 562
43 4 196 7 250
sucha
deszczo
74.95 11.66 217.07 8.33
deszczo
deszczo
wa
deszc
wa
wa
92 17 195 8 312
zowa
135 21 391 15 562
suma
Copyright 2011 Joanna Szyda
TEST c2 KLASYFIKACJA DWUCZYNNIKOWA
3. Wybór i obliczenie wartości testu statystycznego
2
ij
NK NM ij
(nobs - nexp)
2
c = =

nexp
i=1 j=1
2 2 2 2
(43 - 60.05) (92 - 74.95) (4 - 9.34) (17 -11.66)
+ + +
60.05 74.95 9.34 11.66
2 2 2 2
(196 -173.93) (195 - 217.07) (7 - 6.67) (8 - 8.33)
+ + + + =
173.93 217.07 6.67 8.33
19.30
~ c(2 -1)(M -1)=3
4. Określenie rozkładu testu:
K
at = 0.0002
5. Obliczenie wartości at:
Excel: przykład
Copyright 2011, Joanna Szyda
TEST c2 KLASYFIKACJA DWUCZYNNIKOWA
6. Decyzja: at < amax H0 H1
liczebność poszczególnych grup słoni różni się w zależności
od pory roku
Copyright 2011 Joanna Szyda
WYBÓR TESTU
PORÓWNANIE ZMIENNOŚCI
ROZKAAD NORMALNY
TEST F
PORÓWNANIE CZSTOŚCI
TEST c2
PORÓWNANIE ZMIENNOŚCI
ROZKAAD INNY NIŻ
NORMALNY
TEST KRUSKALA-WALLISA


Wyszukiwarka

Podobne podstrony:
TESTY STATYSTYCZNE
Wykład MSZ 2 Testy statystyczne
2 testy niem II
Testy II powiat 09
Historia I r II stopnia Gr 1 Statystyka z demografiÄ historycznÄ wykĹ ad 2012 13
TRZECIOTEŚCIK TESTY PRZYGOTOWUJĄCE DO OSKT TEST II KAROLCIA
Testy II gminne 09
Kuloodporne strony internetowe Jak poprawic elastycznosc z wykorzystaniem XHTML a i CSS Wydanie II
testy technik geodeta egzamin praktyczny 2010 wersja I i II
Egzamin II ze statystyki luty 07
statys testy
rafajłowicz,Inżynierskie zastosowania statystyki, testy nieparametryczne, testy zgodności
Przykładowe testy ze statystyki
testy technik geodeta egzamin teoretyczny czerwiec 2012 czesc II

więcej podobnych podstron