Test chi-kwadrat
porównuje częstości
Analiza wariancji (ANOVA)
- Analiza wariancji (klasyfikacja prosta)
czy grupy różnią się?
- Test
a posteriori
Tukeya
które grupy się różnią?
- Test Kruskala-Wallisa
nieprametryczna odmiana ANOVA
Test t-Studenta
porównuje różnice między 2 grupami
Analiza wariancji (ANOVA)
porównuje różnice między > 2 grupami
Analiza wariancji (ANOVA)
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
x
2
=
514,55
x = 64,65
s
2
= 514,55 / (20 - 1) =
27,082
Źródła zmienności
Ogólna
Międzygrupowa
Wewnątrzgrupowa
SK
df
Oszacowanie wariancji
514,55
215,15
299,20
19
3
16
27,082
71,783
18,700
Średnia z 4 średnich =
Analiza wariancji (ANOVA)
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
Źródła zmienności
Ogólna
Międzygrupowa
Wewnątrzgrupowa
SK
df
Oszacowanie wariancji
514,55
215,35
299,20
19
3
16
27,082
71,783
18,700
x
2
= 43,07
x 5
=
215,35
x = 59,4 68,4 65,8 65,0
s
2
= 215,35 / (4 – 1 ) =
71,783
64,65
Jeśli z populacji o wariancji
2
pobieramy próby N-elementowe
i obliczamy średnią z tych prób, to wariancja obliczona z tych średnich
wynosi
2
/ N, czyli jest N-krotnie mniejsza
Aby otrzymać oszacowanie wariancji między pomiarami
należy tą
wariancję pomnożyć przez N
Analiza wariancji (ANOVA)
Źródła zmienności
Ogólna
Międzygrupowa
Wewnątrzgrupowa
SK
df
Oszacowanie wariancji
514,55
215,35
299,20
19
3
16
27,082
71,783
18,700
x = 59,4 68,4 65,8 65,0
x
2
= 123,2 77,2 50,8 48
s
2
= 299,2 / (20 – 4) =
18,7
Suma
x
2
=
299,20
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
Analiza wariancji (ANOVA)
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
Źródła zmienności
Ogólna
Międzygrupowa
Wewnątrzgrupowa
SK
df
Oszacowanie wariancji
728,55
429,35
299,20
19
3
16
38,344
143,117
18,700
x = 59,4
68,4 65,8 65,0
x
2
= 123,2 77,2 50,8 48
s
2
= 299,2 / (20 – 4) =
18,7
Suma
x
2
=
299,20
A
+2
+4
-2
58
67
73
61
60
72
66
66
51
66
74
66
66
77
67
58
62
70
69
64
x = 59,4
70,4 69,8
63,0
x
2
= 123,2 77,2 50,8 48
s
2
= 299,2 / (20 – 4) =
18,7
Średnia z 4 średnich =
64,65
Średnia z 4 średnich =
65,65
Suma
x
2
=
299,20
Źródła zmienności
Ogólna
Międzygrupowa
Wewnątrzgrupowa
SK
df
Oszacowanie wariancji
514,55
215,35
299,20
19
3
16
27,082
71,783
18,700
Analiza wariancji (ANOVA)
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
Ogólna SK
=
X
ij
2
-
j i
a N
j
N
(
X
ij
)
2
j i
a N
j
(58)
2
+ (60)
2
+ … + (66)
2
=
84107
(58 + 60 + … + 66)
2
/ 20 = (1293)
2
/ 20 =
83592,45
84107 – 83592,45 =
514,55
= 514,55
Międzygrupowa SK
=
N
(
X
ij
)
2
j i
a N
j
N
j
(
X
ij
)
2
i
N
j
j
a
-
= 297 342 329 325
(297)
2
/ 5 + (342)
2
/ 5 + (329)
2
/ 5 + (325)
2
/ 5 =
83807,8
83807,8 – 83592,45 =
215,35
= 215,35
Ogólna SK
=
Międzygrupowa SK
+
Wewnątrzgrupowa SK
Wewnątrzgrupowa SK
=
Ogólna SK
–
Międzygrupowa SK
= 299,20
514,55
215,35
Analiza wariancji (ANOVA)
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
Źródła zmienności
SK
df
Oszacowanie wariancji
Ogólna
Międzygrupowa
Wewnątrzgrupowa
514,55
215,35
299,20
19
3
16
27,082
71,783
18,700
df
ogólna SK = N - 1 = 20 – 1 = 19
df
międzygrupowa SK = a – 1 = 4 – 1 = 3
df
wewnątrzgrupowa SK =
(N
j
– 1) = (5 – 1) + (5 – 1) + (5 – 1) + (5 – 1) = 16
i
a
F = wariancja między grupami / wariancja w grupach
F = 71,783 / 18,700 =
3,839
F
0,05; 3; 16
=
?
df
ogólna SK =
df
międzygrupowa SK +
df
wewnątrzgrupowa SK
Wariancja międzygrupowa
= SK / df = 215,35 / 3 =
71,783
Wariancja wewnątrzgrupowa
= SK / df = 299,2 / 16 =
18,7
Analiza wariancji (ANOVA)
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
F = wariancja między grupami / wariancja w grupach
F = 71,783 / 18,700 =
3,839
F
0,05; 3; 16
=
3,24
Między którymi?
F> F
0,05; 3; 16
Między grupami są różnice
s
x
Test
a posteriori
Tukeya (metoda T)
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
Źródła zmienności
SK
df
Oszacowanie wariancji
Ogólna
Międzygrupowa
Wewnątrzgrupowa
514,55
215,35
299,20
19
3
16
27,082
71,783
18,700
NIR = (wartość krytyczna)(błąd standardowy) =
Q
0,05; a;
df
1) Obliczamy Najmniejszą Istotną Różnicę (NIR)
a) wartość krytyczna
Q
0,05; a;
df
=
?
Q
0,05; 4; 16
=
?
Rozstęp studentyzowany (Tablica H)
df
– liczba stopni swobody
a – liczba grup
Test
a posteriori
Tukeya (metoda T)
a) wartość krytyczna
(rozstęp studentyzowany - Tablica H)
Q
0,05; a;
df
=
?
Q
0,05; 4; 16
=
4,05
df
– liczba stopni swobody = N - a
a – liczba grup
Test
a posteriori
Tukeya (metoda T)
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
Źródła zmienności
SK
df
Oszacowanie wariancji
Ogólna
Międzygrupowa
Wewnątrzgrupowa
514,55
215,35
299,20
19
3
16
27,082
71,783
18,700
NIR = (wartość krytyczna)(błąd standardowy) =
Q
0,05; a;
df
a) wartość krytyczna
Q
0,05; a;
df
=
?
Q
0,05; 4; 16
=
4,05
Rozstęp studentyzowany (Tablica H)
1) Obliczamy Najmniejszą Istotną Różnicę (NIR)
b) błąd standardowy
√
s
2
n
s
x
=
= 4,05 1,934 =
s
x
= 7,8327
= (18,7 / 5) =
1,934
s
2
– wariancja
n – liczba powtórzeń w jednym zabiegu
df
– liczba stopni swobody
a – liczba grup
√
d = 55,48 64,48 61,88 61,08
Test
a posteriori
Tukeya (metoda T)
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
Źródła zmienności
SK
df
Oszacowanie wariancji
Ogólna
Międzygrupowa
Wewnątrzgrupowa
514,55
215,35
299,20
19
3
16
27,082
71,783
18,700
NIR =
7,8327
1) Obliczamy Najmniejszą Istotną Różnicę (NIR)
d = X – NIR/2
2) Obliczamy średnią i jej zakres
g = X + NIR/2
x = 59,4 68,4 65,8 65,0
g = 63,32 72,32 69,72 68,92
50
60
70
80
d
A
= 59,4 – 7,8327/2 = 55,48
g
A
= 59,4 + 7,8327/2 = 63,32
3) Porównujemy zakresy średnich
A B C D
B
+
-
- -
C - - -
D - - -
Jeśli średnie między zakresami z dwóch zabiegów
zachodzą na siebie, to nie ma między nimi statystycznie
istotnych różnic
Analiza wariancji - założenia
- Niezależność prób
- Losowość prób
- Addytywność
(czynnik
j
zmniejsza lub zwiększa średnią w danej grupie)
- Homogeniczność wariancji
(poszczególne grupy nie różnią się wariancją)
- Normalność
(czynnik losowy E
ij
ma rozkład normalny)
X
ij
=
+
j
+ E
ij
X
ij
– pojedynczy pomiar
– ogólna średnia z populacji generalnej
j
– wpływ zabiegu eksperymentalnego
j
E
ij
– losowe odchylenie każdego z pomiarów
Założenia analizy wariancji:
Test Kruskala-Wallisa
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
60
2
4
1
13
6,5
11,5
18,5
10
20
15
17
6,5
18,5
8,5
11,5
8,5
15
15
4
4
H
=
N
j
N(N + 1)
j
a
12
R
j
2
- 3(N + 1)
3
4
5
4
5
2
7
8
4
2
4
6,5
4
6,5
1
8
9
4
N
j
– liczba pomiarów w grupie j-tej
N – liczba pomiarów we wszystkich (a)
grupach łącznie
a – liczba grup
R
j
– suma rang
Test Kruskala-Wallisa
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
60
2
4
1
13
6,5
11,5
18,5
10
20
15
17
6,5
18,5
8,5
11,5
8,5
15
15
4
4
H
=
N
j
N(N + 1)
j
a
12
R
j
2
- 3(N + 1)
R
j
= 26,5 75 62 46,5
(26,5)
2
/5 + (75)
2
/5 + (62)
2
/5 + (46,5)
2
/5 =
2466,7
3(20 + 1) =
63
H
= 0,0286 2466,7 – 63 =
7,477
12/(20
21) =
0,0286
t – ranga wiązana
D
= 1 -
N
3
- N
(t
3
– t)
(t
3
– t) = 4 (2
3
– 2) + 2 (3
3
– 3) = 46 + 324 =
72
N
3
– N = 20
3
– 20 =
7980
D
=
?
N
j
– liczba pomiarów w grupie j-tej
N – liczba pomiarów we wszystkich (a)
grupach łącznie
a – liczba grup
R
j
– suma rang
Test Kruskala-Wallisa
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
60
2
4
1
13
6,5
11,5
18,5
10
20
15
17
6,5
18,5
8,5
11,5
8,5
15
15
4
4
H
=
N
j
N(N + 1)
j
a
12
R
j
2
- 3(N + 1)
R
j
= 26,5 75 62 46,5
(26,5)
2
/5 + (75)
2
/5 + (62)
2
/5 + (46,5)
2
/5 =
2466,7
3(20 + 1) =
63
H
= 0,0286 2466,7 – 63 =
7,477
12/(20
21) =
0,0286
D
= 1 -
N
3
- N
(t
3
– t)
(t
3
– t) = 4 (2
3
– 2) + 2 (3
3
– 3) = 46 + 324 =
72
N
3
– N = 20
3
– 20 =
7980
D
= 1 – 72/7980 = 1 – 0,009023 =
0,9909775
H
= 7,477 / 0,9909775 =
7,545
N
j
– liczba pomiarów w grupie j-tej
N – liczba pomiarów we wszystkich (a)
grupach łącznie
a – liczba grup
R
j
– suma rang
t – ranga wiązana
Test Kruskala-Wallisa
H
=
7,545
2
0,05; 3
=
7,815
brak różnic między grupami
Obserwowane zmienne
mają charakter normalny
Test t
dla prób
zależnych
TAK
Test Cochrana-
Coxa
Test t
dla prób
niezależnych
wariancje
równe
różne
próby
zależne
niezależne
skala
interwałowa,
ilorazowa
Test chi-
kwadrat
nominalna,
porządkowa
Liczba prób
2
założenia ANOVA:
równość wariancji
normalność rozkładu
test Kruskala-
Wallisa
test Tukeya
Analiza
wariancji
ANOVA
spełnione
niespełnione
Czy są różnice?
Między którymi są różnice?
>2
Test Levene’a
jak
sprawdzić?
Test F
Statistica:
Wpisywanie danych
Typ 1:
Zmienna grupująca (Grupa) Zmienna zależna (Pomiar)
Zastosowanie:
-
Test chi-kwadrat;
-
Testy t dla prób niezależnych;
-
Test Manna-Whitney’a
-
ANOVA
-
Test Tukey’a
-
Test Kruskalla-Wallisa
Typ 2:
Grupa A Grupa B
(dane w parach obok siebie)
Zastosowanie:
-
Testy t dla prób zależnych;
-
Test kolejności par Wilcoxona
Analiza wariancji (ANOVA)
Efekt – zmienność międzygrupowa
Błąd – zmienność wewnątrzgrupowa
SS – suma kwadratów odchyleń od średniej = SK
MS – wariancja (s
2
)
Jak obliczyć:
> Statystyka > Statystyki podstawowe i tabele > Przekroje, prosta ANOVA > Zmienne >
wybieramy zmienną grupującą i zmienną zależną > Kody zmiennych grupujących
(wszystko lub wybieramy kody przez ich zaznaczenie) > Test Levene’a (aby
sprawdzić, czy wariancje są równe) > Analiza wariancji > Post-hoc > Test rozsądnej
istotnej różnicy (RIR) Tukey’a.
Analiza wariancji (ANOVA)
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
Źródła zmienności
SK
df
Oszacowanie wariancji
Ogólna
Międzygrupowa
Wewnątrzgrupowa
514,55
215,35
299,20
19
3
16
27,082
71,783
18,700
F = wariancja między grupami / wariancja w grupach
F = 71,783 / 18,700 =
3,839
F
0,05; 3; 16
=
?
Wariancja międzygrupowa
= SK / df = 215,35 / 3 =
71,783
Wariancja wewnątrzgrupowa
= SK / df = 299,2 / 16 =
18,7
d = 55,48 64,48 61,88 61,08
Test
a posteriori
Tukeya (metoda T)
A
B
C
D
58
65
69
63
60
70
62
68
51
64
70
68
66
75
63
60
62
68
65
66
NIR =
7,8327
1) Obliczamy Najmniejszą Istotną Różnicę (NIR)
d = X – NIR/2
2) Obliczamy średnią i jej zakres
g = X + NIR/2
x = 59,4 68,4 65,8 65,0
g = 63,32 72,32 69,72 68,92
50
60
70
80
d
A
= 59,4 – 7,8327/2 = 55,48
g
A
= 59,4 + 7,8327/2 = 63,32
3) Porównujemy zakresy średnich
A B C D
B
+
-
- -
C - - -
D - - -
Jeśli średnie między zakresami z dwóch zabiegów
zachodzą na siebie, to nie ma między nimi statystycznie
istotnych różnic
Test Kruskala-Wallisa
Jak obliczyć:
> Statystyka > Statystyki nieparametryczne > Porównanie wielu prób niezależnych (grup)
> Zmienne > wybieramy zmienną grupującą i zmienną zależną > ANOVA Kruskala-
Wallisa i test mediany >
! Po lewej stronie
wybrać ANOVA Kruskala-Wallisa.
Test chi-kwadrat
Jak obliczyć:
> Statystyka > Statystyki podstawowe i tabele > Tabele wielodzielcze > Określ tabele
(wybierz zmienne) > wybieramy jedną zmienną z jednej listy, a drugą zmienną z
drugiej listy > Użyj kodów grupujących użytkownika > Kody > Wszystko > OK. > OK.
> Opcje > Chi-kwadrat Pearsona i NW + Liczności oczekiwane > Więcej > Dokładne
tabele dwudzielcze.