Statystyki
nieparametryczne
Statystyki
parametryczne
• Więcej założeń
– np. normalność
rozkładu,
homogeniczność
wariancji
• Większa moc
Statystyki
nieparametryczne
• Mniej założeń
• Mniejsza moc
Test chi-kwadrat
• Dwa rodzaje
– test niezależności
• analiza współzależności dwóch zmiennych
mierzonych na skalach nominalnych
– test zgodności
• analiza zgodności rozkładu empirycznego
z danym rozkładem teoretycznym (np.
można sprawdzić, czy rozkład jest
normalny)
E
E
O
2
2
)
(
Istota testu chi-kwadrat
• Porównywanie liczebności
zaobserwowanych (czyli tym, co
wyszło w badaniach empirycznych)
i oczekiwanych (czyli tym, co
powinno wyjść, gdyby prawdziwa
była hipoteza zerowa, czyli gdyby
dany efekt nie istniał)
• Przykład: (nie dotyczy korelacji!):
O
E (O-E) (O-E)
2
(O-E)
2
/ E
Kobiety
67 45 22
484
10,76
Mężczyźni 23 45 -22 484
10,76
21,51
chi
2
=12,55, df=7, p=0,08
chi
2
=12,55, df=16,
p=0,71
Friedman, Katcher, Lynch, and
Thomas (1980)
Test niezależności chi-
kwadrat
a
b
a+b
c
d
c+d
a+c
b+d
N
E
a
= (a+c) (a+b) / N
E
b
= (b+d) (a+b) / N
E
c
= (a+c) (c+d) / N
E
d
= (b+d) (c+d) / N
Aerobik
Piłka nożna Inne
Dziewczęta 51
24
23
Chłopcy
22
43
26
Założenia testu chi-
kwadrat
• Dane pochodzą z niezależnych
obserwacji
– (analiza danych powtarzanych
niemożliwa)
• Liczebności komórek nie mniejsze
niż 5
Wskaźniki wielkości
efektu dla korelacji skal
nominalnych
• dla tabel 2x2
– współczynnik phi (0 - 1)
• dla dowolnych tabel:
– współczynnik kontyngencji (C) (0 - ?
…)
– V Cramera (0 - 1)
Skala nominalna a pomiar
powtórzony
• test McNemara - powtórzony
pomiar na skali nominalnej z
dwiema kategoriami. Pytanie
badawcze: czy proporcja
pewnego typu odpowiedzi jest
inna po manipulacji, w
porównaniu z proporcją przed
manipulacją
Postawa po
TAK
NIE
TAK
13
2
Postawa przed
NIE
21
27
Alternatywy
nieparametryczne
Stosowane, kiedy:
• założenia danego testu
parametrycznego są niespełnione (np.
założenia o normalności rozkładów lub
homogeniczności wariancji) i / lub
• skale pomiarowe zmiennych nie
spełniają wymogów danego testu
parametrycznego (np. nie są mierzone
na skali interwałowej)
Alternatywy
nieparametryczne
• Oparte na medianach i
rangowaniu wyników, nie na
obliczaniu średnich i wariancji
• Nie wymagają założeń co do
rozkładu, dopuszczają pomiar na
skali porządkowej (niektóre też na
nominalnej)
Korelacja dwóch
zmiennych
• Analiza parametryczna: r Pearsona
– wymaga rozkładów z grubsza
normalnych i skal ciągłych
• Alternatywy nieparametryczne
– tau Kendalla
– rho Spearmana
• obie przyjmują wartości z przedziału od -1
do +1; rho jest zwykle nieco wyższe niż tau
8
9
9
4
5
7
4
5
6
2
7
1
Ranga X
X
Ranga Y
Y
1
4
1
1
2
5
2
2
3
6
3
4
4
7
5
7
5
8
4
5
6
9
6
9
Porównanie dwóch grup
• Analiza parametryczna: test t
Studenta
– wymaga rozkładów z grubsza
normalnych, wariancji w obu grupach
porównywalnych i skal ciągłych
• Alternatywa nieparametryczna:
– test U Manna-Whitneya (niewielki spadek
mocy w porównaniu z testem t Studenta)
• oparty na rangowaniu danych; nie wymaga
żadnego z powyższych założeń
Porównanie trzech i
więcej grup
• Analiza parametryczna: analiza
wariancji (ANOVA)
– wymaga rozkładów z grubsza normalnych,
wariancji we wszystkich grupach
porównywalnych i skal ciągłych
• Alternatywa nieparametryczna (dla
jednoczynnikowej jednozmiennowej
analizy wariancji - ONEWAY)
– test H Kruskala-Wallisa
• Problem: Brak eleganckiej nieparametrycznej
alternatywy dla
testów post-hoc
, interakcji,
analizy wielorakiej, analizy wieloczynnikowej
– (daleki) odpowiednik testów post-hoc: porównania
parami testem U, z korektą Bonferroniego
– mała moc, jeśli grup więcej niż trzy
Porównanie dwóch
powtórzonych pomiarów
• Analiza parametryczna: test T dla
powtórzonych pomiarów
– wymaga rozkładów z grubsza
normalnych i skal ciągłych
• Alternatywa nieparametryczna:
– test znaków rangowych Wilcoxona
Porównanie trzech i
więcej powtórzonych
pomiarów
• Analiza parametryczna: ANOVA dla
powtórzonych pomiarów
– wymaga rozkładów z grubsza
normalnych i skal ciągłych
• Alternatywa nieparametryczna:
– test rang Friedmana
• Problem: Brak nieparametrycznej
alternatywy dla porównań wielokrotnych
– porównania parami testem znaków rangowych
Wilcoxona z korektą Bonferroniego
– mała moc, jeśli pomiarów więcej niż trzy
Analizy interakcji i inne
plany złożone
• Brak jest eleganckich alternatyw
nieparametrycznych dla bardziej
złożonych planów ANOVA, np.
analizy interakcji międzygrupowe i
wewnątrzgrupowe, analizy
interakcji międzygrupowo-
wewnętrzne, analizy trendów,
analizy wielorakie
• Niektórzy dopuszczają analizę
parametryczną na skalach porządkowych
(powstałych w wyniku szacowania, a nie
rangowania), jeśli ma ona co najmniej
siedem poziomów lub więcej
–
Cohen i Cohen (????) Applied regression analysis:
„running example” w analizie regresji: zmienną
zależną był status akademicki, szacowany na
trzystopniowej skali porządkowej: niski, średni i
wysoki.
• współczynniki tau, rho i r zwykle różnią się
nieznacznie
• korelacje Spearmana i Pearsona są sobie
równoważne, jeśli dane zostały porangowane
• współczynnik phi jest tożsamy z r