Wykład 8
Materiał I semestru
l
Statystka opisowa
l
Miary tendencji centralnych, rozproszenia
l
Zależności między nimi
l
Rozkład normalny i standaryzacja wyników
l
Wprowadzenie do wnioskowania
statystycznego
l
Statystyka inferencyjna
l
Testy istotności związku
l
Testy istotności różnic
Dane kategorialne
Jedna zmienna Dwie zmienne
nominalna nominalne
Test zgodności 2 Test 2, tabele krzyżowe
Związek zmiennych
Skala pomiarowa
porządkowa ilościowa
Korelacja
Rho Spearmana
r-Pearsona
Różnice
Dwie grupy
zależne
Test t dla
Test Wilcoxona
grup zależnych
niezależne
Test t dla Test U
grup niezależnych Manna-Whitneya
Ogólne założenia testów
parametrycznych
l
Rozkład normalny zmiennej w populacji
l
Sprawdzamy jaki jest rozkład: histogramy, ale
i test K-S dla jednej próby
l
Dane zbierane na przynajmniej
przedziałowej skali
Dodatkowe założenie do testu t
dla grup niezależnych
l
Założenie o homogeniczności wariancji
l
Testuje je test Levena (statystyka F)
l
Ho: wariancje są sobie równe
l
Test t jest dosyć odporny na zaburzenie tego założenia, jeśli
wariancje nie są dramatycznie różne można go stosować
l
Przy dużej różnicy w liczebnościach grup i nierównych
wariancjach lepiej zrobić nieparametryczny odpowiednik
l
Reguła kciuka przy nierównych liczebnoścach grup: jeśli większa
wariancja z dwóch nie jest większa niż 3 razy od mniejszej
można stosować testy t
l
Mniejsze zaufanie do wyników testu t, gdy oba założenia
(o równości wariancji i normalności rozkładu) są zaburzone
Odporność testów t
l
Przy małych i równolicznych grupach
l
i kiedy zmienna zależna jest mierzona na skali
przedziałowej
l
Można robić test t nawet nie sprawdzając założeń
l
Jeśli natomiast mamy wyraznie
nierównoliczne próby
l
Wtedy należy sprawdzić założenia i
zaburzenie któregoś z nich powinno skłonić
nas do zastosowania nieparametrycznych
odpowiedników
Co zrobić, kiedy zmienna nie ma
rozkładu normalnego
l
Puryści
l
Nie można robić testów parametrycznych (w
tym naszych ulubionych testów t)
l
Liberałowie i jak wygląda to w praktyce
l
Testy t są odporne na zaburzenie założenia
o rozkładzie normalnym zmiennej zarówno
małe jak i duże próby
l
Jeśli nierównoliczne próbki i zaburzenie
rozkładu normalnego - nieparametryczne
Kiedy nawet liberał musi się poddać
l
nałożenie się zaburzenia normalności, czy
homogeniczności wariancji (przy testach t
dla grup niezależnych) z wyraznie nie
równą liczbą osób
l
skłania do zastosowania testów
nieparametrycznych
Przykłady zastosowania
testów nieparametrycznych
l
nierówne liczebności oraz
l
test Levena wskazuje na na istotną nierówność
wariancji
l
rozkład wyników w podgrupach niezgodny z
rozkładem normalnym test K-S
(Kołmogorowa-Smirnowa)
l
Niższa skala pomiarowa (porządkowa)
Test Manna-Whitneya
l
Stosowany do testowania różnic między
dwoma niezależnymi grupami
l
Uznawany za odpowiednik testu dla grup
niezależnych
l
Dla danych porządkowych
l
Przy braku spełnienia założeń dla testu t
logika
l
Mamy dwie grupy N1 i N2, rangujemy
wyniki dla obu grup
l
Sprawdzamy, w której grupie mamy niższe
rangi (suma rang)
l
Jeżeli hipoteza zerowa jest prawdziwa:
l
Rozkład rang powinien być przypadkowy
l
Czyli nasza różnica w rangach między grupami też
Jak liczy się statystykę U
l
Wyniki dla wszystkich
Wyniki ranga Wyniki ranga
badanych są porangowane
1gr 2gr
od najniższego do
7 6 4 2,5
najwyższego
l
Następnie test oblicza ile
15 11 6 4
razy 1 warunek ma wyższą
rangę od drugiego, w
14 10 11 9
oparciu o sumy rang i liczbę
osób w każdej grupie
3 1 7 6
l
Dla własnej orientacji czy są
17 12 9 8
różnice, możemy obliczyć
sumę rang, lub średnią rang
4 2,5
gdy są nierówne grupy
7 6
M=8 M=5,4
Śr. rang
Z głównego menu wybieramy testy nieparametryczne >
test dla 2 prób niezależnych> definiujemy zmienną grupującą i testowaną
Rangi
GRUPA N Średnia ranga Suma rang
SMAK 1,00
5 8,00 40,00
2,00
7 5,43 38,00
Ogółem
12
Statystyka U,
którą podajemy
opisując wyniki
Statystyki testub
SMAK
Poziom istotności,
U Manna-Whitneya
10,00
zakładając prawdziwość
W Wilcoxona
H0, istnieje 22%
38,00
prawdopodobieństwo, że
Z
-1,23
uzyskane wyniki są
Istotność asymptotyczna
przypadkowe
,219
(dwustronna)
Istotność dokładna
,268a
[2*(jednostronna)]
a. Nieskorygowane ze względu na wiązania.
Wniosek: bpdoHo
b. Zmienna grupująca: GRUPA
Test Wilcoxona
l
Jeden z najbardziej popularnych testów
nieparametrycznych
l
Wolny od założeń analog testu t dla grup
zależnych
l
Ho: próbki wyciągnięte z identycznych
populacji
l
Rozkład różnicy pomiarów w populacji jest
symetryczny wokół zera
l
(to samo założenie co przy teście t dla zależnych)
wyniki
1 zjazd
130 170 125 170 130 130 145 160
ostatni
120 163 120 135 143 136 144 120
różnica
10 7 5 35 -13 -6 1 40
rangi
5 4 2 7 6 3 1 8
+ znak
5 4 2 7 -6 -3 1 8
T+ = suma pozytywnych rang=27
T- =suma negatywnych rang=-9
Na bazie mniejszej obliczna jest statystyka
Test T-Wilcoxona dla zależnych
l
Obliczamy różnicę dla każdej pary danych D
l
Jeśli pojawią sie różnice zerowe pomijamy je
l
Rangujemy |D|
l
Sumujemy rangi przypisane różnic D<0 i D>0
l
H0: suma rang różnic o znaku dodatnim
równa się sumie rang o znaku ujemnym
Analiza wydruku
Rangi
N Średnia ranga Suma rang
OSTATNI - PIERWSZY Ujemne rangi
6a 4,50 27,00
Dodatnie rangi
2b 4,50 9,00
Wiązania
0c
Ogółem
8
a. OSTATNI < PIERWSZY
b. OSTATNI > PIERWSZY
c. PIERWSZY = OSTATNI
Statystyki testub
OSTATNI -
PIERWSZY
Z
-1,260a
Istotność asymptotyczna
,208
(dwustronna)
a. Na bazie dodatnich rang.
b. Test znaków rangowanych Wilcoxona
Testy nieparametryczne
l
Nieparametryczne testy wolne są od założeń na
temat danych, na których są stosowane
l
Większośc obliczana jest na podstawie
porangowanych danych
l
Najniższy wynik ma rangę 1, drugi co do wielkości 2 i tak
do końca
l
Wysokie wyniki mają wysokie rangi, a małe niski
l
Analiza jest obliczna na rangach a nie na surowych danych
(obchodzimy w ten sposób założenia testów
parametrycznych)
l
Nie są wrażliwe na skrajne wyniki
Cena za samowolę
rangowania
l
Rangując wyniki tracimy informację o
wielkości różnicy między wynikami
l
Przez to też testy nieparametryczne mają
mniejszą moc wykrywania rzeczywistych
różnic
l
Wzrasta prawdopodobieństwo popełnienia błędu II
rodzaju
ż
Nie odrzucenia hipotezy zerowej, kiedy jest fałszywa
ż
Możemy nie wykazać istotnych efektów
Wyszukiwarka
Podobne podstrony:
10 Funkcje wykładnicze i logarytmiczne, zadania powtórzeniowe przed maturąSS wyklad nr 10 pptWykład 02 (część 07) zasada prac wirtualnych dla odkształcalnych układów prętowychWykład 9 przestępczość przestępczość ujawniona [10 11]Wykład 03 (część 08) twierdzenie o wzajemności prac i z niego wynikająceWykład 02 (część 06) energia potencjalna odkształcenia sprężystegoWykład 6 przestępca koncepcje socjologiczne 2 [10 11]ZW Pol pien PP 2011 2012 odcinek 1 dla studentów slides z wykładów w dniach 02 16 10 2011Wykład 01 (część 03) repetytorium więzyWyklad Wybrane parazytozy czlowieka 10 2010 Materialy dla studentowWyklad BANKOWE ZRODLA FINANSOWANIA 10101022 WYKŁAD 03 CZESCwyklady 5 relacje ERD bryk v2 pptAnaliza Finansowa Wykład 07 13 01 10więcej podobnych podstron