wykład9 statystyka


Wykład 9
Nieparametryczne testy istotności  ciąg dalszy
Test Wilcoxona (rangowanych znaków)  dla par obserwacji
Test Wilcoxona jest alternatywÄ… dla testu t dla par obserwacji w przypadku, gdy za-
łożenie o normalności rozkładu nie jest spełnione. W teście Wilcoxona dla par obserwacji
(X1, Y1), (X2, Y2), . . ., (Xn, Yn), pary są wzajemnie niezależne, ale zmienne w parze mogą
być zależne. Zakładamy ponadto, że pary mają ten sam rozkład dwuwymiarowy. Sytu-
acja ta odpowiada np. pomiarowi pewnej zmiennej dla tych samych jednostek przed i
po zastosowaniu terapii. Cecha wynikowa, której zmiany chcemy zweryfikować musi być
wyrażona co najmniej w skali interwałowej (różnicowej).
Model
" Dane są dwie populacje generalne o ciągłych dystrybuantach F1(x) i F2(x)
" Z populacji tych wylosowano jednakową liczbę n elementów do dwu prób, których
wyniki odpowiadajÄ… sobie parami.
" Na podstawie wyników tych prób należy zweryfikować hipotezę, że obie próby po-
chodzÄ… z tej samej populacji
H0 : F1(x) = F2(x),
wobec hipotezy alternatywnej
F1(x) = F2(x).

Próba mała (n 25)
Test istotności jest dla tej hipotezy następujący:
" Obliczamy różnice wyników obu prób dla wszystkich par wyników.
" Rangujemy wartości bezwzględne tych różnic (tzn. nadajemy im kolejne numery
zaczynając od 1 dla najmniejszej co do wartości bezwzględnej różnicy).
" Wyznaczone rangi piszemy w dwu grupach, oddzielnie dla różnic dodatnich oraz
ujemnych.
+
" Sumując rangi w tych dwu grupach uzyskujemy sumę rang T dla różnic dodatnich
-
i sumę rang T dla różnic ujemnych.
" Znajdujemy wartość statystyki T , jako najmniejszą z tych dwu sum rang, tzn.
+ -
T = min{T , T }.
" Statystyka T ma przy założeniu prawdziwości hiopotezy H0 znany rozkład.
1
Uwaga Jeśli przy rangowaniu różnic występują jednakowe wartości tych różnic, to na-
dajemy każdej z nich rangę (numer) będącą średnią arytmetyczną rang, jakie kolejno te
różnice otrzymałyby, gdyby nie były jednakowe.
Przykład 1
Jednym z celów badań pewnego nadstopu kobaltu była ocena istotności zmian udziału
objętościowego węglików typu M23C6 (węgliki eutektyczne), wywołanych procesem prze-
sycania w temperaturze 1260ć%C przez 1 godzinę. Czy na podstawie pomiarów udziału
powierzchniowego tych węglików na serii tych samych próbek badanego nadstopu można
stwierdzić, że udział objętościowy (powierzchniowy AA), po zabiegu obróbki cieplnej, ob-
niżył się w stosunku do stanu wyjściowego (lanego)? Przyjąć poziom istotności ą = 0, 05.
Próba duża (n > 25)
W tym przypadku można korzystać z granicznego rozkładu normalnego, bo statystyka
T ma rozkÅ‚ad asymptotycznie zbieżny do N(m, Ã), gdzie
n(n + 1)
R = ,
2
R n(n + 1)
m = = ,
2 4

n(n + 1)(2n + 1)
à = ,
24
R - m
uemp = .
Ã
Gdy próba jest duża, to przed obliczeniem wartości statystyki u dokonujemy korek-
ty parametru Ã, bowiem rangi wiÄ…zane objawiajÄ… swojÄ… obecność wysmuklajÄ…c rozkÅ‚ad
normalny, którym zastepuje się dokładny rozkład sumy rang. Skorygowaną wartość pa-
rametru à oblicza się ze wzoru;


g


n(n + 1)(2n + 1) 1

à = - (t3 - tj),
j
24 48
j=1
2
gdzie g jest liczbÄ… grup skupiajÄ…cych rangi wiÄ…zane, a tj jest liczbÄ… wiÄ…zanych rang w
j-tej grupie (każda indywidualna ranga może być traktowana, jako grupa złożona z jednej
rangi wiązanej, co jak łatwo zauważyć nie ma wpływu na wartość sumy korekcyjnej).
Przykład 2
Na podstawie wieloletnich obserwacji ustalono, że cotygodniowa, przeciętna liczba
konsultacji (LK) z zakresu statystyki matematycznej, udzielonych studentom w trak-
cie roku akademickiego wynosi 4. Wysunięto przypuszczenie, że wprowadzone ostatnio
wyższe wymagania egzaminacyjne w nowym roku akademickim spowodują zwiększenie
tej liczby. Po jego zakończeniu zestawiono dane, dotyczące liczby udzielonych studen-
tom konsultacji. Czy hipoteza o zwiększonej liczbie cotygodniowych konsultacji znalazła
potwierdzenie w praktyce? Przyjąć poziom istotności ą = 0, 05.
Test znaków
W przypadku, gdy wartości cechy statystycznej wyrażone są w skali porządkowej (co
jest powszechne np. w medycynie) test dla par obserwacji i test Wilcoxona nie mogą być
zastosowane, ponieważ w obu tych testach wymagana jest co najmniej skala różnicowa
(interwałowa). W takich przypadkach stosuje się test znaków.
Wstępna faza postępowania w teście znaków jest dokładnie taka sama, jak w teście
Wilcoxona. Uzyskane różnice wartości obydwu serii pomiarowych mają na celu jedynie
uchwycenie kierunku zmiany.
Różnicom ujemnym (wskazującym, że wartość  po była niższa niż  przed ) przypi-
suje się znak  - , różnicom dodatnim  + .
Jeśli dla jakiegoś elementu próby różnica wynosi 0, to zostaje on z niej usunięty, a
liczebność próby zredukowana.
W teście znaków stawia się hipotezę zerową, która zakłada, że pomiędzy obserwacjami
 przed i  po nie ma istotnej różnicy. Oznaczając wartości serii  przed przez yi, a serii
 po przez xi, treść hipotezy zerowej można przedstawić następująco:
H0 : P (yi > xi) = P (yi < xi).
3
Hipoteza alternatywna dla takiej postaci H0 jest hipotezÄ… dwustronnÄ…, czyli
H1 : P (yi > xi) = P (yi < xi),

co oznacza, że sprawdza się jedynie, czy nastąpiła zmiana analizowanej cechy staty-
stycznej. Możliwe jest także weryfikowanie hipotez jednostronnych, o postaciach:
H0 : P (yi > xi) P (yi < xi) i H1 : P (yi > xi) > P (yi < xi),
co oznacza w tym przypadku sprawdzenie, czy nie wystapił istotny przyrost badanej
cechy wynikowej.
Przebieg testu  próba mała (n 35)
" Po ustaleniu znaków różnic różnych od 0 zliczamy znaki  + i  - uzyskując od-
powiednio n+ i n-.
" n = n+ + n-
" Jeżeli hipoteza zerowa jest prawdziwa, to liczba znaków  + i  - podlega rozkła-
dowi dwumianowemu z parametrem p = q = 1/2.
" Jeżeli n+ n-, to prawdopodobieństwo, że liczba znaków lz n+ jest równe
prawdopodobienstwu tego, że lz n- i wynosi
n+ n n n
i=0 i=n- i
i
P (lz n+) = = P (lz n-) .
2n 2n
" Wzór powyższy przy odwrotnej liczbie znaków, czyli n+ n- przyjmie postać:
n- n n n
i=0 i=n+ i
i
P (lz n-) = = P (lz n+) .
2n 2n
" Gdy weryfikowane hipotezy są jednostronne, wystarczy obliczyć wartość prawdopo-
dobieństwa p, wykorzystując jeden z powyższych wzorów i porównać z przyjętym
poziomem istotności ą.
" Jeżeli zajdzie relacja p > ą stwierdza się brak podstaw do odrzucenia H0, w prze-
ciwnym przypadku H0 odrzuca się na korzyść H1.
" Weryfikując hipotezy dwustronne porównuje się podwojoną wartość p z przyjętym
poziomem istotności.
Przebieg testu  próba duża (n > 35)
" Gdy n > 35 dwumianowy rozkład liczby znaków można zastąpić rozkładem nor-
malnym N(m, Ã), którego parametry wyznacza siÄ™ nastÄ™pujÄ…co:
n n
m = n · p = ; Ã2 = n · p · q = .
2 4
" Zmienna standaryzowana
lz - m
u =
Ã
przy prawdziwości hipotezy zerowej podlega rozkładowi normalnemu standaryzo-
wanemu N(0, 1).
4
" Ten zastępczy rozkład normalny lepiej aproksymuje rozkład dwumianowy, gdy w
procesie standaryzacji uwzględni się tzw. poprawkę na ciągłość.
n
(lz Ä… 0, 5) - 2lz Ä… 1 - n
2

u = = " .
n
n
4
" Wyznaczenie wartości p i porównanie z wartością poziomu istotności ą przebiega
dokładnie tak samo, jak w teście Wilcoxona, gdy liczebność próby przekracza 15.
Przykład 3
Za pomocą pięciostopniowej skali Likkerta (1  brak bólu, . . ., 5  ból nie do zniesienia)
grupa 17 osób oceniła nasilenie bólu przed i po przyjęciu pewnego preparatu przeciwbó-
lowego. Oceń na podstawie danych, przyjmując ą = 0, 05, skuteczność zwalczania bólu
za pomocÄ… tego preparatu.
5


Wyszukiwarka

Podobne podstrony:
Wyklad4 statystyka
Wyklad2 statystyka
wykład statystyka matematyczna cz 4
wykład 1 Statystyka
wykład10 statystyka
Wykład 2 statystyka opisowa
2010 TB wyklady statystyka
wykład5 statystyka
Wyklad1 statystyka
Wyklad3 statystyka
wykład3 statystyka
Wyklad 7 Nieparametryczne metody statystyczne PL [tryb zgodności]
Statystyka wyklad 7
wyklad 1 wprowadzenie statystyki oisowe
Wykłady z metod statystycznych
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 6
Statystyka wyklad 4
Statystyka wyklad4nowy

więcej podobnych podstron