dużego ośrodka onkologicznego, zaczęto poszerzać próbę, wprowadzając dalsze dane i kontrolując, jak wzrost N wpływa na wartość p. Okazało się, że porównywalną z testem Studenta moc testu Manna-Whitneya uzyskano przy Nu = 150 (oszacowanie p wynosiło wtedy 0,11 czyli moc osiągała poziom 89%).
Z definicji efektywności można więc stwierdzić, że efektywność testu U w stosunku do testu / oszacować można na
150
Warto dodać, że wyliczona w przykładzie wartość efektywności testu Manna-Whiuieya jest mniejsza od podawanej w literaturze wartości e = 95%.
9.2.1 Ogólna charakterystyka zadania
Omawiana w tym podrozdziale grupa testów nieparametrycznych, służących do porównywania populacji, pełni w zasadzie podobną rolę, jak rozważany poprzednio test /-Studenta. Poszukujemy odpowiedzi na pytanie: czy dwie rozważane populacje różnią się w sposób istotny, czy nic. O tym, że się różnią — upewnia nas wstępna analiza wyników (jeśli takiej różnicy nie dostrzegamy, wówczas bezcelowa jest cała analiza matematyczna, bo nic ma czego badać). O tym, że różnicy takiej oczekujemy, decyduje sposób rekrutacji danych do obydwu rozważanych populacji — najczęściej jedna z nich obejmuje pacjentów stanowiących przedmiot obserwacji, zaś dniga jest grupą kontrolną, stanowiącą punkt odniesienia. Pytanie jest zatem tylko jedno: czy obserwowana różnica jest przejawem jakiejś głębszej prawidłowości, czy też wynikła z przypadkowego zbiegu okoliczności?
W teście /-Studenta zakładaliśmy, że charakter rozkładu jest określony (normalny) oraz że badane rozkłady są zgodne we wszystkim z wyjątkiem różnicy wartości oczekiwanych. Obecnie żadnych takich założeń nic robimy, stawiając pytanie maksymalnie szeroko: czy obserwowane rozkłady różnią się, czy nie? Poznamy niżej kilka testów, przy pomocy których można poszukiwać odpowiedzi na to pytanie.
9.2.2 Test Walda-Wolfowitza (test serii)
Zaletą testu Walda-Wolfowitza jest prostota jego przeprowadzania, natomiast wadą — stosunkowo niska efektywność. W aktualnej sytuacji, kiedy strona rachunkowa przeprowadzanych rozważań obciąża z reguły jedynie komputery a zawiłości algorytmu wbudowane są w używany program — test ten ma stosunkowo mniejsze znaczenie i omawiamy go
175