9.3.1 Uwagi wprowadzające
W wiciu metodach statystycznych możliwość zastosowania określonej metody postępowania warunkowana jest tym. że dane muszą podlegać określonemu, ustalonemu rozkładowi prawdopodobieństwa (na przykład test r-Studcnta możliwy jest do zastosowania wyłącznie dla danych o rozkładzie normalnym). Z tego względu zadanie identyfikacji charakteru rozkładu jest w biometrii jednym z ważniejszych i jednym z (niestety) częściej pomijanych.
Przeświadczenie o tym, że dane mają określony rozkład ma z reguły charakter intuicyjny i nieświadomość potrzeby weryfikacji lego założenia jest stałym elementem badań statystycznych. Tymczasem rozbieżność między postulowanym (najczęściej normalnym) a rzeczywistym charakterem rozkładu może być źródłem wyjątkowo przykrych rozczarowań przy stosowaniu metod statystycznych. Dlatego zalecany sposób postępowania musi obejmować weryfikację charakteru rozkładu ilekroć zamierzamy zastosować techniki statystyczne wymagające danych o określonym rozkładzie. W ogólnym wypadku weryfikacja charakteru rozkładu jest zadaniem trudnym właśnie dlatego, że jest to zadanie z samej swojej natury nieparametryczne. W odniesieniu do rozkładów wielowymiarowych problem identyfikacji (w szerokim tego słowa znaczeniu) rozkładu jest jednym z najtrudniejszych zadań statystyki.
Jest jednak zadanie, które jest szczególnie ważne z praktycznego punktu widzenia, a które stosunkowo łatwo rozwiązać. Chodzi o sprawdzenie, czy rozważany zbiór danych spełnia założenie, że dane te zaczerpnięte zostały z populacji o rozkładzie normalnym. Warto podkreślić, że chodzi o jednowymiarowy rozkład normalny, gdyż rozkład wielowymiarowy nic może być weryfikowany lak łatwo. Wspomniane zadanie rozwiązać można z użyciem tak zwanego testu k-Kołmogorowa, który teraz dokładniej opiszemy.
9.3.2 Test X-Kołmogoro\va
Opisywany test opiera się na następujących zasadach: chcąc stwierdzić, że obserwowane dane podlegają określonemu rozkładowi (najczęściej normalnemu), sporządzamy dystry-buantę (empiryczną) obserwowanego rozkładu analizowanych danych i porównujemy ją z dystrybuantą założonego rozkładu teoretycznego. Podstawą do podjęcia decyzji jest maksymalna wartość różnicy pomiędzy dystrybuantą empiryczną i teoretyczną. Warto zwrócić uwagę, że test ten jest pod wieloma względami podobny do testu Kolmogoro-wa-Smimowa, chociaż cel jego stosowania jest w tym wypadku zdecydowanie inny.
Punktem wyjścia do obliczeń jest uporządkowanie ocenianych obserwacji ..., xN w ciąg o rosnących wartościach Dla dalszych obliczeń wygodne jest pogrupowanie
188