Wszystkie statystyczne metody opracowywania danych i wnioskowania oparte są na pewnych założeniach, które to założenia nie zawsze sq w dostatecznym stopniu spełnione. Piszemy, że założenia nie są spełnione w dostatecznym stopniu, a nic po prostu, że nie są spełnione, gdyż stwierdzenie tego (aktu z całkowitą pewnością jest niemożliwe ze względu na brak ostrych kryteriów takiego osądu oraz losowy charakter samych danych. Jednakże często prawdopodobieństwo niezgodności danych z założeniami jest dostatecznie duże. aby postulować potrzebę wstępnego przekształcenia danych pierwotnych x za pomocą pewnej transformacji f(x):
y =/(-'*) (2.1)
tak aby uzyskane przekształcone dane charakteryzowały się dużym prawdopodobieństwem zgodności z założeniami określonej metody statystycznej.
Konkretyzując, na ogół dokonujemy przekształcenia (2.1) w jednym z trzech poniższych celów:
1) stabilizacja wariancji,
2) linearyzacja zależności między dwiema cechami,
3) normalizacja rozkładu.
Wariancja jest miarą rozrzutu danych wokół średniej. Często przychodzi nam analizować kilka podgrup danych różniących się średnimi. Znamy bardzo wygodną metodę przeprowadzania badań statystycznych w takich przypadkach, a mianowicie analizę wariancji (por. rozdział 7). Metoda ta wymaga jednak, aby rozrzut wewnątrz poszczególnych podgrup wokół średnich w tych podgrupach był w przybliżeniu jednakowy dla wszystkich podgrup. Jeżeli tak nic jest i miara tego rozrzutu (tzw. wariancja resztowa) jest pewną funkcją wartości średniej w podgrupach
c2 (x) = <t> (E (*)1 (2.2)
to w celu stabilizacji wariancji można przed przystąpieniem do analizy dokonać takiego wstępnego przekształcenia danych (2.1), aby w przybliżeniu była spełniona zależność:
(2.3)
dy const dx ~ \'o2 (x)
Drugi cel przekształceń wstępnych to linearyzacja zależności między dwiema cechami. Jeżeli dla elementów pewnej zbiorowości będziemy znali wartości dwu zmiennych o charakterze ilościowym (np. dla grupy niemowląt wagę urodzeniową i przyrost wagi między
15