w opraciu o dane obciążone przypadkowym rozrzutem — trzeba uwzględnić ten rozrzut w procesie wnioskowania i trzeba umieć formułować pewne sądy w oparciu o niepewne dane. Techniką używaną w tym celu są tak zwane testy statystyczne. W rozdziale piątym opisano najpopularniejsze testy umożliwiające wnioskowanie na podstawie danych ilościowych a w rozdziale szóstym — test chi-kwadrat przeznaczony dla danych jakościowych.
Uogólnieniem techniki testów statystycznych jest tak zwana analiza wariancji opisana w rozdziale siódmym. Ta bardzo pożyteczna technika statystyczna powinna być znacznie częściej stosowana!
Testy zazwyczaj służą do wykrywania różnic między zmiennymi, natomiast w biologicznych i medycznych zastosowaniach biometrii równic często poszukujemy związków pomiędzy nimi. Rutynową techniką służącą do oceny istnienia (lub braku) tych związków jest obliczanie korelacji, zaś metodą matematycznego opisu zachodzących powiązań jest technika regresji. Obydwie opisano w rozdziale ósmym. Rozdział ten bezwzględnie powinien być przestudiowany przez każdego studenta nawet w wypadku pominięcia niektórych wcześniejszych rozdziałów!
Testy opisane w rozdziałach 5, 6 i 7 zakładały (niejawnie), że przedmiotem zainteresowania badacza są pewne parametry dotyczące rozważanych zmiennych, na przykład wartości średnic w testach Studenta i w analizie wariancji. Czasami zachodzi jednak potrzeba oceny danych bez odwoływania się do jakichkolwiek parametrów — na przykład w celu oceny charakteru rozkładu. W takim wypadku konieczne jest stosowanie testów nieparametrycznych, opisanych stosunkowo obszernie w rozdziale dziewiątym. Rozdział ten kończy pierwszą część skryptu, dotyczącą statystyki jednowymiarowej.
Dyskusja metod wielowymiarowych rozpoczyna się oddzielnym wprowadzeniem w rozdziale dziesiątym. Warto go uważnie przestudiować, gdyż dostarcza on całościowego spojrzenia na zagadnienia wielowymiarowej analizy danych, które — chociaż trudne — są szczególnie wartościowe w zastosowaniach.
Dyskusja metod wielowymiarowych rozpoczyna się od opisu i analizy zmiennych wielowymiarowych (w rozdziale dziesiątym). Na tle tej dyskusji wprowadzona jest (w następnym, jedenastym rozdziale) najpopularniejsza technika wielowymiarowej analizy danych, mianowicie wielowymiarowa analiza wariancji. Ta ważna problematyka, uzupełniona analizą dyskryminacyjną oraz opisem metod regresji wielokrotnej (z uwzględnieniem także w rozdziale dwunastym regresji nieliowej. która z obliczeniowego punktu widzenia traktowana musi być jako wielowymiarowa nawet w przypadku zmiennych skalarnych), tworzy zrąb najczęściej stasowanych metod biometrii wielowymiarowej. Skrypt domykają dwa rozdziały tyczące bardziej wyrafinowanych metod analizy korelacji kanonicznych w rozdziale czternastym i analizy czynnikowej oraz jej odmiany zwanej analizą głównych składowych w rozdziale piętnastym.
11