Błędem pierwszego rodzaju (zwanym inaczej błędem pierwszego typu, błędem przyjęcia lub alfa-błędem) nazywamy błąd polegający na odrzuceniu hipotezy zerowej, która jest prawdziwa. Innymi słowy jest to błąd polegający na tym, że na podstawie wyników testu statystycznego twierdzimy, że jakiś fakt jest statystycznie istotny, natomiast w rzeczywistości jest on dziełem przypadku.
Prawdopodobieństwo popełnienia błędu pierwszego rodzaju równy jest α i nazywamy poziomem istotności testu.
Błędem drugiego rodzaju (zwanym inaczej błędem drugiego typu, błędem przyjęcia lub beta-błędem) nazywamy błąd polegający na przyjęciu hipotezy zerowej, która jest fałszywa. Innymi słowy jest to błąd polegający na tym, że na podstawie wyników testu statystycznego twierdzimy, że jakiś fakt jest dziełem przypadku, natomiast w rzeczywistości jest on statystycznie istotny.
Prawdopodobieństwo popełnienia błędu drugiego rodzaju równe jest β.
Przy utrzymaniu na stałym poziomie błędu I rodzaju można zmniejszyć błąd II rodzaju poprzez zwiększenie liczebności próby.
Błąd trzeciego rodzaju (zwany inaczej błędem typu trzeciego ) to pojęcie wprowadzone w 1968 roku przez statystyka Howarda Raiffa. Zaproponował on wprowadzenie błędu trzeciego rodzaju, czyli błędu polegającego na prawidłowym i dokładnym rozwiązaniu niewłaściwego problemu (np. przy niewłaściwie sformułowanej hipotezie zerowej).
Czasami nazwą błąd trzeciego rodzaju określa się też wszelkie inne błędy które mogą wyniknąć przy testowaniu hipotez, np. błąd wynikający z zaokrąglenia wartości statystyki testowej podczas obliczeń komputerowych.
Poziom istotności - prawdopodobieństwo popełnienia błędu pierwszego rodzaju, polegającego na odrzuceniu poprawnej hipotezy zerowej (α).
Poziom ufności - prawdopodobieństwo poprawnego wnioskowania (1-α).
Błąd standardowy średniej - odchylenie standardowe rozkładu średniej z próby.
Przedział ufności - przedział wartości prawdopodobnych.
Obszar krytyczny - obszar wartości nieprawdopodobnych.
MIARY TENDENCJI CENTRALNEJ
Są statystykami opisującymi rozkład proporcji.
Mediana - jest to 50. centyl, czyli taka wartość, przy której połowa obserwacji ma wartości nie większe od niej i równocześnie połowa obserwacji ma wartości nie mniejsze. W sytuacji parzystej liczby obserwacji, mediana jest średnią dwu środkowych obserwacji w próbie posortowanej rosnąco lub malejąco. W przeciwieństwie do średniej, na którą wpływ może mieć nawet kilka ekstremalnie dużych lub małych wartości, mediana jest miarą tendencji centralnej niewrażliwą na wartości odstające.
Modalna - najczęściej spotykana wartość.
Średnia - suma obserwacji dzielona przez ich liczbę.
MIARY ROZPROSZENIA
Statystyki mierzące zmienność lub rozrzut danych; obejmują miedzy innymi:
Odchylenie standardowe - miara rozproszenia wokół średniej, wyrażona w tych samych jednostkach co zmienna, równa pierwiastkowi kwadratowemu z wariancji.
Wariancja - miara rozproszenia wokół średniej, równa sumie kwadratów odchyleń od średniej podzielonej przez liczbę obserwacji minus jeden. Wariancja jest podawana w kwadratach jednostek, w jakich mierzona jest zmienna.
Rozstęp - różnica między największą a najmniejszą wartością zmiennej numerycznej; maksimum minus minimum.
Minimum - najmniejsza wartość zmiennej numerycznej.
Maksimum - największa wartość zmiennej numerycznej