Średnia, mediana i kwattyle należą do grupy charakterystyk nazywanych miarami położenia. Określają one średni lub typowy poziom wartości zmiennej, czyli przedstawiają przeciętny poziom badanej cechy.
Rozstęp, wariancja i odchylenie standardowe charakteryzują zmienność (rozproszenie) badanej cechy i dlatego nazywane są miarami zmienności.
Współczynnik asymetrii (skośność) określa kierunek i siłę asymetrii rozkładu danych. Współczynnik asymetrii równy zero (gi ■ 0) wskazuje na symetrię rozkładu zmiennej. Wartość dodatnia (gi > 0) oznacza asymetrię prawostronną (rozkład ma dłuższy prawy „ogon”), natomiast wartość ujemna (gi < 0) oznacza asymetrię lewostronną (rozkład ma dłuższy Iowy „ogon”).
(Współczynnik skupienia (kurioza) opisuje koncentrację wartości badanej cechy wokół średniej. Jeżeli kurioza jest ujemna (K < 0), to rozkład jest bardziej spłaszczony od rozkładu normalnego, a jeżeli kurioza jest dodatnia (K > 0), to rozkład jest bardziej wysmukły niż normalny. Im większa jest wartość kuriozy, tym rozkład jest bardziej wysmukły, czyli występuje większa koncentracja cechy wokół wartości średniej.
Wygodnym sposobem przedstawienia danych obserwowanych pozwalających na wizualne poznanie rozkładu danych jest ich prezentacja graficzna. W tym celu, przy dostatecznie dużej liczbie danych (n > 30). można je przedstawić w postaci tzw. szeregu rozdzielczego (tabeli liczebności). Tworzy się go dzieląc przedział zmienności [xan, XmwJ na zadaną liczbę k klas o równej długości i obliczając liczbę danych m (liczebność) należących do kolejnych klas. Wybór liczby klas jest w zasadzie dowolny. Należy jednak pamiętać, żc zbyt duża liczba klas (tym samym zbyt wąskie przedziały klasowe) nie daje przejrzystego obrazu, ujawniają się przypadkowe odchylenia. Zbyt mała liczba klas zaciera istotne szczegóły zawarte w danych. Można tutaj skorzystać z podawanego w piśmiennictwie (7] wzoru na liczbę klas:
k= 1 + 3,3 logn. v O-8)
Graficznym sposobem przedstawienia informacji zawartych w szeregu rozdzielczym jest histogram liczebności (częstości). Jest to wykres słupkowy, w którym wysokość słupka jest proporcjonalna do liczebności. Jeżeli liczby obserwacji w klasach zostaną podzielone przez całkowitą liczbę danych n, otrzyma się alternatywną formę interpretacji danych zwaną histogramem liczebności względnej. Często też korzysta się z szeregu rozdzielczego w postaci skumulowanej, w którym liczebność danej klasy zastępuje się liczbą obserwacji należących do danej klasy i wszystkich ją poprzedzających. Wówczas dane mogą być przedstawione w postaci histogramu liczebności skumulowanej lub histogramu skumulowanej liczebności względnej.
Przyjmuje się założenie, że dane mają rozkład normalny N(p, o ) Z nieznaną wartością oczekiwaną p i nieznaną wariancją o3. Najlepszym estymatorem wartości oczekiwanej (średniej) p jest średnia arytmetyczna z próby x. Jest to estymator zgodny, nicobciążony i o najmniejszej wariancji. Najlepszym estymatorem wariancji <r zmiennej losowej jest
8