Przy większej liczebności próby, w celu ułatwienia analizy, wartości próby grupuje się w klasach (prze-działach) najczęściej jednakowej długości, przyjmując upraszczające założenie, że wszystkie wartości znajdujące się w danej klasie są identyczne ze środkiem klasy.
Szereg rozdzielczy stanowią poszczególne klasy (lub środki klas xi) oraz ich liczebności ni.
klasy
[ x 1 , x 2] ( x 2 , x 3] . . . . . . ( xk, xk+1]
liczebności
n 1
n 2
. . . . . .
nk
Niech y 1 , . . . , yn próba prosta pobrana z populacji1.
R = y max − y min nazywamy rozstępem badanej cechy w próbie, gdzie: y min = min {y 1 , . . . , yn}, y max = max {y 1 , . . . , yn}.
Istnieje kilka reguł ustalania orientacyjnie liczby klas szeregu rozdzielczego w zależności od liczebności próby, my przyjmiemy następujące kryterium:
√
k ≈
n
Jako długość klasy przyjmuje się liczbę b ≈ R , ale tak by bk > R.
k
Środek pierwszej klasy wyznaczymy korzystając ze wzoru:
x 1 = y min + b ,
2
środki kolejnych klas korzystając z zależności:
xi = xi− 1 + b, gdzie i = 2 , . . . , k.
Mając środki klas możemy wyznaczyć poszczególne klasy:
h
i
x 1 − b , x
− pierwsza klasa ,
2
1 + b
2
i
xi − b , x
− i-ta klasa, gdzie i = 2 , . . . , k.
2
i + b
2
Liczbę elementów próby zawartych w i-tej klasie nazywamy liczebnością i-tej klasy i oznaczamy k
X
symbolem ni. Oczywiście
ni = n, ponadto:
i=1
k
X
wi = ni oznacza częstość i-tej klasy, w
n
i = 1,
i=1
i
X
fi =
ws oznacza częstość skumulowaną i-tej klasy.
s=1
Sposób w jaki liczebności ni są rozłożone w poszczególnych klasach, nazywamy rozkładem liczebności badanej cechy przy danej liczbie k klas.
Szereg rozdzielczy można przedstawić graficznie w postaci:
• histogramu liczebności − na osi poziomej zaznacza się klasy, na osi pionowej ich liczebności,
• histogramu częstości − na osi poziomej zaznacza się klasy, na osi pionowej ich częstości,
• histogramu częstości skumulowanej − na osi poziomej zaznacza się klasy, na osi pionowej ich częstości skumulowane.
Jeśli dysponujemy danymi przedstawionymi w postaci szeregu rozdzielczego to średnią oraz wariancję2
z próby wyznaczamy według poniższych wzorów:
k
k
X
X
x = 1
x
( x
n
ini,
s 2 = 1 n
i − x)2 ni
i=1
i=1
1Przed przystąpieniem do budowy szeregu rozdzielczego warto uporządkować rosnąco wartości próby.
2Gdy rozkład liczebności badanej cechy ciągłej jest jednomodalny, liczebności klas zaś maleją do zera w obu kierunkach, wtedy od wariancji obliczonej dla utworzonego szeregu rozdzielczego - w celu dokładniejszego jej obliczenia - odejmuje się pewną poprawkę uwzględniającą skutki grupowania w klasy. Poprawka ta - zwana poprawką Shepparda jest równa b 2 .
12
Poprawkę Shepparda stosuje się w praktyce, gdy n 1000 , k 20. Poprawki Shepparda nie stosuje się, gdy rozkład liczebności badanej cechy jest antymodalny (typu U lub J ) lub silnie asymetryczny.