Szereg rozdzielczy

Przy większej liczebności próby, w celu ułatwienia analizy, wartości próby grupuje się w klasach (prze-działach) najczęściej jednakowej długości, przyjmując upraszczające założenie, że wszystkie wartości znajdujące się w danej klasie są identyczne ze środkiem klasy.

Szereg rozdzielczy stanowią poszczególne klasy (lub środki klas xi) oraz ich liczebności ni.

klasy

[ x 1 , x 2] ( x 2 , x 3] . . . . . . ( xk, xk+1]

liczebności

n 1

n 2

. . . . . .

nk

Niech y 1 , . . . , yn próba prosta pobrana z populacji1.

R = y max − y min nazywamy rozstępem badanej cechy w próbie, gdzie: y min = min {y 1 , . . . , yn}, y max = max {y 1 , . . . , yn}.

Istnieje kilka reguł ustalania orientacyjnie liczby klas szeregu rozdzielczego w zależności od liczebności próby, my przyjmiemy następujące kryterium:

√

k ≈

n

Jako długość klasy przyjmuje się liczbę b ≈ R , ale tak by bk > R.

k

Środek pierwszej klasy wyznaczymy korzystając ze wzoru:

x 1 = y min + b ,

2

środki kolejnych klas korzystając z zależności:

xi = xi− 1 + b, gdzie i = 2 , . . . , k.

Mając środki klas możemy wyznaczyć poszczególne klasy:

h

i

x 1 − b , x

− pierwsza klasa ,

2

1 + b

2

i

xi − b , x

− i-ta klasa, gdzie i = 2 , . . . , k.

2

i + b

2

Liczbę elementów próby zawartych w i-tej klasie nazywamy liczebnością i-tej klasy i oznaczamy k

X

symbolem ni. Oczywiście

ni = n, ponadto:

i=1

k

X

wi = ni oznacza częstość i-tej klasy, w

n

i = 1,

i=1

i

X

fi =

ws oznacza częstość skumulowaną i-tej klasy.

s=1

Sposób w jaki liczebności ni są rozłożone w poszczególnych klasach, nazywamy rozkładem liczebności badanej cechy przy danej liczbie k klas.

Szereg rozdzielczy można przedstawić graficznie w postaci:

• histogramu liczebności − na osi poziomej zaznacza się klasy, na osi pionowej ich liczebności,

• histogramu częstości − na osi poziomej zaznacza się klasy, na osi pionowej ich częstości,

• histogramu częstości skumulowanej − na osi poziomej zaznacza się klasy, na osi pionowej ich częstości skumulowane.

Jeśli dysponujemy danymi przedstawionymi w postaci szeregu rozdzielczego to średnią oraz wariancję2

z próby wyznaczamy według poniższych wzorów:

k

k

X

X

x = 1

x

( x

n

ini,

s 2 = 1 n

i − x)2 ni

i=1

i=1

1Przed przystąpieniem do budowy szeregu rozdzielczego warto uporządkować rosnąco wartości próby.

2Gdy rozkład liczebności badanej cechy ciągłej jest jednomodalny, liczebności klas zaś maleją do zera w obu kierunkach, wtedy od wariancji obliczonej dla utworzonego szeregu rozdzielczego - w celu dokładniejszego jej obliczenia - odejmuje się pewną poprawkę uwzględniającą skutki grupowania w klasy. Poprawka ta - zwana poprawką Shepparda jest równa b 2 .

12

Poprawkę Shepparda stosuje się w praktyce, gdy n ­ 1000 , k ­ 20. Poprawki Shepparda nie stosuje się, gdy rozkład liczebności badanej cechy jest antymodalny (typu U lub J ) lub silnie asymetryczny.