22 Janusz Buga, Helena Kassyk-Rokicka
Korzystając z danych ostatniej kolumny tablicy 6 powiemy, że np. gospodarstwa domowe złożone z trzech osób stanowiły w analizowanym okresie 20,3% wszystkich gospodarstw, a gospodarstwa złożone z sześciu osób stanowiły 4,3% całości itd. Możliwe są przypadki, że analizując strukturą badanej zbiorowości zamiast liczebności będziemy posługiwali się odpowiednimi wskaźnikami struktury. Ważne jest przy tym sprawdzienie, czy suma wskaźników struktury równa się 1 (lub 100%).
Rozpatrywany wyżej przykład (tablice 5 i 6) wykorzystywał dane już uporządkowane, ujęte w szereg rozdzielczy ze stosunkowo małą liczbą wariantów badanej cechy. Sprawa się nieco komplikuje, gdy otrzymujemy materiał statystyczny nieuporządkowany, z dużą liczbą wariantów danej cechy i dużą liczbą jednostek. Utworzenie z takiego materiału szeregu prostego jest praktycznie niewykonalne, a co najmniej technicznie bardzo żmudne. Z tych m.in. względów niezbędne okazuje się ujęcie wartości cechy w przedziały klasowe, oraz przyporządkowanie każdemu z nich liczebności badanych jednostek.
Przypuśćmy, że zgromadzono dane o wysokości średnich miesięcznych wydatków na higienę w wybranych gospodarstwach domowych pewnego województwa w roku 1998, które przedstawiały się następująco (w PLN):
Województwo Z
5,8,9,11,13,10, 12, 7, 15,16,17
6, 7,21,25,30,22,19, 16,30,35
40,45, 50, 60,55, 42,47, 49, 53, 62, 55
67, 70, 71, 73,78, 82, 85, 88,90, 95, 100,105.
Nietrudno zauważyć, że zbudowanie szeregu rozdzielczego dla powyższych danych nie jest sprawą tak prostą, jak to miało miejsce w tablicy 5. Najpierw musimy utworzyć przedziały klasowe dla badanej cechy, a następnie każdemu z nich przyporządkować liczbę gospodarstw, których wydatki na higienę mieszczą się w danej klasie wydatków. Pierwsze pytanie, na które musimy udzielić odpowiedzi, to kwestia liczby przedziałów klasowych. Ile ich powinno być, aby nie została pominięta żadna z zebranych informacji liczbowych. Wspomnieliśmy poprzednio, że jeden z postulatów formalnych mówi, że liczba przedziałów k może być w przybliżeniu równa pierwiastkowi kwadratowemu z liczby obserwacji, a więc w tym przypadku k - V44 «6,6, czyli po zaokrągleniu 7. Analityk musi spojrzeć na tę liczbę przede wszystkim z punktu widzenia poznawczego. Czy w związku z tym chcemy uzyskać szczegółowe informacje o rozkładzie badanej cechy, czy też wystarczy dla realizacji celu mieć informacje bardziej ogólne. W pierwszym przypadku liczba przedziałów klasowych powinna być stosunkowo duża, a ich długość relatywnie mała, w drugim przypadku - odwrotnie. Przypuśćmy, że rozkład wydatków na higienę i związany z tym stopień ich szczegółowości może być ujęty w sposób bardziej ogólny (bardziej syntetycznie). Jeżeli tak, to możemy przyjąć, że badaną cechę ujmiemy w siedem przedziałów klasowych, każdy o jednakowej długości równej 15 (PLN). Otrzymamy następujący układ przedziałów klasowych:
0-15
15-30
30-45
45-60
60-75
75-90
90-105.
Następnie należy przyporządkować każdemu przedziałowi wartości cechy liczbę rodzin o średnich miesięcznych wydatkach na higienę odpowiadających danemu przedziałowi. Ostatecznie, szereg rozdzielczy tlln analizowanej cechy uzupełniony o wielkości wskaźników struktury mu postać, jak w tablicy 7.
Na przykładzie tej tablicy omówimy kilka ważnych kwestii pogłębiających wiedzę o badaniu struktury zjawisk. Najpierw jednak istotna uwaga dotycząca zapisu przedziałów klasowych w takiej postaci, jak to ma miejsce właśnie w tablicy 7. Otóż przy klasyfikowaniu jednostek do poszczególnego przedziału natrafiamy na trudność wynikającą z przyporządkowania tych jednostek, które przyjmują wartości graniczne. Np. poziom wydatków równy 15 PLN może być zaliczany do pierwszej klany, jak i do drugiej. Aby uniknąć tej niejednoznaczności, musimy