12 Janusz Buga, Helena Kassyk-Rokicka
1.6. Ogólne zasady prezentacji danych statystycznych1
Od właściwej prezentacji danych zależy nie tylko poprawna ocena przebiegu zjawiska, jego interpretacja oraz wykorzystanie do analiz prognostycznych, lecz także wyrobienie sobie ogólnego jego obrazu. Chodzi o to, że zanim przystąpimy do bardziej szczegółowych analiz danych opisujących konkretne zjawisko, dobrze jest wyrobić sobie ogólny pogląd o nim, co w wielu przypadkach ułatwia zastosowanie adekwatnej do jego charakteru metodologii.
Opis badanej populacji (niezależnie czy jest to zbiorowość generalna, czy próbka) opieramy na tzw. szeregu statystycznym. Jest on zbiorem (zestawem) liczb, który w sposób możliwie zwarty opisuje badaną populację. Wśród szeregów statystycznych szczególne miejsce zajmuje tzw. szereg rozdzielczy. Jest to szereg, który niejako rozdziela całą populację na części wg wartości (lub odmian) cechy będącej przedmiotem badania. Tak więc szereg rozdzielczy pokazuje rozłożenie się różnych wartości (odmian) cechy na poszczególne jednostki populacji. Można więc powiedzieć, że jest on swoistym obrazem rozkładu cechy w populacji. Skrótowo określamy to mianem rozkładu populacji.
Zacznijmy od najprostszego przykładu rozkładu cechy w populacji, a mianowicie od cechy jakościowej. Przypuśćmy, że badaną cechą jest poziom wykształcenia. Wyróżnimy trzy poziomy wykształcenia, lub mówiąc inaczej trzy odmiany cechy. Odpowiedni szereg rozdzielczy ma następuj ącą postać:
Tabl. 1. Ludność Polski wg poziomu wykształcenia w roku 1994
Poziom wykształcenia |
Liczba osób w tysiącach |
podstawowe |
15 015 |
średnie |
7 020 |
wyższe |
1 515 |
Źródło: Dane umowne
Jak widzimy, każdej odmianie cechy zostały przyporządkowane liczebności, dzięki czemu otrzymaliśmy szereg rozdzielczy.
Weźmiemy teraz pod uwagę cechę ilościową (mierzalną). W tym przypadku musimy się liczyć z faktem, że liczba odmian cechy może być bardzo duża. Zacznijmy od szeregu rozdzielczego o małej liczbie odmian (czasami mówi się o liczbie wariantów cechy). Przedmiotem badania były rodziny zamieszkujące kilka bloków mieszkalnych w pewnym osiedlu.
Tabl. 2. Liczba osób w rodzinie na osiedlu Z w 1998 r.
Liczba osób w rodzinie |
Liczba rodzin |
1 |
14 |
2 |
20 |
3 |
30 |
4 |
10 |
5 |
4 |
6 |
2 |
W tym konkretnym przypadku występuje zaledwie 6 odmian cechy, a zatem odpowiedni szereg rozdzielczy jest dość prosty. W pierwszej kolumnie znajdują się odmiany badanej cechy, którymi są liczby osób w rodzinie. W drugiej kolumnie występują liczebności rodzin odpowiadające poszczególnym odmianom cechy. Z bardziej złożoną sytuacją mamy do czynienia wówczas, gdy badane zjawisko charakteryzuje się dużą liczbą odmian badanej cechy. Wtedy całą populację dzielimy na grupy tak, aby określić (wyznaczyć) przedziały wartości cechy, do których przyporządkujemy te elementy populacji, które charakteryzują się wartościami cechy należącymi do konkretnego przedziału. Tworząc przedziały wartości cechy (będziemy je również nazywali przedziałami klasowymi) dla określonej populacji dążymy w miarę możliwości do spełnienia trzech postulatów - należy: po pierwsze, tworzyć przedziały n jednakowej długości, po drugie, tworząc odpowiednie długości przedziałów kierować się merytorycznymi przesłankami analizy, po trzecie, dążyć do konstrukcji tablicy o niezbyt dużej liczbie przedziałów.
Por. W. Sadowski, op.cil, s. 23 i dalsze.