pomiarem a pozostałymi są puste. Ale rozbieżność między tym obwodem a innymi jest faktem, którego przy opracowywaniu danych pominąć nie możemy. Z drugiej strony, skrócenie tabeli może być w pewnych okolicznościach bardzo wygodne. Gdyby wartość pomiaru mogła wykroczyć ponad 100 i gdyby kilka pomiarów leżało w odległości 10 lub więcej interwałów od reszty, sytuacja byłaby jeszcze trudniejsza. Istnieje kilka sposobów rozwiązania tego problemu. Po pierwsze, możemy zastosować przedziały klasowe o różnych długościach: przedziały krańcowe byłyby dłuższe niż środkowe. Jeśli na przykład najwyższy przedział umieścimy między 50,0 i 89,9, to znajdą się w nim dwa największe pomiary. Oczywiście, tracimy w ten sposób część informacji, gdyż obecnie mniej wiemy o wielkości tych pomiarów, niż uprzednio.
Po drugie, możemy najwyższy przedział klasowy określić jako otwarty. Może to na przykład być kategoria: „50% i więcej”. W ten sposób tracimy jeszcze więcej informacji. W tym przykładzie wartość pomiaru nie może być większa od 100%, ale jeśli najwyższy przedział klasowy przy pomiarze dochodu określimy jako „20000 dolarów lub więcej”, w żaden sposób nie będzie można stwierdzić, jakie najwyższe dochody wystąpiły w badanej grupie. W pewnych jednak sytuacjach nie jest to wcale konieczne. W naszym przykładzie zyski z wprowadzenia przedziału otwartego przeważają chyba nad stratami. Gdy rozkład ma bardzo małą liczbę przypadków znacznie różniących się od reszty, sposób ten jest często najlepszy. Faktyczne zarobki osób najwyżej uposażonych można przecież opisać w tekście. W następnym rozdziale przekonamy się, że gdy celem grupowania danych jest uproszczenie pewnych wyliczeń, a nie prezentacja rozkładu, przedziałów otwartych stosować nie należy.
Dokładne granice przedziałów. Czytelnik z pewnością zauważył, że określając granice przedziałów klasowych pozostawiliśmy między nimi małe luki. Ten sposób zapisu granic przedziałów stosuje się często w celu uniknięcia dwuznaczności. Gdyby granicami były liczby 10, 20, 30, itp., powstałby problem, do którego przedziału należy pomiar równy dokładnie 20,0. W rzeczywistości pewna dwuznaczność istnieje zawsze, niezależnie od sposobu określenia granicy przedziału. Zastanówmy się bowiem, gdzie zaklasyfikować pomiar leżący między 19,9 a 20,0. W naszych danych nie ma takiego pomiaru, lecz wynika to z faktu, że otrzymaliśmy jako dane surowe liczby już zaokrąglone. Postawmy więc pytanie: Jakie pomiary leżą faktycznie w granicach danego interwału, zakładając, że dane surowe są już liczbami zaokrąglonymi? Otóż dokładne granice przedziałów kłaso-wych nie są równe granicom podanym w tabelach. Jeśli w pewnym obwodzie frekwencja wynosiła 19,95%, to zgodnie z regułami zaokrąglania podajemy ten pomiar jako 20,0% i umieszczamy go w przedziale 20,0-29,9. Gdyby frekwencja była nieco niższa od 19,95%, zaokrąglilibyśmy tę liczbę do 19,9% i umieścili ją w przedziale niższym. Dlatego dokładne granice przedziałów są następujące:
0,0 - 9,95
9,95-19,95 19,95-29,95 itp.
Widzimy, że poza pierwszym przedziałem wszystkie mają długość 10 jednostek (a nie 9,9) i że górna granica każdego przedziału jest równa dolnej granicy następnego1. Nie grozi nam jednak z tego powodu niejednoznaczność klasyfikowania, gdyż pomiar równy na przykład dokładnie 9,95000 należy zgodnie z regułami zaokrąglić do 10,0 i zaliczyć do przedziału 9,95-19,952 3 4. Możemy więc każdy przypadek zaliczyć do właściwego przedziału. Zauważmy, że jeśli zaokrąglamy zawsze do najbliższej liczby o mniejszej liczbie znaków dziesiętnych, jak to właśnie powinno się robić, faktyczna granica przedziałów wypada w połowie luki między granicami określonymi w tabeli 4.2. Na przykład dokładna granica 19,95 znajduje się pośrodku odcinka między 19,9 i 20,0. Zwykle prezentujemy pomiary tak, by zaznaczyć stopień dokładności procesu mierzenia, np. wynik 10,45 świadczy o pomiarze z dokładnością do dwóch miejsc po przecinku, wynik 10,450 — o dokładności trzech miejsc po przecinku, a wynik 10,4 — o dokładności jednego miejsca. Dokładność pomiaru powinna być również uwzględniona przy określaniu granic przedziałów klasowych tak, by czytelnik mógł łatwo znaleźć faktyczne granice i wykorzystać je przy obliczeniach. Gdy na przykład określony jest przedział 10,00-19,99, to dokładność pomiaru wynosi 0,01, zaokrąglenia przeprowadzono do najbliższej 1/100, a dokładne granice przedziału są 9,995
49
Jeśli granicą najniższego przedziału jest zero, a wartości pomiaru nie mogą być ujemne (np. są odsetkami), uważamy wtedy wszystkie przedziały za jednakowo szerokie i przyjmujemy, że dolną granicą najniższego przedziału jest faktycznie —0,05, a wyniki zostały zaokrąglone do 0,00.
Zauważmy, że stosowany przez nas podział na przedziały klasowe daje bardzo niewielką niedokładność, gdyż przypadki znajdujące się dokładnie pośrodku między
przedziałami klasowymi należy zawsze zaliczać do wyższego przedziału. W praktyce niedokładność tę z reguły można pominąć.
— Statystyka dla socjologów