jest to potrzebne, wystarcza dokładność do jednego roku, albo jeszcze dłuższego przedziału czasu, tak jak to ma miejsce w tabeli 2.3.
Tabela 2.3
Rozkład wieku pacjentów z nowotworem płuc w pewnym szpitalu (według [ArmitageJ)
Wick |
Liczba pacjentów |
Udział (frakcja) |
25 + 34 |
17 |
0,012 |
35+44 |
116 |
0,087 |
45 + 54 |
493 |
0,363 |
55 + 64 |
545 |
0,401 |
65 + 74 |
186 |
0,137 |
Ogółem |
1357 |
1,000 |
Niejednokrotnie, zwłaszcza gdy obserwacji nie mamy zbyt wiele, nie możemy zadowolić się takimi zbiorczymi zestawieniami, jakich przykładem jest tabela 2.3 i które nazywamy szeregiem rozdzielczym, a musimy uwzględniać dokładne ilościowe wartości wszystkich obserwacji i dopiero na takiej podstawie dokonywać badania statystycznego. Najważniejszą cechą danych jest to. że dane tego typu pozwalają korzystać — bez żadnych ograniczeń — z wszelkich działań arytmetycznych. Zasady przetwarzania danych typu ilościowego są znacznie wygodniejsze i prowadzą do znacznie bardziej precyzyjnych wyników. Warto zauważyć, że dane ilościowe — na przykład poprzez agregację — zawsze można sprowadzić do postaci analogicznej do danych jakościowych i w ten sposób korzystać z metod wyspecjalizowanych do analizy danych tego typu. Podobna zamiana w drugą stronę na ogół jest niemożliwa. (Jakkolwiek istnieją próby tworzenia technik „wzmacniania” skal przy wykorzystaniu informacji pobocznych — por. prace J. Pociechy).
Dane ilościowe dzielimy niejednokrotnie na obserwacje o charakterze ciągłym i dyskretnym. Obserwacje dyskretne mogą przyjmować tylko określone wartości, na przykład może to być pomiar polegający na policzeniu czegoś i wyrażony tylko w liczbach całkowitych (np. liczba dzieci). Obserwacje ciągłe mogą przyjmować w zasadzie dowolne wartości z określonego przedziału. Przykładem takich danych medycznych może być temperatura ciała, ciśnienie krwi. wzrost, ciężar ciała itp.
14