Statystyka – rozumowanie na podstawie liczb umożliwiające wykrycie prawidłowości wśród pozornie chaotycznych zjawisk masowych – XVII w., Anglia.
Zbiorowość statystyczna – zbiór wszystkich elementów nieidentycznych, które podlegają badaniu.
Populacja próbna – stanowić ją może grupa lub podzbiór jednostek lub elementów całej populacji, który podlega badaniu ze względu na rozpatrywaną cechę. Na podstawie próby wnioskujemy na tę zbiorowość.
Cechy statystyczne – własności charakteryzujące każdą jednostkę statystyczną. Dzielimy je na:
- Mierzalne (ilościowe) ciągłe i skokowe – prezentujemy na skali interwałowej lub ilorazowej – warianty tych cech mogą przyjmować postać ciągłą lub skokową
- Niemierzalne (jakościowe) prezentu – prezentujemy na skali nominalnej lub porządkowej – warianty tych cech mogą przyjmować postać tylko opisu słownego
Skale pomiarowe:
- nominalna/dychotomiczna (miejsce zamieszkania, płeć – opis słowny)
- ilorazowa/stosunkowa/przedziałowa (cena w zł, napięcie elektryczne, inflacja, bezrobocie, masa, czas wykonywania danej czynności, czas przejazdu z miasta do miasta – stosunki między dwiema wartościami)
- porządkowa (wykształcenie, stan zdrowia, stan finansów, kolejność zawodników na podium – grupowanie jednostek w klasy/kategorie, wartości mają określony porządek)
- interwałowa (daty, temperatura w stopniach Celsjusza – można obliczać różnicę i zrobić sensowną interpretację, ale dzielenie nie ma sensu)
Grupowanie danych i szeregi rozdzielcze – graficzna prezentacja materiału:
Szereg szczegółowy – wypisanie wszystkich wartości.
Szereg rozdzielczy punktowy – realizacja zmiennej którą badamy, ilość wariantów, które przyjęła.
Szereg rozdzielczy klasowy (przedziałowy) –
Konstrukcja szeregu rozdzielczego z przedziałami klasowymi:
Ustalenie liczby klas – k:
Liczba klas zależy od:
- ilości obserwacji
- obszaru zmienności danej cechy (różnica między max a min)
- celu badania
Im liczniejsza zbiorowość i większy obszar zmienności, tym więcej przedziałów być powinno.
Liczba obserwacji | Ilość zalecanych klas |
---|---|
40-60 | 6-8 |
60-100 | 7-10 |
100-200 | 9-12 |
200-500 | 13-17 |
k ≈ $\sqrt{n}$
Ustalenie rozpiętości przedziału klasowego (dla badanej cechy) – h lub i
Rozstęp R= xmax – xmin
h(i)≈ $\frac{x_{\max} - x_{\min}}{k} \approx \frac{R}{k}$ gdzie k = $\sqrt{n}$
Ustalenie granic poszczególnych klas.
Problem oznaczania przedziałów.
Nierówne rozpiętości klas (przedziałów wartości) wynikają z tego, że poszczególnym grupom tonażowym odpowiadają różne typy statków o różnym przeznaczeniu przewozowym
Zad. 1: W pewnej liczbie kurierskiej przeciętny koszt przesyłki w zależności od wagi w ciągu 16 dni był następujący: 50, 21, 38, 38, 41, 85, 56, 43, 26, 48, 48, 50, 54, 58, 58, 76. Przedstawić dane w postaci szeregu rozdzielczego (przedziałowego).
Porządkowanie szeregu: 21, 26, 38, 38, 41, 43, 48, 48, 50, 50, 54, 56, 58, 58, 76, 85.
Ustalenie rozpiętości przedziału i liczby klas:
$$h\ \approx \ \frac{x_{\max} - \ x_{\min}}{k} = \ \frac{85 - 21}{\sqrt{16}} = \frac{64}{4} = 16$$
Koszt przesyłki | Liczba paczek | Wskaźnik struktury |
21-37 | 2 | 0,125 |
37-53 | 8 | 0,5 |
53-69 | 4 | 0,25 |
69-85 | 2 | 0,125 |