1. Podstawowe pojęcia.
Termin statystyka pochodzi od łacińskiego słowa status, co oznacza stan, położenie, stosunki.
Statystyka to nauka zajmująca się badaniem zjawisk (procesów) masowych, czyli takich, w których mamy do czynienia z dostatecznie dużą liczbą obserwacji oraz ilościowym jej ujęciem.
Statystyka to zestawienie liczbowe, zbieranie i zestawienie danych, estymator (szacunki) obliczony z obserwowanych danych.
Badania statystyczne to szereg czynności. Zmierzających do jak najlepszego poznania struktury zbioru dowolnych elementów (ludzi, przedmiotów, wydarzeń, zjawisk) podobnych pod względem określonych cech.
Zbiory takie nazywa się zbiorowościami statystycznymi bądź populacjami statystycznymi. Ich elementami są jednostki statystyczne podlegające bezpośredniej obserwacji lub pomiarowi.
Zbiorowość generalna (populacja generalna) to zbiór dowolnych elementów nieidentycznych z punktu widzenia badanej cechy, w odniesieniu do których chcemy formułować wnioski.
Zbiorowość próbna (próba) to podzbiór zbiorowości generalnej objęty badaniem statystycznym, którego wyniki uogólniane są na całą populację. Próba jest duża, gdy n>30
a mała, gdy n*30. Próba musi być reprezentatywna, tzn., aby z przyjętą dokładnością opisywała strukturę zbiorowości generalnej. Własności, którymi odznaczają się jednostki wchodzące w skład badanej zbiorowości, nazywamy cechami statystycznymi np.: płeć, wzrost, liczba zatrudnionych, zarobki, wykształcenie, zawód.
Rodzaje cech statystycznych:
ilościowe (mierzalne),
jakościowe (niemierzalne),
skokowe (dyskretne) cech (zmienne), które przyjmuję skończony lub przeliczalny zbiór wartości na danej skali liczbowej,
ciągłe, które mogą przyjąć każdą wartość zakreślonego przedziału liczbowego, przy czym ilość miejsca po przecinku uzależniona jest od dokładności dokonywanych pomiarów.
Badanie pełne to takie, które swoim zakresem obejmuje wszystkie jednostki danej zbiorowości. Prowadzone są one przy pomocy spisów lub rejestracji bieżącej.
Badania częściowe to takie, które swoim zakresem obejmują jedynie część zbiorowości. Dzielimy je na badania ankietowe, mamograficzne i reprezentacyjne.
Usystematyzowanie zebranych danych statystycznych nazywa się grupowaniem. Polega ono na podziale niejednorodnych zbiorowości na jak najbardziej jednorodne grupy pod względem pewnych ustalonych kryteriów.
Rodzaje grupowania:
typologiczne (np.: wg cech terytorialnych, rzeczowych, czasowych) mających na celu wyodrębnienie grup różnych jakościowo,
wariancyjne, mające na celu uporządkowanie badanej zbiorowości i poznanie jej struktury, które polega na łączeniu w klasy jednostek statystycznych o odpowiednich wartościach cech statystycznych,
analityczne, którego zadaniem jest ustalenie współzależności między badanymi cechami.
Szereg statystyczny otrzymujemy wówczas, kiedy dane statystyczne zostaną sklasyfikowane wg jakiegoś kryterium.
Rodzaje szeregów statystycznych:
Szereg szczegółowy (indywidualny) najczęściej stosowany jest w przypadku, gdy liczba jednostek objętych badaniem jest na tyle mała, że czytelnym i rozsądnym jest uporządkować je kolejno,
Szereg rozdzielczy, w którym zbiorowość statystyczna podzielona jest na kilka klas, wg określonej cechy o podanej liczbie jednostek mających określoną cechę jakościową lub wartość zmiennej. Zakłada się, że zmienna x przybiera wartość x1, x2 ... xn:
szereg punktowy rozdzielczy buduje się zwykle gdy liczba wariantów danej cechy jest niewielka a każdy z tych wariantów występuje kilka razy,
szereg rozdzielczy przedziałowy powstaje w wyniku podziału zbiorowości na klasy i podanie liczebności klas.
W szeregach rozdzielczych do określenia rozkładu (struktury badanej zbiorowości) obok liczebności bezwzględnej stosuje się także odpowiednie wskaźniki struktury.
Wskaźnikiem struktury ωi lub częścią występowania danego wariantu cechy nazywa się stosunek liczby jednostek o danej wartości cechy do liczebności próby.
gdzie:
ni - liczba jednostek o „i” tym wariancie cech,
n - liczebność próby.
Wskaźnik struktury, zwany też liczebnością względną, frakcją lub odsetkiem może być wyrażony w procentach lub promilach.
Przy budowie szeregu rozdzielczego z przedziałami klasowymi należy skorzystać z pewnych reguł, które pozwalają ustalić orientacyjną liczbę klas w zależności od liczebności „n” próbki oraz określić rozpiętość poszczególnych klas.
Istnieje kilka reguł ustalania orientacyjnej liczby klas „k” w zależności od liczebności próbki np.:
Różnicę pomiędzy górną x1i i dolną x0i granicą „i” - tego przedziału klasowego nazywamy rozpiętością (szerokością) przedziału klasowego i oznaczamy ni.
Wyznaczamy ją z zależności:
gdzie:
R - odstęp,
K - liczba klas.
Wybór dolnej granicy pierwszego przedziału x0i najczęściej przyjmuje się jako najmniejszą wartość cechy badanej zbiorowości.
2. Charakterystyki Liczbowe Układów Empirycznych.
Miary tendencji centralnej:
Klasyczne:
średnia arytmetyczna,
średnia harmoniczna,
średnia geometryczna,
Pozycyjne:
dominanta (modolna),
kwantyle:
kwartyle,
Miary zmienności:
Klasyczne:
Wariancja,
Odchylenie standardowe,
Odchylenie przecietne,
Współczynnik zmienności:
typowy obszar zmienności,
Pozycyjne:
rozstęp, odchylenie ćwiartkowe,
współczynnik zmienności.
Średnia Arytmetyczna:
- dla szeregu szczegółowego,
- dla szeregu rozdzielczego punktowego,
- dla szeregu rozdzielczego przedziałowego.
Praca pochodzi z serwisu www.e-sciagi.pl