Opracowanie materiału statystycznego
Grupowanie materiału statystycznego |
Rodzaje grupowania:
typologiczne - (np. wg cech terytorialnych, rzeczowych, czasowych) mające na celu wyodrębnienie grup różnych jakościowo,
wariacyjne - mające na celu uporządkowanie badanej zbiorowości i poznanie jej struktury, które polega na łączeniu w klasy jednostek statystycznych o odpowiednich wartościach cech statystycznych.
Szereg statystyczny - ciąg wielkości statystycznych, uporządkowanych wg określonego kryterium. |
Sposób grupowania cech zależy od: rodzaju badania (przekrojowe, czasowe), rodzaju cechy statystycznej, sposobu pomiaru oraz liczby obserwacji (szczegółowe, rozdzielcze).
Szereg szczegółowy - uporządkowany ciąg wartości badanej cechy statystycznej, stosowany, gdy przedmiotem badania jest niewielka liczba jednostek, np. zmienna X przyjmuje wartości: |
Szereg rozdzielczy - stanowi zbiorowość statystyczną, podzieloną na części (klasy) według określonej cechy jakościowej lub ilościowej z podaniem liczebności lub częstości każdej z wyodrębnionych klas. |
Rozkład empiryczny - zestawienie wyników w postaci szeregu rozdzielczego z cechą mierzalną, odzwierciedla strukturę badanej zbiorowości z punku widzenia określonej cechy statystycznej. |
Szeregi statystyczne |
||
szczegółowe |
rozdzielcze z cechą mierzalną (ilościową): - punktowe (proste, skumulowane), - przedziałowe (proste, skumulowane), rozdzielcze z cechą niemierzalną (jakościową: - geograficzne - inne |
czasowe - momentów - okresów |
Stosowanie szeregów statystycznych:
szereg rozdzielczy z przedziałami klasowymi - dla cech ciągłych
szeregi rozdzielcze bez przedziałów klasowych lub z przedziałami klasowymi - dla cech mierzalnych skokowych - zależnie od możliwości wartości (wariantów) cech: dla niewielkiej liczby wariantów: szereg rozdzielczy punktowy, dla dużej szereg rozdzielczy z przedziałami klasowymi.
szereg rozdzielczy z cechą niemierzalną - szereg geograficzny (terytorialny) - przedstawia rozmieszczenie pewnych zjawisk w przestrzeni (np. zestawienie liczby gmin w Polsce).
szereg czasowy - (dynamiczny chronologiczny) powstaje w wyniku grupowania typologicznego i wariacyjnego, gdy podstawą grupowania jest zmiana badanego zjawiska w czasie:
- szereg czasowy okresów - zawiera informację o rozmiarach zjawiska w krótszych lub dłuższych okresach.
- szereg czasowy momentów - ujmuje wielkość zjawiska w danym momencie, najczęściej na początku lub końcu np. miesiąca.
Podstawowe oznaczenia, podstawowe wielkości
n - liczebność próby (zbiorowości próbnej),
xi - wariant cechy statystycznej (i = 1, 2 , ... , n),
ni - liczba jednostek o i-tym wariancie cechy,
k - liczba klas (wariantów cechy),
przy czym:
Szereg rozdzielczy punktowy
Wskaźnik struktury wi lub częstość (liczebność względna, frakcja, odsetek) - występowania danego wariantu cechy nazywa się stosunek liczby jednostek o danej wartości cechy do liczebności próby. |
(eq.1)
przy czym:
.
Szereg rozdzielczy skumulowany - uzyskuje się poprzez przyporządkowanie kolejnym wariantom cechy odpowiadających im liczebności (częstości) skumulowanych, informuje, dla ilu jednostek badanej zbiorowości cecha przyjmuje wartości nie większe od górnej granicy poszczególnego przedziału klasowego. |
Skumulowany wskaźnik struktury wisk (częstość skumulowana):
(eq.2)
gdzie nisk oznacza liczbę jednostek, których cechy odpowiadają wartościom nie większym niż xi.
Dystrybuanta empiryczna - przyporządkowanie kolejnym wartościom cechy statystycznej (zmiennej) odpowiadających im częstości skumulowanych (względnie liczebności skumulowanych). |
Szereg rozdzielczy z przedziałami klasowymi
a) Ustalanie liczby klas
Liczby klas w zależności od liczebności badanej zbiorowości |
|
Liczba obserwacji n |
Liczba zalecanych klas k |
40-60 60-100 100-200 200-500 |
6-8 7-10 9-12 11-17 |
wzory:
(eq.3)
(eq.4)
b) ustalenie rozpiętości przedziałów klasowych
Rozpiętość (szerokość) przedziału klasowego hi - różnica pomiędzy górną x1i i dolną x0i granicą i-tego przedziału klasowego. |
Z reguły ustala się jednakowe rozpiętości przedziałów klasowych. Przy równej rozpiętości przedziałów klasowych liczebności (częstości) występujące w poszczególnych klasach są porównywalne.
Przy różnych rozpiętościach (dla populacji niejednorodnej z dużą koncentracją wartości w jednej grupie) zamiast liczebności (częstości) stosuje się wskaźnik: gęstość liczebności (gęstość częstości).
Gęstość liczebności (gęstość częstości) - jest to stosunek liczebności (częstości) danej klasy do rozpiętości przedziału klasowego: |
gęstość liczebności |
|
szereg rozdzielczy |
|
Dla szeregu rozdzielczego o jednakowych rozpiętościach przedziałów klasowych hi = h:
(eq.7)
gdzie:
nazywa się rozstępem, a k oznacza liczbę klas.
Uwaga: Jeżeli wybieramy przybliżoną wartość h, to powinno to być zawsze przybliżenie z nadmiarem, tzn.
.
c) Ustalanie granic poszczególnych klas
Jako dolną granicę najczęściej przyjmuje się najmniejszą wartość cechy lub bliskiej tej wartości, czyli
. Przy cechach ciągłych górne granice klas poprzednich powinny być dolnymi granicami klas następnych, aby nie było pomiędzy przedziałami luk Ponadto trzeba ustalić, do które klasy zaliczyć wartości graniczne.
W szeregach o otwartych przedziałach klasowych, konieczne jest czasami domknięcie tych przedziałów. Stosuję się tutaj zasadę, że jeżeli liczebność w tych przedziałach jest niewielka (nie większa niż 5% badanej zbiorowości, można te przedziały domknąć taką szerokością, jaka jest w sąsiednich przedziałach klasowych.
Szereg rozdzielczy z przedziałami klasowymi
Wskaźnik podobieństwa struktury |
Wskaźnik podobieństwa struktury wp - służy do porównywania struktur analizowanych zbiorowości. |
(eq.8)
przy czym:
(im wartość bliższa jedności, tym struktury zbiorowości są bardziej podobne..
Wskaźniki natężenia |
Wskaźniki natężenia - są to wielkości stosunkowe, wyrażające kształtowanie się wielkości jednego zjawiska na tle innego, logicznie z nim związanego. |
Przykładowe współczynniki natężenia:
stopa bezrobocia - stosunek liczby bezrobotnych do liczby ludności czynnej zawodowo,
gęstość zaludnienia - liczba ludności przypadająca na 1 km2 powierzchni,
wskaźnik umieralności - liczba zmarłych do średniej liczby ludności,
wskaźnik rozwoju gospodarczego - produkt krajowy brutto (netto) do liczby ludności kraju,
wskaźnik wydajności pracy - wielkość produkcji do czasu pracy,
wskaźnik spożycia i usług - wielkość spożycia i usług do liczby ludności,
wskaźnik rentowności - zysk do wielkości sprzedaży,
wskaźnik efektywności - zysk do zaangażowanego kapitału,
wskaźnik produktywności - sprzedaż do do zaangażowanego kapitału.