PODSTAWOWE POJĘCIA STATYSTYCZNE
Zbiorowość statystyczna - zbiór jednostek statystycznych, podobnych (lecz nie identycznych) ze względu na określone cechy, poddanych badaniu statystycznemu.
- zbiorowość jednowymiarowa - zbiorowość badana pod względem jednej cechy;
- zbiorowość wielowymiarowa - zbiorowość badana pod względem wielu cech.
Populacja generalna a próba losowa - jeśli badanie całej zbiorowości jest bardzo kosztowne lub niemożliwe bada się część populacji generalnej. Dobór elementów do próby powinien spełniać pewne wymagania, wówczas wyniki uzyskane z badań próby można odnieść do całej populacji.
Cecha statystyczna - jednostki statystyczne posiadają pewne cechy, które mogą być:
- ilościowe (mierzalne)- np. odległość, waga (można je wyrażać w jedn. fizycznych - m, kg);
- jakościowe (niemierzalne) - np. płeć, wykształcenie, stan cywilny.
Poza tym, cechy ilościowe można podzielić na:
- skokowe - cecha może przyjąć wartości ze skończonego lub przeliczalnego zbioru - np. liczba dzieci w rodzinie, liczba klientów;
- ciągłe - cecha może przyjąć dowolne wartości z określonego przedziału liczbowego - np. odległość, poziom płac.
Zjawisko - zbiorowość statystyczna.
Struktura zjawiska - budowa zjawiska z punktu widzenia wyróżnionej cechy.
Cele badania statystycznego: znalezienie prawidłowości tkwiących w badanym zjawisku, ich ocenę i sformułowanie wniosków. W tym celu należy scharakteryzować zbiorowość ze względu na wyróżnioną cechę; określić zakres badania, potrzeby informacyjne i źródła pozyskiwania danych; metody gromadzenia danych i metodologia szukania prawidłowości - co badamy? gdzie badamy? kiedy badamy? jak badamy?
Cele badania statystycznego można sprowadzić do trzech grup problemów:
- statystyczny opis struktury zjawisk;
- statystyczny opis współzależności zjawisk;
- statystyczny opis dynamiki zjawisk.
Etapy badania statystycznego:
- obserwacja statystyczna - jednostka badania, cecha statystyczna i sposób jej pomiaru;
- prezentacja wyników, danych - tablica statystyczna, wykresy;
- opis wyników - obliczenie określonych charakterystyk zbiorowości.
Opis badanej populacji opieramy na tzw. szeregu statystycznym.
Szereg szczegółowy - Porządkujemy wartości badanej cechy X niemalejąco lub nierosnąco i budujemy szereg rozdzielczy.
Szereg rozdzielczy - zbiorowość jest podzielona na grupy (klasy) wg wartości badanej cechy z przyporządkowaniem liczebności każdej z występujących grup (klas).
Szereg rozdzielczy z przedziałami klasowymi - jeśli badane zjawisko charakteryzuje się dużą liczbą odmian badanej cechy - wtedy dzielimy całą populacje na grupy, wyznaczając przedziały wartości cechy i przyporządkujemy im liczbę elementów, które charakteryzują się wartościami cechy należących do określonego przedziału. Przedziały wartości cechy, zwane przedziałami klasowymi muszą być o jednakowej długości.
Rozkład empiryczny - zestaw wyników w postaci szeregu rozdzielczego z cechą mierzalną. Rozkład empiryczny stanowi odzwierciedlenie struktury badanej zbiorowości ze względu na przyjętą cechę.
- rozkład punktowy - dla cechy skokowej
- rozkład przedziałowy - dla cechy ciągłej
Liczba przedziałów klasowych:
Długość (szerokość) przedziału klasowego:
Przykład:
Wśród 30 pracowników pewnego przedsiębiorstwa przeprowadzono badanie wynagrodzenia i otrzymano następujące wyniki w PLN: 1050, 1100, 1210, 1260, 1300, 1310, 1320, 1340, 1360, 1365, 1410, 1420, 1500, 1510, 1510, 1520, 1520, 1540, 1550, 1560, 1590, 1610, 1620, 1650, 1700, 1720, 1780, 1830, 1920, 1980.
1) Zbudować szereg rozdzielczy z przedziałami klasowymi.
2) Obliczyć wskaźniki struktury.
3) Obliczyć liczebności skumulowane.
4) Zbudować histogram.
Rozwiązanie:
|
|
|
|
% |
|
|
|
1100 |
1000-1200 |
2 |
0,07 |
7 |
2 |
2200 |
320000 |
1300 |
1200-1400 |
8 |
0,27 |
27 |
10 |
10400 |
320000 |
1500 |
1400-1600 |
11 |
0,36 |
36 |
21 |
16500 |
0 |
1700 |
1600-1800 |
6 |
0,20 |
20 |
27 |
10200 |
240000 |
1900 |
1800-2000 |
3 |
0,1 |
10 |
30 |
5700 |
480000 |
|
|
30 |
1 |
100 |
- |
45000 |
1360000 |
|
|
|
|
Wykres kołowy |
|
|
|
|
|
|
|
|
|
|
|
Zadanie: Tablica przedstawia wynagrodzenie pracowników w pewnej firmie.
|
|
|
|
|
|
|
250 |
0-500 |
1300 |
0,87 |
1300 |
325000 |
174777777,78 |
750 |
500-1000 |
50 |
0,03 |
1350 |
37500 |
888888,89 |
1250 |
1000-1500 |
0 |
0 |
1350 |
0 |
0 |
1750 |
1500-2000 |
0 |
0 |
1350 |
0 |
0 |
2250 |
2000-2500 |
0 |
0 |
1350 |
0 |
0 |
2750 |
2500-3000 |
0 |
0 |
1350 |
0 |
0 |
3250 |
3000-3500 |
0 |
0 |
1350 |
0 |
0 |
3750 |
3500-4000 |
150 |
0,10 |
1500 |
562500 |
1472666666,67 |
|
|
1500 |
1,00 |
- |
925000 |
1648333333,33 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1) Obliczyć wskaźniki struktury.
2) Obliczyć liczebności skumulowane.
3) Zbudować histogram.
Zadanie: Rozkład ocen otrzymanych przez studentów na egzaminie ze statystyki jest następujący:
|
|
|
|
|
|
2 |
10 |
0,2 |
10 |
20 |
16,90 |
3 |
20 |
0,4 |
30 |
60 |
1,80 |
4 |
15 |
0,3 |
45 |
60 |
7,35 |
5 |
5 |
0,1 |
50 |
25 |
14,45 |
|
50 |
1 |
- |
165 |
40,50 |
|
|
|
|
|
|
|
|
|
|
|
|
1) Obliczyć wskaźniki struktury.
2) Obliczyć liczebności skumulowane.
3)Obliczyć miary położenia.
1