STATYSTYKA
Opisowe charakterystyki rozkładów empirycznych
dla danych przedziałowych (grupowanych)
Miary położenia (przeciętne)
Średnie:
Średnia arytmetyczna:
a) średnia z szeregu rozdzielczego przedziałowego
b) średnia z średnich
Przykład:
Wyniki egzaminu pisemnego ze statystyki przedstawiono w następującym zestawieniu zbiorczym. Obliczyć średni rezultat egzaminu.
Wartości |
ni |
Obliczenia pomocnicze |
|
w pkt. |
|
|
|
20-30 |
2 |
25 |
50 |
30-40 |
10 |
35 |
350 |
40-50 |
7 |
45 |
315 |
50-60 |
9 |
55 |
495 |
60—70 |
12 |
65 |
780 |
70-80 |
10 |
75 |
750 |
Razem |
50 |
x |
2740 |
Przeciętne pozycyjne
Wartość modalna (dominanta): wartość zmiennej, która w danym rozkładzie empirycznym występuje najczęściej.
Dla szeregów rozdzielczych przedziałowych:
xD - dolna granica klasy, w której znajduje się dominanta
nD - liczebność klasy, w której znajduje się dominanta
iD - rozpiętość klasy, w której znajduje się dominanta
nD-1 - liczebność klasy poprzedzającej klasę , w której znajduje się dominanta
nD - liczebność klasy następującej po klasie, w której znajduje się dominanta
Wiek |
Liczba |
Odsetek |
do 19 |
314 |
0,7 |
20-24 |
6979 |
16,2 |
25-29 |
11440 |
26,5 |
30-34 |
6391 |
14,8 |
35-39 |
5412 |
12,5 |
40-49 |
8450 |
19,6 |
50 i więcej |
4200 |
9,7 |
D=25+(11440-6979)*5/[(11440-6979)+(11440-6391)]=27,3
Kwantyle: wartości cechy, które dzielą badaną zbiorowość na określone części.
Mediana (Me): dzieli na połowę;
Kwartyle (Q1, Q2 (Me), Q3): oddzielają ćwiartki.
k - liczba klas od pierwszej do tej, w której znajduje się dany kwartyl,
iQ - rozpiętość przedziału, w którym znajduje się dany kwartyl,
nQ - liczność klasy, w której znajduje się dany kwartyl,
xQ - dolna granica klasy, w której znajduje się dany kwartyl.
Przykład
Wiek |
Liczba ni |
Odsetek wi |
Skumulowany wi |
do 19 |
68694 |
21,1 |
21,1 |
20-24 |
184088 |
56,4 |
77,5 |
25-29 |
43239 |
13,3 |
90,8 |
30-34 |
10217 |
3,1 |
93,9 |
35-39 |
4925 |
1,5 |
95,4 |
40-49 |
7251 |
2,2 |
97,6 |
50-59 |
4586 |
1,4 |
99,0 |
60 i więcej |
3277 |
1,0 |
100,0 |
Ogółem |
326277 |
100,0 |
x |
Miary zmienności
Wariancja
Wiek |
Liczba ni |
|
|
|
|
|
0-6 |
3186 |
3,0 |
9558 |
-3,6 |
12,96 |
41290,56 |
7-13 |
623 |
10,0 |
6230 |
3.4 |
11,56 |
7201,88 |
14-20 |
336 |
17,0 |
5712 |
10,4 |
108,16 |
36341,76 |
21-27 |
243 |
24,0 |
5832 |
17,4 |
302,76 |
73570,68 |
28-29 |
74 |
28,5 |
2109 |
21,9 |
479,61 |
35491,14 |
Ogółem |
4462 |
x |
29441 |
x |
x |
193896,02 |
Odchylenie standardowe
Odchylenie przeciętne
Odchylenie ćwiartkowe
Q < d < s
Współczynnik zmienności
Miary asymetrii i koncentracji
Współczynnik asymetrii (skośności)
Współczynnik asymetrii (momentowy)
gdzie
jest momentem centralnym rzędu 3
Współczynnik koncentracji
gdzie
jest momentem centralnym rzędu 4
Proste metody analizy szeregów czasowych
Szeregiem czasowym nazywamy ciąg wartości badanego zjawiska obserwowanego w kolejnych jednostkach czasu (momentach, okresach)
Szeregi czasowe wykorzystywane są do analizy zjawisk dziejących się w czasie. Mówimy też, że służą one do analizy zjawisk dynamicznych.
Ogólny zapis szeregu czasowego:
Proste metody analizy:
Ciąg przyrostów absolutnych o podstawie stałej (jednopodstawowych)
Ciąg przyrostów absolutnych łańcuchowych
Ciąg przyrostów względnych o podstawie stałej (jednopodstawowych)
Ciąg przyrostów względnych łańcuchowych
Wskaźniki dynamiki (indeksy)
Ciąg indeksów o podstawie stałej (jednopodstawowych)
Ciąg indeksów łańcuchowych
Obliczanie średniego tempa zmian
Analiza tendencji rozwojowych (trendów)
Średnia ruchoma (k-okresowa)
Wykorzystywana do wygładzania przebiegów, eliminacji wpływu zjawisk cyklicznych itp.
Statystyka15 Wykład6 10