Grupowanie danych i histogramy |
|
|
|
|
|
|
|
|
|
Szereg prosty (pozycyjny, szczegółowy) to uporządkowany niemalejąco ciąg liczb będących np. wynikami |
|
|
|
|
|
|
|
|
|
pomiarów (o liczebności do 20 jednostek). |
|
|
|
|
|
|
|
|
|
Jeżeli liczność próby dotyczącej cechy mierzalnej jest duża (orientacyjnie większa od 20), to pierwszym |
|
|
|
|
|
|
|
|
|
etapem jej opracowania jest dokonanie grupowania, czyli klasyfikacji. Szereg rozdzielczy otrzymujemy przez |
|
|
|
|
|
|
|
|
|
podział wartości cechy zmiennej na klasy oraz przyporządkowanie odpowiednim klasom (przedziałom) |
|
|
|
|
|
|
|
|
|
odpowiednich liczebności zmiennej. |
|
|
|
|
|
|
|
|
|
W celu zbudowania szeregu rozdzielczego kierujemy się praktycznymi regułami postepowania. |
|
|
|
|
|
|
|
|
|
1. Określamy obszar zmiennosci (rozstęp) badanej cechy, tzn. ustalamy różnicę pomiędzy maksymalną |
|
|
|
|
|
|
|
|
|
i minimalną wartością badanej cechy: R = xmax - xmin. W Excelu: =MAX(dane)-MIN(dane). |
|
|
|
|
|
|
|
|
|
2. Ustalamy ilość przedziałów klasowych (k), np. według formuły: k <= 1 + 3,322 * log(n). W Excelu: |
|
|
|
|
|
|
|
|
|
=ZAOKR(1+3,322*LOG(ILE.LICZB(dane));0). Następnie ustalamy długość przedziałów klasowych Dx. |
|
|
|
|
|
|
|
|
|
W Excelu np. =ZAOKR.GÓRA(R/k;2). |
|
|
|
|
|
|
|
|
|
3. Budujemy tabelę o liczbie wierszy równej liczbie klas k i liczbie kolumn 7: |
|
|
|
|
|
|
|
|
|
|
Krzysztof DUDEK:
Numer klasy
i |
Krzysztof DUDEK:
Dolna granica i-tego przedziału klasowego
x0i |
Krzysztof DUDEK:
Górna granica i-tego przedziału klasowego
x1i |
Krzysztof DUDEK:
Liczebność i-tej klasy
ni |
Krzysztof DUDEK:
Względna częstość i-tej klasy
fi = ni/n
fi |
Krzysztof DUDEK:
Skumulowane liczebności
nsi |
Krzysztof DUDEK:
Skumulowane częstości względne
fsi |
|
|
|
1 |
x01 = xmin |
x11 = x01+Dx |
n1 |
n1/n |
n1 |
n1/n |
|
|
|
2 |
x02 = x11 |
x12 = x02+Dx |
n2 |
n2/n |
n1 + n2 |
(n1+n2)/n |
|
|
|
3 |
x03 = x12 |
x13 = x03+Dx |
n3 |
n3/n |
n1+n2+n3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
x0k = x1k |
x1k = x0k+Dx |
nk |
nk/n |
n |
1,00 |
|
|
|
|
|
|
S = n |
S = 1,00 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Przykład 1. |
|
|
|
|
|
|
|
|
|
Zbudować szereg rozdzielczy oraz wykreślić histogram i dystrybuantę empiryczną dla wyników pomiaru grubości |
|
|
|
|
|
|
|
|
|
blachownicy zebranych w zakresie komórek C26:I35. |
|
|
|
|
|
|
|
|
|
|
|
10,0 |
9,5 |
10,1 |
10,3 |
10,7 |
9,5 |
10,1 |
|
|
|
9,5 |
10,8 |
9,8 |
9,6 |
9,7 |
9,7 |
9,3 |
|
|
|
10,2 |
11,3 |
10,2 |
9,6 |
10,3 |
8,9 |
9,0 |
|
|
|
9,7 |
10,7 |
10,7 |
9,2 |
9,9 |
10,1 |
10,1 |
|
|
|
10,2 |
9,8 |
10,6 |
10,9 |
9,9 |
10,3 |
9,8 |
|
|
|
10,4 |
10,4 |
10,3 |
10,1 |
10,5 |
9,5 |
9,9 |
|
|
|
9,7 |
10,5 |
10,6 |
9,7 |
9,4 |
9,8 |
10,1 |
|
|
|
10,1 |
10,9 |
10,3 |
9,9 |
10,2 |
9,5 |
10,7 |
|
|
|
9,6 |
9,5 |
9,4 |
10,6 |
9,7 |
9,6 |
9,8 |
|
|
|
9,5 |
8,8 |
9,8 |
9,6 |
10,5 |
10,1 |
10,4 |
|
Rozwiązanie: |
|
|
|
|
|
|
|
|
|
Zakresowi C26:I35 nadano nazwę dane. |
|
|
|
|
|
|
|
|
|
|
|
liczebność próby n = |
70 |
=ILE.LICZB(dane) |
|
|
|
|
|
|
|
wartość minimalna xmin = |
8,8 |
=MIN(dane) |
|
|
|
|
|
|
|
wartość maksymalna xmax = |
11,3 |
=MAX(dane) |
|
|
|
|
|
|
|
rozstęp R = |
2,5 |
=MAX(dane)-MIN(dane) |
|
|
|
|
|
|
|
liczba klas k = |
7 |
=ZAOKR(1+3,322*LOG(ILE.LICZB(dane));0) |
|
|
|
|
|
|
|
szerokość klasy Dx = |
0,4 |
=ZAOKR.GÓRA(R/klasy;1) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Krzysztof DUDEK:
Numer klasy
i |
Krzysztof DUDEK:
Dolna granica i-tego przedziału klasowego
x0i |
Krzysztof DUDEK:
Górna granica i-tego przedziału klasowego
x1i |
Krzysztof DUDEK:
Liczebność i-tej klasy
ni |
Krzysztof DUDEK:
Względna częstość i-tej klasy
fi = ni/n
fi |
Krzysztof DUDEK:
Skumulowane liczebności
nsi |
Krzysztof DUDEK:
Skumulowane częstości względne
fsi |
|
|
|
1 |
8,8 |
9,2 |
4 |
0,057 |
4 |
0,057 |
|
|
|
2 |
9,2 |
9,6 |
15 |
0,214 |
19 |
0,271 |
|
|
|
3 |
9,6 |
10,0 |
17 |
0,243 |
36 |
0,514 |
|
|
|
4 |
10,0 |
10,4 |
20 |
0,286 |
56 |
0,800 |
|
|
|
5 |
10,4 |
10,8 |
11 |
0,157 |
67 |
0,957 |
|
|
|
6 |
10,8 |
11,2 |
2 |
0,029 |
69 |
0,986 |
|
|
|
7 |
11,2 |
11,6 |
1 |
0,014 |
70 |
1,000 |
|
|
|
|
|
|
70 |
1,000 |
|
|
|
|
|
|
|
|
|
|
|
xi |
ni |
|
9 |
4 |
|
9,4 |
15 |
|
9,8 |
17 |
|
10,2 |
20 |
|
10,6 |
11 |
|
11 |
2 |
|
11,4 |
1 |
|
|
|
|
|
|
|
|
|
|
Krzysztof DUDEK:
Górna granica i-tego przedziału klasowego
x1i |
Krzysztof DUDEK:
Skumulowane częstości względne
fsi |
|
9,0 |
0,000 |
|
9,2 |
0,057 |
|
9,6 |
0,271 |
|
10,0 |
0,514 |
|
10,4 |
0,800 |
|
10,8 |
0,957 |
|
11,2 |
0,986 |
|
11,6 |
1,000 |
|
12,0 |
1,000 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Obliczanie statystyk dla danych pogrupowanych |
|
|
|
|
|
|
|
|
|
W przypadku danych przedstawionych w postaci szeregu rozdzielczego nie można korzystać z funkcji |
|
|
|
|
|
|
|
|
|
statystycznych Excela, ale należy wykorzystać następujące zależności. |
|
|
|
|
|
|
|
|
|
|
Liczebność próby: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k - liczba przedziałów klasowych |
|
|
|
|
|
|
|
ni - liczebność i-tej klasy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Średnia arytmetyczna: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- środek i-tej klasy |
|
|
|
|
|
|
|
|
Wariancja w próbie: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Mediana: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x0 - lewy koniec przedziału zawierającego medianę, |
|
|
|
|
|
|
|
|
|
n0 - liczebność tego przedziału, |
|
|
|
|
|
|
|
|
|
ns-1 - skumulowana liczebność poprzedniego przedziału, |
|
|
|
|
|
|
|
|
|
Dx - wspólna długość przedziałów klasowych |
|
|
|
|
|
|
|
Wartość modalna (dominanta): |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x0 - lewy koniec najliczniejszego przedziału klasowego, |
|
|
|
|
|
|
|
|
|
n0, n-1, n1 - liczebności przedziałów klasowych: |
|
|
|
|
|
|
|
|
|
|
najliczniejszego (0), poprzedniego (-1) i następnego (1). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Przykład 1. |
|
|
|
|
|
|
|
|
|
Obliczyć statystyki dla danych podanych w postaci szeregu rozdzielczego: |
|
|
|
|
|
|
|
|
|
|
|
i |
x0i |
x1i |
ni |
|
xi |
ni |
|
|
|
1 |
8,8 |
9,2 |
4 |
|
9,0 |
4 |
|
|
|
2 |
9,2 |
9,6 |
15 |
|
9,4 |
15 |
|
|
|
3 |
9,6 |
10,0 |
17 |
|
9,8 |
17 |
|
|
|
4 |
10,0 |
10,4 |
20 |
|
10,2 |
20 |
|
|
|
5 |
10,4 |
10,8 |
11 |
|
10,6 |
11 |
|
|
|
6 |
10,8 |
11,2 |
2 |
|
11,0 |
2 |
|
|
|
7 |
11,2 |
11,6 |
1 |
|
11,4 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Rozwiązanie |
|
i |
x0i |
x1i |
ni |
Krzysztof DUDEK:
Środek i-tego przedziału klasowego
xi |
ni*xi |
ni(xi-m)2 |
nsi |
fsi |
|
1 |
8,8 |
9,2 |
4 |
9,0 |
36,0 |
3,730 |
4 |
0,057 |
|
2 |
9,2 |
9,6 |
15 |
9,4 |
141,0 |
4,800 |
19 |
0,271 |
|
3 |
9,6 |
10,0 |
17 |
9,8 |
166,6 |
0,467 |
36 |
Krzysztof DUDEK:
Przedział klasowy, w którym znajduje się mediana - 50% percentyl
0,514 |
|
4 |
10,0 |
10,4 |
20 |
10,2 |
204,0 |
1,098 |
56 |
0,800 |
|
5 |
10,4 |
10,8 |
11 |
10,6 |
116,6 |
4,426 |
67 |
0,957 |
|
6 |
10,8 |
11,2 |
2 |
11,0 |
22,0 |
2,139 |
69 |
0,986 |
|
7 |
11,2 |
11,6 |
1 |
11,4 |
11,4 |
2,057 |
70 |
1,000 |
|
|
|
|
Krzysztof DUDEK:
n = Sni
70 |
|
Krzysztof DUDEK:
Sni*xi
697,6 |
Krzysztof DUDEK:
Sni*(xi-m)2
18,718 |
|
|
|
|
|
|
|
|
|
|
|
|
|
m = |
Krzysztof DUDEK:
średnia arytmetyczna
10,0 |
|
|
|
|
|
|
|
|
Krzysztof DUDEK:
Wariancja
s2 = |
0,27 |
|
|
|
|
|
|
|
|
Krzysztof DUDEK:
Odchylenie standardowe
s = |
0,52 |
|
|
|
|
|
|
|
|
V = |
5,2% |
|
|
|
|
|
|
|
|
x0 = |
9,6 |
|
|
|
|
|
|
|
|
n0 = |
17 |
|
|
|
|
|
|
|
|
ns-1 = |
19 |
|
|
|
|
|
|
|
|
Dx = |
0,4 |
|
|
|
|
|
|
|
|
Krzysztof DUDEK:
Mediana, wynik dzielący próbę na połowy
Me = |
10,0 |
|
|
|
|
|
|
|
|
x0 = |
10,0 |
|
|
|
|
|
|
|
|
n-1 = |
17 |
|
|
|
|
|
|
|
|
n0 = |
20 |
|
|
|
|
|
|
|
|
n1 = |
11 |
|
|
|
|
|
|
|
|
Krzysztof DUDEK:
Wartość modalna, dominanta, wartość występująca najczęściej
Mo = |
10,1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|