Dokument liczący 35 stron dano do przepisywania trzem różnym osobom a następnie sprawdzono liczbę błędów popełnionych przez te osoby na każdej stronie dokumentu.
Wyniki przedstawia tablica (dane umowne):
Liczba błędów na stronie
0
1
2
3
4
5
6
Osoba 1 – liczba stron
3
4
6
9
6
4
3
Osoba 2 – liczba stron
4
10
8
5
4
3
1
Osoba 3 – liczba stron
1
3
4
5
8
10
4
Określić zbiorowość statystyczną, jednostkę statystyczną i badaną cechę.
Wykorzystując poznane miary, ocenić pracę trzech osób przepisujących dokument. Która z nich najlepiej wykonała zadanie?
Rozwiązanie:
Zbiorowość statystyczną stanowi 35 stron dokumentu.
Jednostka statystyczna to pojedyncza strona.
Badaną cechą jest liczba błędów na stronie dokumentu. Jest to cecha mierzalna, skokowa.
Uzyskane informacje przedstawiono w postaci szeregów rozdzielczych punktowych. Pracę trzech osób ocenimy porównując przeciętną liczbę popełnionych błędów oraz jej zróżnicowanie i asymetrię.
Dysponując pakietami statystycznymi (STATISTICA, SPSS) można tworzyć różnego rodzaju wykresy statystyczne, przedstawiające w sposób graficzny wybrane miary opisujące strukturę zbiorowości. Analiza wykresu ułatwia wstępne porównanie kilku zbiorowości badanych z punktu widzenia tej samej cechy, bez konieczności wykonywania obliczeń.
Jednym z bardziej przydatnych typów wykresów są wykresy pudełkowe, które w sposób schematyczny przedstawiają zakresy wybranych zmiennych oraz klasyczne lub pozycyjne statystyki opisowe (średnia, kwartyle, miary dyspersji). Wykres pudełkowy ma kształt prostokąta z dołączonymi po bokach odcinkami, umieszczonego w pionie lub poziomie, równolegle do skali zakresu wartości danej cechy.
W klasycznym wykresie pudełkowym punktem centralnym (oznaczonym pionową linią) jest mediana, boki pudełka wyznaczają wartości Q1 i Q3, a końce wąsów – najmniejszą i największą wartość cechy.
Rysunek 1 przedstawia wykresy pudełkowe zbudowane w oparciu o miary pozycyjne dla liczby błędów w dokumencie przepisywanym przez trzy różne osoby.
Jak łatwo zauważyć, przeciętna liczba błędów na stronę była najwyższa u osoby 3 a najmniejsza u osoby 2. Z wykresu można bez problemu odczytać wartości pierwszego i trzeciego kwartyla.
Proporcje długości poszczególnych części pudełka i wąsów informują o asymetrii rozkładu badanej cechy. W przypadku osoby 1 szereg jest symetryczny. Dłuższy prawy wąs (osoba 2) informuje o asymetrii prawostronnej (dodatniej) a dłuższy lewy wąs (osoba 3) o asymetrii lewostronnej (ujemnej).
Rysunek 1. Liczba popełnionych błędów - wykresy pudełkowe osoba 3
osoba 2
osoba 1
0
1
2
3
4
5
6
Liczba błędów na stronę dokumentu
Wstępne oceny pracy trzech osób potwierdzimy obliczając niezbędne miary statystyczne.
Obliczenia wykonać można w tablicach pomocniczych.
Liczba popełnionych błędów oraz obliczenia pomocnicze – osoba 1
Liczebności
Liczba błędów
Liczba stron
x
x 2 ⋅ n skumulowane
na stronie x
i ⋅ n
i
i
i
i
n
i
isk
n
0
3
0
0
3
1
4
4
4
7
2
6
12
24
13
3
9
27
81
22
4
6
24
96
28
5
4
20
100
32
6
3
18
108
35
Razem
35
105
413
x
i
105
x =
=
= 3 błędy,
n
35
∑ i
i
Me = x N + = x + = x
= 3
1
35 1
18
błędy,
2
2
Do=3 błędy,
Q = x N + = x + = x = 2
1
1
35 1
9
błędy,
4
4
Q
= x N +
= x
+
= x
= 4
3
(
3
)
1
35
(
3
)
1
27
błędy,
4
4
2
∑ x ni
i
i
2
413
sx =
− x
=
− 32 =
8
,
2
= 67
,
1
błędu,
n
35
∑ i
i
sx
67
,
1
Vs =
⋅ 100% =
⋅ 100% =
7
,
55 % ,
x
x
3
x − Do
3 − 3
s
W =
=
= 0 .
s
67
,
1
x
Liczba popełnionych błędów oraz obliczenia pomocnicze – osoba 2
Liczebności
Liczba błędów na Liczba stron
x
x 2 ⋅ n skumulowane
stronie x
i ⋅ n
i
i
i
i
n
i
isk
n
0
4
0
0
4
1
10
10
10
14
2
8
16
32
22
3
5
15
45
27
4
4
16
64
31
5
3
15
75
34
6
1
6
36
35
Razem
35
78
262
x
∑ xini
i
78
x =
=
=
23
,
2
błędy,
n
35
∑ i
i
Me = x N + = x + = x
= 2
1
35 1
18
błędy,
2
2
Do=1 błąd,
Q = x N + = x + = x = 1
1
1
35 1
9
błąd,
4
4
Q
= x N +
= x
+
= x
= 3
3
(
3
)
1
35
(
3
)
1
27
błędy,
4
4
∑ x ni
i
i
2
262
sx =
− x
=
−
)
23
,
2
(
2 =
51
,
2
= 58
,
1
błędu,
n
35
∑ i
i
sx
58
,
1
Vs =
⋅
%
100
=
⋅
%
100
=
%
85
,
70
,
x
x
23
,
2
x − Do
23
,
2
− 1
s
W
=
=
=
78
,
0
.
s
58
,
1
x
Liczba popełnionych błędów oraz obliczenia pomocnicze – osoba 3
Liczebności
Liczba błędów na Liczba stron
x
x 2 ⋅ n skumulowane
stronie x
i ⋅ n
i
i
i
i
n
i
isk
n
0
1
0
0
1
1
3
3
3
4
2
4
8
16
8
3
5
15
45
13
4
8
32
128
21
5
10
50
250
31
6
4
24
144
35
Razem
35
132
586
x
∑ xini
i
132
x =
=
=
77
,
3
błędu,
n
35
∑ i
i
Me = x N + = x + = x
= 4
1
35 1
18
błędy,
2
2
Do=5 błędów,
Q = x N + = x + = x = 3
1
1
35 1
9
błędy,
4
4
Q
= x N +
= x
+
= x
= 5
3
(
3
)
1
35
(
3
)
1
27
błędów,
4
4
2
∑ x ni
i
i
2
586
sx =
− x
=
−
)
77
,
3
(
2 =
53
,
2
= 59
,
1
błędu,
n
35
∑ i
i
sx
59
,
1
Vs =
⋅ 100% =
⋅ 100% =
2
,
42 % ,
x
x
77
,
3
x − Do
77
,
3
− 5
s
W
=
=
= − 77
,
0
.
s
59
,
1
x
W celu ułatwienia interpretacji wyników w tablicy pomocniczej przedstawić można uzyskane wartości miar statystycznych.
Zestawienie uzyskanych wyników
Miara
x
sx
Me Do Q1 Q3
VSx
Ws
Osoba 1
3
1,67
3
3
2
4
55,7%
0
Osoba 2
2,23
1,58
2
1
1
3
70,85%
0,78
Osoba 3
3,77
1,59
4
5
3
5
42,2%
-0,77
Interpretacja:
Przeciętna liczba błędów była najmniejsza w przypadku osoby 2 (średnio 2,23 błędu na stronę) zaś największa w przypadku osoby 3 (średnio 3,77 błędu na stronę).
W przypadku osoby 1 na połowie stron były co najwyżej 3 błędy, na 1/4 stron – co najwyżej 2 błędy a na 3/4 stron – co najwyżej 4 błędy. Osoba 2 przepisała dokument w taki sposób, że 50% stron zawierało nie więcej niż 2 błędy, 25% nie więcej niż 1 błąd a 75% nie więcej niż 3 błędy. W przypadku osoby 3 – na połowie stron były co najwyżej 4
błędy, na 1/4 stron – nie więcej niż 3 błędy zaś na 3/4 stron nie więcej niż 5 błędów.
Osoba 1 najczęściej popełniła 3 błędy na stronę, osoba 2 – 1 błąd zaś osoba 3 – 5
błędów.
Zróżnicowanie liczby błędów mierzone odchyleniem standardowym było najmniejsze w przypadku osoby 3 i stanowiło 42,2% średniej, zaś największe w przypadku osoby 2, dla której stanowiło 71,3% średniej arytmetycznej.
Szereg obrazujący liczbę błędów na stronach dokumentu przepisanego przez osobę 1 był
symetryczny czyli x = Me = Do .
W przypadku szeregu uzyskanego dla osoby 2 zaobserwowano występowanie asymetrii dodatniej (prawostronnej) o dużej sile. Oznacza to, że najczęściej spotykana liczba błędów na stronie była niższa od przeciętnej.
Szereg nr 3 cechowała silna asymetria ujemna (lewostronna), co oznacza, że na większości stron zaobserwowano liczbę błędów wyższą od przeciętnej.
Wniosek: Najlepiej wykonała pracę osoba 2.