Zadanie 1) Liczbę oficjalnie zarejestrowanych stołówek w 2011 roku według województw przedstawia następujący szereg prosty:
Województwo | Liczba stołówek (xi) |
---|---|
świętokrzyskie | 32 |
opolskie | 36 |
lubuskie | 38 |
podkarpackie | 46 |
podlaskie | 48 |
łódzkie | 54 |
kujawsko-pomorskie | 70 |
warmińsko-mazurskie | 100 |
dolnośląskie | 106 |
pomorskie | 109 |
wielkopolskie | 140 |
zachodniopomorskie | 150 |
małopolskie | 158 |
śląskie | 168 |
lubelskie | 193 |
mazowieckie | 448 |
Razem | 1896 |
Źródło: Główny Urząd Statystyczny.
Wyznacz średnią arytmetyczną oraz pozostałe miary przeciętne.
Rozwiązanie:
Zgodnie ze wzorem na średnią arytmetyczną po podstawieniu odpowiednich wartości otrzymujemy =118,5 czyli przeciętna liczba stołówek przypadająca na jedno województwo wynosi 118,5 obiektów (stołówek).
Modalna (dominanta) informuje który wariant w szeregu wystąpił najwięcej razy. Ponieważ w przypadku badanych województw wszystkie warianty wystąpiły tylko jeden raz - szereg nie posiada modalnej (dominanty).
Aby wyliczyć kolejne miary przeciętne, tj. medianę oraz kwartyle, niezbędne jest uporządkowanie wyrazów tego szeregu rosnąco. Mediana czyli wartość środkowa w przypadku parzystej liczby obserwacji jest średnią arytmetyczną z dwóch środkowych wyrazów szeregu (8 i 9 województwo), a zatem = 103 co oznacza, że połowa województw posiadała mniej niż 103 stołówki, a połowa więcej niż 103.
Kwartyl pierwszy dzieli zbiorowość w stosunku 1/4 – 3/4 a zatem jest to liczba znajdująca się między 4 a 5 wyrazem szeregu, nie leży jednak dokładnie w połowie między nimi (jak w przypadku mediany), ale wyznacza się go z relacji: czyli = 47,5. Znaczy to, że 1/4 województw posiadała mniej niż 47,5 stołówki, a 3/4 więcej niż 47,5 stołówki.
Kwartyl trzeci dzieli zbiorowość w stosunku 3/4 – 1/4 a zatem jest to liczba znajdująca się między 12 a 13 wyrazem szeregu. Ponownie nie leży dokładnie w połowie między nimi (jak w przypadku mediany), ale wyznacza się go z relacji:
czyli = 152. Znaczy to, że 3/4 województw posiadała mniej niż 152 stołówki, a 1/4 więcej niż 152 stołówki.
Zadanie 2) W pewnej firmie produkcyjno-handlowej zatrudnionych jest 100 pracowników. W pierwszym tygodniu lipca 2012 roku część z nich była na urlopie. Ustalono więc ile dokładnie dni każdy z pracowników był nieobecny w tym okresie, o czym informuje poniższa tabela:
Liczba nieobecności (xi) | Liczba pracowników (ni) |
---|---|
0 | 27 |
1 | 33 |
2 | 20 |
3 | 12 |
4 | 5 |
5 | 3 |
Razem | 100 |
Wyznacz średnią arytmetyczną oraz pozostałe miary przeciętne.
Rozwiązanie:
Zgodnie ze wzorem na średnią arytmetyczną w szeregu rozdzielczym jednowariantowym, po podstawieniu odpowiednich wartości otrzymujemy = 1,44 czyli każdy z pracowników w badanym tygodniu pracy był nieobecny średnio przez 1,44 dni (niezbędne kalkulacje pokazuje również tabela poniżej, konkretnie trzecia kolumna).
Modalna (dominanta) informuje jaka liczba nieobecności wystąpiła najwięcej razy. Jest to bezpośrednio widoczne w tabeli, bowiem najwięcej pracowników (33 ze 100 badanych) była nieobecna 1 raz, czyli modalną jest 1 nieobecność.
Medianą czyli wartością środkową w przypadku 100 pracowników jest liczba nieobecności środkowego 50 pracownika. Aby ustalić ile nieobecności miał ten pracownik warto stworzyć kolumnę z liczebnościami skumulowanymi (czwarta kolumna w tabeli poniżej). Wówczas łatwo można zauważyć, że 50 pracownik był nieobecny 1 raz, a zatem oznacza to, że połowa pracowników była nieobecna w pracy 1 raz lub mniej (czyli 1 raz lub 0 razy), a druga połowa 1 raz lub więcej (czyli 1, 2, 3, 4 lub 5 razy).
Na podobnej zasadzie jak mediana wyznaczane są kwartyle. Kwartyl pierwszy wynosi 0, bowiem 25 pracownik (a więc ten, który zamyka pierwszą ćwiartkę) był nieobecny 0 razy. Znaczy to, że 1/4 wszystkich pracowników była nieobecna 0 razy (nie trzeba dopisywać „lub mniej” bo mniej niż 0 nieobecności nie może wystąpić), a 3/4 była nieobecna 0 razy lub więcej (np. 26 i 27 pracownik należący do tych 3/4 też byli nieobecni 0 razy, więc nie można pominąć określenia „0 razy lub więcej” i napisać samo „więcej niż 0 razy”).
W przypadku kwartyle trzeciego (liczba nieobecności 75 pracownika - zamykającego trzecią ćwiartkę), z czwartej kolumny w tabeli poniżej widać, że znajduje się on w grupie 80 pracowników, którzy byli nieobecni co najwyżej 2 razy, a on sam był nieobecny właśnie 2 razy, stąd taka jest wartość kwartyla trzeciego. Znaczy to, że 3/4 pracowników była nieobecna 2 razy lub mniej, a 1/4 była nieobecna 2 razy lub więcej.
Tabela pomocnicza:
Liczba nieobecności (xi) | Liczba pracowników (ni) | xi ⋅ ni | nskum | |
---|---|---|---|---|
0 | 27 | 0 ⋅ 27 = 0 | 27 | ← pozycja 25 pracownika |
1 | 33 | 1 ⋅ 33 = 33 | 60 | ← pozycja 50 pracownika |
2 | 20 | 2 ⋅ 20 = 40 | 80 | ← pozycja 75 pracownika |
3 | 12 | 3 ⋅ 12 = 36 | 92 | |
4 | 5 | 4 ⋅ 5 = 20 | 97 | |
5 | 3 | 5 ⋅ 3 = 15 | 100 | |
Razem | 100 | Σ = 144 |
Zadanie 3) W ankiecie skierowanej do studentów UEP zadano pytanie jaką kwotę (w złotówkach) wydali w ostatnim tygodniu nauki na kserowanie materiałów do zajęć. Dane przedstawia poniższa tabela:
Wydatki na kulturę w zł (xi) |
Liczba uczniów (ni) |
---|---|
0 − 4 4 − 8 8 − 12 12 − 16 16 − 20 20 − 24 24 − 28 |
15 30 40 50 45 35 25 |
Suma | 240 |
Wyznacz średnią arytmetyczną oraz pozostałe miary przeciętne. Dodatkowo przedstaw graficznie modalną i wszystkie kwartyle.
Rozwiązanie:
Zgodnie ze wzorem na średnią arytmetyczną w szeregu rozdzielczym wielowariantowym, po podstawieniu odpowiednich wartości otrzymujemy = 14,75 czyli każdy ze studentów w badanym tygodniu nauki przeciętnie wydawał na ksero 14 złotych 75 groszy (niezbędne kalkulacje pokazuje również tabela poniżej, konkretnie trzecia i czwarta kolumna)
Modalna (dominanta) informuje jaka kwota wydatków na ksero dominowała wśród studentów. Na podstawie maksymalnej liczebności ustalono, że była to kwota między 12 a 16 zł. Korzystając ze wzoru po podstawieniu odpowiednich wartości otrzymujemy = 14,67. Można zatem powiedzieć, że najwięcej studentów wydawało na ksero 14 złotych 67 groszy.
Medianą czyli wartością środkową w przypadku 240 studentów jest wydatek środkowego 120 studenta. Aby ustalić wydawaną przez niego kwotę, na podstawie kolumny skumulowanych liczebności (ostatnia kolumna w tabeli poniżej) ustalamy, że znajduje się on wśród 135 studentów, a zatem wydawał kwotę między 12 a 16 zł. Ze wzoru ustalamy iż = 14,80. Oznacza to, że połowa studentów wydała 14 złotych 80 groszy lub mniej, a połowa taką kwotę lub wyższą.
Na podobnej zasadzie jak mediana wyznaczane są kwartyle, pierwszy i trzeci:
= = 9,50 zł
Komentarz: 1/4 studentów wydała nie więcej niż 9 złotych 50 groszy, a 3/4 nie mniej niż tę kwotę
= = 20,00 zł
Komentarz: 3/4 studentów wydała nie więcej niż 20 złotych, a 1/4 nie mniej niż tę kwotę
Tabela pomocnicza:
Wydatki na kulturę w zł (xi) |
Liczba uczniów (ni) |
x’i | x’i ⋅ ni | nskum | |
---|---|---|---|---|---|
0 − 4 4 − 8 8 − 12 12 − 16 16 − 20 20 − 24 24 − 28 |
15 30 40 50 45 35 25 |
2 6 10 14 18 22 26 |
2 ⋅ 15 = 30 6 ⋅ 30 = 180 10 ⋅ 40 = 400 14 ⋅ 50 = 700 18 ⋅ 45 = 810 22 ⋅ 35 = 770 26 ⋅ 25 = 650 |
15 45 85 135 180 215 240 |
← pozycja 60 pracownika ← pozycja 120 pracownika ← pozycja 180 pracownika |
Suma | 240 | Σ = 3540 |
Rys.1. Graficzne przedstawienie modalnej
Rys.2. Graficzne przedstawienie kwartyli