Istota i przedmiot statystyki.
Prezentacja danych statystycznych
Znaczenia słowa statystyka
• Znaczenie I - nazwa zbioru danych liczbowych
prezentujących kształtowanie się określonych zjawisk
i procesów.
• Znaczenie II - nazwa wszelkich prac związanych z
gromadzeniem i opracowywaniem danych liczbowych.
• Znaczenie III - nazwy pewnych charakterystyk
liczbowych obliczanych ze zbiorowości próbnych.
• Znaczenie IV - nazwa dyscypliny naukowej,
posiadającej własne metody badawcze.
Statystyka jako nauka
Statystyka jest nauką traktującą o specyficznych metodach
ilościowych dostosowanych do badania prawidłowości zjawisk
masowych.
Statystyki branżowe Statystyka opisowa
Statystyka matematyczna
Funkcje statystyki
• Funkcja informacyjna - statystyka daje pełny i obiektywny obraz badanych zjawisk.
• Funkcja analityczna - statystyka określa czynniki kształtujące konkretne zjawiska
i procesy.
• Funkcja prognostyczna - statystyka pozwala na przewidywanie poziomu i struktury
zjawisk.
Badanie statystyczne
Badanie statystyczne - to ogół prac mających na celu poznanie struktury danej zbiorowości statystycznej.
Etapy badania statystycznego
Etap I - przygotowanie badania
Etap II - obserwacja statystyczna
Etap III - opracowanie statystyczne
Etap IV - analiza statystyczna
Rodzaje badań statystycznych
• Badania pełne - obejmujące wszystkie jednostki danej zbiorowości.
• Badania częściowe - obejmujące niektóre jednostki zbiorowości statystycznej.
• Badania interpolacyjne i ekstrapolacyjne (metody pośrednie).
Rodzaje badań statystycznych
• Badania ciągłe - badania, w których zjawiska zmieniające się w czasie są
obserwowane i analizowane sukcesywnie i nieprzerwanie.
• Badania okresowe - badania, które są prowadzone w pewnych, zazwyczaj
regularnych odstępach czasowych.
• Badania doraźne - badania, które są podejmowane w pewnych szczególnych
sytuacjach.
Podstawowe pojęcia
Zbiorowością statystyczną (populacją) nazywamy pewną, zazwyczaj dużą liczbę jednostek mających jedną lub kilka cech stałych oraz wiele cech zmiennych, których warianty wyróżniają poszczególne jednostki zbiorowości statystycznej.
Jednostka statystyczna to element składowy badanej zbiorowości statystycznej.
Cecha statystyczna - właściwość, którą ma i którą się wyróżniają
jednostki wchodzące w skład zbiorowości statystycznej.
Cechy statystyczne
Cechy stałe Cechy zmienne
Cecha
rzeczowa Cecha przestrzenna Cecha czasowa Cecha jakościowa Cecha ilościowa
Cecha ilościowa Cecha ilościowa
skokowa ciągła
Prezentacja materiału statystycznego
Opracowanie materiału statystycznego obejmuje następujące czynności:
porządkowanie, zliczanie danych oraz grupowanie statystyczne.
Szereg statystyczny - materiał statystyczny, który został uporządkowany
lub uporządkowany i pogrupowany według wariantów jednej wybranej
cechy statystycznej.
Tabele statystyczne
Tabela statystyczna - są tworzone w celu: prezentacji, opracowania, popularyzacji, analizie zebranego materiału statystycznego. Tabele statystyczne to liczbowy obraz struktury badanej zbiorowości.
Elementy składowe tabeli statystycznej:
- tytuł tabeli,
- tabela właściwa,
- źródło danych,
- wyjaśnienia.
Sposoby opracowania zbiorów o małej liczebności. Graficzne przedstawianie danych. Średnia arytmetyczna. Średnia ważona. Podstawowe miary zmienności - średnie odchylenie standardowe, wariancja, błędy statystyczne. Statystyka w MS Excel.
Opracowanie materiału statystycznego
Grupowanie statystyczne /podział całej zbiorowości statystycznej na mniejsze jej części, czyli jednolite grupy jednostek/
Wyodrębnienie tych grup dokonywane jest na podstawie jednoznacznych kryteriów. Tymi kryteriami są warianty cechy statystycznej. Jeżeli cecha statystyczna ma charakter naturalny (np. płeć), wówczas grupowanie statystyczne ma również charakter naturalny (np. podział mieszkańców Poznania na mężczyzn i kobiety). Najczęściej jednak kryteria podziału zbiorowości na grupy nie mają charakteru naturalnego i wówczas prowadzący badania musi zdecydować o tym, jakie mniejsze grupy zostaną wyodrębnione w ramach badanej zbiorowości.
Grupowanie statystyczne pozwala na uporządkowanie materiału statystycznego i zapewnia jego porównywalność.
Celem grupowania statystycznego jest wskazanie podobieństw i różnic występujących w badanej zbiorowości statystycznej oraz sformułowanie obiektywnych wniosków ogólnych.
Decydujące znaczenie, przy dokonywaniu grupowania statystycznego, ma cel badania statystycznego.
Punktem wyjścia przy grupowaniu statystycznym jest stworzenie wykazu klasyfikacyjnego, czyli uporządkowanego wykazu wariantów cech. W przypadku cechy niemierzalnej i cechy mierzalnej ze zmiennością skokową o niewielkiej liczbie wariantów stworzenie wykazu klasyfikacyjnego jest zadaniem stosunkowo prostym – można ograniczyć się do wypisania wszystkich cech.
Przykłady wykazów klasyfikacyjnych
Tablica 1
Grupowanie ludności wg wykształcenia
Wykształcenie |
podstawowe |
zasadnicze zawodowe |
średnie |
wyższe |
Gdy badana cecha mierzalna ma charakter ciągły, warianty cechy w wykazie klasyfikacyjnym powinny być przedstawione w postaci przedziałów liczbowych nazywanych przedziałami klasowymi.
Tablica 2
Płace w Spółce Akcyjnej „Klin” w Białymstoku we wrześniu 2006 r.
Płace w zł |
(2700 – 2900> |
(2900 – 3100> |
(3100 – 3300> |
(3300 – 3500> |
(3500 – 3700> |
|
|
|
|
Płace w zł (xi0 – xit> |
2700 – 2900 |
2900 – 3100 |
3100 – 3300 |
3300 – 3500 |
3500 – 3700 |
W wykazach klasyfikacyjnych z cechą ze zmiennością ciągłą ważne jest wyznaczenie środków poszczególnych przedziałów klasowych oznaczanych
=
Gdzie:
i=1,2,….,n – numer przedziału klasowego
xi0 – dolna granica przedziału klasowego o numerze i
xit – górna granica przedziału klasowego o numerze i
Tworząc wykaz klasyfikacyjny z cechą ze zmiennością ciągłą należy podjąć decyzję o rozpiętości przedziałów klasowych.
Z reguły ustala się jednakowe rozpiętości przedziałów klasowych. Przy równej rozpiętości przedziałów klasowych liczebności (częstości) występujące w poszczególnych klasach są porównywalne.
Przy różnych rozpiętościach (dla populacji niejednorodnej z dużą koncentracją wartości w jednej grupie) zamiast liczebności (częstości) stosuje się wskaźnik: gęstość liczebności (gęstość częstości).
Gęstość liczebności (gęstość częstości) - jest to stosunek liczebności (częstości) danej klasy do rozpiętości przedziału klasowego: |
gęstość liczebności |
(wzór1) |
szereg rozdzielczy |
( wzór 2) |
Dla szeregu rozdzielczego o jednakowych rozpiętościach przedziałów klasowych hi = h:
( wzór 3)
gdzie: nazywa się rozstępem, a k oznacza liczbę klas.
Uwaga: Jeżeli wybieramy przybliżoną wartość h, to powinno to być zawsze przybliżenie z nadmiarem, tzn. .
Ustalanie granic poszczególnych klas
Jako dolną granicę najczęściej przyjmuje się najmniejszą wartość cechy lub bliskiej tej wartości, czyli . Przy cechach ciągłych górne granice klas poprzednich powinny być dolnymi granicami klas następnych, aby nie było pomiędzy przedziałami luk Ponadto trzeba ustalić, do które klasy zaliczyć wartości graniczne.
W szeregach o otwartych przedziałach klasowych, konieczne jest czasami domknięcie tych przedziałów. Stosuję się tutaj zasadę, że jeżeli liczebność w tych przedziałach jest niewielka (nie większa niż 5% badanej zbiorowości, można te przedziały domknąć taką szerokością, jaka jest w sąsiednich przedziałach klasowych.
Wskaźnik struktury wi lub częstość (liczebność względna, frakcja, odsetek) - występowania danego wariantu cechy nazywa się stosunek liczby jednostek o danej wartości cechy do liczebności próby. |
(wzór 3)
przy czym: .
Szereg rozdzielczy skumulowany - uzyskuje się poprzez przyporządkowanie kolejnym wariantom cechy odpowiadających im liczebności (częstości) skumulowanych, informuje, dla ilu jednostek badanej zbiorowości cecha przyjmuje wartości nie większe od górnej granicy poszczególnego przedziału klasowego. |
Skumulowany wskaźnik struktury wisk (częstość skumulowana):
( wzór 4)
gdzie nisk oznacza liczbę jednostek, których cechy odpowiadają wartościom nie większym niż xi.
Dystrybuanta empiryczna - przyporządkowanie kolejnym wartościom cechy statystycznej (zmiennej) odpowiadających im częstości skumulowanych (względnie liczebności skumulowanych) |
Ustalanie liczby klas
Liczby klas w zależności od liczebności badanej zbiorowości |
|
Liczba obserwacji n |
Liczba zalecanych klas k |
40-60 60-100 100-200 200-500 |
6-8 7-10 9-12 11-17 |
wzory:
( wzór 5)
( wzór 6)
Tablica 3
Przykład złożonego grupowania statystycznego wg płci i poziomu płac
Płace w zł (xi0 – xit> |
Liczba zatrudnionych |
|
kobiet |
mężczyzn |
|
2700-2900 |
220 |
70 |
2900-3100 |
660 |
250 |
3100-3300 |
480 |
720 |
3300-3500 |
1150 |
650 |
3500-3700 |
90 |
310 |
Razem |
1600 |
2000 |
Ćwiczenia /arkusz kalkulacyjny/
1. Dokonaj grupowania przedsiębiorstw według liczby zatrudnionych w nich pracowników wiedząc, że liczba pracowników w poszczególnych przedsiębiorstwach wynosi:
100 |
125 |
170 |
144 |
144 |
235 |
301 |
100 |
100 |
170 |
144 |
235 |
100 |
301 |
170 |
301 |
125 |
125 |
235 |
125 |
125 |
100 |
144 |
301 |
144 |
144 |
170 |
144 |
144 |
144 |
|
|
|
|
|
|
|
|
Rozstrzygnij, czy w tej sytuacji lepsza będzie cecha mierzalna skokowa czy mierzalna ciągła. Sporządź szereg rozdzielczy i wypełnij go. Przedstaw graficznie informacje zawarte w szeregu.
2. Na podstawie informacji o wieku słuchaczy II roku WSM w Poznaniu przeprowadź grupowanie statystyczne wg kryterium „wiek” (w latach ukończonych). Ustal liczebność każdej grupy wiekowej i sporządź szereg rozdzielczy z przedziałami o rozpiętości dwa lata dla każdego przedziału, jeżeli dane dotyczące wieku słuchaczy są następujące:
26 |
18 |
30 |
20 |
23 |
25 |
19 |
28 |
20 |
24 |
18 |
28 |
21 |
26 |
25 |
23 |
21 |
26 |
20 |
28 |
25 |
21 |
26 |
20 |
19 |
29 |
20 |
22 |
23 |
18 |
19 |
31 |
23 |
28 |
25 |
19 |
21 |
26 |
26 |
20 |
25 |
26 |
20 |
21 |
26 |
21 |
20 |
21 |
26 |
30 |
21 |
21 |
20 |
29 |
28 |
20 |
21 |
19 |
20 |
22 |
21 |
26 |
19 |
31 |
25 |
26 |
26 |
25 |
20 |
21 |
26 |
30 |
28 |
26 |
30 |
22 |
28 |
25 |
23 |
21 |
20 |
26 |
20 |
21 |
26 |
20 |
21 |
20 |
21 |
29 |
21 |
|
|
|
|
|
Przedstaw graficznie informacje zawarte w szeregu.
3. Przedstaw graficznie informacje zawarte w szeregach.
a) przedstawionych w Tablicy 3
b) Tablica 4
Ludność w milionach w latach: 1980, 1990, 2000, 2002
Wyszczególnienie |
1980 |
1990 |
2000 |
2002 |
Afryka |
467 |
620 |
794 |
832 |
Ameryka Północna i Środkowa |
374 |
428 |
487 |
498 |
Ameryka Południowa |
242 |
295 |
346 |
357 |
Azja |
2631 |
3164 |
3672 |
3768 |
Europa |
693 |
722 |
727 |
725 |
Oceania |
23 |
26 |
31 |
31 |
Razem |
4430 |
5255 |
6057 |
6211 |
Źródło: Mały Rocznik Statystyczny Polski 2003 s. 506 tabl. 13 (305)
Analiza tendencji centralnej
Analiza badanych zbiorowości statystycznych z określonego punktu widzenia na
podstawie cech
mierzalnych wymaga ustalenia dla tych zbiorowości przeciętnego
poziomu wartości. Badane zbiorowości charakteryzują się zwykle
pewną tendencją centralną, co oznacza, że wartości cechy, które
są bliższe przeciętnemu poziomowi wartości cechy, występują z
większą częstotliwością.
Przeciętny poziom wartości
cechy obliczamy za pomocą specjalnych miar statystycznych –
średnich.
Średnia jest miarą odzwierciedlającą przeciętny poziom cechy mierzalnej jednostek zbiorowości statystycznej, charakteryzuje centralnie położona wartość, dookoła, której skupiają się jednostki zbiorowości.
Średnie dzieli
się na dwie zasadnicze grupy:
średnie klasyczne – przy ich wyliczaniu uwzględniamy wszystkie wartości szeregu statystycznego ( średnia arytmetyczna, harmoniczna, geometryczna)
średnie pozycyjne – będące wartościami konkretnych wyrazów szeregu statystycznego, wyrazów wyróżniających się pod jakimś względem ( mediana – wartość środkowa, dominanta – wartość dominująca).
1.1
Pojecie średniej arytmetycznej
Średnia arytmetyczna jest to iloraz ogólnej wartości zmiennej i ogólnej liczby jednostek badanej zbiorowości.
Średnia jest więc
taka wartością cechy, jaka miały by wszystkie jednostki przy
ustalonej sumie cechy, gdyby nie występowała zmienność. Oznacza
to, że gdyby każda z jednostek przyjmowała jednakowa wartość, to
ta wartość byłaby równa średniej
arytmetycznej.
1.2
Średnia arytmetyczna prosta
Przed przystąpieniem do obliczeń należy przyjąć następujące założenia:
Xi - wartość cechy dla i-tej jednostki zbiorowości
N – liczba spostrzeżeń
X – średnia arytmetyczna
Zgodnie z definicją średniej arytmetycznej otrzymujemy następujący wzór:
x =
Przykład
1
Oblicz przeciętny
wiek 5 wybranych osób.
Wiek osób w latach: 18, 32. 40, 24, 26
x = ( 18+32+40+24+26): 5 =28
Przeciętny wiek w badanej zbiorowości wynosi 28 lat.
Średnia arytmetyczna ważona i sposoby jej obliczania
Jeżeli informacje dotyczące wartości cech nie są podane w formie szeregu z indywidualnymi wartościami cechy, lecz w formie szeregu rozdzielczego rozdzielczego o różnej liczebności poszczególnych klas wówczas obliczanie średniej arytmetycznej prostej dałoby wyniki błędne, gdyż różne wartości cechy występują w zbiorowości z różną częstotliwością i ich wpływ na średnią nie jest jednakowy. W takich sytuacjach obliczamy się średnią arytmetyczną ważoną.
Jeżeli
informacje podano w formie szeregu rozdzielczego punktowego
średnią obliczamy wg wzoru:
x
=
Przykład
2
Na
podstawie poniższych danych oblicz przeciętny wiek uczniów.
Uczniowie wg wieku w TCE Tarnów w IX br.
Wiek w latach( x) |
Liczba uczniów(n) |
Wiek ogółem (xn) |
16 |
275 |
4400 |
17 |
180 |
3060 |
18 |
98 |
1764 |
19 |
33 |
627 |
20 |
21 |
420 |
Razem |
607 |
10271 |
Źródło: dane umowne
X
=
Przeciętny
wiek uczniów wynosi 16.9 lat.
Jeżeli
informacje podano w formie szeregu rozdzielczego klasowego wówczas
średnią arytmetyczna liczymy wg wzoru
X
=
Przykład 3
Na podstawie poniższych
danych oblicz średnie wynagrodzenie
Wynagrodzenie
pracowników „OLA” sp. z o.o. w X br.
Wynagrodzenie w zł (x) |
Liczba pracowników (n) |
Środek przedziału (x ) |
Wynagrodzenie ogółem (x n) |
1500 – 1800 |
385 |
1650 |
635250 |
1800 - 2100 |
250 |
1950 |
487500 |
2100 – 2400 |
480 |
2250 |
1080000 |
2400 – 2700 |
135 |
2550 |
344250 |
Razem |
1250 |
X |
2547000 |
Źródło: dane umowne
X = 2037,6 zł.
Przeciętne wynagrodzenie w badanej zbiorowości wynosiło 2037,6 zł.
Cechy średniej arytmetycznej
Średnia arytmetyczna,
ze względu na logiczną i prostą konstrukcję jest najczęściej
stosowaną średnią klasyczną.
Odznacza się ona wieloma
własnościami:
Średnia arytmetyczna jest wielkością mianowaną, tzn. wyrażana jest w konkretnych jednostkach miary np. w zł, mb, kg , latach
Średnia
arytmetyczna dla danej zbiorowości nie może być wielkością
mniejszą od najmniejszej wartości a większą od największej
wartości.
Rozpatrując przykład 1 średni wiek 28 lat jest
mniejszy od 40 lat ale większy od 18 lat.
Suma wartości cechy jest równa średniej arytmetycznej pomnożonej przez liczebność.
Z przykładu 1 wynika :
18+32+40+24+26 =140
28 *5 = 140
Suma odchyleń
od średniej arytmetycznej wyrazów szeregu równa się zero.
Z
przykładu 1
(18 -28) +(32-28)+(40-28)+(24-28)+(26-28)=0
Przykład 4
Średnia płaca w 4 osobowej rodzinie wynosi 1350 zł. Rodzice otrzymują wynagrodzenie w wysokości 1720zł, 1480zł. Syn otrzymuje 1280zł. Jakie wynagrodzenie otrzymuje córka?
Cała rodzina zarabia 1350 * 4 = 5400
Córka otrzymuje wynagrodzenie: 5400 -1720 -1480 -1280 = 920
Ćwiczenia
Ćw.1
Wydatki na zakup prasy wybranych rodzin w miastach i na wsi województwa małopolskiego w bm. przedstawiono w poniższej tabeli.
Oblicz przeciętne
wydatki na zakup prasy w mieście i na wsi.
Wydatki na zakup prasy w bm. w województwie małopolskim.
Wydatki w zł (x) |
Liczba rodzin na wsi (n) |
Liczba rodzin w mieście (n) |
Środek przedziału (x) |
Ogółem wydatki ludności
wiejskiej |
Ogółem wydatki ludności miejskiej (x*n) |
0 -10 |
1260 |
1430 |
|
|
|
10 -20 |
1400 |
1790 |
|
|
|
20-30 |
1610 |
1800 |
|
|
|
30 - 40 |
1300 |
2500 |
|
|
|
40-50 |
770 |
1400 |
|
|
|
Razem |
|
|
|
|
|
Źródło: dane umowne
Średnie wydatki na zakup prasy poniesione przez ludność zamieszkałą w mieście wynoszą:
x = 25,73zł.
Średnie wydatki na zakup prasy przez ludność zamieszkałą na wsi wynoszą:
X = 23,30zł.
Ćw. 2
Hurtownia posiada
następujące pomieszczenia:
Powierzchnia składowania w m2 |
Liczba pomieszczeń |
20 |
12 |
25 |
8 |
30 |
10 |
Źródło: dane umowne
Oblicz przeciętna powierzchnię składowania.
Ćw 3. Kapitał udziałowy w sp. z o.o w Tarnowie przedstawiał się następująco:
Kapitał udziałowy w tys. zł |
Liczba spółek |
50 – 60 |
20 |
60 - 70 |
35 |
70 - 80 |
15 |
80 - 90 |
8 |
Źródło: dane umowne
Obliczyć średni kapitał udziałowy.
2.1 Pojęcie i zastosowanie dominanty.
Dominanta – wartość modalna – moda.
Dominanta
(Dx) jest to wartość cechy, która występuje najliczniej,
najczęściej w badanej zbiorowości. Jest to wartość typowa dla
danej zbiorowości.
Obliczanie wartości modalnej jest przydatne
w badaniach dotyczących rynku, np. najbardziej poszukiwany towar,
rozmiar, kolor.
2.2 Sposoby obliczania dominanty
Obliczanie
dominanty w szeregach szeregach z indywidualnymi wartościami oraz
szeregach rozdzielczych punktowych jest bardzo proste, dominantą
jest ta wartość cechy, którą przyjmuje największa liczba
jednostek.
Wiek uczniów klasie IV Liceum
Ekonomicznego:
18. 18 .18. 19. 18, 18, `18, 18 ,19 .18. 18. 18,
18 , 20, 18, 18 19 18 18 18
Dominata Dx wynosi 18 lat, na
20 osób - 16 miało 18 lat.
Wiek
uczniów IV klasy LE
Wiek w latach |
Liczba ucznów |
18 (Dx) |
16 |
19 |
3 |
20 |
1 |
Razem |
20 |
Dominujący
wiek w badanej grupie wynosi 18 lat
Wyznaczanie
dominanty w szeregach statystycznych klasowych jest nieco
trudniejsze. Szereg powinien mieć równe przedziały klasowe.
Na wstępie znajdujemy przedział w którym mieści się
dominanta, jest to klasa o największej liczbie obserwacji. Wartość
dominanty wyznaczamy w sposób przybliżony wg wzoru:
dolna granica klasy dominanty
l – przedział klasowy
liczebność klasy najliczniejszej
- liczebność klasy poprzedzającej klasę najliczniejszą
- liczebność klasy następującej po najliczniejszej klasie
Wyznaczanie wartości dominanty jest możliwe tylko wtedy, gdy rozpiętość przedziałów klasowych jest jednakowa.
Przykład 1
Na podstawie poniższych danych obliczyć dominujące wydatki na zakup prasy.
Wydatki na zakup prasy w bm. wybranych rodzin w województwie małopolskim.
Wydatki w zł |
Liczba rodzin na wsi |
Liczba rodzin w mieście |
0 – 10 |
1260 |
1430 |
10 -20 |
1400 |
1790 |
20 -30 |
1610 Dx |
1800 |
30 -40 |
1300 |
2500Dx |
40 -50 |
770 |
1400 |
Razem |
6340 |
8920 |
Źródło: dane umowne
Wyznaczamy przedział dominanty:
dla rodzin mieszkających na wsi dominanta znajduje się w przedziale wydatków 20 -30 ( najwięcej rodzin)
dla rodzin mieszkających w mieście dominanta znajduje się w przedziale wydatków 30 -40 zł
Obliczamy
dominujące wydatki na zakup prasy przez ludność wiejską
podstawiając do wzoru;
= 24.04
Wśród
rodzin wiejskich dominuje wydatek na zakup prasy w wysokości 24,04
zł.
Obliczamy dominujące wydatki wśród rodzin miejskich:
Rodziny mieszkające w mieście najczęściej wydają na zakup prasy 33,89 zł
2.3 Graficzne wyznaczanie dominanty
Dane
statystyczne przedstawiamy w formie histogramu( słupki przylegające
do siebie w układzie współrzędnych).Wyznaczanie dominanty polega
na wykreśleniu z górnej podstawy prostokąta odzwierciedlającego
przedział dominanty dwóch przekątnych łączących wierzchołki
tego prostokąta z przylegającymi wierzchołkami górnych podstaw
sąsiednich prostokątów. Rzut punktu przecięcia tych przekątnych
na oś odciętych umożliwia odczytanie wartości
modalnej.
Wyznaczam
dominantę na podstawie danych liczbowych z przykładu 1
Źródło: opracowanie własne na podstawie danych umownych
Źródło: opracowanie własne na podstawie danych umownych
2.4
Ćwiczenia
Ćwiczenie 1
Podczas kolejnych sesji giełdowych kurs akcji „M” kształtował się następująco:
86, 89,45, 86,86,86,86,86,56,67,86,56,98,32,86,86, 86, 86, 86,87,86,78
wskaż dominantę.
Odpowiedź: 86 zł
Ćwiczenie
2
Na podstawie poniższych danych oblicz dominujące dochody.
Dochody pracowników „KOKO” sp. z o.o. za bm.
Dochody w zł |
Liczba pracowników |
900 -1000 |
23 |
1000- 1400 |
33 |
1400 -1600 |
12 |
1600 -1800 |
5 |
Źródło: dane umowne
Odpowiedź:
Z
powyższych danych nie można obliczy dominanty, ponieważ
rozpiętości przedziałów klasowych są różne.
Ćwiczenie
3
Obliczyć dominantę oraz wyznaczyć
graficznie.
Wynagrodzenie pracowników „NANA” sp. z
o.o. za bm.
Wynagrodzenie w zł |
Liczba pracowników |
800 -1000 |
12 |
1000 – 1200 |
30 |
1200 - 1400 |
80 |
1400 – 1600 |
20 |
Źródło: dane umowne
Odpowiedź:
Dominujące wynagrodzenie wynosi 1290,91 zł.
3
Mediana (Mx)
Istota mediany
Mediana( wartość środkowa) jest to wartość tego wyrazu w szeregu uporządkowanym, powyżej którego i poniżej którego znajduje się jednakowa liczba obserwacji.
Szereg uporządkowany – szereg w którym wartości cechy mierzalnej są ułożone kolejno od wartości najmniejszej do największej lub odwrotnie
Sposoby obliczania i
interpretacji mediany
Sposób obliczania mediany zależy od tego czy:
Rozpatrywana zbiorowość składa się z parzystej czy teź nieparzystej liczby obserwacji
Wartości zmiennej podano w formie indywidualnych wartości czy też ujęto w szeregu rozdzielczym klasowym
3.2.1 Mediana w szeregach z indywidualnymi wartościami:
o nieparzystej liczbie obserwacji
Medianą jest wartość wyrazu, którego numer kolejny jest połową liczby wyrazów szeregu powiększonej o 1, co można oznaczyć
Przykład 1
Wiek słuchaczy SP w latach:
23, 34,32,19,20
Aby
wyznaczyć medianę należy szereg uporządkować czyli: 19.20,23,
32,34
Mediana wynosi 23 lata, trzeci (
)
słuchacz mający 23 lata dzieli zbiorowość na 2 części, przed
nim jest dwie i za nim jest dwie osoby.
b)
o parzystej liczbie obserwacji
Medianą
jest średnia arytmetyczna dwóch wyrazów środkowych, oznaczając
to symbolami otrzymujemy:
Przykład 2
Wiek
słuchaczy:
19. 20, 23, 32, 34, 38
x
Mediana
wynosi ( 23+32):2 = 27,5 lat
50% badanych słuchaczy miało
mniej niż 27,5 lat a 50% miało więcej niż 27,5 lat
3.2.2
Mediana z szeregów rozdzielczych klasowych
Obliczanie
mediany z szeregów rozdzielczych przedziałowych polega na:
ustaleniu numeru kolejnego obserwacji, której wartość jest medianą
ustaleniu klasy, w której znajduje się mediana
obliczeniu wartości wg wzoru
-
dolna granica klasy mediany
l – rozpiętość klasy mediany
- liczebność klasy mediany
n – ogólna liczba obserwacji
-
skumulowana liczebność w klasach poprzedzających klasę
mediany
Przykład3
Obliczyć i podać interpretację mediany.
Wydatki
wybranych rodzin województwa małopolskiego małopolskiego bm. na
zakup prasy,
Wydatki w zł |
Liczba rodzin na wsi |
Liczba rodzin w mieście |
Skumulowana liczba rodzin wiejskich |
Skumulowana liczba rodzin miejskich |
0 -10 |
1260 |
1430 |
1260 |
1430 |
10 -20 |
1400 |
1790 |
2660 |
3220 |
20-30 |
1610 |
1800 |
4270 |
5020 |
30 -40 |
1300 |
2500 |
5570 |
7520 |
40 -50 |
770 |
1400 |
6340 |
8920 |
razem |
6340 |
8920 |
x |
x |
a)
obliczamy medianę wydatków ponoszonych przez rodziny zamieszkałe
na wsi
ustalamy numer kolejny obserwacji, której wartość jest medianą
3170 rodzina ponosi wydatki, które są medianą
ustalenie klasy mediany
Mając numer wyrazu, którego wartość jest medianą odnajdujemy
klasę, w której znajduje się ten wyraz. W tym celu budujemy szereg
kumulacyjny. Poszczególne wyrazy tego szeregu kumulują(sumują)
liczbę wyrazów(obserwacji) z klas poprzednich z liczba obserwacji
klasy badanej np. wydatki od 0 -20 zł ponosi 1260+1400=2660 rodzin
wiejskich, wydatki 0 -30 ponosi 2660+1610=4270 itd.
Mediana jest
wartością 3170 wyrazu, znajduje się więc w klasie 20 -30zł.
Jest tak, gdyż poprzednia klasa zawiera 2660 obserwacji a liczba
obserwacji, w której znajduje się mediana,
łącznie z liczba wyrazów w klasie poprzedniej wynosi już
4270 tzn. ze 3170 mieści się w tej klasie
obliczanie wartości mediany
= 23,18 zł
50% rodzin mieszkających na wsi wydawało na zakup prasy w bm. mniej a 50% więcej niż 23,18 zł
Graficzne wyznaczanie mediany
W układzie prostokątnym wykreślamy skumulowany histogram( lub diagram).na osi rzędnych(Y) znajdujemy wartość numeru mediany( n:2) i przez ten punkt prowadzimy prostą równoległą do osi odciętych(X). Pierwszy prostokąt skumulowanego histogramu, który jest przecięty przez tę prostą to przedział mediany. W prostokącie tym rysujemy przekątną łączącą prawy górny wierzchołek tego prostokąta z prawym górnym wierzchołkiem prostokąta poprzedniego. Prosta równoległa do osi X przecina wyznaczoną przekątną. Rzutując otrzymany punkt na os odciętych, odczytujemy wartość mediany.
Przykład 4
Przedstawię teraz graficzne wyznaczanie mediany na podstawie liczbowych założeń z przykładu 3
Żrodło: opracowanie własne na podstawie danych umownych
Ćwiczenia
a)
Obliczyć medianę wydatków ponoszonych przez rodziny zamieszkałe
w mieście
numer kolejny, który jest medianą
odpowiedź – 4460
ustalenie klasy mediany
odpowiedź 20 -30
mediana
odpowiedź; 26,89zł
b) wyznaczyć medianę graficznie
Źródłoopracowanie własne na podstawie danych umownych
Podsumowanie
Średnie: arytmetyczna, mediana, dominanta nie zastępują się
wzajemnie, gdyż każda z nich odpowiada na inne pytania,
uzupełniają się natomiast dając łącznie wyraźniejszą
charakterystykę zbiorowości.
Średnia arytmetyczna tym
lepiej odzwierciedla badaną zbiorowość pod względem oceny
przeciętnego poziomu cechy, im bardziej symetryczny jest rozkład
cechy. Jeżeli występuje asymetria to stosuje się średnie
pozycyjne, które w przeciwieństwie do średniej arytmetycznej można
wyznaczyć nie rozpatrując całego szeregu statystycznego, lecz
jedynie określoną jego część.
Stosowanie średnich pozycyjnych jako miar uzupełniających dla
średniej arytmetycznej daje szersze informacje o rozkładzie badanej
zbiorowości.
Pomiędzy miarami tendencji centralnej mogą występować relacje:
wszystkie miary tendencji centralnej mają taką samą wartość: ,co oznacza, że liczba jednostek, która posiada wartości cechy wyższe niż średnia arytmetyczna jest taka sama jak liczba jednostek, która posiada wartości cechy niższe niż średnia arytmetyczna. Taki rozkład wartości cechy w zbiorowości statystycznej określamy mianem rozkładu symetrycznego
wartość średniej jest większa niż wartość mediany i wartość mediany jest większa od wartości dominanty, tj. , co oznacza, że wartość cechy większości jednostek statystycznych jest niższa od średniej statystycznej.
Taki rozkład wartości cechy w zbiorowości statystycznej określamy mianem rozkładu o asymetrii prawostronnej.
wartość średniej jest mniejsza niż wartość mediany i wartość mediany jest mniejsza od wartości dominanty, tj. , co oznacza, że wartość cechy większości jednostek statystycznych jest wyższa od średniej statystycznej.
Taki rozkład wartości cechy w zbiorowości statystycznej określamy mianem rozkładu o asymetrii lewostronnej
Incest Bank zamieścił informacje o polityce kredytowej za i
półrocze br.dane dotyczące kredytów udzielonych( podaż) oraz
dane dotyczące kredytów w jakie występowali klienci (popyt)
przedstawiono w poniższej tabeli:
Wysokość kredytu w tyś. zł |
Liczba wniosków |
Liczba kredytów udzielonych |
0-10 |
1360 |
1520 |
10-20 |
1380 |
178 |
20-30 |
1530 |
1040 |
30-40 |
680 |
630 |
40-50 |
450 |
370 |
50-60 |
230 |
180 |
60-70 |
120 |
100 |
70-80 |
100 |
80 |
80-90 |
100 |
60 |
90-100 |
50 |
40 |
Źródło: dane umowne
Na podstawie powyższych danych oceń politykę kredytową
banku.
Oblicz i podaj interpretację:
- średniej arytmetycznej dla popytu i podaży
- dominanty dla popytu i podaży
- mediany dla popytu i podaży
Wyznacz graficznie dominantę i medianę.
Odpowiedzi:
Srednia arytmetyczna dla popytu - 25,167 tyś. Zł
Średnia arytmetyczna dla podaży - 22,465 tyś.zł
Dominanta popytu – 21,5 tyś. Zł.
Dominanta podaży – 12.6 tyś.zł.
Mediana popytu - 21,698 tyś.zł
Mediana podaży – 17,753 tyś.zł.
Zad. kontrolne
Na podstawie informacji o premii pracowników trzech sklepów należących do Spółki Akcyjnej „Edyta” w Kielcach w styczniu 2005 r określ i zinterpretuj asymetrię rozkładów premii wśród pracowników każdego z tych sklepów
Premia w zł (xi0 – xit> |
Liczba pracowników |
||
Sklep I |
Sklep II |
Sklep III |
|
350 – 400 |
2 |
1 |
3 |
400 – 450 |
4 |
7 |
4 |
450 – 500 |
7 |
5 |
4 |
500 – 550 |
4 |
3 |
6 |
550 - 600 |
2 |
3 |
2 |
Razem |
19 |
19 |
19 |