„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
MINISTERSTWO EDUKACJI
NARODOWEJ
Agnieszka Grzybowska
Aneta Łabędzka
Gromadzenie danych statystycznych i ich wykorzystywanie
w procesach decyzyjnych
343[01].Z2.03
Poradnik dla ucznia
Wydawca
Instytut Technologii Eksploatacji – Państwowy Instytut Badawczy
Radom 2006
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
1
Recenzenci:
mgr Zdzisława Koźmin
mgr Barbara Wierzbowska
Opracowanie redakcyjne:
mgr Agnieszka Grzybowska
mgr Aneta Łabędzka
Konsultacja:
dr Elżbieta Sałata
Korekta:
Poradnik stanowi obudowę dydaktyczną programu jednostki modułowej „Gromadzenie
danych statystycznych i ich wykorzystywanie w procesach decyzyjnych” 343[01].Z2.03
zawartego w modułowym programie nauczania dla zawodu technik administracji.
Wydawca
Instytut Technologii Eksploatacji – Państwowy Instytut Badawczy, Radom 2006
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
2
SPIS TREŚCI
1. Wprowadzenie
4
2. Wymagania wstępne
6
3. Cele kształcenia
7
4. Materiał nauczania
8
4.1. Klasyfikacja badań statystycznych, metody i techniki badań
statystycznych
8
4.1.1. Materiał nauczania
8
4.1.2. Pytania sprawdzające
9
4.1.3. Ćwiczenia
9
4.1.4. Sprawdzian postępów
10
4.2. Kontrola materiału statystycznego i etapy jego opracowania
11
4.2.1. Materiał nauczania
11
4.2.2. Pytania sprawdzające
15
4.2.3. Ćwiczenia
15
4.2.4. Sprawdzian postępów
17
4.3. Prezentacja wyników badania statystycznego, opis statystyczny,
zakres analizy statystycznej
18
4.3.1. Materiał nauczania
18
4.3.2. Pytania sprawdzające
25
4.3.3. Ćwiczenia
26
4.3.4. Sprawdzian postępów
27
4.4. Analiza natężenia i struktury
28
4.4.1. Materiał nauczania
28
4.4.2. Pytania sprawdzające
29
4.4.3. Ćwiczenia
28
4.4.4. Sprawdzian postępów
31
4.5. Analiza tendencji centralnej – średnie klasyczne i pozycyjne
32
4.5.1. Materiał nauczania
32
4.5.2. Pytania sprawdzające
36
4.5.3. Ćwiczenia
36
4.5.4. Sprawdzian postępów
38
4.6. Analiza dyspersji – obszar zmienności, odchylenie przeciętne
i standardowe, współczynnik zmienności
39
4.6.1. Materiał nauczania
39
4.6.2. Pytania sprawdzające
42
4.6.3. Ćwiczenia
42
4.6.4. Sprawdzian postępów
44
4.7. Analiza asymetrii – kierunek i siła asymetrii, współczynnik skośności
45
4.7.1. Materiał nauczania
45
4.7.2. Pytania sprawdzające
46
4.7.3. Ćwiczenia
47
4.7.4. Sprawdzian postępów
48
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
3
4.8. Analiza dynamiki
49
4.8.1. Materiał nauczania
49
4.8.2. Pytania sprawdzające
52
4.8.3. Ćwiczenia
52
4.8.4. Sprawdzian postępów
54
4.9. Analiza korelacji zjawisk – tablica i wykres korelacyjny, miary
korelacji
55
4.9.1. Materiał nauczania
55
4.9.2. Pytania sprawdzające
57
4.9.3. Ćwiczenia
58
4.9.4. Sprawdzian postępów
59
5. Sprawdzian osiągnięć
60
6. Literatura
64
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
4
1. WPROWADZENIE
Poradnik będzie Ci pomocny w przyswojeniu wiadomości z zakresu gromadzenia danych
statystycznych i ich wykorzystywania w procesach decyzyjnych.
W poradniku zamieszczono:
−
wymagania wstępne, czyli wykaz umiejętności, jakie ukształtujesz podczas pracy
z poradnikiem,
−
materiał nauczania, czyli minimum wiadomości teoretycznych niezbędnych do
opanowania treści jednostki modułowej,
−
zestaw pytań przydatny do sprawdzenia, czy już opanowałeś podane treści,
−
ćwiczenia, które pomogą Ci zweryfikować wiadomości teoretyczne oraz ukształtować
umiejętności praktyczne,
−
sprawdzian postępów
−
sprawdzian osiągnięć, przykładowy zestaw zadań i pytań. Pozytywny wynik sprawdzianu
potwierdzi, że dobrze pracowałeś podczas lekcji i że nabyłeś wiedzę i umiejętności
z zakresu tej jednostki modułowej,
−
literaturę uzupełniającą.
W rozdziale Materiał nauczania treści kształcenia zostały omówione w sposób ogólny.
Podany zasób wiadomości powinien być wystarczający do osiągnięcia celów kształcenia
niniejszej jednostki modułowej, ale możesz poszerzyć wiadomości o wskazaną literaturę.
Materiał nauczania podzielono na następujące części:
1. Metody i techniki badań statystycznych
2. Kontrola materiału statystycznego i etapy jego opracowania
3. Prezentacja wyników badania statystycznego, opis statystyczny, zakres analizy
statystycznej
4. Analiza natężenia i struktury
5. Analizy tendencji centralnej – średnie klasyczne i pozycyjne
6. Analiza dyspersji – obszar zmienności, odchylenie przeciętne i standardowe, współczynnik
zmienności
7. Analiza asymetrii – kierunek i siła asymetrii, współczynnik skośności
8. Analiza dynamiki
9. Analiza korelacji zjawisk – tablica i wykres korelacyjny, miary korelacji
W części pierwszej materiału nauczania omówiono podstawowe metody badań
statystycznych i techniki ich przeprowadzania. W kolejnych dwóch częściach przedstawiono
etapy opracowywania materiału statystycznego ze zwróceniem szczególnej uwagi na
kompletność zebranych danych statystycznych, a także prezentację uzyskanych wyników.
Następne podrozdziały dotyczą ostatniego etapu badania statystycznego jakim jest analiza
statystyczna. W zależności od zaistniałych potrzeb stosuje się różnego rodzaju analizy, których
celem jest pokazanie i zbadanie zjawiska, a także znalezienie zależności zachodzących w
badanej zbiorowości statystycznej. W materiale nauczania zamieszczono liczne przykłady,
celem lepszego zrozumienia omawianych zagadnień. Pytania sprawdzające zawarte w każdym
podrozdziale sprawdzą stopień przyswojenia przez Ciebie materiału nauczania i gotowość do
wykonania ćwiczeń.
Wskazanie jest abyś wykonał wszystkie ćwiczenia zawarte w poradniku. Pomocą w tym
może okazać się literatura zamieszczona na końcu poradnika. Po wykonaniu ćwiczeń masz
możliwość sprawdzenia poziomu swojej wiedzy i umiejętności z zakresu omówionego
materiału, odpowiadając na pytania zawarte w Sprawdzianie postępów.
Po zrealizowaniu zagadnień zawartych we wszystkich podrozdziałach możesz sprawdzić
i ocenić nowo zdobytą wiedzę, wykorzystując do tego zamieszczony w poradniku test.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
5
Schemat układu jednostek modułowych w module
„Ekonomiczne podstawy funkcjonowania jednostek organizacyjnych”
343[01].Z2
Ekonomiczne podstawy
funkcjonowania jednostek
organizacyjnych
343[01].Z2.01
Prowadzenie pełnej ewidencji zdarzeń
gospodarczych
w przedsiębiorstwie
343[01].Z2.02
Prowadzenie ewidencji księgowej
w jednostkach organizacyjnych sfery
budżetowej
343[01].Z2.03
Gromadzenie danych statystycznych
i ich wykorzystywanie
w procesach
decyzyjnych
343[01].Z2.04
Sporządzanie sprawozdań finansowych,
statystycznych i budżetowych
343[01].Z2.05
Przeprowadzanie analizy ekonomiczno-
-finansowej
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
6
2. WYMAGANIA WSTĘPNE
Przystępując do realizacji programu jednostki modułowej, powinieneś umieć:
−
korzystać z różnych źródeł informacji,
−
stosować podstawowe działania matematyczne, pamiętając o kolejności ich wykonywania
(dodawanie, odejmowanie, mnożenie, dzielenie, potęgowanie itp.),
−
posługiwać się podstawową terminologią z zakresu ekonomii,
−
obsługiwać komputer na poziomie podstawowym z uwzględnieniem znajomości programu
EXCEL,
−
pracować w grupie i indywidualnie.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
7
3. CELE KSZTAŁCENIA
W wyniku realizacji programu jednostki modułowej, powinieneś umieć:
−
sklasyfikować badania statystyczne,
−
wyjaśnić istotę obserwacji statystycznej,
−
zastosować metody i techniki gromadzenia danych statystycznych,
−
opracować materiał statystyczny,
−
zaprezentować materiał statystyczny w formie tabelarycznej i graficznej,
−
przeprowadzić analizę struktury badanego zjawiska,
−
posłużyć się miarami przeciętnymi: średnimi klasycznymi i pozycyjnymi,
−
obliczyć i zinterpretować indeksy proste i złożone,
−
przeprowadzić analizę dyspersji, asymetrii i korelacji badanych zjawisk,
−
zinterpretować miary statystyczne.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
8
4. MATERIAŁ NAUCZANIA
4.1. Klasyfikacja badań statystycznych, metody i techniki badań
statystycznych
4.1.1. Materiał nauczania
Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy
statystycznej w populacji.
Podejmowanie decyzji należy do najważniejszych zadań związanych z zarządzaniem.
Tylko posiadanie rzetelnych, dokładnych i wyczerpujących informacji zapewnia podjęcie
prawidłowej decyzji. Statystyka dostarcza informacji o wielkości zjawisk i ich kształtowania się
w przeszłości. Informacje te mogą być wykorzystywane w procesie podejmowania decyzji. Na
podstawie danych statystycznych możliwe jest również dokonywanie kontroli stopnia
wykonywania wydanych poleceń lub oceny skutków podjętych wcześniej decyzji.
Metody badań statystycznych dzieli się według dwóch podstawowych kryteriów:
– liczby jednostek statystycznych objętych badaniem,
– częstotliwości prowadzenia badań statystycznych.
Biorąc poda uwagę liczbę jednostek statystycznych objętych badaniem wyróżnia się:
– badania pełne (spis statystyczny, rejestracja statystyczna, sprawozdawczość),
– badania częściowe (badania reprezentacyjne, badania monograficzne, badania ankietowe),
– szacunek statystyczny.
Badania pełne polegają na gromadzeniu informacji od wszystkich jednostek
statystycznych wchodzących w skład zbiorowości statystycznej.
Spis statystyczny to zbierania informacji bezpośrednio od wszystkich jednostek
wchodzących w skład zbiorowości statystycznej. Informacje te zbierane są przez rachmistrzów
spisowych i ujmowane są na formularzach spisowych. Istotą spisu statystycznego jest dokładne
określenie momentu tzw. krytycznego, na który zbiera się potrzebne informacje, np. spis
ludności dokonywany na dzień 31 grudnia 2005 r. na godzinę 24.00. Pomimo, że rachmistrze
spisowi odwiedzają gospodarstwa domowe np. w dniu 6 stycznia 2006 r., to nie uwzględnia
się osób urodzonych od 1-go do 6-go stycznia 2006 r. Natomiast bierze się pod uwagę
informacje o osobach zmarłych po 1 stycznia 2006 r. Spisy statystyczne są bardzo kosztowne
i dlatego metodę tę wykorzystuje się do badania najważniejszych zjawisk społeczno-
-gospodarczych, tj. spisy ludności czy spisy rolne.
Rejestracja statystyczna stanowi węższy zakres tematyczny niż spis statystyczny.
Nie występuje tu bezpośrednia obserwacja statystyczna, informacje zgłaszane są w punktach
rejestracyjnych, które wyznacza instytucja prowadząca rejestrację. Wyróżnia się 2 rodzaje
rejestracji statystycznej:
– doraźną rejestrację statystyczną,
– bieżącą rejestrację statystyczną.
Doraźna rejestracja statystyczna dotyczy określonych osób, które zgłaszają się
w wyznaczonych miejscach i udzielają informacji objętych rejestracją.
Bieżąca rejestracja statystyczna polega na ciągłym, bieżącym, systematycznym notowaniu
zdarzeń i faktów. Przykładem takiej rejestracji są: Krajowy Rejestr Sądowy (KRS), rejestr
podatników i nadawanie im numerów identyfikacji podatkowej (NIP).
Sprawozdawczość statystyczna polega na tym, że jednostki sprawozdawcze sporządzają
sprawozdanie statystyczne na jednolitych formularzach sprawozdawczych, stosując zarówno
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
9
opis liczbowy, jak i słowny. Formularze, instrukcje, terminy ich wypełnienia są opracowane
i ustalone przez instytucję prowadzącą badanie. Jest to najbardziej powszechna metoda badań
statystycznych pełnych.
Badania częściowe polegają na zbieraniu informacji o wartościach cech statystycznych
tylko od wybranych z całej zbiorowości jednostek statystycznych. Jednostki te stanowią
zbiorowość próbną, zwaną częściej próbą. Otrzymywane wyniki są uogólniane na całą
zbiorowość statystyczną. Badania częściowe są łatwiejsze i tańsze, mniej pracochłonne
i czasochłonne w porównaniu do badań pełnych. Stosuje się je w badaniu jakości towarów lub
w marketingu.
Badania reprezentacyjne polegają na wybraniu próby statystycznej. Próba będzie
reprezentatywna, jeżeli jej struktura będzie taka sama, jak w całej zbiorowości statystycznej.
Przykładem tego rodzaju badań mogą być np. badania dotyczące sytuacji społeczno-socjalnej
kobiet mieszkających na wsi.
Badanie monograficzne polega na szczegółowym zbadaniu pojedynczej jednostki
statystycznej lub niewielkiej liczby tych jednostek, po czym wnioski z tego badania uogólnia
się na całą zbiorowość. Ze względu na niewielką liczbę badanych jednostek można to badanie
pogłębić i objąć nim większą liczbę cech niż w przypadku badania całkowitego. Monografia
polega przede wszystkim na opisie badanych zjawisk, a nie tylko na zbieraniu danych
liczbowych. Metodę monograficzną stosuje się na przykład w badaniu warunków pracy
pracowników.
Badania ankietowe polegają na tym, że instytucja przeprowadzająca badanie zwraca
się do określonej grupy osób lub organizacji z zaproszeniem, by dobrowolnie wypowiedziały
się na temat, którego dotyczy ankieta. Formularze ankiety wysyła się albo do szerokiego grona
osób, albo do zespołu specjalistów z danej dziedziny.
Szacunek statystyczny jest metodą badań statystycznych stosowaną w przypadku, gdy
nie można zastosować badania pełnego lub częściowego lub gdy otrzymany materiał
statystyczny jest niekompletny. Szacunek statystyczny polega na określeniu przybliżonej
wielkości zjawisk i jest on możliwy tylko wówczas, gdy istnieje jakiś związek pomiędzy
cechami znanymi a poszukiwanymi. Typowym przykładem jest oszacowanie liczby ludności
w okresach, w których nie dysponujemy danymi ze spisów ludności.
4.1.2. Pytania sprawdzające
Odpowiadając na pytania, sprawdzisz czy jesteś przygotowany do wykonania ćwiczenia.
1. Według jakich kryteriów dzieli się metody badań statystycznych?
2. Jakie znasz rodzaje badań statystycznych?
3. Na czym polegają badania pełne, częściowe i szacunek statystyczny?
4.1.3. Ćwiczenia
Ćwiczenie 1
Scharakteryzuj poszczególne rodzaje badań pełnych.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) scharakteryzować rodzaje badań statystycznych,
3) zaprezentować wyniki pracy.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
10
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru,
– literatura zgodna z punktem 6 Poradnika dla ucznia.
Ćwiczenie 2
Scharakteryzuj badania częściowe i szacunek statystyczny i podaj różnice między
badaniami pełnymi, częściowymi i szacunkiem statystycznym.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) scharakteryzować badania częściowe,
3) podać definicję szacunku statystycznego,
4) wskazać zachodzące między nimi różnice,
5) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru,
– literatura zgodna z punktem 6 Poradnika dla ucznia.
4.1.4. Sprawdzian postępów
Czy potrafisz:
Tak
Nie
1) określić kryteria podziału metod badań statystycznych?
2) podać definicję badania statystycznego?
3) wskazać rodzaje badań statystycznych?
4) scharakteryzować badania pełne, częściowe i szacunek statystyczny?
5) podać różnice między poszczególnymi rodzajami badań statystycznych?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
11
4.2. Kontrola materiału statystycznego i etapy jego opracowania
4.2.1. Materiał nauczania
Prowadząc badania statystyczne często korzystamy z różnorodnych materiałów. Zwykle
przed wykorzystaniem materiału w badaniu statystycznym poddajemy go kontroli.
Kontrola materiału jest niezbędna, gdyż badania statystyczne są czasochłonne,
pracochłonne, a przede wszystkim kosztowne. Istotne jest aby wyniki tych badań były zgodne
z prawdą i nie zawierały błędów.
Rozróżniamy 2 rodzaje kontroli materiału statystycznego:
– kontrolę formalną obejmującą kontrolę kompletności materiału statystycznego,
kontrolę
zupełności
zapisów
oraz
kontrolę
zgodności
rachunkowej,
– kontrolę
merytoryczną
tj.
kontrolę
logicznej
poprawności
zapisu.
Kontrola kompletności materiału statystycznego polega na sprawdzeniu, czy otrzymano
materiał od wszystkich jednostek sprawozdawczych zobowiązanych do jego przesłania.
Ponadto jeśli badanie wymagało wypełnienia kilku formularzy, to należy w ramach kontroli
kompletności sprawdzić czy wszystkie dokumenty zostały przekazane. Jeśli stwierdzono brak
formularzy, wówczas należy przesłać je ponownie wraz z pismem przypominającym,
powołując się na podstawę prawną prowadzenia badań statystycznych. Ponowny brak
wypełnionych formularzy dla instytucji prowadzących badania powoduje, że wyniki dla tych
jednostek szacuje się. Jednak przy prezentowaniu wyników badania statystycznego należy
wymienić dla jakich jednostek wynik został określony na podstawie szacunku statystycznego.
W przypadku gdy jednostki, które nie przesłały formularzy tworzą charakterystyczną grupę,
której wyniki mogą w sposób znaczący obniżyć jakość całego badania, to oszacowane wyniki
mogą w sposób decydujący zniekształcić jakość całego badania.
Przykład
Do 50 średniej wielkości firm wysłano formularze ankiet dotyczących liczby komputerów.
Sprawozdanie nadesłało 49 firm objętych badaniem tj. 98%. Brakujące sprawozdanie stanowi
2% ogólnej liczby sprawozdań. Zakładając, że dane zawarte w brakującym sprawozdaniu nie
mogą zniekształcić wyników badania, to na podstawie nadesłanych 49 sprawozdań można
byłoby przyjąć:
Procent kompletności
Ankieta
Liczba ankiet
Łączna liczba
komputerów
Materiału
statystycznego
Danych
statystycznych
nadesłane
49
245
49/50*100 = 98
245/260*100 = 94,23
brakujące
1
15
1/50*100 = 2
15/260*100 = 5,27
50
260
100
100
Kontrola zupełności zapisu polega na sprawdzeniu, czy odpowiedziano na wszystkie
pytania zawarte w przekazanych materiałach statystycznych. Kontroli zapisu dokonuje się,
sprawdzając wszystkie druki. Jeżeli stwierdzono niezupełność zapisu lub jego brak, to należy
skontaktować się z osobą sporządzającą dany formularz (dane zamieszczone są na ostatniej
stronie formularza), celem uzupełnienia brakujących informacji. Pozostawienie pozycji
niewypełnionej, stwarza różne warianty interpretacyjne (np. brak danych dotyczących tej
pozycji, w jednostce sprawozdawczej nie wystąpiły fakty dotyczące tej pozycji, nieuwaga
osoby wypełniającej formularz).
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
12
Kontrola zgodności rachunkowej jest prowadzona, kiedy informacje zawarte
w formularzach są przedstawione w sposób liczbowy. Kontrola ta polega na sprawdzeniu
poprawności obliczeń (np. sumowanie, mnożenie). Ponadto dokonuje się weryfikacji, czy
wszystkie wartości zostały podane we właściwych jednostkach miary oraz czy dokonano
wymaganych zaokrągleń.
Kontrola logicznej poprawności zapisów wymaga znajomości badanego zagadnienia,
sprowadza się do wykrywania błędów w treści zapisów, poprawności sformułowanych pytań
zawartych w formularzu, instrukcji statystycznej oraz czy odpowiedzi są zgodne ze stanem
faktycznym i z przepisami prawa. Jest ona dokonywana przez specjalistów z określonego
tematu. Przeprowadzając kontrolę logicznej poprawności zapisu, porównuje się ją z innymi
materiałami dotyczącymi tego samego zjawiska. Błędy ujawnione w czasie kontroli mogą być
czasami wyjaśnione bezpośrednio. Jeśli to jest niemożliwe, należy zwrócić się do jednostki
sporządzającej materiał statystyczny z pytaniem o ich wyjaśnienie. Kontrola ta stanowi
najważniejszy jak również najtrudniejszy etap przygotowania surowego materiału
statystycznego do opracowania.
Podczas zbierania materiału statystycznego mogą pojawiać się błędy. Kontrola pod względem
merytorycznym i formalnym pomaga w wykryciu części tych nieprawidłowości.
Rozróżniamy 2 rodzaje błędów w materiale statystycznym:
Błędy przypadkowe – wynikające z nieuwagi, omyłki liczbowe (np. zamiast 2 napisano 20)
oraz błędy zwane czeskimi (np. zamiast 12 napisano 21), błędy wynikające z braku
umiejętności podawania prawidłowych odpowiedzi czy zwykłego niedbalstwa. Wpływ błędów
o charakterze przypadkowym na wynik badania jest zawsze mniejszy niż błędów
o charakterze systematycznym.
Błędy systematyczne – polegające na świadomym podawaniu błędnych danych. Błędy
systematyczne mają z reguły jeden kierunek (celowo są zaniżane bądź zawyżane w stosunku
do stanu faktycznego), przez co są groźniejsze i w dużym stopniu wpływają na ostateczne
wyniki badań.
Przykład
Przedsiębiorstwo Komunikacyjne „X” zorganizowało badanie statystyczne, którego celem
było ustalenie liczby pasażerów korzystających z komunikacji podmiejskiej. W tabeli
przedstawiono wyniki badania z uwzględnieniem błędów systematycznych i przypadkowych.
Liczba pasażerów obciążona błędami
Linia autobusowa
Faktyczna liczba pasażerów
przypadkowymi
świadomymi
A
1 130
1 119
1 150
B
1 215
1 220
1 270
C
845
854
886
D
1 020
1 017
1 060
RAZEM
4 210
4 210
4 366
Powstanie błędów przypadkowych mogło być spowodowane np. poprzez przeliczenie
dwukrotne tego samego pasażera lub pominięcie w liczeniu ze względu na duży przepływ
pasażerów w godzinach szczytu.
Powstanie błędów systematycznych mogło być spowodowane celowym zawyżaniem wyniku,
np. w sytuacji gdy linia autobusowa miałaby być zlikwidowana.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
13
Wyniki badań statystycznych powinny być podawane w sposób dokładny. Jeśli badanie
polega na przeliczeniu osób czy przedmiotów, wówczas podanie informacji nie jest trudne.
Problem pojawia się, gdy musimy zastosować urządzenia pomiarowe, czy zaokrąglać liczy.
Zaokrąglenie polega na odrzuceniu końcowych cyfr i jeżeli ostatnia z odrzuconych cyfr jest 0,
1, 2, 3, 4, to pozostałe cyfry nie ulegają zmianie. Jeżeli ostatnią odrzuconą cyfrą jest 5, 6, 7, 8,
9, to ostatnią pozostawioną cyfrę zwiększa się o 1 (np. 1,456 = 1,46; 1,654 = 1,65).
Zebrany materiał statystyczny zwany jest materiałem surowym, gdyż ma postać
nieuporządkowanego zbioru danych, który nie może być przedmiotem analizy, porównań czy
wyciągania wniosków, a więc nie wystarcza do przeprowadzenia badania. Dlatego materiał ten
podlega opracowaniu.
Opracowanie materiału obejmuje: grupowanie statystyczne i zliczanie materiału
statystycznego.
Grupowanie statystyczne polega na podziale badanej zbiorowości statystycznej na
mniejsze jej części według cech, które są istotne ze względu na cel badania, pozwala na
uporządkowanie materiału statystycznego i zapewnia jego porównywalność. Wskazanie
podobieństw i różnic występujących w badanej zbiorowości statystycznej oraz sformułowanie
obiektywnych wniosków jest celem grupowania statystycznego.
Pierwszym etapem przy grupowaniu statystycznym jest stworzenie wykazu
klasyfikacyjnego, czyli uporządkowanego wykazu wariantów cech. Uporządkowanie to
powinno być logiczne i przejrzyste. Ułatwi to zaszeregowanie poszczególnych jednostek do
odpowiednich grup.
Przykład
Jeśli badanie statystyczne polega na określeniu poziomu wykształcenia ludności
zatrudnionej w gospodarce, wówczas klasyfikacja ma postać:
wykształcenie
wyższe
średnie
zasadnicze zawodowe
podstawowe
Dla cech mierzalnych grupy porządkujemy zazwyczaj zgodnie ze wzrostem wartości cechy
(tzn. od najmniejszej do największej wartości cechy).
Trudności pojawiają się, kiedy badana cecha ma charakter ciągły. Wówczas warianty
cechy w wykazie klasyfikacyjnym powinny być przedstawione w przedziałach liczbowych,
zwanych przedziałami klasowymi, gdzie mniejsza z liczb nazywana jest dolną granicą,
a większa górną granicą przedziału klasowego.
Przykład
Przykład
Płace w firmie „X” za m-c luty 2006 Płace w firmie „X” za m-c luty 2006
Płace w zł
Płace w zł
(2500 – 2800>
2500,01 – 2800
(2800 – 3100>
2800,01 – 3100
(3100 – 3400>
3100,01 – 3400
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
14
Zapis (3100 – 3400>oznacza, przedział otwarty lewostronnie i domknięty prawostronnie.
Do tego przedziału zaliczeni zostaną pracownicy, których zarobki są większe niż 3100 zł
i mniejsze lub równe 3400 zł. Osoby z wynagrodzeniem 3100 zł znajdować się będą
w przedziale (2800-3100>. W przykładzie obok zagwarantowana jest rozłączność
przedziałów, tj. górna granica przedziału poprzedniego jest o jednostkę mniejsza od dolnej
granicy następnego.
Istnieje również możliwość ujęcia zapisów w taki sposób, że dolna granica przedziału
następnego jest o jednostkę większa od górnej granicy przedziału poprzedniego. Jednak tego
sposobu nie można wykorzystać, gdy wartość cechy jest wartością pośrednią między górną
a dolną granicą dwóch występujących po sobie przedziałów liczbowych.
W wykazach klasyfikacyjnych z cechą ze zmiennością ciągłą ważne jest obliczanie
środków poszczególnych przedziałów klasowych (symbol
o
x ). Środek przedziału klasowego
jest wykorzystywany przy obliczaniu miar statystycznych stosowanych w analizie statystycznej.
Obliczenie środka przedziału klasowego dokonujemy, posługując się wzorem:
(
)
it
io
o
x
x
x
+
=
2
1
gdzie:
i = 1, 2…. – numer przedziału klasowego
io
x – dolna granica przedziału klasowego o numerze i
it
x
– górna granica przedziału klasowego o numerze i
Tworząc wykaz klasyfikacyjny z cechą ze zmiennością ciągłą, należy określić rozpiętość
przedziałów klasowych, czyli różnicę między jego górną a dolną granicą. Rozpiętość
poszczególnych przedziałów powinna być taka sama, gdyż tworzenie przedziałów klasowych
o różnej rozpiętości wyklucza wykorzystanie do analizy materiału statystycznego.
Liczba przedziałów klasowych w wykazie klasyfikacyjnym zależy m.in. od celu badania,
liczebności zbiorowości statystycznej.
Poprawne grupowanie statystyczne wymaga przestrzegania określonych zasad:
−
wykaz klasyfikacyjny musi być tak opracowany, by wszystkie jednostki statystyczne objęte
badaniem były w nim zawarte – jest to zasada grupowania wyczerpującego,
−
w wykazie klasyfikacyjnym badana jednostka statystyczna powinna przynależeć do jednej
grupy – jest to zasada grupowania rozłącznego,
−
w przypadku zróżnicowania badanych jednostek statystycznych pod względem wartości
cechy, należy stworzyć tyle przedziałów klasowych, aby każdy z nich zawierał jednostki
o małym zróżnicowaniu wartości cechy,
−
nie powinno się zbyt rozdrabniać grup, dlatego jeżeli niektóre warianty cechy występują
u niewielkiej liczby jednostek, wówczas możliwe jest stworzenie grup zbiorczych
określanych jako pozostałe lub różne,
−
przy badaniach powtarzalnych nie powinno się zmieniać wykazu klasyfikacyjnego,
ponieważ możliwe będzie porównanie wyników tych badań.
Istotną czynnością po dokonaniu grupowania statystycznego jest jego zliczenie, czyli ustalenie
liczebności poszczególnych grup.
Wyróżniamy następujące sposoby zliczania materiału statystycznego: bezpośrednie,
sposobem kreskowym, sposobem kartkowym i za pomocą programów komputerowych.
Zliczanie bezpośrednie dotyczy małej zbiorowości, gdy podział jednostek na grupy jest
prosty (np. policzenie przez ucznia liczby krzeseł w sali lekcyjnej).
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
15
Zliczanie sposobem kreskowym polega na przygotowaniu arkusza roboczego, w którym
pionowymi kreskami zaznacza się wystąpienie określonego wariantu cechy. Zastosowanie
zliczania materiału statystycznego sposobem kreskowym wymaga dokonania grupowania
statystycznego i stworzenia szeregu rozdzielczego. Najczęściej stawiamy cztery pionowe
kreski, a piątą przecinamy te cztery. Metoda kreskowa jest metodą prostą i tanią, gdyż nie
wymaga stosowania żadnych urządzeń technicznych.
Zliczanie sposobem kartkowym polega na segregacji indywidualnego materiału
statystycznego w postaci wypełnionych ankiet, formularzy na stosy o jednakowych wariantach
cechy. Po zliczeniu formularzy znajdujących się w każdym stosie zapisuje się ich liczbę. Taka
metoda stosowana jest, gdy informacje o poszczególnych jednostkach podlegających badaniu
zebrane zostały na indywidualnych formularzach.
Przykład
Dyrektorzy szkół podstawowych w Hrubieszowie wypełnili formularze statystyczne
dotyczące liczby komputerów w szkole. Otrzymany materiał zliczono sposobem kartkowym.
Na pierwszym stosie ułożono formularze z tych szkół, w których nie było komputerów, na
drugim stosie formularze z tych szkół, w których był jeden komputer, a na ostatnim ósmym
stosie ułożono formularze, pochodzące z tych szkół w których było dziewięć komputerów.
Następnie dokonano zliczenia formularzy znajdujących się w każdym ze stosów i te liczby
wpisano do zbiorczego zestawienia. Celem sprawdzenia prawidłowości zliczania materiału
statystycznego porównano, czy suma formularzy we wszystkich stosach jest równa 68,
ponieważ taka była liczebność badanej zbiorowości.
Zliczanie przy wykorzystaniu programów komputerowych ma zastosowanie, gdy jest duża
liczebność badanej jednostki. Stosowanie odpowiednich programów komputerowych oraz
wykorzystywanie nośników informacji znacznie wpływa na efektywność opracowania
materiału statystycznego i umożliwia długotrwałe przechowywanie dużych ilości informacji.
Dodatkową zaletą jest skrócenie czasu opracowania materiału statystycznego.
4.2.2. Pytania sprawdzające
Odpowiadając na pytania, sprawdzisz, czy jesteś przygotowany do wykonania ćwiczeń.
1. Na czym polega grupowanie statystyczne i jaki jest jego cel?
2. Jakie są zasady tworzenia wykazów klasyfikacyjnych?
3. Jakie znasz rodzaje kontroli materiału klasyfikacyjnego?
4. Na czym polega i jakie znasz sposoby zliczania materiału statystycznego?
4.2.3. Ćwiczenia
Ćwiczenie 1
Dokonaj grupowania uczestników spotkania według następujących kryteriów:
a) wykształcenie, wiek i płeć,
b) wiek i płeć
c) płeć i wykształcenie,
a następnie przeprowadź zliczenia materiału metodą kreskową.
Uczestnikami spotkania jest 15 osób:
1) 42 lata, średnie, kobieta; 2) 32 lata, wyższe, kobieta; 3) 26 lat, wyższe, mężczyzna,
4) 27 lat, średnie, kobieta; 5) 59 lat, podstawowe, kobieta; 6) 50 lat, zasadnicze zawodowe,
mężczyzna; 7) 30 lat, wyższe, mężczyzna; 8) 29 lat, wyższe, mężczyzna; 9) 23 lata, średnie
kobieta; 10) 61 lat, wyższe, kobieta; 11) 68 lat, wyższe, mężczyzna; 12) 45 lat, wyższe,
kobieta; 13) 35 lat, wyższe, mężczyzna; 14) 60 lat, zasadnicze zawodowe, mężczyzna;
5) 28 lat, wyższe, kobieta.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
16
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) opracować dostępny materiał statystyczny,
3) zbudować stosowny wykaz klasyfikacyjny.
Wyposażenie stanowiska pracy:
−
materiały biurowe,
−
literatura zgodna z punktem 6 Poradnika dla ucznia.
Ćwiczenie 2
Za pomocą metody kreskowej dokonaj podziału kandydatów na Akademię Medyczną
według otrzymanych ocen z biologii i chemii:
– biologia: 4, 2, 4, 5, 3, 4, 3, 2, 2, 4, 3, 2, 4, 5, 3, 4, 3, 2, 3, 3, 4, 3, 2, 4, 4, 3, 5, 3, 2, 3;
– chemia: 4, 3, 3, 5, 5, 3, 3, 3, 4, 2, 3, 4, 2, 5, 3, 4, 4, 2, 5, 3, 2, 3, 4, 4, 3, 3, 4, 5, 4, 4.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) dokonać grupowania statystycznego,
3) stworzyć szereg rozdzielczy,
4) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
−
materiały biurowe,
−
literatura zgodna z punktem 6 Poradnika dla ucznia.
Ćwiczenie 3
Pogrupuj przedsiębiorstwa według kosztów jakie poniosły w 200X r., zbuduj szereg
rozdzielczy z przedziałami liczbowymi o rozpiętości 15 tys. Koszty (w tys.) w badanych
przedsiębiorstwach były następujące: 15, 18, 25, 27, 36, 39, 44, 50, 58, 60, 63, 67, 72, 76, 80,
84, 88, 90, 94.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) zbudować szereg rozdzielczy o wymaganej rozpiętości,
3) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– materiały biurowe,
– literatura zgodna z punktem 6 Poradnika dla ucznia.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
17
4.2.4. Sprawdzian postępów
Czy potrafisz:
Tak
Nie
1) omówić czynności związane z grupowaniem statystycznym?
2) określić zasady tworzenia wykazów klasyfikacyjnych?
3) dokonać kontroli materiału klasyfikacyjnego?
4) zastosować w praktyce zliczanie materiału statystycznego?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
18
4.3. Prezentacja wyników badania statystycznego, opis
statystyczny, zakres analizy statystycznej
4.3.1. Materiał nauczania
Przygotowany materiał statystyczny należy zaprezentować w sposób czytelny i rzetelny.
Stosuje się trzy metody prezentacji danych statystycznych: tabelaryczną, graficzną
i opisową.
Tabelaryczna prezentacja danych statystycznych podaje w sposób zwięzły, przejrzysty
i zrozumiały wiele informacji. Występuje w rocznikach statystycznych. W ramach tabelarycznej
formy prezentacji materiału statystycznego wyróżniamy:
−
szeregi statystyczne, zwane prostymi tablicami statystycznymi,
−
tablice statystyczne, zwane złożonymi.
Szeregi statystyczne przedstawiają pogrupowany i uporządkowany według jednego
kryterium materiał statystyczny. Tablica, w której prezentowany jest szereg statystyczny
składa się z dwóch kolumn (wierszy). Rubryka pierwsza zawiera opis treści pozycji szeregu,
zaś druga rubryka podaje informacje o liczbie jednostek statystycznych spełniających
poszczególne kryteria. Liczebność określonej klasy oznacza liczbę jednostek statystycznych,
które posiadają określony wariant cechy, czyli liczbę jednostek należących do poszczególnych
klas.
Przykład
Wygrane w lotto Jacka X w roku 2005: 2, 5, 1, 4, 2, 1, 2, 3, 3, 2, 1, 4, 5, 2, 1, 3, 2, 4, 3, 4, 3
Ilość trafnych skreśleń
Liczba obserwacji
1
4
2
6
3
5
4
4
5
2
6
-
Razem
21
Szeregi statystyczne poddawane dalszej klasyfikacji dają nam następujące ich rodzaje:
rozdzielcze, geograficzne, wyliczające i dynamiczne.
Połączenie kilku szeregów statystycznych w jedną całość daje nam tablice statystyczne.
Przedstawiają one zróżnicowanie kilku zbiorowości według jednego kryterium albo
zróżnicowanie jednej zbiorowości przy zastosowaniu kilku kryteriów.
Szereg rozdzielczy – stanowi zbiorowość statystyczną podzieloną na części (klasy) według
określonej cechy jakościowej lub ilościowej z podaniem liczebności lub częstości każdej z
wyodrębnionych
klas.
Podział
ten
oparty
jest
na
cechach
niemierzalnych
i mierzalnych ze zmiennością ciągłą lub zmiennością skokową. Szereg rozdzielczy opracowany
z zastosowaniem cechy niemierzalnej nosi nazwę szeregu jakościowego.
W szeregu rozdzielczym w jednej kolumnie (wierszu) w sposób uporządkowany
zamieszczony jest wykaz klasyfikacyjny, czyli warianty badanej cechy mierzalnej lub
niemierzalnej, a w drugiej kolumnie (wierszu) zawarte są liczebności odpowiadające
poszczególnym klasom z wykazu klasyfikacyjnego. Liczebność (wielkość) określonego
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
19
przedziału klasowego oznacza liczbę jednostek statystycznych, które posiadają określony
wariant cechy, czyli liczbę jednostek należących do poszczególnych klas.
Poniżej przedstawiono przykłady szeregów rozdzielczych. Pierwszy z nich jest szeregiem
rozdzielczym z cechą niemierzalną, drugi z cechą mierzalną ze zmiennością skokową, trzeci
z cechą mierzalną ze zmiennością ciągłą.
Pracownicy firmy „A” zatrudnieni na podstawie poziomu wykształcenia. Stan na 31.12.2005
Poziom wykształcenia
wyższe
średnie
zasadnicze
zawodowe
podstawowe
ogółem
Liczba zatrudnionych
14
40
11
5
70
Oceny uczniów z biologii otrzymane w roku szkolnym 2004/2005
Ocena
Liczba uczniów
1
2
2
5
3
15
4
4
5
2
6
2
Razem
30
Pracownicy firmy „S” na podstawie wynagrodzenia uzyskanego w miesiącu lutym 2006 r.
Wynagrodzenie w zł. (xio-xit)
Liczba pracowników
2100-2400
86
2400-2700
102
2700-3000
67
Razem
255
Szeregi geograficzne prezentują terytorialne rozmieszczenie lub nasilenie badanych
wielkości statystycznych w określonym czasie. Konstrukcja szeregu geograficznego polega na
ujęciu w pierwszej rubryce jednostek podziału zbiorowości statystycznej (np. regionu,
państwa, kontynentu), zaś w drugiej przedstawia się informacje o wielkości badanego
zjawiska.
Kraje
Zbiory ziemniaków (w tys. ton)
w 2001 r.
Świat w tym:
204 046
Chiny
64 032
Indie
22 143
Ukraina
17 344
Rosja
35 000
USA
19 862
Polska
19 379
Holandia
7 015
Niemcy
11 503
Białoruś
7 768
Źródło: Opracowanie własne na podstawie Małego rocznika statystyczn. Polski 2003, Tabl. 31, s. 540.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
20
Szeregi wyliczające służą do przedstawiania różnych wielkości statystycznych, które
w sumie nie tworzą całości, jedynie mają charakter informacyjny. Szeregi wyliczające składają
się z trzech kolumn: pierwsza zawiera określenie prezentowanych zjawisk, druga jednostki
miary, trzecia wielkości prezentowanych zjawisk.
Spożycie niektórych artykułów w wybranej grupie osób w przeliczeniu na 1 mieszkańca
w 2005 r.
Wyszczególnienie
Jednostka miary
Wielkość spożycia
Mąka
kg
25,5
Papierosy
szt.
2200
Obuwie
para
2,3
Mleko
l
190,6
Szeregi dynamiczne pokazują, jak kształtuje się zjawisko na skutek upływu czasu. Szeregi
dynamiczne zbudowane są z dwóch kolumn. W pierwszej z nich podawane są momenty czasu
(np. rok, miesiąc), a w drugiej wielkość badanego zjawiska w czasie określonym w pierwszej
kolumnie.
Rok
Liczba zarejestrowanych
samochodów osobowych w Polsce
w tys. szt. (stan w dniu 31.12)
1998
8 891
1999
9 283
2000
9 991
2001
10 503
2002
11 029
Źródło: Opracowanie własne na podstawie Małego rocznika statystycznego Polski 2003.
Metoda graficzna wykorzystuje do prezentacji danych statystycznych różnego rodzaju
wykresy. Jest ona mniej dokładna niż prezentacja tabelaryczna, dlatego wskazane jest dodanie
do wykresów danych liczbowych określających poszczególne wielkości zawarte na wykresie.
W statystyce wykorzystuje się wykresy: liniowe, powierzchniowe, w układzie współrzędnych,
obrazkowe, ilościowe, prezentacje metodą wiedeńską, kartogramy.
Metodę liniową przedstawiamy w postaci pionowych lub poziomych odcinków, których
długość jest proporcjonalna do przedstawianego zjawiska.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
21
Przykład
Przyjmując, że lądy na Ziemi obejmują łącznie 150 milionów km², powierzchnie
poszczególnych kontynentów wynoszą:
Europa Azja Afryka Ameryka Płn. Ameryk Płd. Australia Antarktyda
10,5 mln km² 44,4 mln km² 30,3 mln km² 21,5 mln km² 20,5 mln km² 8,5 mln km² 13,4 mln km²
Źródło: Mały rocznik statystyczny Polski 2003, Tabl. 1, s. 488.
Metoda powierzchniowa polega na zastosowaniu w badanym zjawisku figur
geometrycznych (kół, prostokątów, koła podzielonego na wycinki). Wykorzystując prostokąty
do prezentacji graficznej, powinno się stosować zasadę – podstawa każdego prostokąta jest
stała, a wysokość proporcjonalna do liczebności albo odwrotnie, jeśli wysokość prostokątów
jest stała, wówczas ich szerokość jest proporcjonalna do liczebności.
Przykład
Prezentacja graficzna powierzchni kontynentów za pomocą prostokątów.
Europa
Azja
Afryka
Ameryka P
łn Ameryka Płd.
Australia
Antarktyda
Źródło: Mały rocznik statystyczny Polski 2003, Tabl. 1, s. 488.
Europa
Azja
Afryka
Ameryka
Północna
Ameryka
Południowa
Australia Antarktyda
Czytelną prezentację materiału statystycznego daje zastosowanie koła. Wykres kołowy
może przyjąć postać jednego koła podzielonego na części lub kilku kół, po jednym dla każdej
liczebności cząstkowej. Jeżeli wykres ma postać jednego koła, to przedstawia ono całą
zbiorowość, natomiast poszczególne wycinki koła określają części pewnej całości.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
22
W celu wyznaczenia wycinków koła o właściwej powierzchni, należy określić miarę kąta
każdego z wycinków kołowych. W tym celu stosuje się wzór:
N
n
m
i
i
o
360
×
=
gdzie:
i = 1, 2,……, n – numer klasy (przedziału klasowego) z szeregu rozdzielczego
i
m – miara kąta wycinka kołowego, który będzie przedstawiał liczebność klasy o numerze i
i
n – liczebność klasy o numerze i
N – liczebność całej zbiorowości
Europa
Azja
Afryka
Ameryka Płn.
Ameryka Płd.
Australia
Antarktyda
Stosując wykres, który ma kilka kół, należy uwzględnić zachodzące między nimi
proporcje:
–
dla pierwszej klasy szeregu rozdzielczego i dla klasy o numerze „i” powinna zachodzić
proporcja:
( )
( )
( )
( )
1
1
2
2
n
n
r
r
i
i
=
π
π
gdzie:
i = 1, 2, .,n – kolejny numer poszczególnych części zbiorowości klas, przedziałów klasowych)
i
r – promień koła przedstawiającego liczebność klasy (przedziału klasowego)
i
n – liczebność klasy (przedziału klasowego) o numerze i
Europa
Azja
Afryka
Ameryka
Ameryka Australia Antarktyda
Płn.
Płd.
Kolejną metodą prezentacji materiału statystycznego jest wykres w układzie
współrzędnych. Najczęściej wykorzystywany jest do prezentacji określonego zjawiska na
skutek zmian zachodzących w czasie. Sporządzając wykres, należy narysować pierwszą
ćwiartkę układu współrzędnych, zaznaczając na osi odciętych(x) warianty cechy czasu, a na osi
rzędnych (y) liczebności cząstkowe odpowiadające poszczególnym wariantom cechy. Po
zaznaczeniu punktów łączy się je odcinkami, które w całości tworzą poziom prezentowanego
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
23
zjawiska. Sporządzając wykres w układzie współrzędnych, należy mieć na uwadze dobór skali
(jednostki na osiach współrzędnych).
Skutkiem nieprawidłowego doboru skali jest błędny obraz prezentowanych informacji.
0
20
40
60
80
100
2000
2001
2002
2003
2004
2005
Okres
L
ic
z
b
a
g
a
rn
it
u
ró
w
w
t
y
s
.
s
z
t.
Układ współrzędnych wykorzystujący do prezentacji prostokąty nazywany jest
histogramem. Histogram prezentuje materiał statystyczny z szeregów statystycznych z cechą
mierzalną ze zmiennością ciągłą. Na osi odciętych (x) zaznaczamy wartości cechy, a na osi
rzędnych (y) liczebności.
Prezentacja szeregów dynamicznych odbywa się za pomocą tzw. diagramów. Dla
szeregów z cechą ze zmiennością ciągłą diagram tworzy się przez połączenie punktów, których
współrzędne wyznaczają środki przedziałów klasowych i ich liczebności. Jeśli skrajne punkty
zostaną połączone z osią odciętych, to powstanie zamknięty wielobok liczebności.
Współrzędną pierwszego z punktów na osi (x) otrzymuje się przez odjęcie od dolnej granicy
pierwszego przedziału liczbowego połowy jego rozpiętości, a współrzędną drugiego
z punktów na osi (x) ustala się poprzez dodanie do górnej granicy przedziału liczbowego
połowy jego rozpiętości. Otrzymujemy wówczas pole powierzchni wieloboku równe polu
powierzchni prostokątów tworzących histogram.
Metoda obrazkowa polega na przedstawieniu zjawisk za pomocą rysunków określających
jakiego zjawiska dotyczą. Obrazki są różnej wielkości, a zależności między nimi określają
proporcje, jakie występują między wielkościami prezentowanych zjawisk. Jest to atrakcyjna
metoda przedstawiania danych statystycznych, ponieważ łatwa jest do przyswojenia.
Wielkość sprzedaży komputerów przez firmę Conwex w Lublinie w poszczególnych
kwartałach 2005 r.
I kwartał
II kwartał
III kwartał
IV kwartał
Źródło: Opracowanie własne.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
24
Metoda ilościowa polega na tym, że wielkość badanego zjawiska przedstawiona jest za
pomocą dowolnego znaku graficznego (np. trójkąta, koła, prostokąta). Jeśli jeden znak
oznacza 200 wyprodukowanych suszarek, to chcąc przedstawić 1000 sztuk wyprodukowanych
suszarek, należy ten znak powtórzyć 5 razy.
Metoda wiedeńska jest połączeniem metody ilościowej i obrazkowej. W metodzie tej
stosuje się rysunki, które przedstawiają dane zjawisko.
Liczba warsztatów samochodowych w Olsztynie w 2004 i 2005 r.
2004 r.
2005 r.
Legenda:
– 10 warsztatów
Źródło: Opracowanie własne.
Kartogramy służą do prezentacji materiału statystycznego zawartego w szeregach
geograficznych. Sporządzany jest na mapie lub planie przez naniesienie wielkości za pomocą:
tekstu, symboli, liczb, punktów, figur geometrycznych, a także stosowanie różnej kolorystyki.
Sporządzając kartogram, ważne jest prawidłowe sporządzenie legendy, w której należy
dokładnie określić zastosowane objaśnienia.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
25
Źródło: Opracowanie własne.
Najbardziej popularnymi publikacjami zawierającymi wyniki badań statystycznych są
roczniki statystyczne. Informacje zamieszczane w nich są w postaci tablic i wykresów,
stanowią ważne źródło wykorzystywane w różnych dziedzinach życia. Dane zawarte
w rocznikach stanowią niejednokrotnie podstawę prognozowania i opracowywania planów
polityki społeczno-gospodarczej
Opisowa prezentacja danych statystycznych polega na zastosowaniu tekstu do
prezentacji materiału statystycznego. Jest ona stosowana, gdy liczba danych jest niewielka.
Istotną rolę spełnia w dokształcaniu odbiorcy w zakresie czytania wykresów, wyciągania
wniosków, analizowaniu tablic statystycznych. Mając większą liczbę danych, tekst staje się
nieczytelny i łatwiej jest prezentować dane w postaci tablic.
Ostatnim etapem badania statystycznego jest jego analiza, tj. wszechstronne pokazanie
i zbadanie zjawiska. Zadaniem analizy statystycznej jest znalezienie prawidłowości i relacji
zachodzących w badanej zbiorowości. W analizie statystycznej wykorzystuje się liczby
absolutne (bezwzględne) i względne (stosunkowe). Liczby absolutne powstają podczas
zbierania materiału informacyjnego, określają wielkość badanego zjawiska w odpowiednich
jednostkach miary (np. wzrost w centymetrach, wartość sprzedaży w złotych). Liczby
względne natomiast pokazują relacje między dwoma liczbami absolutnymi. Do liczb
względnych zaliczymy współczynniki natężenia, wskaźniki struktury i indeksy. Przykłady liczb
względnych dokładniej będą prezentowane w późniejszych partiach materiału nauczania.
4.3.2. Pytania sprawdzające
Odpowiadając na pytania, sprawdzisz, czy jesteś przygotowany do wykonania ćwiczeń.
1. Jakie znasz metody prezentacji danych statystycznych?
2. Jakie wykresy zastosujesz do prezentacji szeregów: rozdzielczych, dynamicznych?
3. Jakie znasz odmiany prezentacji powierzchniowej?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
26
4.3.3. Ćwiczenia
Ćwiczenie 1
Wpisz, jakie szeregi statystyczne zostały zamieszczone poniżej.
Obrót przedsiębiorstwa „X” w latach 2002 – 2004
Okres
Obrót w zł
2002
63 000
2003
75 000
2004
98 000
Szereg:…………………………………….
Pracownicy firmy „Z” według stażu pracy
Staż pracowników
(
it
io
x
x
−
>
Liczba pracowników
i
n
5 – 10
30
10 – 15
75
15 – 20
60
Razem
165
Szereg:…………………………………….
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) określić metodę prezentacji danych statystycznych,
3) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– materiały biurowe,
– literatura zgodna z punktem 6 Poradnika dla ucznia.
Ćwiczenie 2
Na podstawie informacji zawartych w roczniku statystycznym, odpowiedz na pytania:
1. Jaką część polskich teatrów i instytucji muzycznych stanowią teatry lalkowe?
W roku…….. teatry lalkowe stanowiły……………. wszystkich teatrów.
2. Ilu uczniów szkół gimnazjalnych otrzymywało w ostatnich latach stypendium?
W roku szkolnym. ….. liczba uczniów szkół gimnazjalnych otrzymująca stypendium……
3. Jakie trzy kraje mają największy stopień bezrobocia?
W roku ….. największe bezrobocie wystąpiło w………………………………
Sposób wykonania ćwiczenia
:
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) skorzystać z rocznika statystycznego,
3) odpowiedzieć na pytania zawarte w poleceniu.
Wyposażenie stanowiska pracy:
– materiały biurowe,
– literatura zgodna z punktem 6 Poradnika dla ucznia.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
27
Ćwiczenie 3
Przedstaw graficznie, wykorzystując znane ci metody informacje zawarte w tabeli:
Płace w zł (
it
io
x
x
−
>
kobiety
mężczyźni
1 500 – 1 800
10
6
1 800 – 2 100
26
15
2 100 – 2 400
38
21
2 400 – 2 700
32
40
2 700 – 3 000
14
60
Razem
120
142
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) zastosować jedną z graficznych metod prezentacji materiału statystycznego,
3) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– materiały biurowe,
– literatura zgodna z punktem 6 Poradnika dla ucznia.
4.3.4. Sprawdzian postępów
Czy potrafisz:
Tak
Nie
1) przedstawić metody prezentacji danych statystycznych?
2) zastosować odpowiednie wykresy do prezentacji szeregów
rozdzielczych i dynamicznych?
3) przedstawić odmiany prezentacji powierzchniowej?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
28
4.4. Analiza natężenia i struktury
4.4.1. Materiał nauczania
W analizie statystycznej wykorzystuje się liczby absolutne (bezwzględne) i stosunkowe
(względne). Liczby absolutne są liczbami mianowanymi i otrzymuje się je w trakcie zbierania
informacji. Określają wielkość badanego zjawiska we właściwych jednostkach, np. wzrost
uczniów w centymetrach. Niekiedy jednak konieczne staje się zastosowanie liczb względnych,
które przedstawią zależność między dwiema liczbami absolutnymi poprzez dzielenie jednej
z
nich
przez
drugą.
Do
liczb
względnych
zalicza
się
wskaźniki
natężenia
i struktury.
Wskaźniki natężenia wykorzystuje się w analizie natężenia i oblicza się je w celu ustalenia
stopnia natężenia zjawiska jednej zbiorowości przypadającego na jednostkę drugiej
zbiorowości. Przykładem wskaźników natężenia jest gęstość zaludnienia na 1 km
2
czy
urodzenia żywe na 10 tys. mieszkańców. Obliczamy je według wzoru:
W
n
=
2
1
Z
Z
gdzie: Z
1
– wielkość pierwszej zbiorowości,
Z
2
– wielkość drugiej zbiorowości.
Wskaźniki natężenia umożliwiają porównanie ze sobą wielkości, które wyrażone
w liczbach absolutnych nie pozwolą na wyciągnięcie głębszych wniosków.
Tabela 1. Oceny ze sprawdzianu ze statystyki.
Oceny ze statystyki
Liczby absolutne
Struktura w %
Ogółem
w tym:
mierny
dostateczny
dobry
bardzo dobry
(N)
(n
1
)
(n
2
)
(n
3
)
(n
4
)
28
4
12
8
4
100,0
14,3
42,8
28,6
14,3
Źródło: Opracowanie własne
Wskaźniki struktury przedstawiają stosunek wielkości poszczególnych części zbiorowości
do wielkości całej zbiorowości. Można je obliczyć jako:
– wskaźniki ułamkowe, wtedy suma wskaźników będzie równa 1,
N
n
1
+
N
n
2
= 1
Na podstawie powyższej tabeli suma tych wskaźników przedstawia się następująco:
4/28 + 12/28 + 8/28 + 4/28 = 28/28 = 1
– wskaźniki procentowe, wówczas suma wskaźników będzie równa 100,
n
1
/N x 100 + = 100
4/28 x 100 + 12/28 x 100 = 100
– wskaźniki wyrażone w promille, suma wskaźników jest równa 1000.
W praktyce najczęściej stosuje się wskaźniki procentowe. Wskaźniki wyrażone
w promille stosuje się wówczas, gdy wskaźniki procentowe byłyby liczbami z wieloma cyframi
po przecinku.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
29
4.4.2. Pytania sprawdzające
Odpowiadając na pytania sprawdzisz, czy jesteś przygotowany do wykonania ćwiczenia.
1. Co to są liczby absolutne i liczby względne? Podaj przykłady.
2. Co to są wskaźniki struktury i natężenia i jakim celom służy ich wyliczanie?
3. W jakich postaciach mogą występować wskaźniki struktury i natężenia?
4.4.3. Ćwiczenia
Ćwiczenie 1
Oblicz wskaźniki struktury w ułamkach i określ ile procent w całej zbiorowości stanowią
wielkości poszczególnych zbóż.
Produkcja zbóż we wsi Kolanki w tys. ton
%
żyto
200
jęczmień
148
owies
53
pszenica
112
kukurydza
110
RAZEM
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem i skorzystać z podanych tam wskaźników,
2) w razie potrzeby skorzystać z literatury wskazanej w punkcie 6 Poradnika,
3) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru,
– kalkulator.
Ćwiczenie 2
Korzystając z danych z ćwiczenia 1 i wiedząc, że wieś Kolanki zamieszkuje
141 mieszkańców określ, ile poszczególnych rodzajów zbóż przypada na 1 mieszkańca.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem i skorzystać z podanych tam wskaźników,
2) w razie potrzeby skorzystać z literatury wskazanej w punkcie 6 Poradnika,
3) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy
– przybory do pisania,
– kartka papieru,
– kalkulator.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
30
Ćwiczenie 3
W magazynie hurtowni znajdują się następujące soki:
– sok pomarańczowy
1040 l,
– sok żurawinowy
580 l,
– sok marchwiowy
910 l,
– sok grejfrutowy
420 l,
– sok jabłkowy
720 l.
Zapas soków w hurtowni został wykupiony przez 9 właścicieli sklepów w równej
wysokości przypadającej na 1 sklep. Określ strukturę soków w hurtowni i ilość litrów każdego
rodzaju soku przypadająca na 1 sklep wiedząc, że jeden z właścicieli ma 3 sklepy, trzech po 2,
reszta po jednym.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem i skorzystać z podanych tam wskaźników,
2) w razie potrzeby skorzystać z literatury wskazanej w punkcie 6 Poradnika,
3) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru,
– kalkulator.
Ćwiczenie 4
Oblicz, ile dm
3
wody miesięcznie zużywa pojedyncze gospodarstwo domowe w klatce,
w której znajduje się 10 mieszkań wiedząc, że mieszkańcy poszczególnych lokali zużyli:
Nr lokalu
1
2
3
4
5
6
7
8
9
10
Struktura %
16
8
27
14
11
9
24
X
6
15
X – lokal niezamieszkany
Ilość zużytej wody w ciągu miesiąca przez wszystkich mieszkańców klatki wynosi 78 tys. dm
3
.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem i skorzystać z podanych tam wskaźników,
2) w razie potrzeby skorzystać z literatury wskazanej w punkcie 6 Poradnika,
3) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru,
– kalkulator.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
31
4.4.4. Sprawdzian postępów
Czy potrafisz:
Tak
Nie
1) określić, co to są liczby absolutne i względne i podać przykłady?
2) określić cel wyliczania wskaźników struktury i natężenia?
3) wyliczyć wskaźniki struktury i natężenia w różnych postaciach?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
32
4.5. Analiza tendencji centralnej – średnie klasyczne i pozycyjne
4.5.1. Materiał nauczania
Określenie tendencji centralnej w zbiorowości oznacza ustalenie takiej wartości badanej
cechy, wokół której skupiają się wartości cechy wszystkich jednostek wchodzących w skład tej
zbiorowości.
W celu ustalenia przeciętnego poziomu wartości centralnej stosuje się miary:
–
miary klasyczne, przykładem jest średnia arytmetyczna,
–
miary pozycyjne, do których zaliczamy dominantę i medianę.
Miary klasyczne obliczane są na podstawie wartości cechy wszystkich jednostek badanej
zbiorowości.
Średnia arytmetyczna ( x ) to suma wartości cechy wszystkich jednostek objętych
badaniem podzielona przez liczbę jednostek tworzących badaną zbiorowość statystyczną.
Zgodnie z określeniem otrzymujemy wzór:
–
dla danych indywidualnych (średnia arytmetyczna nie ważona
):
∑
=
=
n
i
i
x
n
x
1
1
gdzie:
x – średnia arytmetyczna,
i
x – wartość cechy statystycznej u poszczególnych jednostek statystycznych,
n – liczebność całej zbiorowości.
Przykład
Obliczamy średni wiek osoby uczestniczącej w wycieczce autokarowej. Wiek poszczególnych
osób wynosi: 45, 41, 39, 55, 25, 58, 28, 56, 43, 50. Korzystając ze wzoru powyżej,
otrzymujemy:
44
10
50
43
56
28
58
25
55
39
41
45
=
+
+
+
+
+
+
+
+
+
=
x
lata
–
dla danych pogrupowanych (średnia arytmetyczna ważona) przy czym inna jest technika
dla cechy mierzalnej ze zmiennością skokową, a inna ze zmiennością ciągłą:
– cecha mierzalna ze zmiennością skokowa:
∑
∑
=
i
i
i
n
n
x
x
gdzie:
x – średnia arytmetyczna
i = 1, 2, …, n – numery kolejnych klas z szeregu statystycznego,
i
x – wartość cechy w klasie szeregu rozdzielczego o numerze i,
i
n – liczebność klasy szeregu rozdzielczego o numerze i.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
33
Przykład
Obliczamy średni wzrost dziewcząt w wieku 7 lat ze szkoły podstawowej „X”, w maju 2006 r.
Wzrost w cm.
i
x
Liczba dziewcząt
i
n
Kolumna robocza
i
x
i
n
125
26
3250
127
30
3810
129
46
5934
131
42
5502
133
16
2128
Razem
160
20624
Po podstawieniu do wzoru średni wzrost wynosi:
cm
x
9
,
128
160
20624
=
=
–
cecha mierzalna ze zmiennością ciągła:
∑
∑
=
i
i
i
o
n
n
x
x
gdzie:
o
i
x - środek przedziału klasowego o numerze i.
Przykład
Obliczamy średnie wynagrodzenie pracowników Przedsiębiorstwa „W” w lutym 2006 r.
Wynagrodzenie w zł
(
it
io
x
x
−
>
Liczba
pracowników
i
n
Środek przedziału
o
i
x
Kolumna robocza
o
i
x
i
n
2400-2600
46
2500
115000
2600-2800
18
2700
48600
2800-3000
10
2900
29000
Razem
74
x
192600
Po podstawieniu do wzoru otrzymujemy:
72
,
2602
74
192600
=
=
x
zł
Średnia arytmetyczna może być obliczana także na podstawie szeregu statystycznego,
gdzie danymi są informacje o udziale poszczególnych klas w całej zbiorowości, czyli wskaźniki
struktury (
si
W ). Zgodnie z przedstawionymi informacjami otrzymujemy wzór:
–
dla cechy mierzalnej ze zmiennością skokową:
W
x
x
si
i
∑
=
–
dla cechy mierzalnej ze zmiennością ciągłą:
∑
=
W
x
x
si
i
o
Miary pozycyjne to wielkości, których wartości wyznaczamy, wykorzystując wartości
tylko niektórych wyrazów szeregu. Średnie pozycyjne to wartości rzeczywiste cechy
statystycznej, jakie wystąpiły w uporządkowanym szeregu statystycznym, wybrane ze względu
na zajmowaną pozycję w szeregu.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
34
Dominanta (
x
D
) (moda, wartość typowa, wartość modalna) jest to wartość cechy, która
najliczniej występuje w badanej zbiorowości. Jest ona jedyną miarą tendencji centralnej, którą
można wykorzystać w przypadku cech niemierzalnych. Obliczanie wartości modalnej jest
przydatne w badaniach dotyczących rynku, np. w ustalaniu przeciętnej ceny rynkowej różnych
towarów.
Ustalenie dominanty w przypadku indywidualnego szeregu polega na wskazaniu wartości
cechy, która najczęściej występuje w badanej zbiorowości.
Przykład
Liczba trafień w totolotka na przestrzeni miesiąca w kolekturze ”C” przedstawiała się
następująco: 2, 4, 1, 2, 3, 2, 4, 1, 3, 2, 5, 3, 2, 4, 3, 3, 5, 1, 3, 1, 3. Najczęściej występującą
wartością cechy w indywidualnym szeregu jest wartość 3, gdyż wartość ta występuje
siedmiokrotnie. Dominanta wynosi 3, co oznacza, najwięcej prawidłowych skreśleń.
Wyznaczanie dominanty w szeregach statystycznych z cechą mierzalną ze zmiennością
skokową polega na wskazaniu wartości cechy dla której liczebność cząstkowa
i
n jest
największa. Jeżeli liczebności cząstkowe przedstawione zostaną w postaci wskaźników
struktury, to dominanta jest równa wartości cechy, dla której wskaźnik struktury
si
W ma
największą wartość.
Wyznaczenie dominanty dla szeregów rozdzielczych z cechą mierzalną ze zmiennością
ciągłą wymaga obliczenia jej przybliżonej wartości, na podstawie wzoru:
(
)
(
) (
)
1
0
1
0
1
0
0
n
n
n
n
n
n
L
x
D
x
−
+
−
−
×
+
=
−
−
gdzie:
x
D – dominanta
0
x – dolna granica przedziału, w którym występuje dominanta,
L – rozpiętość przedziału liczbowego dominanty,
0
n – liczebność przedziału dominanty,
1
−
n – liczebność przedziału poprzedzającego przedział dominanty,
1
n – liczebność przedziału następującego po przedziale dominanty.
Stosując wzór, należy pamiętać o zachowaniu jednakowej rozpiętości przedziałów klasowych.
Dominantę można również wyznaczyć metodą graficzną. W tym celu należy na wykresie
przedstawić histogram dla przynajmniej trzech przedziałów; przedziału dominanty
i przedziałów sąsiednich. Wyznaczenie dominanty polega na wykreśleniu dwóch odcinków,
których początkiem są wierzchołki najwyższego prostokąta, a końcem wierzchołki sąsiednich
prostokątów przylegające do najwyższego prostokąta. Rzut punktu przecięcia tych
przekątnych na oś odciętych umożliwia odczytanie dominanty.
Mediana
( )
x
M
jest to wartość środkowa w uporządkowanym szeregu statystycznym,
dzieląca zbiorowość na dwie części. Jedna część zawiera jednostki o wartościach wyższych od
mediany, a druga wartości od niej niższe. Ustalenie mediany zależy od wielu czynników.
Jeżeli informacje o wartości cechy są przedstawione w postaci uporządkowanego szeregu
indywidualnego o nieparzystej liczbie jednostek, to pierwszym krokiem jest ustalenie pozycji,
którą zajmuje wartość środkowa. Pozycja ta obliczana jest według wzoru:
2
1
+
=
N
N
Mx
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
35
gdzie:
Mx
N
– wyraz środkowy (wyraz mediany),
N – ogólna liczba jednostek statystycznych.
Po ustaleniu pozycji wartości środkowej odczytujemy wartość wyrazu środkowego, czyli
wartość mediany:
W przypadku uporządkowanego szeregu indywidualnego o parzystej liczbie wyrazów możemy
stwierdzić, że mamy dwa wyrazy środkowe. Są to wyrazy:
(
)
Mx
Mx
iN
N
2
1
. Ich pozycję obliczamy
według wzoru:
2
1
N
N
Mx
=
2
2
2
+
=
N
N
Mx
Mediana jest tu średnią arytmetyczną dwóch wartości środkowych, obliczana według
wzoru:
2
2
2
2
+
=
+
N
N
x
x
x
M
gdzie:
x
M – wartość mediany,
(
)
2
2
2
2
+
+
N
N
x
x
– średnia arytmetyczna dwóch środkowych wyrazów,
N – liczebność całej zbiorowości.
Jeżeli mamy podany szereg statystyczny z cechą mierzalną ze zmiennością skokową, to
wówczas tworzymy dodatkową kolumnę zawierającą szereg skumulowany. Kolejnym krokiem
jest ustalenie numeru jednostki mediany w oparciu o wzór wykorzystywany przy
indywidualnym szeregu wartości cechy i uwzględniając dane zawarte w szeregu
skumulowanym ustala się wartość mediany. Wartość ta odczytywana jest z kolumny
z wartościami cechy statystycznej. Przy interpretacji wyniku należy zwrócić uwagę, czy
mediana została obliczona na podstawie szeregu indywidualnego, czy też na podstawie szeregu
rozdzielczego.
Wartość mediany obliczona z wykorzystaniem szeregu indywidualnego oznacza, że
połowa jednostek statystycznych posiada wartość cechy niższą niż mediana i połowa posiada
wartość cechy wyższą niż mediana.
Wartość mediany obliczona w oparciu o szereg rozdzielczy oznacza, że połowa jednostek
statystycznych posiada wartość cechy niższą lub równą niż mediana i połowa posiada wartość
cechy wyższą lub równą niż mediana.
Medianę w przypadku szeregów statystycznych z cechą mierzalną ze zmiennością ciągłą
można obliczyć, stosując metodę graficzną lub korzystając ze wzoru:
NMx
x
x
M
=
−
+
=
−
1
0
2
sMx
Mx
Mx
x
S
N
n
L
x
M
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
36
gdzie:
x
M – mediana,
Mx
x
0
– dolna granica przedziału liczbowego mediany,
L – rozpiętość przedziału mediany (różnica między górną, a dolną granicą przedziału),
Mx
n
– liczebność przedziału mediany,
N – liczebność zbiorowości,
1
−
sMx
S
– liczebność szeregu skumulowanego w wierszu poprzedzającym wiersz mediany.
Metoda graficzna ustalenia mediany polega na sporządzeniu w układzie współrzędnych
skumulowanego histogramu. W tym celu na osi rzędnych należy odnaleźć wartość numeru
mediany i poprowadzić prostą równoległą do osi odciętych. Pierwszy prostokąt
skumulowanego histogramu, który przecina ta prosta, jest prostokątem zbudowanym na
przedziale mediany. Następną czynnością jest narysowanie przekątnej łączącej prawy górny
wierzchołek tego prostokąta z prawym górnym rogiem poprzedniego. Prosta równoległa do
osi (x) poprowadzona przez punkt odpowiadający numerowi mediany przecina określoną
w ten sposób przekątną. Rzutując otrzymany punkt przecięcia na oś odciętych, odczytujemy
wartość mediany.
Miary tendencji centralnej w sposób przejrzysty charakteryzują zbiorowość statystyczną,
dlatego są one powszechnie stosowane
4.5.2. Pytania sprawdzające
Odpowiadając na pytania, sprawdzisz, czy jesteś przygotowany do wykonania ćwiczeń.
1. Jak dzielimy miary tendencji centralnej?
2. Kiedy obliczamy średnią arytmetyczną zwykłą, a kiedy średnią arytmetyczną ważoną?
3. Jak brzmi definicja dominanty i jakie są warunki do jej obliczenia?
4.5.3. Ćwiczenia
Ćwiczenie 1
Oblicz przeciętne wynagrodzenie 5 pracowników firmy „Z” za m-c październik 2005 r.
Wynagrodzenia za ten miesiąc wynosiły: 1 500 zł, 1 800 zł, 2 400 zł, 3 500 zł, 4 100 zł.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) ustalić średnie wynagrodzenie wykorzystując wzór podany w materiale nauczania,
3) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– materiały biurowe,
– kalkulator,
– literatura zgodna z punktem 6 Poradnika dla ucznia.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
37
Ćwiczenie 2
Oblicz średnią arytmetyczną na podstawie poniższych danych:
Oceny końcowe z biologii uzyskane przez uczniów klasy 3b LO w Łomży w roku szkolnym
2004/2005
Ocena
i
x
Liczba uczniów
i
n
6
3
5
3
4
8
3
11
2
6
1
1
razem
32
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) wykorzystać odpowiedni wzór podany w materiale nauczania,
3) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– materiały biurowe,
– kalkulator,
– literatura zgodna z punktem 6 Poradnika dla ucznia.
Ćwiczenie 3
Na podstawie danych zawartych poniżej oblicz dominantę i podaj jej interpretację,
a następnie wyznacz graficznie dominantę.
Sklepy w Kaliszu według obrotów za m-c maj 2005 r.
Obroty w tys. zł (
it
io
x
x
−
>
Liczba sklepów
i
n
500 – 1 000
6
1 000 – 1 500
15
1 500 – 2 000
23
2 000 – 2 500
30
2 500 – 3 000
40
Razem
114
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) ustalić przeciętny poziom wartości centralnej wykorzystując jedną z miar pozycyjnych,
3) wyznaczyć dominantę za pomocą wykresu,
4) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– materiały biurowe,
– kalkulator,
– literatura zgodna z punktem 6 Poradnika dla ucznia.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
38
4.5.4. Sprawdzian postępów
Czy potrafisz:
Tak
Nie
1) podzielić miary tendencji centralnej?
2) wykorzystać w obliczeniach średnią arytmetyczną zwykłą i średnią
arytmetyczną ważoną?
3) zdefiniować pojęcie dominanty?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
39
4.6. Analiza dyspersji – obszar zmienności, odchylenie przeciętne
i standardowe, współczynnik zmienności
4.6.1. Materiał nauczania
Dyspersja (rozproszenie) to rozrzut wyników pomiaru jakiejś wielkości bądź rozrzut cech
jakiejś populacji, np. wzrost, waga człowieka.
Do mierzenia rozproszenia wariantów cechy służą:
–
miary odchyleń,
–
miary zmienności.
Do najprostszych miar rozproszenia należą:
–
obszar zmienności,
–
odchylenie przeciętne.
Obszar zmienności to różnica między najwyższą a najniższą wartością cechy. Jest to miara
prosta i dość prymitywna. Obszar zmienności stosuje się w analizie jako miarę wstępną
i nieprecyzyjną.
Tabela 2. Wielkość produkcji w przedsiębiorstwie A i B w I półroczu w tys. sztuk.
Przedsiębiorstwo A
Miesiące
1
2
3
4
5
6
Produkcja
34
26
32
18
20
42
Przedsiębiorstwo B
Miesiące
1
2
3
4
5
6
Produkcja
14
24
26
19
36
43
Źródło: opracowanie własne.
Średnia miesięczna wielkość produkcji jest jednakowa w przypadku obydwu
przedsiębiorstw i wynosi 27 tys. sztuk. Obszar zmienności w przedsiębiorstwie A wynosi 24
tys. sztuk ( 42 tys. sztuk – 18 tys. sztuk), a w przedsiębiorstwie B wynosi 29 tys. sztuk (43 tys.
sztuk – 14 tys. sztuk). Można powiedzieć, że stopień skupienia wartości poszczególnych
wyrazów dookoła średniej jest większy w przedsiębiorstwie A niż w przedsiębiorstwie B.
Odchylenie przeciętne jest bardziej precyzyjną miarą rozproszenia niż obszar zmienności.
Wyróżnia się:
–
odchylenie przeciętne proste (d
x
), oblicza się według wzoru:
d
x
=
n
X
X
∑
−
gdzie: x – poszczególne wartości zmiennej,
x – średnia arytmetyczna wartości zmiennej,
n – liczba spostrzeżeń.
Odchylenie przeciętne proste obliczamy w następujący sposób:
–
obliczamy średnią arytmetyczną (x),
–
obliczamy odchylenie poszczególnych wyrazów szeregów od średniej arytmetycznej:
x
1
– x , x
2
– x , x
3
– x , ..... x
n
– x ;
–
sumujemy bezwzględne wartości odchyleń od średniej arytmetycznej (pomijając znaki tych
odchyleń).
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
40
=
−
∑
x
x
x
x
x
x
x
x
x
x
n
−
+
+
−
+
−
+
−
...
3
2
1
;
–
sumę bezwzględnych wartości odchyleń od średniej arytmetycznej dzielimy przez liczbę
wyrazów szeregu.
Przykład 1
Obliczamy odchylenie przeciętne proste na podstawie danych z przedsiębiorstwa A.
Średnia arytmetyczna wielkości produkcji wynosi: 27 tys. sztuk.
Suma wartości bezwzględnych odchyleń od średniej arytmetycznej wynosi: 44.
Odchylenie przeciętne wynosi: 7,33 (44 : 6).
– odchylenie przeciętne ważone – stosujemy, gdy wartości zmiennej podane są w szeregu
rozdzielczym (przedziałowo). Odchylenie przeciętne ważone oblicza się według wzoru:
d
x
=
∑
∑
−
w
x
x
w
gdzie: w – wagi poszczególnych wartości.
Tabela 3. Pracownicy zatrudnieni w administracji według wynagrodzenia miesięcznego za marzec 2006 r.
Wynagrodzenie
miesięczne za
marzec 2006 r.
w zł
(x)
Liczba
pracownikó
w w %
(w)
Środki
przedziałów
wynagrodzeń
miesięcznych
w
zł
Odchylenia
środków
przedziałów
od średniej
arytmetycznej
(
o
x
-
x
)
x
= 1394 zł
Iloczyn
liczebności przez
bezwzględne
wartości odchyleń
środków
przedziałów
od średniej
arytmetycznej
w(
o
x
-
x
)
(b x d
)
Kwadraty
odchyleń od
średniej
arytmetycznej
(
o
x
-
x
)
2
Iloczyny
liczebności przez
kwadraty
odchyleń od
średniej
arytmetycznej
w(
o
x
-
x
)
2
(b x f)
a
b
C
d
e
f
g
901-1000
12
950
- 444
5328
197136
2365632
1001-1300
26
1200
- 194
5044
37636
978536
1301-1500
28
1400
6
168
36
1008
1501-1700
18
1600
206
3708
42436
763848
1701-1900
16
1800
406
6496
164836
2637376
Razem
100
x
x
20744
442080
6746400
Źródło: opracowanie własne.
Odchylenie przeciętne ważone wynosi:
d
x
=
44
,
207
100
20744
=
zł
Bardziej precyzyjną miarą zmienności cech jest odchylenie standardowe, czyli tzw.
odchylenie średnie. Jest to miara, która podobnie jak odchylenie przeciętne, wskazuje
przeciętny poziom odchyleń faktycznych wartości cechy od średniej arytmetycznej. Poziom
rozproszenia obliczany za pomocą odchylenia standardowego jest zawsze wyższy od poziomu
rozproszenia ustalonego za pomocą odchylenia przeciętnego.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
41
Dla wartości zmiennej podanych w szeregu indywidualnym oblicza się go według wzoru:
δ
x
=
( )
n
x
x
∑
−
2
Wzór
na odchylenie standardowe obliczane z szeregu rozdzielczego przedstawia się
następująco:
δ
x
=
(
)
∑
∑
−
w
x
x
w
2
ο
dla danych z tabeli wynosi:
δ
x
=
=
100
6746400
259,74
Do
porównania rozproszenia dwóch różnych zjawisk albo do porównania dyspersji
zjawiska w szeregach statystycznych o różnych poziomach średnich służy, wyrażany
w procentach, współczynnik zmienności. Jest stosunek odchylenia przeciętnego lub odchylenia
standardowego do średniej arytmetycznej:
V
x
=
x
d
x
x 100
lub
V’
x
=
x
x
δ
x 100
Zakład I
Zakład II
Średnia wydajność pracy
72 szt./h
180 szt./h
Odchylenie przeciętne
7,2 szt./h
11,1 szt./h
Odchylenie standardowe
8,6 szt./h
13,3 szt./h
Określmy, w którym z zakładów stopień zróżnicowania wydajności pracy jest większy:
–
dla zakładu I współczynniki zmienności wynoszą:
V
x
=
72
2
,
7
x 100 = 10%
oraz
V’
x
=
72
6
,
8
x 100 = 11,9%
– dla zakładu II współczynniki zmienności wynoszą:
V
x
=
180
1
,
11
x 100 = 6,2% oraz
V’
x
=
180
3
,
13
x 100 = 7,4%
Na podstawie otrzymanych wyników można stwierdzić, że wydajność pracy była bardziej
zróżnicowana w zakładzie I niż w zakładzie II.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
42
4.6.2. Pytania sprawdzające
Odpowiadając na pytania, sprawdzisz, czy jesteś przygotowany do wykonania ćwiczeń.
1. Co to jest obszar zmienności?
2. Jakie są rodzaje odchyleń przeciętnych i wzory na ich obliczenie?
3. Kiedy stosuje się odchylenie przeciętne ważone?
4. Jakie są wzory na obliczenie odchylenia standardowego?
5. W jakim celu i w jaki sposób wyznacza się współczynnik zmienności?
4.6.3. Ćwiczenia
Ćwiczenie 1
Na podstawie poniższych danych oblicz obszary zmienności, odchylenie przeciętne
i zinterpretuj otrzymane wyniki.
Tabela 5. Wielkość produkcji w przedsiębiorstwach A i B w II półroczu w tys. sztuk.
Przedsiębiorstwo A
miesiąc
7
8
9
10
11
12
wielkość produkcji
21
23
32
38
42
58
Przedsiębiorstwo B
miesiąc
7
8
9
10
11
12
wielkość produkcji
18
30
41
40
48
60
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) wyliczyć obszary zmienności,
3) w celu wyliczenia odchyleń przeciętnych należy:
– wyliczyć średnią arytmetyczną dla przedsiębiorstwa,
– dokonać reszty obliczeń stosownie do wzoru na odchylenie przeciętne.
4) w razie potrzeby skorzystać z literatury wskazanej w punkcie 6 Poradnika.
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru,
– kalkulator; można wykorzystać arkusz kalkulacyjny EXCEL.
Ćwiczenie 2
Na podstawie tabeli z ćwiczenia 1 oblicz odchylenie standardowe i współczynnik
zmienności. Zinterpretuj otrzymane wyniki.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) dokonać obliczeń stosownie do wzorów na odchylenie standardowe i współczynnik
zmienności,
3) w razie potrzeby skorzystać z literatury wskazanej w punkcie 6 Poradnika.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
43
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru
– kalkulator; można wykorzystać arkusz kalkulacyjny EXCEL.
Ćwiczenie 3
Tabela 6. Obroty w sklepach w mieście Grójcu w marcu 2006 r. w zł.
Obroty w sklepach
Liczba sklepów w % (w)
2000 – 10000
16
10001 – 20000
48
20001 – 30000
26
30001 – 50000
18
50001 – 70000
2
Źródło: dane przykładowe
Oblicz odchylenie przeciętne i standardowe.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) dokonać obliczeń stosownie do wzorów na odchylenie standardowe i współczynnik
zmienności,
3) w razie potrzeby skorzystać z literatury wskazanej w punkcie 6 poradnika.
Wyposażenie stanowiska pracy:
−
przybory do pisania,
−
kartka papieru,
–
kalkulator; można wykorzystać arkusz kalkulacyjny EXCEL.
Ćwiczenie 4
Oceń prawdziwość poniższych zdań.
Zdanie
Prawda
Fałsz
1. Najprostszą i najbardziej nieprecyzyjną miarą rozproszenia jest
obszar zmienności.
2. Odchylenie przeciętne obliczamy bez wykorzystania średniej
arytmetycznej.
3. Odchylenie przeciętne ważone oblicza się wg wzoru:
d
x
=
∑
∑
−
w
x
x
w
4. Obszar zmienności jest różnicą pomiędzy najwyższą a najniższą
wartością cechy.
5. Odchylenie standardowe przedstawia przeciętny poziom odchyleń
faktycznych wartości cechy od średniej arytmetycznej.
6. Współczynnik zmienności służy porównaniu rozproszenia dwóch
zjawisk.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
44
7. Współczynnik zmienności to iloraz bezwzględnej miary odchylenia
standardowego i wyraża się wzorem:
V
x
=
x
d
x
x 100
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) zaznaczyć właściwą odpowiedź znakiem X w kolumnie „Prawda” lub „Fałsz”,
3) w razie potrzeby skorzystać z literatury wskazanej w punkcie 6 Poradnika.
Wyposażenie stanowiska pracy:
−
przybory do pisania,
−
kartka papieru.
4.6.4. Sprawdzian postępów
Czy potrafisz:
Tak
Nie
1) podać wzory na obliczenie miar dyspersji?
2) określić zakres analizy dyspersji?
3) zastosować odpowiednie wzory do posiadanych informacji
o zjawiskach?
4) zinterpretować
otrzymane
wartości
odchylenia
przeciętnego,
standardowego, współczynnika zmienności?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
45
4.7. Analiza asymetrii – kierunek i siła asymetrii, współczynnik
skośności
4.7.1. Materiał nauczania
W wielu sytuacjach badanie średniego poziomu cechy i rozproszenia jej wartości nie
wskazuje na istnienie różnic między badanymi zbiorowościami. Dopiero wnikliwa analiza
wartości przyjmowanych przez daną cechę przy zastosowaniu miar uzupełniających wyklucza
podobieństwo struktury rozważanych zbiorowości. Ustalenie, w jaki sposób wartości cechy
statystycznej rozłożone są wokół średniej arytmetycznej, nosi nazwę asymetrii rozkładu
wartości cechy.
Miary asymetrii (skośności)
b – rozkład symetryczny (osią symetrii byłaby rzędna)
a, c – rozkłady asymetryczne; a – ma asymetrię lewostronną, c – asymetrię prawostronną
Rozkłady różnią się między sobą kierunkiem i siłą asymetrii:
–
dla rozkładów symetrycznych wszystkie miary tendencji centralnej mają taką samą wartość
x
x
D
M
x
=
=
–
dla rozkładów asymetrii prawostronnej wartość średniej jest większa niż mediana
i dominanta
x
x
D
M
x
>
>
–
dla rozkładów asymetrii lewostronnej wartość średniej jest mniejsza niż mediana
i dominanta.
x
x
D
M
x
<
<
Wzajemne położenie średniej, dominanty i mediany w rozkładzie:
b
a
c
cecha
liczebność
D
M
średnia
b
a
c
x
n
i
D
x
D
M
średnia
średnia
M
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
46
Przy asymetrii ujemnej średnia arytmetyczna jest zaniżona, przy asymetrii dodatniej
średnia arytmetyczna jest zawyżona.
Miary asymetrii dzielą się podobnie jak poprzednie na miary klasyczne i pozycyjne:
1) miary klasyczne (współczynnik skośności (A
s
lub A
d
), współczynnik asymetrii (A)),
2) miary pozycyjne (współczynnik skośności (A
Q
)).
Najprostszą miarą przyjętą do określania asymetrii jest wskaźnik skośności (
s
W
).
Dla miar klasycznych jest to różnica pomiędzy średnią arytmetyczną i dominantą.
x
s
D
x
W
−
=
Dla miar pozycyjnych badamy odległości obu kwartyli
( )
Q
od mediany.
(
) (
)
x
x
x
Q
M
Q
Q
Q
M
M
Q
W
×
−
+
=
−
−
−
=
2
3
1
1
3
Jeżeli rozkład badanej cechy jest symetryczny, to średnia jest równa modalnej, a wskaźnik
skośności jest równy 0.
0
=
−
=
x
s
D
x
W
Jeżeli rozkład badanej cechy nie jest symetryczny, to mamy do czynienia z asymetrią
rozkładu. Mówimy o dwóch rodzajach (kierunkach) asymetrii: lewo – i prawostronnej. Dla
miar klasycznych będzie to:
–
asymetria lewostronna, gdy
0
<
−
=
x
s
D
x
W
–
asymetria prawostronna, gdy
0
>
−
=
x
s
D
x
W
Dla miar pozycyjnych będzie to:
–
asymetria lewostronna, gdy
)
(
(
)
0
1
3
<
−
−
−
=
Q
M
M
Q
W
x
x
Q
–
asymetria prawostronna, gdy
(
) (
)
0
1
3
>
−
−
−
=
Q
M
M
Q
W
x
x
Q
Dla porównania kierunku i siły asymetrii w dwóch lub więcej zbiorowościach stosujemy
współczynniki skośności:
–
dla miar klasycznych
s
D
x
A
x
s
−
=
–
dla miar pozycyjnych
Q
M
Q
Q
A
x
Q
2
2
3
1
×
−
+
=
4.7.2. Pytania sprawdzające
Odpowiadając na pytania, sprawdzisz, czy jesteś przygotowany do wykonania ćwiczeń.
1. Na czym polega asymetria lewostronna?
2. Co jest miarą asymetrii rozkładu?
3. Czy można metodą graficzną wyznaczyć asymetrię?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
47
4.7.3. Ćwiczenia
Ćwiczenie 1
Co można powiedzieć o kształtowaniu się płac w firmie „M”, jeśli miary tendencji
centralnej pozostają w następującej relacji:
x
x
D
M
x
>
>
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) scharakteryzować rozkłady asymetryczne wartości cechy,
3) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– materiały biurowe,
– literatura zgodna z punktem 6 Poradnika dla ucznia.
Ćwiczenie 2
Wiedząc, że asymetria jest lewostronna, ustal na podstawie przeprowadzonego badania,
czy premie pracowników w 4 sklepach w lutym 2006 r. były mniejsze czy większe od średniej.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) przeprowadzić analizę asymetrii lewostronnej,
3) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
– materiały biurowe,
– kalkulator,
– literatura zgodna z punktem 6 Poradnika dla ucznia.
Ćwiczenie 3
Wykreśl krzywą liczebności i zaznacz takie miary, jak: średnia arytmetyczna, dominanta,
mediana, na podstawie danych zawartych poniżej:
Struktura wiekowa zarejestrowanych bezrobotnych kobiet w roku 2002.
Wiek
Wskaźnik struktury
1
2
24 lata i mniej
27,2
25-34
29,8
35-44
23,4
45-54
18,4
55 lat i więcej
1,2
Razem
100
Omów asymetrię.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
48
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) wskazać wzajemne położenie średniej arytmetycznej dominanty i mediany w rozkładzie,
3) wykreślić krzywą liczebności,
4) zaprezentować wyniki pracy.
Wyposażenie stanowiska pracy:
−
materiały biurowe,
−
kalkulator,
−
literatura zgodna z punktem 6 Poradnika dla ucznia.
4.7.4. Sprawdzian postępów
Czy potrafisz:
Tak
Nie
1) wyznaczyć asymetrię metodą graficzną?
2) wskazać zależności między miarami tendencji centralnej?
3) rozróżnić asymetrię lewostronną od prawostronnej?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
49
4.8. Analiza dynamiki
4.8.1. Materiał nauczania
Analiza dynamiki polega na badaniu zmian jakie następują w procesach czy zjawiskach na
skutek upływu czasu. Mogą to być zmiany polegające na tym, że zjawisko rośnie, maleje lub
pozostaje na tym samym poziomie. Ten wzrost lub spadek może być słabszy lub silniejszy.
Miary dynamiki pozwalają zmierzyć zarówno kierunek, jak i siłę zmian. W analizie dynamiki
mamy do czynienia z dwiema wielkościami:
−
wielkość badana – obecnie analizowana, którą oceniamy poprzez porównanie jej z inną
wielkością (najczęściej jest to wielkość, która wystąpiła w okresie późniejszym),
−
wielkość podstawowa – wielkość, do której porównuje się wielkość badaną (może
dotyczyć okresu bezpośrednio poprzedzającego okres badany bądź też okresu
wcześniejszego).
Indeksy dynamiki charakteryzują zmiany poziomu zjawiska obserwowanego w różnym
czasie i obliczane są według wzoru:
I =
0
1
x
x
gdzie:
I – indeks dynamiki,
x
0
– wielkość zjawiska w okresie podstawowym,
x
1
–
wielkość zjawiska w okresie badanym.
Wyróżnia się dwa rodzaje indeksów:
–
indeksy indywidualne (indeksy jednopodstawowe o podstawie stałej, indeksy łańcuchowe
o podstawie zmiennej),
– indeksy agregatowe.
Indeksy o podstawie stałej można zapisać następująco:
0
1
x
x
x 100;
0
2
x
x
x 100;
0
3
x
x
x 100; ...
0
1
x
x
n
−
x 100;
0
x
x
n
x 100
Przykład 1
Tabela 7. Wielkość produkcji trzewików w spółce „AVA” w latach 2003-2005.
Rok
Wielkość produkcji w tys. sztuk
2003
340
2004
460
2005
620
Źródło: opracowanie własne
Indeks o podstawie stałej w roku 2004 wynosi:
0
1
x
x
, czyli
340
460
x 100 = 135,3%. Oznacza to,
że wielkość produkcji w 2004 r. w porównaniu do wielkości produkcji w roku 2003 wzrosła
o 35,3%.
Indeks o podstawie stałej w roku 2005 wynosi 182,4%, co oznacza, że wielkość produkcji
w roku 2005 stanowiła 182,4% wielkości produkcji w 2003 r.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
50
Indeksy o podstawie zmiennej przedstawia wzór:
0
1
x
x
x 100;
1
2
x
x
x 100;
2
3
x
x
x 100; ...
2
1
−
−
n
n
x
x
x 100;
1
−
n
n
x
x
x 100
gdzie:
x
i
– wartość cechy; i = 0, 1, 2, 3, itd. oznacza różne okresy.
Na podstawie danych z tabeli 7 wynika, że indeks o podstawie zmiennej w roku 2005 wynosi:
1
2
x
x
x 100, czyli
460
620
x 100 = 134,8%. Oznacza to, że wielkość produkcji w roku 2005
w porównaniu do wielkości produkcji w roku 2004 wzrosła o 34,8%.
Tabela 8. Przeciętna miesięczna płaca w Przedsiębiorstwie „GAMA” w latach 2000–2005.
Rok
Przeciętna
miesięczna płaca
w zł
Przyrost w zł
Indeksy
łańcuchowe
1
2
3
4
2000
1800,00
-
-
2001
1980,00
180,00
110%
2002
2178,00
198,00
110%
2003
2395,80
217,80
110%
2004
2635,38
239,58
110%
2005
2898,92
263,54
110%
Źródło: opracowanie własne.
Przyglądając się wielkościom absolutnym z tabeli 8 widzimy, że przeciętna miesięczna
płaca w przedsiębiorstwie „GAMA” rośnie i że wzrost ten z okresu na okres jest większy.
Indeksy łańcuchowe pozwalają ustalić, że siła tego wzrostu jest stała i wynosi 10%. Jeżeli
tendencja tego rodzaju rysuje się przez wystarczająco długi okres, można wówczas na jej
podstawie wyciągać pewne wnioski na przyszłość.
Indeksy indywidualne dają możliwość ustalenia poziomu i kierunku zmian, ale nie
odpowiadają na pytanie, w jakim stopniu na wzrost wielkości produkcji czy sprzedaży
wpłynęły zmiany cen, a w jakim ilości wyprodukowanych czy sprzedanych wyrobów.
Do najczęściej wykorzystywanych indeksów agregatowych należą:
–
agregatowy indeks wartości,
–
agregatowy indeks cen,
–
agregatowy indeks wielkości fizycznej (produkcji, sprzedaży).
Agregatowy indeks wartości odnosi się do zmian jakie nastąpiły w łącznej wartości
badanej zbiorowości. Oblicza się go wg wzoru:
I
w
=
∑
∑
0
0
1
1
p
q
p
q
x 100
gdzie: q
1
– ilość w okresie badanym,
p
1
– cena w okresie badanym,
q
0
– ilość w okresie bazowym (podstawowym),
p
0
– cena w okresie bazowym (podstawowym).
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
51
Tabela 9. Produkty Przedsiębiorstwa Przemysłu Garbarskiego „SKÓRA” w roku 2000 i 2005
Ilość w tys.
Cena w zł
Obliczenia
Produkt
Jedn.
miary
2000 r.
q
0
2005 r.
q
1
2000 r.
p
0
2005 r.
p
1
q
0
x p
0
q
1
x p
1
q
0
x p
1
q
1
x p
0
A
szt.
3500
4200
70,-
130,- 245000,- 546000,- 455000,- 294000,-
B
m
6200
6800
32,-
62,- 198400,- 421600,- 384400,- 217600,-
C
l
120
240
8,-
18,-
960,-
4320,-
2160,-
1920,-
∑
x
x
x
x
x
444360,- 971920,- 841560,- 513520,-
Źródło: opracowanie własne.
Agregatowy indeks wartości obliczony do danych z tabeli 9 wynosi:
444360
971920
x 100 = 218,7%
Otrzymany wynik oznacza, że wartość produkcji w roku 2005 w stosunku do roku 2000
wzrosła o 118,7%. Na wzrost ten miały wpływ zmiany zarówno wielkości produkcji
poszczególnych produktów, jak i zmiany cen tych produktów.
Agregatowy indeks cen wyraża zmiany, w wielkości zjawiska spowodowane wyłącznie
zmianami cen. Przyjmuje się tutaj, że ilości pozostają na stałym poziomie. Indeks ten może być
ustalony według:
– formuły Paaschego, wówczas stały poziom ilości dotyczy okresu badanego;
– formuły Laspeyresa, wtedy stały poziom ilości dotyczy okresu bazowego.
Indeks cen oblicza się według wzoru:
– wg formuły Paaschego:
I
c
=
∑
∑
0
1
1
1
p
q
p
q
x 100
– wg formuły Laspeyresa:
I
c
=
∑
∑
0
0
1
0
p
q
p
q
x 100
Na podstawie danych z tabeli 6 indeks cen wyniesie:
– wg formuły Paaschego:
513520
971920
x 100 = 189,3%
i oznacza, że przy założeniu, że wielkość produkcji była stała i kształtowała się na poziomie
roku 2005, ceny wzrosły o 89,3%.
– wg formuły Laspeyresa:
444360
841560
x 100 = 189,4%
i oznacza, że przy założeniu, że wielkość produkcji była stała i kształtowała się na poziomie
roku 2000, ceny wzrosły o 89,4%.
Agregatowy indeks wielkości fizycznej wyraża zmiany w wielkości zjawiska
spowodowane wyłącznie zmianami ilości. Przyjmuje się tutaj, że ceny pozostają na stałym
poziomie. Indeks ten, podobnie jak indeksy cen, oblicza się według dwóch formuł:
– Paaschego, wówczas indeks wielkości fizycznej wyznacza się za pomocą wzoru:
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
52
I
wf
=
∑
∑
1
0
1
1
p
q
p
q
x 100
– Laspeyresa , wtedy indeks wielkości fizycznej wyznacza się według wzoru:
I
wf
=
∑
∑
0
0
0
1
p
q
p
q
x 100
Na podstawie danych z tabeli 6 indeks wielkości fizycznej wyniesie:
– wg formuły Paaschego:
841560
971920
x 100 = 115,5%
i oznacza, że przy założeniu, że ceny w badanym okresie były stałe i kształtowały się na
poziomie roku 2005, wielkość fizyczna produkcji wzrosła o 15,5%.
– wg formuły Laspeyresa:
444360
513520
x 100 = 115,6%
i oznacza, że przy założeniu, że ceny w badanym okresie były stałe i kształtowały się na
poziomie roku 2000, wielkość fizyczna produkcji wzrosła o 15,6%.
Indeksy obliczone według różnych formuł (Paaschego czy Laspeyresa) z reguły różnią się
między sobą i tylko niekiedy uzyskuje się taki sam wynik, tak jak ma to miejsce
w przykładach powyżej, gdzie otrzymane wyniki różnią się między sobą zaledwie o 0,1%.
4.8.2. Pytania sprawdzające
Odpowiadając na pytania, sprawdzisz, czy jesteś przygotowany do wykonania ćwiczeń.
1. Na czym polega analiza dynamiki?
2. Jakie dwie wielkości występują w analizie dynamiki?
3. Jakie są rodzaje indeksów w analizie dynamiki?
4. Co wyrażają agregatowe indeksy wartości, cen i wielkości fizycznej i jak należy
interpretować ich wyniki?
5. Jaki jest wzór na obliczenie indeksu wartości, indeksu cen i indeksu wielkości fizycznej?
4.8.3. Ćwiczenia
Ćwiczenie 1
Na podstawie poniższych danych porównaj, o ile % zmieniła się sprzedaż cukru
w Cukrowni „LESZNO” w latach 2002 – 2005, przyjmując za okres podstawowy rok 2002.
Określ rodzaj zastosowanych indeksów.
Tabela 10. Wielkość sprzedaży cukru w cukrowni „LESZNO” w latach 2002–2005.
Rok
Wielkość sprzedaży cukru w tonach
2002
192
2003
244
2004
340
2005
302
Źródło: dane przykładowe
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
53
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) przyjrzeć się informacjom z ćwiczenia,
3) wykonać ćwiczenie na przykładzie z materiału nauczania.
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru,
– kalkulator.
Ćwiczenie 2
Wykorzystując dane z tabeli 10, porównaj zmiany sprzedaży cukru w kolejnych latach
obierając za rok bazowy rok poprzedni. Nazwij wykorzystane indeksy.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) przyjrzeć się informacjom z ćwiczenia,
3) wykonać ćwiczenie na przykładzie z materiału nauczania.
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru,
– kalkulator.
Ćwiczenie 3
Dysponując informacjami z tabeli poniżej, oblicz indeks wartości i podaj jego interpretację.
Tabela 11. Sprzedaż Przedsiębiorstwa Rolno-Spożywczego „NATURA” w roku 2002 i 2005.
Ilość
Cena w zł
Obliczenia
2002
2005
2000
2005
Produkt
Jedn.
miary
q
0
P
1
p
0
p
1
A
l
1200
3640
0,90
1,20
B
kg
11904
42082
2,00
3,40
C
szt.
940
1206
18,00
38,00
∑
x
x
x
x
x
Źródło: opracowanie własne.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) przyjrzeć się informacjom z ćwiczenia,
3) wykonać ćwiczenie krok po kroku, wzorując się na przykładzie z materiału nauczania.
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru,
– kalkulator; można do wyliczeń wykorzystać arkusz kalkulacyjny EXCEL.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
54
Ćwiczenie 4
Ustal w odniesieniu do danych z tabeli 11, jaki wpływ na zmiany sprzedaży miały ceny
produktów, przyjmując za stałe wielkości sprzedaży. Zastosuj indeks cen wg formuły
Paaschego i Laspeyresa.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) przyjrzeć się informacjom z ćwiczenia,
3) wykonać ćwiczenie krok po kroku wzorując się na przykładzie z materiału nauczania.
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru,
– kalkulator; można do wyliczeń wykorzystać arkusz kalkulacyjny EXCEL.
Ćwiczenie 5
Ponownie wykorzystaj dane z tabeli 11 i oblicz tym razem indeks wielkości fizycznej
wg dwóch formuł. Zinterpretuj otrzymane wyniki.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) przyjrzeć się informacjom z ćwiczenia,
3) wykonać ćwiczenie krok po kroku, wzorując się na przykładzie z materiału nauczania.
Wyposażenie stanowiska pracy:
– przybory do pisania,
– kartka papieru,
– kalkulator; można do wyliczeń wykorzystać arkusz kalkulacyjny EXCEL.
4.8.4. Sprawdzian postępów
Czy potrafisz:
Tak
Nie
1) omówić, na czym polega analiza dynamiki i jakie dwie wielkości w niej
występują?
2) omówić rodzaje indeksów w analizie dynamiki?
3) wyliczyć indeksy proste (indywidualne)?
4) wyliczyć indeksy agregatowe: wartości, cen i wielkości fizycznej?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
55
4.9. Analiza korelacji zjawisk – tablica i wykres korelacyjny,
miary korelacji
4.9.1. Materiał nauczania
Zachodzące wokół nas zjawiska pozostają we wzajemnym powiązaniu ze sobą. Zadaniem
statystyki jest stwierdzenie, czy pomiędzy badanymi zjawiskami istnieje bądź też nie istnieje
jakaś współzależność (korelacja), a jeśli istnieje zbadanie jej charakteru i stopnia ścisłości.
Związek korelacyjny występuje wówczas, gdy każdej wartości jednej cechy odpowiada
przybliżona wartość innej cechy. Aby stwierdzić istnienie lub brak związku korelacyjnego
między dwiema badanymi cechami, należy:
– porównać przebieg szeregów statystycznych dla badanego zjawiska,
–
zastosować metodę graficzną (wykres korelacyjny),
–
zestawić wyniki badań w tablice zwane tablicami korelacyjnymi.
Tabela 12
Zakłady
Produkcja wyrobu x w szt.
Koszt jednostkowy
w zł
r
x
-r
y
(r
x
-r
y
)
2
1
2
3
4
5
I
H
G
F
E
D
B
I
A
C
A
B
C
D
E
F
G
H
I
J
1910
1860
1790
1680
1610
1490
1320
1290
1250
1100
(2)
(4)
(1)
(5)
(6)
(7)
(8)
(9)
(10)
(3)
1250
1320
1100
1490
1610
1680
1790
1860
1910
1290
7,2
7,3
7,4
7,7
7,8
8,0
8,3
8,6
8,8
9,4
(9)
(7)
(10)
(6)
(5)
(4)
(3)
(2)
(1)
(8)
8,8
8,3
9,4
8,0
7,8
7,7
7,4
7,3
7,2
8,6
-7
-3
-9
-1
1
3
5
7
9
-5
49
9
81
1
1
9
25
49
81
25
Razem
0
330
Źródło: dane przykładowe.
Jeśli chcemy zbadać, czy zachodzi związek między wielkością produkcji a kosztem
jednostkowym wyrobu w 10 zakładach, należy najpierw porównać przebieg szeregów
statystycznych. W tym celu układamy obydwa szeregi według rosnącej (lub malejącej)
wielkości produkcji lub kosztu jednostkowego. Z porównania szeregów widać, że w miarę
zmniejszania się ilości sztuk produkowanego wyrobu jego koszt jednostkowy rośnie.
Jeżeli obydwa szeregi są zbieżne, tj. obydwa na ogół rosną lub obydwa na ogół maleją,
związek taki nazywa się korelacją dodatnią, w przeciwnym wypadku, gdy wartości jednego
szeregu na ogół rosną, a wartości drugiego na ogół maleją, mamy do czynienia z korelacją
ujemną. Powyższa tabela jest przykładem korelacji ujemnej.
Do przedstawienia korelacji może służyć również metoda graficzna. Dane liczbowe
nanosi się na wykres na osiach współrzędnych.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
56
0
2
4
6
8
10
0
500
1000
1500
2000
2500
Produkcja wyrobu w szt.
K
o
s
z
t j
e
dno
s
tk
o
w
y
w z
ł
W przypadku istnienia dużej liczby jednostek statystycznych badanie związków
korelacyjnych może odbywać się przez układanie tablic korelacyjnych. Tablice korelacyjne to
tablice statystyczne, w których zamieszczone są dwie cechy – jedna w główce tablicy
korelacyjnej, druga w boczku tej tablicy. W poszczególne pozycje tablicy wpisujemy wszystkie
te jednostki objęte badaniem, które odpowiadają wartościom obydwóch cech.
Tabela 13
Produkcja w sztukach
Koszt jednostkowy
w zł
1001 - 1300 1301 - 1500 1501 - 1700 1701 - 2000
Razem
8,8 – 9,5
8,1 – 8,7
7,4 – 8,0
7,0 – 7,3
2 (A,C)
1 (J)
1 (B)
1(D)
2 (E, F)
1 (G)
2 (H, I)
2
2
4
2
Razem
3
2
2
3
10
Źródło: opracowanie własne.
Tabela 13 pokazuje, że liczby układają się od lewej strony tablicy wzdłuż przekątnej: góra
– dół, co wskazuje na istnienie korelacji ujemnej.
Aby ustalić nie tylko istnienie lub brak związku korelacyjnego, ale także jego siłę określa
się: współczynnik korelacji lub współczynnik korelacji rang.
Współczynnik korelacji (r
xy
)
obliczamy wg wzoru:
r
xy
=
∑
∑
∑
2
2
Y
X
XY
gdzie:
X – różnice między indywidualnymi wartościami pierwszej zmiennej (x) a ich średnią
arytmetyczną (x- x ),
Y – różnice między indywidualnymi wartościami drugiej zmiennej (y) a ich średnią
arytmetyczną (y- y ).
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
57
Współczynnik korelacji może przyjmować wartości od –1 do 1. Jeżeli wartość tego
współczynnika jest ujemna oznacza to, że między dwoma zjawiskami występuje korelacja
ujemna, a więc ze wzrostem wartości jednej cechy, maleją wartości drugiej cechy.
Gdy współczynnik korelacji jest dodatni oznacza to korelację dodatnią. Im jest on mniejszy
tym związek jest słabszy, im większy, tym korelacja jest silniejsza. Pełna korelacja ma miejsce
wówczas, gdy współczynnik jest równy 1 lub –1. Brak korelacji określa wartość
współczynnika = 0. Poniższe wartości współczynnika korelacji przedstawiają różny stopień
ścisłości związku korelacyjnego. I tak:
0 < r < 0,3 ścisłość współzależności jest nieznaczna,
0,3 < r < 0,5 ścisłość jest średnia,
0,5 < r < 0,7 ścisłość jest wysoka,
0,7 < r < 1,0 ścisłość jest bardzo wysoka.
Inną miarą współzależności cech jest współczynnik korelacji rang. Obliczanie tego
współczynnika jest proste i może być stosowane w przypadku, gdy mamy do czynienia
z mniejszą liczbą obserwacji.
Q = 1-
(
)
N
N
r
r
y
x
−
−
∑
3
2
6
gdzie:
Q – współczynnik korelacji rang,
r
x
– rangi, czyli numery porządkowe nadawane wartościom cechy „x” w szeregu
uporządkowanym,
r
y
– rangi, czyli numery porządkowe nadawane wartościom cechy „y” ułożonymi w
kolejności od najmniejszej do największej lub odwrotnie,
N – liczebność zbiorowości statystycznej.
Na podstawie tabeli 12 współczynnik korelacji rang będzie wynosił: -1. Należy zaznaczyć,
że współczynnik korelacji rang nie jest miernikiem współzależności wartości badanych cech,
lecz miernikiem ścisłości uszeregowania i bywa nazywany kolejnościowym współczynnikiem
korelacji.
4.9.2. Pytania sprawdzające
Odpowiadając na pytania, sprawdzisz, czy jesteś przygotowany do wykonania ćwiczeń.
1. Wykonanie jakich czynności pomaga stwierdzić istnienie związku korelacyjnego między
dwiema badanymi cechami?
2. Na czym polega porównywanie przebiegu szeregów statystycznych?
3. Co to są tablice korelacyjne?
4. Jakie znasz miary korelacji? Co one określają? Jakie są wzory na ich obliczenie?
5. Jakie wartości może przyjmować współczynnik korelacji?
6. Co oznacza wartość współczynnika korelacji mieszcząca się w przedziale 0<
r
<0,3?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
58
4.9.3. Ćwiczenia
Ćwiczenie 1
Zbadaj, czy pomiędzy poniższymi wartościami istnieje związek korelacyjny.
W celu przedstawienia istnienia ewentualnej korelacji narysuj wykres.
Nr
mieszkania
Ilość osób mieszkających w 1 lokalu
Miesięczne zużycie wody przypadające
na 1 mieszkanie w m
3
11
12
13
14
15
16
17
18
19
20
2
1
5
4
1
6
7
2
6
3
1,8
1,4
5,1
4,5
2,0
6,2
6,8
2,6
6,0
3,7
Źródło: dane przykładowe.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) ułożyć obydwa szeregi malejąco lub rosnąco,
3) nanieść podane wartości na układ współrzędnych.
Wyposażenie stanowiska pracy:
−
przybory do pisania, linijka,
−
kartka papieru.
Ćwiczenie 2
Do danych z ćwiczenia 1 z tabeli 4 ułóż tablicę korelacyjną. Podane wartości zamknij
w następujących przedziałach:
–
zużycie wody w m
3
: 1,0 – 2,0; 2,1 – 4,0; 4,1 – 5,5; 5,6 – 7,0;
–
ilość osób w lokalu: 1 – 2; 3 – 4; 5 – 6; 7 – 8.
Określ rodzaj korelacji.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) narysować tabelę na wzór tej z materiału nauczania i nanieść w odpowiednie kolumny
i wiersze dane z ćwiczenia,
3) w przypadku wątpliwości możesz skorzystać z literatury zamieszczonej w punkcie
6 Poradnika.
Wyposażenie stanowiska pracy:
−
przybory do pisania, linijka,
−
kartka papieru,
−
literatura zamieszczona w punkcie 6 Poradnika.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
59
Ćwiczenie 3
Posługując się danymi z tabeli 4 (ćwiczenie 1), oblicz współczynnik korelacji i zinterpretuj
otrzymany wynik.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) wykorzystać wzór z materiału nauczania,
3) w przypadku wątpliwości skorzystać z literatury zamieszczonej w punkcie
6 Poradnika.
Wyposażenie stanowiska pracy:
−
przybory do pisania, linijka,
−
kartka papieru,
−
kalkulator,
−
literatura zamieszczona w punkcie 6 Poradnika.
Ćwiczenie 4
Podobnie jak w ćwiczeniu 3 wykorzystaj dane z tabeli 4 i wyznacz tym razem
współczynnik korelacji rang.
Sposób wykonania ćwiczenia
Aby wykonać ćwiczenie, powinieneś:
1) zapoznać się z przygotowanym materiałem,
2) wykorzystać wzór z materiału nauczania,
3) w przypadku wątpliwości skorzystać z literatury zamieszczonej w punkcie
6 Poradnika.
Wyposażenie stanowiska pracy:
−
przybory do pisania, linijka,
−
kartka papieru,
−
kalkulator,
−
literatura zamieszczona w punkcie 6 Poradnika.
4.9.4. Sprawdzian postępów
Czy potrafisz:
Tak
Nie
1) stwierdzić istnienie związku korelacyjnego między dwiema badanymi
cechami?
2) określić, na czym polega porównanie szeregu statystycznego
i co to są tablice korelacyjne?
3) nazwać miary korelacji, podać wzory na ich obliczenie i interpretację
wyników?
4) stworzyć na podstawie posiadanych danych wykres korelacyjny?
5) nazwać ścisłości współzależności, dysponując wartościami
współczynnika korelacji r ?
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
60
5. SPRAWDZIAN OSIĄGNIĘĆ
INSTRUKCJA DLA UCZNIA
1. Przeczytaj uważnie instrukcję.
2. Podpisz imieniem i nazwiskiem kartę odpowiedzi.
3. Zapoznaj się z zestawem zadań testowych.
4. Test zawiera 20 zadań o różnym stopniu trudności. Do każdego zadania są cztery możliwe
odpowiedzi. Tylko jedna jest prawidłowa.
5. Udzielaj odpowiedzi na załączonej karcie odpowiedzi, zakreślając prawidłową odpowiedź
znakiem „X”. W przypadku pomyłki należy błędną odpowiedź zaznaczyć kółkiem, a
następnie ponownie postawić znak „X” tym razem już we właściwym miejscu.
6. Pracuj samodzielnie, bo tylko wtedy będziesz miał satysfakcję z wykonanego zadania.
7. Jeśli będziesz miał trudności z udzieleniem odpowiedzi na pytanie, odłóż jego rozwiązanie
na później i wróć do niego, gdy zostanie Ci wolny czas.
8. Na rozwiązanie testu masz 45 minut.
Powodzenia!
ZESTAW ZADAŃ TESTOWYCH
1. Do badań statystycznych pełnych zalicza się:
a) badania ankietowe,
b) badania monograficzne,
c) spis statystyczny,
d) szacunek statystyczny.
2. Badanie monograficzne polega na:
a) wybraniu próby statystycznej,
b) określeniu przybliżonej wielkości zjawisk,
c) systematycznym notowaniu zdarzeń,
d) szczegółowym zbadaniu pojedynczej jednostki statystycznej.
3. Liczby względne zwane są inaczej:
a) liczbami stosunkowymi,
b) absolutnymi,
c) wartościami złożonymi,
d) liczbami prostymi.
4. Jedną z dwóch wielkości występujących w analizie dynamiki jest:
a) wielkość obecna,
b) wielkość przyszła,
c) wielkość przeszła,
d) wielkość podstawowa.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
61
5. Indeksy łańcuchowe to indeksy:
a) mające jedną, tę samą podstawę,
b) o podstawie zmiennej,
c) nie zmieniające się bez względu na upływ czasu,
d) stałej podstawie zawsze równej 1.
6. Która z miar nie jest miarą dyspersji:
a) odchylenie standardowe,
b) średnia arytmetyczna,
c) odchylenie przeciętne,
d) obszar zmienności.
7. Odchylenie przeciętne ważone stosuje się, gdy:
a) wartości zmiennej ułożone są od najmniejszej do największej,
b) wartości zmiennej ułożone są od największej do najmniejszej,
c) wartości zmiennej podane są w szeregu rozdzielczym,
d) wartości zmiennej są liczbami całkowitymi.
8. Odchylenie standardowe jest od odchylenia przeciętnego zawsze:
a) niższe,
b) wyższe,
c) równe,
d) wyższe o 0,1.
9. Analiza korelacji to analiza:
a) zmian w strukturze badanej zbiorowości,
b) wielkości badanych zjawisk w ciągu ostatnich lat,
c) współzależności pomiędzy badanymi zjawiskami,
d) stopnia zmian zmiennych w czasie.
10. Metoda graficzna przedstawienia korelacji to:
a) wykres słupkowy,
b) wykres na układzie współrzędnych,
c) wykres kołowy,
d) wykres mieszany słupkowo-kołowy.
11. Sprawdzenie wszystkich pozycji formularza statystycznego oznacza, że przeprowadzono
kontrolę:
a) logicznej poprawności zapisu,
b) zgodności rachunkowej,
c) zupełności zapisu,
d) kompletności materiału statystycznego.
12. Dokładność wyników badania statystycznego zależy od:
a) wykształcenia osób prowadzących badania,
b) możliwości urządzeń pomiarowych,
c) upływu czasu między momentem badania a momentem publikacji wyników,
d) stosownego zaokrąglania wyników.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
62
13. Błędy o charakterze przypadkowym mogą wynikać z:
a) nieuwagi osoby wypełniającej,
b) błędów tzw. czeskich i pomyłek liczbowych,
c) celowego zniekształcania wyników,
d) niekompetencji osoby sporządzającej formularz.
14. Stopień szczegółowości podziału zbiorowości statystycznej zależy od:
a) rodzaju zjawiska,
b) celu badania,
c) ilości grup klasyfikacyjnych,
d) osoby prowadzącej badania.
15. W ramach tabelarycznej formy prezentacji materiału statystycznego wyróżnia się:
a) przedziały klasowe,
b) szeregi statystyczne,
c) tablice statystyczne,
d) metody liniowe.
16. Histogramy to:
a) wykresy mapowe prezentujące szeregi geograficzne,
b) wykresy prostokątne obrazujące szeregi wyliczające,
c) wykresy słupkowe przedstawiające szeregi rozdzielcze,
d) wykresy liniowe pokazujące szeregi dynamiczne.
17. Dominanta to inaczej:
a) wartość znikoma,
b) wartość modalna,
c) wartość średnia,
d) wartość nietypowa.
18. Średnią klasyczną jest:
a) mediana,
b) kwanty,
c) średnia arytmetyczna,
d) dominanta.
19. Średnia płaca w rodzinie czteroosobowej wynosi 2 200 zł. Jeżeli wynagrodzenie matki
wynosi 1890 zł, córki 1420 zł, syna 2790 zł, to wynagrodzenie ojca wynosi:
a) 2 700,
b) 2 200,
c) 1 800,
d) 2 100.
20. Wartość mediany w szeregu o nieparzystej liczbie wyrazów 81, 82, 83, 85, 86, 88, 90, 91,
92 wynosi:
a) 81,
b) 86,
c) 85,
d) 92.
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
63
KARTA ODPOWIEDZI
Imię i nazwisko..........................................................................................
Gromadzenie danych statystycznych i ich wykorzystywanie w procesach
decyzyjnych
Zakreśl poprawną odpowiedź.
Nr
zadania
Odpowiedź
Punkty
1
a
b
c
d
2
a
b
c
d
3
a
b
c
d
4
a
b
c
d
5
a
b
c
d
6
a
b
c
d
7
a
b
c
d
8
a
b
c
d
9
a
b
c
d
10
a
b
c
d
11
a
b
c
d
12
a
b
c
d
13
a
b
c
d
14
a
b
c
d
15
a
b
c
d
16
a
b
c
d
17
a
b
c
d
18
a
b
c
d
19
a
b
c
d
20
a
b
c
d
Razem:
„Projekt współfinansowany ze środków Europejskiego Funduszu Społecznego”
64
6. LITERATURA
1. GUS: Mały Rocznik Statystyczny Polski 2003, Zakład Wydawnictw Statystycznych,
Warszawa 2003.
2. Komosa A., Musiałkiewicz J.: Statystyka, Ekonomik, Warszawa 2005.
3. Michalski T.: Statystyka, Wydawnictwa Szkolne i Pedagogiczne, Warszawa 1996.
4. Michalski T.: Statystyka. Zbiór zadań, Wydawnictwa Szkolne i Pedagogiczne,
Warszawa 1997.
5. Ostasiewicz S., Rusnak Z., Siedlecka U.: Statystyka Elementy teorii i zadania,
Wydawnictwo Akademii Ekonomicznej im. O. Lanego, Wrocław 1997.