1
Metody prezentacji danych statystycznych
Surowy materiał liczbowy, otrzymany w wyniku przeprowadzonej obserwacji (pomiaru) zostaje
odpowiednio usystematyzowany i pogrupowany w postaci tablic, charakteryzujących badane zjawiska za
pomocą liczb, podanych w pewnej kolejności i wzajemnie ze sobą powiązanych. Drugim równorzędnym
sposobem prezentacji informacji są wykresy.
Tablice
Tablice (tabele) statystyczne są zbiorem szeregów statystycznych – dzieli się je na proste i kombinowane
(złożone). Służą do prezentacji pogrupowanego i uporządkowanego materiału badawczego; prezentują
badane zjawiska za pomocą liczb, które podane są w pewnej kolejności i wzajemnie ze sobą powiązane.
Każda tablica statystyczna powinna zawierać:
tytuł, który w sposób jasny i zwięzły prezentuje treść tablicy, określając zbiorowość statystyczną;
kolejny numer jeśli w opracowaniu jest więcej tablic;
główkę tablicy stanowiącą jej część opisową; umieszcza się ją u góry tablicy aby określić treść
poszczególnych kolumn;
boczek tablicy, umieszczony z lewej strony, określa treść poszczególnych wierszy;
stosowane jednostki miary, które umieszcza się w pierwszej kolumnie po boczku; jeśli w całej tablicy
występuje jeden rodzaj jednostki miary, to podaje się ją w tytule lub dolnej części główki;
główne oznaczenia kolumn i wierszy;
źródło danych statystycznych celem zwiększenia wiarygodności danych zawartych w tablicy;
wypełnione wszystkie pola tablicy za pomocą właściwych liczb lub umownych znaków.
Do umownych znaków stosowanych w tablicach należą:
kreska (
) – zjawisko nie wystąpiło;
zero (0) – zjawisko istniało w ilościach mniejszych od liczb, które mogły być wyrażone uwidocznionymi
w tablicy znakami cyfrowymi;
kropka (
) – zupełny brak informacji lub brak informacji wiarygodnych;
krzyżyk (
) – wypełnienie pozycji, ze względu na układ tablicy jest niemożliwe lub niecelowe;
znak „#”– oznacza, że dane nie mogą być opublikowane ze względu na konieczność zachowania
tajemnicy statystycznej w rozumieniu ustawy o statystyce publicznej;
„w tym” – oznacza, że nie podaje się wszystkich składników sumy;
znak () – występuje w Rocznikach Statystycznych GUS w „Przeglądzie międzynarodowym” i oznacza,
że dane dla Polski różnią się zakresem od danych w części krajowej Rocznika;
wykrzyknik (!) – stawiany jest obok liczby celem wskazania, że została ona zmieniona w porównaniu z
liczbą poprzednio ogłoszoną, ponieważ jest poprawniejsza [Zając 1994].
2
Wykresy
Głównym celem wykresów jest syntetyzacja danych liczbowych oraz popularyzacja liczb. Wykresy służą też
celom poznawczym, mogą być narzędziem analizy naukowej, można je wykorzystać do uwydatnienia
specjalnych stron danego zagadnienia lub jako środek przedstawiania związków i zależności między
zjawiskami.
Wykres powinien być zwięzły, wyrazisty, jasny i prosty.
Zasady tworzenia wykresów [Analiza danych marketingowych 2006]:
napisy na wykresach powinny być zredukowane do minimum, a liczby – podawane w zaokrągleniu;
zbędne dodatki w formie linii pomocniczych, linii siatki należy z wykresu usunąć;
osie wykresu powinny być opisane;
do wykresu powinna być dołączona legenda;
wykres powinien być wyrazisty, barwy powinny być mocne, intensywne a nie mdłe; jednakże zbyt
intensywne barwy na wykresie mogą spowodować zmęczenie odbiorcy, zatem bardzo ostrych kolorów,
np. czerwonego, powinno się używać tylko w wyjątkowych przypadkach;
nie należy stosować zbyt oryginalnych form wykresów i zbytniej różnorodności ale również powinno się
unikać monotonii, stosując jeden rodzaj wykresów;
każdy wykres powinien być opatrzony tytułem (poprzedzonym ewentualnie numerem) oraz źródłem,
które zwiększa wiarygodność danych zawartych na wykresie;
należy wystrzegać się złudzeń optycznych, które powodują u odbiorcy wrażenia niezgodne z
rzeczywistością, szczególnie jeśli te złudzenia mają za cel manipulowanie odbiorcami.
Różne typy wykresów można pogrupować w cztery klasy:
liniowe i powierzchniowe;
na osiach współrzędnych prostokątnych;
kartogramy;
ilościowo-symbolowe.
Wykresy liniowe prezentują liczebności porównywanych zbiorowości za pomocą odcinków linii
prostych umieszczonych obok siebie.
Wykresy słupkowe otrzymuje się poprzez nadanie liniom większej grubości. Wysokość (długość)
słupka jest proporcjonalna do wielkości przedstawionych przez niego liczb.
Zasady tworzenia wykresów liniowych (słupkowych):
słupki powinny być smukłe a nie krępe, ponieważ elementem porównania jest ich wysokość a nie
powierzchnia;
podstawy słupków powinny być większe od odstępów między nimi;
odstępy między słupkami powinny być jednakowe;
dodawane liczby do wykresu słupkowego należy umieszczać wewnątrz słupka a nie nad nim, ponieważ
może spowodować to wrażenie, że słupek jest wyższy niż w rzeczywistości;
słupki stojące (leżące) obok siebie zakreskowuje się liniami ukośnymi w tym samym kierunku;
kreskowanie lub barwienie poszczególnych części słupka należy intensyfikować od dołu do góry;
3
słupki, prezentujące dynamikę umieszcza się pionowo, słupki, które prezentują inne porównania – można
umieścić również poziomo;
napisy obok słupków poziomych umieszcza się z lewej strony słupków, nie jeden nad drugim, i nie
skośnie.
Poniżej podano wybrane przykłady wykresów słupkowych, które są niewłaściwie skonstruowane
oraz poprawną ich wersję.
Przykład 1. Niepoprawny i poprawny wykres słupkowy
Rys. 1. Nieprawidłowe (a) i poprawne (b) umieszczenie liczb nad (w) słupkami(ch) i odstępów między słupkami. Nieprawidłowe
kreskowanie słupków (c)
Źródło: opracowanie własne
Na rysunku 1. (a) niepoprawnie umieszczono liczby nad słupkami, powodując wrażenie, że są one
wyższe niż w rzeczywistości. Niepoprawne jest również to, że odstępy między słupkami są większe niż
szerokość słupków. Na rysunku 1.(b) zmniejszono odstępy między słupkami, liczby umieszczono w świetle
słupka i dodatkowo usunięto linie siatki, które nie były niezbędne.
Wykresy liniowe są najprostszym sposobem przedstawiania liczebności porównywanych
zbiorowości poprzez umieszczanie obok siebie odcinków linii prostych. Jeśli liniom tym nada się większą
grubość to otrzyma się wydłużone prostokąty. Będą to wykresy słupkowe. W wykresach tych wysokość
(długość) słupka jest proporcjonalna do wielkości przedstawionych liczb. Dlatego słupki powinny być
smukłe, wydłużone a nie krępe, bowiem elementem porównania jest ich wysokość a nie powierzchnia.
Podstawa słupka powinna być większa od odstępów między nimi, zaś odstępy powinny być jednakowe. Jeśli
słupki stojące (leżące) obok siebie zakreskowuje się liniami ukośnymi to kreskowanie nie powinno
przebiegać w przeciwnych kierunkach, bo spowoduje to wrażenie skrzywienia słupków (rys.1 c.). Dodając
liczby do wykresu słupkowego należy umieszczać je wewnątrz słupka a nie nad nim, ponieważ może
spowodować to wrażenie, że słupek jest wyższy niż w rzeczywistości (rys.1 a.).
W przykładzie 2. wskazano, że jeżeli słupek jest dzielony na części i prezentuje strukturę
zbiorowości, to kreskowanie lub barwienie poszczególnych części należy intensyfikować od dołu do góry.
4
Przykład 2. Intensyfikowanie barw/odcieni na wykresie słupkowym
Rys.2. Niepoprawna (a) i poprawna (b) kolorystyka słupków
Źródło: opracowanie własne
Słupki, które prezentują dynamikę powinny być umieszczone pionowo, natomiast słupki
prezentujące inne porównania – poziomo. Napisy obok takich słupków (szczególnie, jeśli są długie) należy
umieszczać z lewej strony słupków. Nie powinno się ich umieszczać nad lub pod słupkami czy skośnie. Na
rysunku 3. nie zastosowano tej zasady stąd czasami trudno odgadnąć, do którego poziomu należy odnieść
nazwę województwa. Niepoprawna jest również na tym rysunku kolorystyka, bowiem słupki o odcieniu
ciemniejszym są powyżej jaśniejszych. Rysunek 4. nie ma tych mankamentów.
Przykład 3. Podpisy przy wykresie słupkowym
Rys.3. Linie kolejowe eksploatowane według wybranych województw w 2011 roku
Źródło: opracowanie własne na podstawie Transport, wyniki działalności w 2011 roku, GUS Warszawa 2012,
http://www.stat.gov.pl/cps/rde/xbcr/gus/tl_transport_wyniki_dzialalnosci_2011.pdf, 10.11.2013
5
Rys. 4. Linie kolejowe eksploatowane według wybranych województw w 2011 roku
Źródło: opracowanie własne na podstawie Transport, wyniki działalności w 2011 roku, GUS Warszawa 2012,
http://www.stat.gov.pl/cps/rde/xbcr/gus/tl_transport_wyniki_dzialalnosci_2011.pdf, 10.11.2013
Wykresy powierzchniowe obejmują kwadraty, prostokąty oraz koła, które wykorzystywane są
najczęściej. Wykresy te wyrażają wielkość liczb za pomocą powierzchni figur geometrycznych. Pola figur są
proporcjonalne do wielkości liczb, które te figury wyrażają. Stosuje się je, gdy rozpiętości między
przedstawianymi liczbami są bardzo duże i wykorzystanie wykresów liniowych nie byłoby możliwe z
powodów technicznych. Wykresy powierzchniowe służą najczęściej do prezentacji struktury badanej
zbiorowości.
Kwadraty i prostokąty są rzadziej wykorzystywane, ponieważ dużo trudniej jest wzrokowo
uchwycić różnice zachodzące pomiędzy powierzchnią tych figur niż pomiędzy wysokością czy długością
słupka (rys.5.). Jeszcze trudniejsze jest uchwycenie różnic zachodzących w objętości figur [Osipow 1957].
Zatem należy unikać prezentowania zjawisk za pomocą sześcianów czy prostopadłościanów.
Przykład 4. Wykres powierzchniowy – prostokątny
Rys. 5. Udział w rynku użytkowników smartfonów według systemów operacyjnych w II kwartale 2011 r.
Źródło:
http://www.engadget.com/2011/07/28/nielsen-android-leads-us-smartphone-market-with-39-percent-shar/
6
Zasady tworzenia wykresów kołowych:
koła umieszczone obok siebie powinny mieć środki na jednej linii poziomej (rys. 6.);
koła umieszczane jedne w drugich powinny być wewnętrznie styczne, a nie współśrodkowe (rys.7.);
liczba składników w strukturalnym wykresie kołowym nie powinna przekroczyć 7-10 elementów. Jeżeli
występuje duża liczba składników struktury to można połączyć wykres kołowy ze słupkowym.
Przykład 5. Wykresy kołowe
dobrze
źle
Rys. 6. Poprawny i niepoprawny wykres kołowy
Źródło: opracowanie własne na podstawie
dobrze
źle
Rys. 7. Poprawny i niepoprawny wykres kołowy
Źródło: opracowanie własne na podstawie
Rys.7.Poszkodowani w wypadkach przy pracy w 2012 r. – wykres niepoprawny
Źródło:
http://www.stat.gov.pl/cps/rde/xbcr/wroc/ASSETS_Wroclaw_w_liczbach_2013_n.swf
Liczba składników w strukturalnym wykresie kołowym nie powinna być zbyt duża i przekroczyć 7-
10 elementów. Jeśli jednak konieczne jest uwzględnienie dużej liczby składników strukturalnych to można
połączyć wykres kołowy ze słupkowym (rys. 8. i 9.)
7
79
43
32
26
16
13
8
7
6
5
3
42
Mazowieckie
Lubelskie
Łódzkie
Świętokrzyskie
Wielkopolskie
Małopolskie
Kujawsko-pomorskie
Dolnośląskie
Podkarpackie
Zachodniopomorskie
Podlaskie
Rys. 8. Powierzchnia sadów (w tys. hektarów) w wybranych województwach w 2003 r.
Źródło: opracowanie własne na podstawie „Statystyka to lubię” GUS Warszawa 2004, s. 53
Rys. 9. Struktura powierzchni lasów państwowych według składu gatunkowego drzewostanu w 2003 r. Stan w dniu 1 I.
Źródło: opracowanie własne na podstawie: „Statystyka to lubię” GUS Warszawa 2004, s. 52
Do statystycznej analizy danych można wykorzystać wykresy na osiach współrzędnych. Wykresy te
służą do:
przedstawienia graficznego szeregów rozdzielczych – zalicza się tu histogramy, wieloboki liczebności
oraz krzywe liczebności;
graficznej prezentacji rozwoju zjawisk w czasie – za pomocą trendów;
graficznego przedstawienia związku cech – za pomocą wykresów korelacyjnych.
Zasady tworzenia wykresów na osiach współrzędnych prostokątnych:
linie siatki wykresu powinny być dużo cieńsze od linii wykresu;
między słupkami histogramu nie występują przerwy;
dobór skali ma wpływ na obraz wielkości lub dynamiki zjawiska (przykład 11.);
przerwanie skali wykresu może powodować zniekształcenie wielkości zjawiska lub obrazu jego
dynamiki;
8
prezentując szereg czasowy momentów punkty wyznacza się na liniach pionowych, oddzielających
poszczególne momenty (rys.10);
prezentując szereg czasowy okresów punkty należy zaznaczyć w środku przedziałów czasowych (rys.
11.).
Przykład 6. Szeregi czasowe momentów i okresów
0
100
200
300
400
500
600
1990 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Małżeństwa (w tys.)
Urodzenia żywe (w
tys.)
Rys. 10. Małżeństwa i urodzenia żywe w latach 1990-2004 (stan na 31 XII)
Źródło: Opracowanie własne na podstawie: Ludność. Stan i struktura w przekroju terytorialnym., GUS, Tabl. I. Podstawowe dane
demograficzne dla lat 1990-2004; http://www.stat.gov.pl/dane_spol-gosp/ludnosc/stan_struk_teryt/2004/31_XII/index.htm
Rys. 11. Mieszkania we Wrocławiu oddane do użytku według miesięcy w 2012 r.
Źródło:
http://www.stat.gov.pl/cps/rde/xbcr/wroc/ASSETS_Wroclaw_w_liczbach_2013_n.swf
Kartogramy to wykresy na mapie lub planie, których celem jest prezentowanie rozmieszczenia
terytorialnego, lokalizacji lub natężenia zjawiska.
Tworząc kartogramy należy pamiętać o pewnych zasadach:
z mapy geograficznej należy usunąć wszystkie zbędne elementy;
mniejsze natężenie zjawiska wyraża się za pomocą większych odstępów kreskowania i cieńszych linii lub
mniej intensywnych barw;
stosując sposób punktowy prezentacji zjawisk należy rozwiązać problem ustalenia właściwej jednostki
miary oraz rozmieszczenia punktów na pewnym obszarze.
Szczególnym przypadkiem kartogramów są kartodiagramy – mapy z naniesionymi wykresami
kołowymi lub histogramami.
Miejscem praktycznego stosowania metod przestrzennej prezentacji zjawisk jest Portal
Geostatystyczny, pozwalający na kartograficzną prezentację danych pozyskanych w spisach powszechnych,
9
tj. Powszechnym Spisie Rolnym 2010 (PSR 2010) i Narodowym Spisie Powszechnym Ludności i Mieszkań
2011 (NSP 2011) [
]. Portal ten pełni funkcje gromadzenia, prezentowania i
udostępniania informacji dla wielu użytkowników – indywidualnych i instytucjonalnych.
Dane prezentowane są przy użyciu takich metod prezentacji kartograficznej jak kartogramy i
kartodiagramy. Przykład kartodiagramu zamieszczono poniżej (rys.12.).
Przykład 7. Kartodiagram
Rys. 12. Powierzchnia zasiewów wybranymi zbożami według regionów w 2011 roku
Źródło: opracowanie własne z wykorzystaniem Portalu Geostatystycznego
Wykresy obrazkowe czyli piktogramy wykorzystywane są do popularnego, wizualnego opisu i
graficznej prezentacji wielkości, struktury lub dynamiki zjawisk i zbiorowości statystycznych. Wykresy te
nie prezentują wielkości zjawiska dokładnie, ponieważ nie jest to ich celem. Mają one natomiast
przyciągnąć uwagę obserwatorów i skierować ją na prezentowane zjawisko celem popularyzacji statystyki.
Piktogramy wykorzystują znaki, symbole, obrazki, które wyrażają dowolnie obraną liczbę
prezentowanych jednostek. Wykorzystywane symbole powinny się kojarzyć pojęciowo z prezentowanym na
wykresie zjawiskiem lub zbiorowością.
Zasady tworzenia piktogramów:
liczba znaków na wykresie jest proporcjonalna do wielkości liczb przez nie wyrażanych a symbole
należy powtórzyć tyle razy ile liczb wyrażają;
liczby ułamkowe należy zaokrąglać a nie przedstawiać części symboli na piktogramie (rys. 13);
symbole muszą być jednakowej wielkości – rozmiar zjawiska różnicuje się poprzez liczbę występujących
symboli.
10
Przykład 8. Piktogram
Rys. 13. Liczba pracujących mężczyzn w województwie dolnośląskim w II kwartale 2003 roku
Źródło: opracowanie własne na podstawie: Województwa w latach 1995-2003, GUS,
http://www.stat.gov.pl/opracowania_zbiorcze/wojewodztwa/index.htm
Rys. 14. Przyjazdy pasażerów w portach lotniczych w województwie dolnośląskim w roku 2002 i 2003
Źródło: opracowanie własne na podstawie: Województwa w latach 1995-2003, GUS,
http://www.stat.gov.pl/opracowania_zbiorcze/wojewodztwa/index.htm
Niepoprawne jest rysowanie symboli różnej wielkości zamiast symboli jednakowej wielkości (rys.14).
Powiększając symbol poprzez zmianę jego wysokości nie są zachowane proporcje pomiędzy liczbami
prezentowanymi na wykresie.
Rys. 13. Pracujący według płci i wybranych sekcji w 2012 r.
Źródło:
http://www.stat.gov.pl/cps/rde/xbcr/wroc/ASSETS_Wroclaw_w_liczbach_2013_n.swf
11
Złudzenia optyczne i manipulacje wykresami
Prezentując pewne dane na wykresach należy wystrzegać się złudzeń optycznych, które mogą wprowadzać
w błąd odbiorcę. Niektóre złudzenia optyczne mogą być wykorzystywane z rozmysłem, aby manipulować
ocenami odbiorców.
Przykładem takiej manipulacji był wykres opublikowany w czasopiśmie „Wirtschaft und Statistik”
[Osipow 1957, s. 12], przedstawiający podział ludności Niemiec po pierwszej wojnie światowej.
Oddzielenie części trójkąta w jego górnej części i dodatkowo zaznaczenie jej ciemną barwą powoduje, że
odbiorca wyolbrzymia tę oddzieloną część.
Przykład 9. Manipulacja barwą i kształtem na wykresie
Rys. 14. Podział ludności Niemiec po I wojnie światowej
Źródło: opracowanie własne na podstawie [Osipow 1957, s. 12]
Manipulacja wykresem może wynikać z zastosowania nieodpowiedniej skali. W przykładzie 10.
zaprezentowano porównanie dwóch województw ze względu na długość linii jednotorowych w 2011 roku
(w km). Na wykresie a (niepoprawnym) widać ogromną dysproporcję między długością tych linii w
województwie kujawsko-pomorskim i lubelskim, bowiem skala osi rzędnych jest od 630 do 730. Domyślne
ustawienie Excela spowodowało tak duże wizualne różnice. Wykres b (poprawny) nie wykazuje już tak
drastycznych różnic w długości linii jednotorowych w analizowanych województwach, ponieważ skala jest
od 0 do 800.
Przykład 10. Manipulacja skalą
Rys.15. Długość linii jednotorowych w 2011 r. ( w km)
Źródło: opracowanie własne na podstawie Transport, wyniki działalności w 2011 r., GUS Warszawa 2012,
http://www.stat.gov.pl/cps/rde/xbcr/gus/tl_transport_wyniki_dzialalnosci_2011.pdf, 10.11.2013
12
Nieprawidłowy dobór skali do wykresu może powodować również duże zniekształcenia jeśli
prezentowane jest zjawisko dynamiczne. Zmniejszenie skali na osi odciętych czy też „ucięcie” skali na osi
rzędnych (b) powoduje powstanie złudzenia, że prezentowane zjawisko charakteryzuje się większą
dynamiką niż na wykresie w skali podstawowej (a). Z kolei wykres, na którym zmniejszono skalę na osi
rzędnych a zwiększono na osi odciętych (c) prezentuje bardzo słabą dynamikę. W przykładzie 11.
zaprezentowano to samo zjawisko – przeciętne miesięczne wynagrodzenie w gospodarce narodowej w
latach 2001-2012 – w wersji podstawowej (a) oraz przy zmienionych skalach, zarówno na osi rzędnych jak i
osi odciętych.
Przykład 11. Manipulacja skalą w wykresach dynamiki
Rys. 16. Przeciętne miesięczne wynagrodzenie w gospodarce narodowej w latach 2001- 2012
Źródło: opracowanie własne na podstawie
http://www.stat.gov.pl/gus/5840_1630_PLK_HTML.htm
Na rysunku 17. pokazano manipulację wykresem zamierzającą ukryć niekorzystny trend w zjawisku,
który charakteryzuje spadek w sprzedaży dla niektórych produktów podczas, gdy inne wykazują wzrost
sprzedaży. Wykorzystano w tym celu wykres słupkowy skumulowany. Z rysunku wynika, że bez względu na
system operacyjny sprzedaż smartfonów rośnie.
13
Przykład 12. Ukrywanie trendu
Rys. 17. Liczba sprzedanych smartfonów według wybranych systemów operacyjnych w kwartałach 2012 i 2013 roku (w mln sztuk)
Źródło: opracowanie własne na podstawie
http://www.gartner.com/newsroom
Spowodowane jest to tym, że sprzedaż smartfonów systemu Android „podnosi” słupki sprzedaży dla
smartfonów pozostałych systemów operacyjnych.
Poprawny wykres zamieszczono poniżej (rysunek 18).
Rys. 18. Liczba sprzedanych smartfonów według wybranych systemów operacyjnych w kwartałach 2012 i 2013 roku (w mln sztuk)
Źródło: opracowanie własne na podstawie http://www.gartner.com/newsroom 11.11.2013
Przykład 13. Wykresy 3D
Na rysunku 19 zastosowanie trójwymiarowej przestrzeni powoduje, że niektóre informacje są zupełnie
nieczytelne.
Rys. 19. Liczba sprzedanych smartfonów według wybranych systemów operacyjnych w kwartałach 2012 i 2013 r. (w milionach
sztuk) – niepoprawny wykres przestrzenny
Źródło: opracowanie własne na podstawie
14
Poprawienie wykresu pod względem kolejności serii danych spowodowało lepszą wizualizację
danych, ale nadal porównania informacji przekazywanych przez wykres są utrudnione.
Rys. 20. Liczba sprzedanych smartfonów według wybranych systemów operacyjnych w kwartałach 2012 i 2013 r. (w milionach
sztuk) – poprawiony wykres
Źródło: opracowanie własne na podstawie
http://www.gartner.com/newsroom
Najczytelniejszy jest wykres na płaszczyźnie (rys.21) lub jak na rys. 18.
Rys. 2. Liczba sprzedanych smartfonów według wybranych systemów operacyjnych w kwartałach 2012 i 2013 r. (w milionach
sztuk) – wykres na płaszczyźnie
Źródło: opracowanie własne na podstawie
http://www.gartner.com/newsroom