WYKLADY SZ TEORIA I A STRUKTURY


1
STATYSTYKA
" Statystyka  (łac. status   państwo )  nauka traktująca o metodach ilościowych badania
prawidłowości zjawisk masowych
- metoda  swoisty sposób badania liczbowego specjalnego typu zbiorowości
- zjawiska masowe  takie zjawiska, które badane w du\ej masie zdarzeń wykazują
prawidłowości, których nie mo\na zaobserwować w pojedynczym
przypadku (np. zgony)
" Ka\de zjawisko kształtuje się pod wpływem dwojakiego rodzaju przyczyn:
- głównych - działają na ka\de zjawisko w sposób jednakowy
- mają charakter wewnętrzny
- działają w ściśle określonym kierunku
- są wspólne dla wszystkich jednostek zbiorowości statystycznej
- powodują prawidłowości w procesach masowych
- ubocznych (indywidualnych, nietypowych)
- działają na ka\de zjawisko w sposób odmienny
- zródłem ich powstania są czynniki zewnętrzne (stąd nazwa: przyczyny
przypadkowe)
- powodują odchylenia od procesów masowych
" Wszystkie zjawiska masowe odznaczają się pewnymi prawidłowościami  zadaniem sta-
tystyki jest poznanie tych prawidłowości i ich wyra\enie ilościowe.
Prawidłowości występujące wyłącznie w procesach masowych (tj. w zbiorowości o du\ej
liczbie jednostek) nazywamy prawidłowościami statystycznymi.
" U podstaw badania prawidłowości statystycznych le\y prawo wielkich liczb  matema-
tyczne sformułowanie pewnych prawidłowości występujących w zjawiskach masowych:
- Określenie prawidłowości wymaga aby obserwowane zbiorowości jednostek były do-
statecznie liczne: im większa liczebność, tym większa szansa, \e ujawni się efekt dzia-
łania przyczyn głównych.
- W indywidualnych przypadkach działanie przyczyn ubocznych zaciemnia działanie
przyczyn głównych, natomiast w du\ej masie działanie przyczyn ubocznych znosi się
w mniejszym lub większym stopniu i występuje wyrazne działanie prawa wielkich
liczb.
2
" W statystyce ka\da wielkość ma sens wtedy i tylko wtedy gdy ma odpowiednik w rze-
czywistości.
- Statystyka  to nauka formalna  ma znaczenie u\ytkowe.
- Teoria statystyki  zajmuje się tym, w jaki sposób i za pomocą jakich metod pozna-
wać rzeczywistość  jakimi metodami badać prawidłowości i jak je interpretować.
- Metoda poznawania zjawisk masowych to metoda indukcyjna  umo\liwia uogólnie-
nie wyników otrzymanych z badania jednostek na całą zbiorowość. Taką generalizację
nazywamy wnioskowaniem statystycznym, a ten rodzaj badań wymaga zastosowania
metod statystyki matematycznej.
" Zadania statystyki:
- idiograficzne  mają charakter opisowy, wią\ący się z konstrukcją metod umo\liwia-
jących opis otaczającej nas rzeczywistości
- eksplikacyjne  pozwalają na streszczenie wyników opisu zjawisk w syntetycznej
formie, a tym samym dają podstawy do wnioskowania
" Subdyscypliny przedmiotowe statystyki:
- statystyka ludności
- statystyka ekonomiczna
- statystyka społeczna
- statystyka ubezpieczeń
- statystyka handlu
- statystyka rolnictwa
- statystyczna kontrola jakości
" Historia
- Staro\ytność (Egipt, Grecja, Rzym, Chiny)
- sporządzano spisy ludności i majątku, które dostarczały danych charaktery-
zujących stosunki społeczno gospodarcze
- cenzusy i spisy przeprowadzano w Rzymie w odstępach pięcioletnich (cha-
rakter militarny i podatkowy)
- Średniowiecze
- obserwacje o znamionach statystyki prowadziły instytucje kościelne oraz
feudałowie, przy czym miały one charakter prywatno-gospodarczy
- 1086r.  Księga Sądu Ostatecznego  ewidencja przeprowadzona w Anglii,
zawierająca opis posiadłości króla i kleru, z określeniem obszaru i wartości
3
- XIII wiek
- w północnych Włoszech (głównie w Wenecji) pozyskiwano materiały staty-
styczne do oceny aktualnej oraz przewidywanej przyszłej sytuacji
- XVII wiek
- rzeczywisty rozwój statystyki jako nauki rozpoczyna się od momentu zaob-
serwowania prawidłowości w zjawiskach masowych
- J. Grant (1620-1679)  badając księgi stanu cywilnego ludności Londynu
wykrył prawidłowości występujące w zgonach  tablice trwania \ycia
- W. Petty (1625-1687)  opublikował pracę  Arytmetyka polityczna , w któ-
rej mówi się o nowej nauce umo\liwiającej identyfikację prawidłowości w
zjawiskach masowych
- J. Grant i W. Petty uwa\ani są za pierwszych statystyków i nazywani byli
arytmetykami politycznymi
- XVIII wiek
- G. Achenwall (1719-1772)  prof. w Marburgu, pózniej w Getyndze, po raz
pierwszy u\ył słowa statystyka; pod pojęciem tym rozumiał zbiór wiadomo-
ści o państwie
- pojawił się drugi bardzo wa\ny nurt badań naukowych dotyczących nowego
działu matematyki  rachunek prawdopodobieństwa
- rozwija się w oparciu o badania zjawisk występujących w grach
losowych  gracze w kości i karty, chcąc dociec w jaki sposób
osiągnąć wielką wygraną czynili ogromną ilość obserwacji a re-
zultatem było powstanie teorii prawdopodobieństwa
- do przedstawicieli tego kierunku nale\ą:
Galton Kołmogorow
Pearson Lange
Queletet Markow
Gauss Neyman-Spława
" Pojęcie statystyka odnoszone jest do:
- nauki traktującej o metodach ilościowych badania prawidłowości zjawisk (procesów)
masowych  statystyka opisowa (zajmuje się zagadnieniami związanymi z groma-
dzeniem i prezentacją danych oraz badaniem populacji na podst. pobranych prób);
- oznaczania określonych charakterystyk opisowych (parametrów) obliczonych ze zbio-
rowości próbnych (średnia arytmetyczna, odchylenie standardowe)  statystyka ma-
tematyczna (zwana te\ wnioskowaniem statystycznym  zajmuje się metodami wnio-
skowania o całej zbiorowości generalnej na podst. zbadania pewnej jej części, wybra-
nej w sposób losowy, zwanej próbą opartą na metodach rachunku prawdopodobień-
stwa).
4
" Przedmiotem badania statystycznego jest zbiorowość statystyczna (masa statystyczna,
populacja).
a. Zbiorowość statystyczna  odpowiednio liczny zbiór elementów nieidentycznych,
ale tworzących całość jednoznacznie określoną pod względem rzeczowym,
czasowym i przestrzennym
b. Podział zbiorowości statystycznych:
- z punktu widzenia liczebności:
- skończenie liczne  zbiorowości składające się z określonej przeliczal-
nej liczby elementów (np. zbiór studentów AE Poznań 2000/2001)
- nieskończenie liczne  zbiorowości tworzone przez elementy o nieprze-
liczalnej liczbie (np. zbiór organizmów \ywych na Ziemi)
- z punktu widzenia czasu:
- statyczne  zbiorowości tworzone przez jednostki, które istniały, istnie-
ją lub będą istnieć w określonym momencie czasu (np. ludność Polski
stan na 31.XII.2000)
- dynamiczne  zbiorowości, które tworzą jednostki obserwowane w
pewnym przedziale czasu (np. kredyty konsumenckie w PKO BP S.A.
od stycznia do grudnia 2000r.)
- z punktu widzenia treści:
- jednorodna  zbiorowość, którą tworzą jednostki niezró\nicowane pod
względem cechy stałej (np. studenci AE Poznań 2000/2001)
- niejednorodna  zbiorowość, w której jednostki nie posiadają takiej sa-
mej cechy przedmiotowej (np. studenci i pracownicy AE  w jednym
zbiorze)
- z punktu widzenia pełnej lub częściowej obserwacji jednostek:
- generalna  zbiorowość wszystkich elementów, liczebność takiej zbio-
rowości mo\e być skończona lub nieskończona, zbiorowość mo\e być
statyczna lub dynamiczna
- próbna  część zbiorowości wybrana losowo lub przez wybór celowy:
n  liczebność danej próby
n d" 30  próba mała
n > 30  próba du\a
" Jednostka statystyczna  poszczególny element wchodzący w skład zbiorowości staty-
stycznej; jednostki statystyczne muszą być jednoznacznie określone pod
względem rzeczowym, czasowym i przestrzennym.
5
a. Podział jednostek statystycznych:
- jednostka prosta  taka, której elementy nie tworzą zbiorowości statystycznej; (np.
istoty \yjące, zdarzenia typu wypadek drogowy)
- jednostka zło\ona (agregatowa)  taka, której elementy mogą tworzyć dalsze zbio-
rowości (np. województwo  dzieli się na powiaty)
b. Suma jednostek statystycznych  określana jest jako liczebność zbiorowości i ozna-
czana symbolem N.
ni  jednostki zbiorowości (i = 1, 2, ..., k)
k
N =
"ni
i=1
" Cechy statystyczne  właściwości, którymi odznaczają się jednostki wchodzące w skład
badanej zbiorowości statystycznej
cechy statystyczne
stałe zmienne
rzeczowe czasowe przestrzenne rzeczowe czasowe przestrzenne
ilościowe jakościowe
ciągłe skokowe
a. Cechy stałe
- wspólne dla wszystkich jednostek zbiorowości
- słu\ą do zdefiniowania zbiorowości pod względem rzeczowym (co?), czaso-
wym (kiedy?), przestrzennym (gdzie?)
- pozwalają odgraniczyć badaną zbiorowość i wchodzące w jej skład jednostki
od innych zbiorowości
- nie stanowią one przedmiotu badań statystycznych
- np. w zbiorowości ludności Polski  cecha stała: posiadanie obywatelstwa pol-
skiego
6
b. Cechy zmienne  właściwości, którymi poszczególne jednostki zbiorowości ró\nią
się między sobą; podlegają one badaniu statystycznemu:
- rzeczowe (przedmiotowe)  słu\ą do określenia kogo lub co badamy (właści-
wości, którymi charakteryzują się ściśle określone zbiory osób, rzeczy lub
zjawisk)
- jakościowe (niemierzalne)  nie da się ich wyrazić liczbowo, ale
mo\na je opisać słownie (np. płeć, pochodzenie społeczne, rodzaj
kredytu)  rodzaj właściwości, której konkretny wariant występuje
lub nie u danej jednostki
- ilościowe (mierzalne)  mo\na je wyrazić w jednostkach miar (wła-
ściwość występująca z określonym liczbowo natę\eniem u wszyst-
kich jednostek zbiorowości)
- ciągłe  takie, które mogą przyjmować dowolne wartości
z określonego przedziału liczbowego (np. wiek, wynagro-
dzenie, sta\ pracy, wzrost)
- skokowe  takie, które przyjmują wartości równe liczbom
naturalnym (np. liczba dzieci w rodzinie, liczba pracowni-
ków)
- czasowe  określają, jakiego okresu lub momentu obserwacja dotyczy
- przestrzenne  określają lokalizację danego zjawiska w określonym miejscu
(rozmieszczenie danego zjawiska w przestrzeni)
Podział cech na stałe i zmienne jest względny  uzale\niony od przedmiotu i rodzaju badania
(np. płeć w zbiorowości ludności Polski jest cechą zmienną, a w zbiorowości kobiet w Polsce
 cechą stałą).
" Wariant cechy  to odmiana cechy:
- warianty cechy ilościowej  to rezultaty pomiaru jednostki
- warianty cechy jakościowej  identyfikujemy wg opisu uwzględniającego wszystkie
odmiany cech
7
Przykład
Zbiorowość Jednostka Cechy zmienne Wariant cechy Rodzaj cechy
płeć kobieta, mę\czyzna rzeczowa jakościowa
Studenci I roku Student I roku
WE, AE Poznań WE, AE Poznań
wzrost 158,160,168... rzeczowa ilościowa ciągła
w roku akadem. w roku akadem.
2000/2001 2000/2001
wiek 19,20,... rzeczowa ilościowa ciągła
pochodzenie robotnicze, chłopskie.. rzeczowa jakościowa
miejsce zam. Poznań,Piła,Gniezno... przestrzenna
średnia ocen z I
3.0, 3.21, ... rzeczowa ilościowa ciągła
semestru
rzeczowa ilościowa sko-
liczba rodzeństwa 1,2,3...
kowa
...
" Zasady wyodrębniania zbiorowości statystycznej:
Zbiorowością statystyczną mo\e być ka\dy wybrany przedmiot badania, wszelka masa osób,
przedmiotów lub zdarzeń, jeśli potrafimy wyodrębnić w sposób jednoznaczny jednostki i je-
\eli spełnione zostaną w stosunku do tych jednostek następujące warunki:
- masowość badania  warunek wywodzi się z rachunku prawdopodobieństwa,
- posiadanie cech stałych i zmiennych (co najmniej 1 cechy stałej i 1 cechy zmiennej),
- jednorodność zbiorowości.
Etapy badania statystycznego
" Badanie statystyczne  proces zło\ony, obejmujący całokształt czynności prowadzących
do odkrycia prawidłowości statystycznych
" Etapy badania statystycznego:
- przygotowanie badania
- obserwacja statystyczna
- opracowanie i prezentacja materiału statystycznego
- analiza opracowanego materiału statystycznego
Etapy te są ze sobą nierozerwalnie związane i stanowią logiczną całość.
W obrębie poszczególnych etapów badania mo\liwe jest zastosowanie ró\nych metod staty-
stycznych, których ka\dorazowy wybór zale\y d rodzaju materiału statystycznego oraz od
celu badania.
8
1. Etap I  przygotowanie badania.
Etap ten obejmuje czynności przygotowujące takie jak:
- ustalenie celu i zakresu badania
- określenie zbiorowości statystycznej i cech podlegających badaniu
- zdefiniowanie jednostek statystycznych
- dokonanie wyboru metody badania
2. Etap II  obserwacja statystyczna.
" Obserwacja statystyczna  ustalenie i rejestrowanie ogółu faktów dotyczących jednostek
statystycznych
" Materiał statystyczny  zbiór informacji, ustalony z reguły na piśmie, o wchodzących w
skład badanej zbiorowości jednostkach i charakteryzujących je cechach:
- materiał pierwotny  to materiał gromadzony w toku specjalnych badań
statystycznych (np. informacje utrwalone na arkuszach spisowych); jest
to materiał lepszy  dokładniejszy, bardziej wiarygodny, ale i kosztowny
i pracochłonny w uzyskaniu
- materiał wtórny  to materiał zebrany dla celów innych ni\ statystyczne
(np. do celów podatkowych, księgowych); materiał nie tak kosztowny,
ale wadą mo\liwość obarczenia błędami
" Formularz (kwestionariusz) statystyczny  podstawowe narzędzie przy zbieraniu pier-
wotnego materiału statystycznego  to zbiór pytań dotyczących pewnego za-
gadnienia i uszeregowanych logicznie.
- Zasady opracowywania kwestionariuszy:
- mo\liwie mało pytań w kwestionariuszu  nale\y uwzględnić tylko pytania
niezbędne dla oceny badanej zbiorowości; zbyt du\a liczba pytań powoduje,
\e odpowiedzi na część pytań mogą być udzielane bez zastanowienia
- pytania sformułowane zwięzle, krótko, a jednocześnie jasno  stopień trud-
ności mo\e być ró\ny, z zale\ności od tego, kto wypełnia formularz
- pytania nale\y sformułować tak, aby w miarę mo\liwości uzyskać odpowie-
dzi wyra\ane w liczbach lub słownie: tak/nie
- w miarę mo\ności nale\y unikać pytań dra\liwych i wymagających odpo-
wiedzi poufnych
- pytania nale\y uszeregować wg kolejności logicznej ułatwiającej zrozumie-
nie celu badania
- wa\na jest forma zewnętrzna formularza, druk musi być czytelny
- kwestionariusz powinien zawierać krótką instrukcję o sposobie jego wypeł-
niania; je\eli objaśnienia są krótkie, umieszcza się je bezpośrednio przy py-
taniu.
9
- Budowa kwestionariusza:
- I  nazwa instytucji, cel badania, itp.
- II  część właściwa  pytania
- III  uwagi dotyczące wypełniania kwestionariusza
" Podział badań statystycznych:
a. Badania całkowite:
- spis statystyczny
- rejestracja bie\ąca
- bie\ąca sprawozdawczość statystyczna
b. Badania częściowe:
- metoda ankietowa
- metoda monograficzna
- metoda reprezentacyjna
ad. a.) Badania całkowite  obejmują wszystkie jednostki badanej zbiorowości; mogą być
ciągłe, periodyczne lub dorazne.
Spis statystyczny - metoda gromadzenia danych w pewnych dłu\szych odstępach czasu;
- mo\e to być badanie jednorazowe lub periodyczne
- celem spisu jest ustalenie wielkości i struktury badanego zjawiska
- biuro statystyczne ONZ zaleca, aby spisy ludności były przeprowadzane w
latach kończących się na zero lub liczby bliskie zeru
- wg biura ONZ spis powinien zawierać tzw. minimum merytoryczne  dla
krajów europejskich 19 pytań poruszających zagadnienia: demograficzne
(płeć, wiek, stan cywilny, obywatelstwo, itp.), ekonomiczne (np. zawód),
społeczne, geograficzne (np. miejsce zamieszkania i jego charakter); mo\e
zawierać tak\e pytania dodatkowe (np. ustalające dzietność rodzin, migracje
ludności)
- cechy podstawowe spisu:
- centralizacja  spis przeprowadza rząd kraju, którego mieszkańcy zo-
staną spisani, rząd wyznacza odpowiednie organy do realizacji spisu i
opracowania zebranego materiału
- powszechność
- imienność
- jednoczesność
- regularność i międzynarodowa porównywalność
- statystyczne ujęcie wyników i zapewnienie tajemnicy statystycznej
- mikrospisy  sporządzane o metodę reprezentacyjną (badanie częściowe),
np. spisy gospodarstw rolnych, majątków trwałych; w Polsce:1974, 1984,
1995
10
- historia:
- staro\ytność  cenzusy (ostatni w Rzymie w 48r. n.e.  objął ok. 6
mln ludności)
- w USA: pierwszy spis (imienny, bezpośredni) w 1790r., pózniej w
odstępach 10-letnich; w 1890r. przeprowadzono spis zawierający 13
tys. pytań (w tym 5 tys. dotyczyło ubezpieczeń), którego publikacja
zajęła 24 tys. stron (koszt - $11mln)
- w Polsce: pierwszy spis w 1789r., kolejne: 1808, 1811, 1921, 1931,
1950, 1960, 1970, 1978, 1988; najbli\szy w 2002r.
Rejestracja bie\ąca - polega na ciągłym notowaniu określonych faktów
- ró\ni się od spisu tym, \e nie jest to badanie jednorazowe, lecz cią-
głe, wykonywane stale
- np. ewidencja ludności w urzędach stanu cywilnego
Bie\ąca sprawozdawczość statystyczna
- to sprawozdania wykonywane na jednolitych formularzach przez
poszczególne podmioty gospodarcze
- sprawozdania te są przekazywane do Wojewódzkich Urzędów Sta-
tystycznych, a stamtąd do GUS-u
ad. b.) Badania częściowe  obejmują jedynie część jednostek badanej zbiorowości, na pod-
stawie wyników z próby oceniamy całą zbiorowość.
Metoda ankietowa - jest jednym z najszybszych sposobów badania zjawisk masowych
- stosujemy ją zawsze w celu wyświetlenia jakiegoś specyficznego, ściśle
określonego zjawiska
- badanie ankietowe sprowadza się do udzielenia odpowiedzi na pytania uję-
te w kwestionariuszu
ankieta `" kwestionariusz (formularz)
jest jedną z metod badania częściowego
jest zbiorem pytań  stosujemy go zarówno w badaniu
całkowitym, jak i w częściowym
- badanie ankietowe jest badaniem dobrowolnym
- jest powszechnie stosowaną metodą badania opinii publicznej na temat ak-
tualnych zagadnień społecznych, politycznych, gospodarczych
- podstawową zaletą metody ankietowej jest szybkość uzyskania informacji i
zdecydowanie mniejsze koszty w porównaniu do kosztów badania całko-
witego
- badanie ankietowe nie jest w pełni badaniem reprezentacyjnym  nale\y
ostro\nie formułować wnioski i podejmować decyzje
11
Metoda monograficzna - jest to jedna z najstarszych metod badań społeczno-gospodarczych
- polega ona na badaniu indywidualnego przypadku (tj. pojedynczej jednost-
ki statystycznej), np. na badaniu jednej wsi, powiatu, miasta, województwa
- z uwagi na fakt, \e monografia dotyczy jednego przypadku, porusza bardzo
du\ą ilość problemów  pozwala zatem na gruntowną i wnikliwą analizę
danego przykładu i pogłębia naszą wiedzę o badanej zbiorowości
- badania monograficzne zyskały znacznie szersze zastosowanie pod koniec
XIXw. (do uzyskiwania obrazu warunków \ycia ludności)
Metoda reprezentacyjna  polega na tym, \e ze zbiorowości badanej (zwanej populacją ge-
neralną) losujemy jednostki (czyli pobieramy próbę) i na podstawie zbada-
nej próby wnioskujemy o całej zbiorowości
- jednostki statystyczne do próby mogą być wybrane dwoma sposobami:
- wybór przez losowanie  czyli wybór przypadkowy dający takie
same szanse do wylosowania (ka\da jednostka ma takie same
szanse znalezienia się w próbie)
- celowa selekcja  w tym przypadku w sposób świadomy (tj. opar-
ty na wstępnym rozpoznaniu zagadnienia) typuje się pewne jed-
nostki do próby
- nale\y zawsze dokonać oceny reprezentacyjności próby (oblicza się nie-
zbędną liczebność próby przed przeprowadzeniem badania i po jego prze-
prowadzeniu)
- w przypadku metody reprezentacyjnej uzyskane wyniki uogólnia się na ca-
łą zbiorowość (np. mikrospisy)
- metoda reprezentacyjna ma zastosowanie w badaniu zagadnień społeczno-
ekonomicznych
3. Etap III  opracowanie zebranego materiału statystycznego.
a. kontrola materiału statystycznego
b. grupowanie materiału statystycznego
c. zliczanie materiału statystycznego
d. budowa szeregów statystycznych
e. sporządzanie tablic statystycznych
f. sporządzanie wykresów statystycznych
ad. a.) Kontrola materiału statystycznego:
- Ka\dy zebrany materiał statystyczny (pierwotny czy wtórny) musi być poddany kontroli 
od kontroli zale\y bowiem w du\ej mierze poprawność wniosków formułowanych na
podstawie informacji uzyskiwanych z badaniach.
12
- W materiale statystycznym mogą występować ró\nego rodzaju błędy lub braki. Błędy w
materiale mogą być niezamierzone albo umyślne  wśród błędów niezamierzonych mo\na
wyró\nić:
- błędy systematyczne  przyczyną ich powstawania jest przede wszystkim
wieloznaczność pojęć badanej cechy oraz niedokładność definicji,
- błędy przypadkowe  powstają na skutek szeregu ró\nych drobnych przy-
czyn, a najczęściej na skutek nieuwagi.
- Kontrola materiału statystycznego dotyczy dwóch zagadnień:
- kompletność materiału statystycznego  kontrola kompletności polega na
stwierdzeniu czy zebrano formularze od wszystkich jednostek
oraz czy wszystkie pozycje formularza są wypełnione,
- jakość materiału statystycznego  kontrola jakościowa wymaga starannego
przejrzenia ka\dego wypełnionego kwestionariusza; polega ona
na badaniu zgodności, logiczności oraz wiarygodności odpowie-
dzi.
ad. b.) Grupowanie materiału statystycznego:
- Zebrany materiał jest materiałem nieuporządkowanym (surowym)  czynność porządko-
wania takiego materiału nosi nazwę grupowania statystycznego.
- Grupowanie materiału statystycznego  polega na mniej lub bardziej zró\nicowanym
podziale niejednorodnej zbiorowości na mo\liwie jednorodne grupy według wybranych
kryteriów.
- Dopiero w ramach poszczególnych grup mo\liwe jest dokonanie szczegółowych obliczeń
(grupowanie stanowi podstawę umo\liwiającą obliczenie charakterystyk liczbowych).
- Grupowanie statystyczne pozwala na prawidłowe odzwierciedlenie struktury badanej
zbiorowości oraz ustalenie związków między badanymi cechami.
- Warunki dotyczące poprawności przeprowadzenia grupowania:
- dokładnie i konkretnie musi być sformułowany cel badania,
- zjawiska muszą być ujęte w ich wzajemnym powiązaniu,
- za podstawę grupowania nale\y przyjąć cechy istotne dla badanej zbiorowości.
- W zale\ności od celu badania wyró\niamy trzy rodzaje grupowania statystycznego:
- grupowanie typologiczne (dawniej nazywane  grupowaniem leninowskim ) 
polega na podziale zbiorowości na jakościowo jednorodne grupy (np.
podział przedsiębiorstw na małe, średnie, du\e)
13
- grupowanie wariancyjne - najczęściej stosowane; polega ono na łączeniu po-
szczególnych jednostek wg wielkości pewnej interesującej nas cechy;
- celem tego grupowania jest uporządkowanie ba-
danej zbiorowości i poznanie jej struktury
- przy tym grupowaniu mamy zawsze do czynie-
nia z jedną cechą mierzalną (ilościową)
- np. grupowanie studentów wg liczby punktów
uzyskanych na egzaminie
- grupowanie analityczne - polega na podziale zbiorowości w oparciu o co naj-
mniej dwie cechy
- pozwala ono na ustalenie współzale\ności między
badanymi cechami
- z tym rodzajem grupowania mamy do czynienia
np. w rachunku korelacji
- Efektem grupowania statystycznego są szeregi statystyczne.
ad. c.) Zliczanie materiału statystycznego:
Występują tutaj cztery metody:
- Metoda bezpośrednia  polega na tym, \e przeglądamy zebrany materiał statystyczny i
zliczamy jednostki nale\ące do określonej grupy (metoda przestarzała).
- Metoda kreskowa  polega na tym, \e przeglądamy materiał statystyczny i ka\dą jednost-
kę zaliczamy do określonej grupy przez narysowanie kreski.
- Metoda kartkowa  stosowana jest wówczas, gdy materiał statystyczny znajduje się na
indywidualnych formularzach; przeglądając poszczególne kartki odkładamy ka\dą
z nich na odpowiednie stanowiska w zale\ności od tego, do jakiej grupy nale\ą.
- Metoda maszynowa  zliczanie przy pomocy komputerów; najczęściej stosowana.
ad. d.) Budowa szeregów statystycznych:
- Szereg statystyczny  ciąg wielkości statystycznych rosnących lub malejących, uporząd-
kowanych wg określonych cech (inaczej mówiąc szereg statystyczny to ciąg licz-
bowy monotoniczny, ograniczony z góry lub z dołu).
14
- Podział szeregów statystycznych:
szeregi
z punktu widzenia budowy (formy) z punktu widzenia treści
proste rozdzielcze strukturalne czasowe przestrzenne
z przedziałami z przedziałami okresów momentów
jednostkowymi wielojednostkowymi
(jednostopniowe) (wielostopniowe)
z równymi z nierównymi z równymi z nierównymi
przedziałami przedziałami przedziałami przedziałami
otwarte otwarte otwarte otwarte
zamknięte zamknięte zamknięte zamknięte
z punktu widzenia treści:
Szeregi strukturalne  oparte o cechę rzeczową (jakościową lub ilościową); umo\liwiają one
pogląd na wewnętrzną strukturę budowy zbiorowości
np. grupowanie pracowników wg wykształcenia, liczby dzieci, wieku
typ wykształcenia liczba pracowników
wy\sze
szereg strukturalny
średnie
oparty o cechę rzeczową jakościową
zas. zawodowe
podstawowe
liczba dzieci liczba pracowników
szereg strukturalny
0
oparty o cechę rzeczową
1
mierzalną skokową
2
3
wiek
liczba pracowników
szereg strukturalny
oparty o cechę rzeczową
mierzalną ciągłą
15
Szeregi czasowe  oparte o cechę czasową; przedstawiają natę\enie badanego zjawiska w
czasie
- szereg czasowy okresów  jeśli cecha ma charakter ciągły
- szereg czasowy momentów  gdy zmienność cechy jest skokowa
lata liczba ludności
Ludność Polski w latach 1990-2000.
1990
Stan na 31.XII.2000.
1991
.
szereg czasowy momentów
.
2000
lata liczba ludności
Ludność Polski w latach 1990-2000.
1990
1991
szereg czasowy okresów
.
.
2000
Szeregi przestrzenne (geograficzne)  oparte są o cechę przestrzenną; przedstawiają natę\enie
badanego zjawiska w przestrzeni
np. liczba studentów w pięciu wybranych miastach Polski
miasto liczba studentów
Warszawa
szereg przestrzenny
Kraków
Aódz
Poznań
Wrocław
z punktu widzenia budowy (formy):
Szeregi proste (wyliczające, szczegółowe)  stosujemy je wówczas, gdy zbiorowość składa się
z niedu\ej liczby jednostek, tzn. d" 30
np. lista obecności
Szeregi rozdzielcze - stosujemy je wówczas, gdy liczebność zbiorowości przekracza 30 jedno-
stek; zbiorowość jest podzielona na określoną ilość klas wg zmienności interesu-
jącej nas cechy
- szeregi rozdzielcze z przedziałami jednostkowymi  opierają się o cechę mie-
rzalną skokową
16
- szeregi rozdzielcze z przedziałami wielojednostkowymi  opierają się o cechę
mierzalną ciągłą
Ka\dy z tych szeregów mo\e mieć równe bądz nierówne przedziały klasowe;
mo\e być otwarty lub zamknięty.
- szereg zamknięty  szereg, który ma określone wszystkie granice przedzia-
łów klasowych
- szereg otwarty  szereg, który ma otwartą jedną z granic przedziałów klaso-
wych (zazwyczaj górną)
liczba dzieci liczba rodzin
0
szereg rozdzielczy z przedziałami jednostkowymi
1
2
3
liczba punktów liczba studentów
szereg rozdzielczy z przedziałami wielojednostko-
0-40
wymi, zamknięty,
40-80
o równych przedziałach klasowych
80-120
liczba punktów liczba studentów
do 20
szereg rozdzielczy z przedziałami wielojednostko-
20-40
wymi, otwarty
40-60
60 i więcej
lata liczba studentów
szereg rozdzielczy z przedziałami wielojednostko-
1990-1992
wymi, zamknięty,
1993-1996
o nierównych przedziałach klasowych
1997-1998
1998-2000
ad. e.) Sporządzanie tablic statystycznych:
- Tablica statystyczna jest formą prezentacji danych statystycznych. Praktyka i teoria staty-
styki wypracowały pewne zasady, których nale\y przestrzegać, aby tablice staty-
styczne spełniały swoją rolę.
17
- Zasadniczo tablica statystyczna składa się z trzech części:
- tytułu tablicy
- tablicy właściwej
- informacji na temat zródła powstania tablicy
Tytuł tablicy - powinien być zwięzły oraz zawierać określenie pod względem rzeczowym,
czasowym i przestrzennym
- powinien pokazywać cechy wg których dokonano grupowania
Tablica właściwa - składa się z kolumn i wierszy
- wszystkie miejsca w tablicy właściwej muszą być wypełnione
- jeśli nie podajemy w jakimkolwiek miejscu tablicy liczby, to nale\y ją
zastąpić znakiem umownym
- znaki umowne stosowane w tablicach statystycznych:
- kreska ( -)  dane zjawisko nie wystąpiło
- zero  dane zjawisko wprawdzie występuje, lecz jest tak nieliczne, \e
nie da się wyrazić w przyjętych w tablicy jednostkach miary
( 0 )  zjawisko istniało w wielkości mniejszej od 0,5
( 0,0 )  zjawisko istniało w wielkości mniejszej od 0,05
- kropka ( . )  brak wiarygodnych informacji o zjawisku
- krzy\yk ( )  dane pole tablicy nie mo\e być wypełnione ze wzglę-



du na układ tablicy lub wypełnienie jest niece-
lowe
- znak ( f& )  występuje w Przeglądzie Międzynarodowym  oznacza,
f&
f&
f&
\e dane dla Polski ró\nią się zakresem od danych w
części krajowej Rocznika
- znak ( " )  nazwy zostały skrócone w stosunku do obowiązującej
"
"
"
klasyfikacji
-  w tym  nie podaje się wszystkich składników sumy
- wykrzyknik ( ! )  umieszczany przy liczbach  liczba została zmie-
niona, poprawiona w porównaniu z liczbą
poprzednio ogłoszoną
yródło  podaje skąd zaczerpnięto dane, a tak\e zawiera uwagi dotyczące informacji zawar-
tych w tablicy.
- Tablica statystyczna jest zbiorem szeregów  ka\da tablica mo\e zawierać jeden lub
więcej szeregów statystycznych  stąd wyró\niamy tablice:
- proste  zawierają tylko jeden szereg statystyczny; grupowanie wg jednej inte-
resującej nas cechy
- kombinowane  zawierają więcej ni\ jeden szereg statystyczny; zbiorowość jest
charakteryzowana wg co najmniej dwóch cech jednocześnie
18
- W zale\ności od stopnia opracowania tablice dzielimy na:
- robocze  słu\ą do wstępnego opracowania materiału statystycznego  zawie-
rają stosunkowo mało pozycji, nie nadają się do umieszczenia w publika-
cjach,
- wynikowe  przeredagowane tablice robocze, zawierają wiele pozycji, są bar-
dziej szczegółowe, zawierają zazwyczaj więcej ni\ jeden szereg staty-
styczny  są publikowane.
ad. f.) Sporządzanie wykresów statystycznych:
- Wykres statystyczny  to inna forma prezentacji danych statystycznych; wykresem na-
zywam graficzny sposób przedstawienia zjawisk ujętych w szereg statystyczny.
- Wykresy posiadają wiele zalet: są bardziej plastyczne i przejrzyste ni\ tablice statystycz-
ne, stanowią cenny środek pomocniczy przy prezentacji danych, bo zawierają mniej
szczegółów.
- Wykresy składają się z trzech części:
- tytuł wykresu,
- wykres właściwy,
- zródło na podstawie jakiego został sporządzony wykres.
- Wa\ny jest wybór skali dla wykresu. Skale występujące w wykresach statystycznych mo-
gą być:
- równomierne  takie, w których jednakowym przedziałom graficznym odpo-
wiadają jednakowe przedziały liczbowe,
- nierównomierne  odznaczają się tym, \e nierównym przedziałom graficznym
odpowiadają jednakowe przedziały liczbowe lub odwrotnie; do skali tych
zalicza się m.in. skalę logarytmiczną (zbudowaną wg postępu geome-
trycznego), semilogarytmiczną.
4. Etap IV  analiza opracowanego materiału statystycznego.
Analiza statystyczna obejmuje:
a. analizę struktury
b. analizę współzale\ności
c. analizę dynamiki
19
a. ANALIZA STRUKTURY
Celem analizy struktury jest ustalenie podobieństw i ró\nic między jednostkami badanej zbio-
rowości ze względu na wyró\nioną cechę zmienną (analiza struktury dotyczy tylko jednej
zmiennej  rzeczowej).
Podobieństwa między jednostkami ustala się przez wyznaczenie tzw. tendencji centralnej,
czyli przeciętnego poziomu wartości cechy u wszystkich jednostek.
Badanie ró\nic między jednostkami przebiega wielokierunkowo i obejmuje:
- analizę dyspersji (czyli rozproszenia),
- analizę asymetrii (czyli skośności),
- analizę koncentracji.
Sumaryczny opis badanej zbiorowości ze względu na przeciętny poziom i zró\nicowanie
mo\na uzyskać przy pomocy parametrów statystycznych. Parametry statystyczne dzielimy na
klasyczne i pozycyjne.
Parametry statystyczne
PARAMETRY KLASYCZNE PARAMETRY POZYCYJNE
MIARY PRZECITNE
Średnia arytmetyczna Dominanta
Średnia harmoniczna Mediana
Średnia geometryczna Kwartyle
Średnia potęgowa
MIARY DYSPERSJI
Odchylenie przeciętne Obszar zmienności
Wariancja Odchylenie ćwiartkowe
Odchylenie standardowe Pozycyjny współczynnik zmienności
Typowy obszar zmienności
Współczynnik zmienności
MIARY ASYMETRII
Współczynnik asymetrii Pozycyjny współczynnik asymetrii
Współczynnik ą3
MIARY KONCENTRACJI
Współczynnik koncentracji Stosunek koncentracji (krzywa Lorentza)
Współczynnik ą4
Parametry klasyczne stosujemy gdy:
warianty badanej cechy charakteryzują się niewielkim stopniem wewnętrznego zró\-
nicowania,
szeregi statystyczne rozdzielcze są zamknięte i mają równe przedziały klasowe,
szeregi nie są skrajnie asymetryczne.
20
Parametry pozycyjne stosujemy gdy:
szeregi statystyczne rozdzielcze są otwarte lub posiadają nierówne przedziały klaso-
we,
chcemy sprawdzić wartość poznawczą parametru klasycznego,
chcemy uzyskać dodatkowe informacje o strukturze badanej zbiorowości.
MIARY PRZECITNE
Średnie klasyczne
" Średnia arytmetyczna
w szeregu prostym: w szeregu rozdzielczym w szeregu rozdzielczym
jednostopniowym: wielostopniowym:
n k k
xi " ni xi '"ni
"xi " "
i=1 i=1 i=1
x = x = x =
a a a
N N N
(śr. arytm. wa\ona) (śr. arytm. wa\ona)
gdzie: xi  warianty badanej cechy zmiennej
xi  środki przedziałów klasowych
ni  wagi, tzn. liczebności częściowe
Właściwości średniej arytmetycznej:
parametr łatwy do obliczenia i interpretacji
liczba zawsze mianowana (określona co do swojej wartości)
je\eli pomno\ymy średnią arytmetyczną przez ogólną liczebność, to otrzymamy sumę
wartości cech wszystkich jednostek zbiorowości:
n
= x " N
a
"xi
i=1
suma odchyleń poszczególnych jednostek zbiorowości statystycznej od średniej aryt-
metycznej równa się zeru:
n
- x ) = 0
a
"(xi
i=1
suma kwadratów odchyleń wartości poszczególnych jednostek zbiorowości staty-
stycznej od średniej arytmetycznej równa się minimum:
n
- x )2 = min
a
"(xi
i=1
obliczenie średniej arytmetycznej opiera się na wszystkich obserwacjach
średnią arytmetyczną mo\na obliczyć dla szeregów o liczebnościach bezwzględnych i
względnych
średnią arytmetyczną mo\na obliczyć tylko dla zbiorowości jednorodnych
spełnia relację: xmin < x < xmax , co pozwala na ocenę logiczną parametru
a
wadą jest to, \e na wynik wpływ mają wartości skrajne
21
" Średnia geometryczna
w szeregu prostym: w szeregu rozdzielczym:
n
n1 n2 nn
n n
n
x = x1 " x2 "..." xn = xi x = x1 " x2 "..." xn
g g
"
i=1
gdzie: n  liczba elementów
x1, x2, ..., xn  wartości szeregu w liczbach względnych
  znak iloczynu określonej liczby wyrazów
Właściwości średniej geometrycznej:
średnia geometryczna prosta jest n-tym pierwiastkiem z iloczynu wszystkich wartości
szeregu
stosujemy ją wówczas, gdy wartości jednostek są wyra\one w liczbach względnych, a
tak\e gdy występują znaczne ró\nice między obserwacjami
średnia geometryczna jest mniej wra\liwa na wartości krańcowe ni\ średnia arytme-
tyczna
średnia geometryczna w swej wartości jest zawsze mniejsza od średniej arytmetycznej
średnia geometryczna ró\ni się od innych średnich tym, \e gdy obliczana jest dla sze-
regu, którego choć jedna wartość jest równa zero, to jej wartość te\ równa jest zero
" Średnia harmoniczna
w szeregu prostym: w szeregu rozdzielczym:
N
N
x = x =
h h
n
k
1 ni
" "
xi xi
i=1 i=1
gdzie: xi  warianty badanej cechy
ni  wagi, tzn. liczebności cząstkowe
Właściwości średniej harmonicznej:
równa jest odwrotności średniej arytmetycznej z odwrotności poszczególnych jedno-
stek zbiorowości
stosuje się ją gdy wartości jednostek podane są w formie odwrotności
u\ywa się jej do obliczania m.in.: przeciętnego czasu potrzebnego do wyprodukowa-
nia jednostki wyrobu, siły nabywczej pieniądza, szybkości obrotów pienię\nych
22
" Średnia potęgowa
ogólna formuła:
k
"x
k
x =
p
N
średnia kwadratowa jest pierwiastkiem kwadratowym ze średniej arytmetycznej kwa-
dratów jednostek zbiorowości statystycznej:
w szeregu prostym: w szeregu rozdzielczym:
k
n
xi2ni2
xi2
"
"
i=1
i=1
x =
x = k
k
N N
Podsumowanie:
wszystkie powy\sze średnie nale\ą do średnich klasycznych,
słu\ą do sumarycznej charakterystyki wartości jednostek zbiorowości statystycznej,
wspólną ich cechą jest to, \e ich wielkość zale\y od wartości wszystkich jednostek
zbiorowości,
średnie te nale\y traktować jako narzędzie analizy zwłaszcza przy porównywaniu 2
lub więcej zbiorowości,
wszystkie średnie sprowadzić mo\na do średniej arytmetycznej za pomocą pewnych
przekształceń,
ka\da z nich ma swoisty sens i musi być logicznie interpretowana,
wybór średniej zale\y od charakteru zjawiska, które chcemy poznać.
Średnie pozycyjne
Miary przeciętne pozycyjne to wartości pewnych konkretnych jednostek zbiorowości wyod-
rębnione ze względu na ich poło\enie w danej zbiorowości.
" Dominanta (modalna, wartość najczęstsza)
dominanta to wartość zmiennej, która największą ilość razy powtarza się w szeregu
w szeregu prostym:
np. 52, 53, 55, 55, 55, 63, 68 D = 55
23
w szeregu rozdzielczym jednostopniowym:
lata studiów liczba studentów
D = 1
1 610
2 103
3 360
4 315
5 290
w szeregu rozdzielczym wielostopniowym:
nD - nD-1
D = xD + CD "
(wzór interpolacyjny)
(nD - nD-1) + (nD - nD+1)
gdzie: xD  dolna granica przedziału, w którym znajduje się dominanta
CD  rozpiętość przedziału, w którym znajduje się dominanta
nD  liczebność przedziału dominanty
nD-1  liczebność przedziału poprzedzającego przedział dominanty
nD+1 - liczebność przedziału następującego po przedziale dominanty
Własności dominanty:
stosujemy ją w statystykach płac, cen, w meteorologii, antropologii, zoologii
nadaje się do charakterystyki cech jakościowych
jest miarą najbardziej zrozumiałą wśród miar przeciętnych
nale\y do miar tendencji centralnej
na jej wartość liczbową nie mają wpływu wielkości skrajne
do jej wyznaczenia wystarczy znajomość 3 przedziałów klasowych o równej rozpięto-
ści
mo\na ją wyznaczyć w szeregu otwartym
dokładne wyznaczenie dominanty nie jest mo\liwe w szeregu rozdzielczym wielo-
stopniowym
dominanta nie nadaje się do przekształceń algebraicznych
dominanty nie wyznacza się w szeregach bimodalnych lub wielomodalnych, gdy\ ob-
razują one zbiorowości niejednorodne ze względu na cechę zmienną
" Mediana (wartość środkowa)
jest to wartość jednostki statystycznej poło\onej w ten sposób, \e liczba jednostek ma-
jących wartość nie mniejszą jest równa liczbie jednostek mających wartość nie więk-
szą od mediany
mediana dzieli szereg uporządkowany rosnąco lub malejąco na dwie części równe co
do liczebności wyrazów
24
w szeregu prostym:
Me = X
dla nieparzystej liczby wyrazów: N +1
2
np. 48, 52, 58, 60, 61 Me = 58
X + X
N N
+1
2 2
Me =
dla parzystej liczby wyrazów:
2
np. 48, 52, 58, 60, 61,64 Me = (58+60):2 = 59
w szeregu rozdzielczym:
N +1 Co
ł
Me = xd +
ł
dla nieparzystej liczby wyrazów: ł - cum n-1 ł "
2 no
ł łł
N Co
ł
Me = xd + - cum n-1 ł "
ł ł
dla parzystej liczby wyrazów:
2 no
ł łł
gdzie: xd  dolna granica przedziału, w którym znajduje się mediana
N/2  połowa liczebności, pozycja mediany
cum n-1  skumulowana liczebność przedziałów poprzedzających
przedział mediany
C0  rozpiętość przedziału mediany
n0  liczebność przedziału mediany
Właściwości mediany:
łatwa do obliczenia
niezale\na od wartości krańcowych szeregu
mo\na ją wyznaczyć nawet gdy nie wszystkie obserwacje są dokładnie znane
dokładność obliczenia mediany zale\y od wielkości przedziałów klasowych  im
mniejsze, tym obliczenia są dokładniejsze
mo\na ustalić ją w szeregu otwartym
medianę mo\na wyznaczyć tylko w szeregu uporządkowanym (jak wszystkie miary
przeciętne pozycyjne)
mediana nie nadaje się do przekształceń algebraicznych
" Kwartyle (wartości ćwiartkowe)
kwartyl 1
kwartyl 2 ( = mediana)
kwartyl 3
25
Wartość ćwiartkowa 1  wartość jednostki, która dzieli szereg w ten sposób, \e ź jedno-
stek ma od niej wartość nie większą, a - wartość nie mniejszą
N Co
ł
Q1 = xd + - cum n-1 ł "
ł ł
4 no
ł łł
Wartość ćwiartkowa 3  wartość jednostki, która dzieli szereg w ten sposób, \e jedno-
stek ma od niej wartość nie większą, a ź - wartość nie mniejszą
3N Co
ł
Q3 = xd + - cum n-1 ł "
ł ł
4 no
ł łł
gdzie: xd  dolna granica przedziału, w którym znajduje się kwartyl
N/4, 3N/4  pozycje kwartyli
cum n-1  skumulowana liczebność przedziałów poprzedzających
przedział kwartyla
C0  rozpiętość przedziału kwartyla
n0  liczebność przedziału kwartyla
MIARY DYSPERSJI (ZMIENNOŚCI, ROZPROSZENIA)
- zadaniem miar dyspersji jest wskazanie w jakim stopniu poszczególne wartości jedno-
stek zbiorowości statystycznej koncentrują się wokół wartości centralnej
- miary zmienności nale\ą do charakterystyk opisujących rozkład cechy
- pozwalają mierzyć zró\nicowanie wartości zmiennej w ramach danej zbiorowości, a
więc informują jak du\e są ró\nice między poszczególnymi wartościami jednostek
zbiorowości a przeciętną
- im mniejszy stopień zmienności, tym większe jest znaczenie danej średniej
Miary zmienności klasyczne
" Odchylenie przeciętne
jest średnia arytmetyczna bezwzględnych wartości odchyleń poszczególnych wartości
zbiorowości statystycznej od średniej arytmetycznej
w szeregu prostym: w szeregu rozdzielczym:
n k
xi - x xi - xni
" "
i=1 i=1
d = d =
p p
N N
26
" Wariancja
jest średnią arytmetyczną kwadratów odchyleń poszczególnych wartości jednostek
zbiorowości od ich średniej arytmetycznej (przyjmuje tylko wartości dodatnie)
w szeregu prostym: w szeregu rozdzielczym:
k
n
- x)2ni
- x)2
"(xi
"(xi
2 i=1 i=1
S2(x) =
S (x) =
N N
" Odchylenie standardowe
pierwiastek kwadratowy ze średniej arytmetycznej kwadratów odchyleń poszczegól-
nych wartości jednostek zbiorowości od ich średniej arytmetycznej (czyli pierwiastek
kwadratowy z wariancji)
w szeregu prostym:
n n
(xi - x)2 xi 2
" "
i=1 i=1
S(x) = S(x) = - (x)2
N N
w szeregu rozdzielczym:
k k
(xi - x)2 ni xi 2ni
" "
2
i=1 i=1
S(x) = S(x) = - (x)
N N
Własności odchylenia standardowego:
oblicza się je na podstawie wszystkich wartości szeregu
mo\na je obliczyć, gdy liczebności szeregu są podane w liczbach względnych
dodanie lub odjęcie od wszystkich wartości zmiennej w szeregu jakiejkolwiek (tej sa-
mej) liczby nie zmienia wartości odchylenia standardowego
je\eli wszystkie wartości szeregu pomno\ymy lub podzielimy przez jakąkolwiek tę
samą liczbę, odchylenie standardowe będzie równie\ tylokrotnie mniejsze lub większe
odchylenie standardowe ma sens statystyczny dopiero wówczas, gdy znamy wartość
średniej arytmetycznej, od której było obliczone
Reguła trzech sigm:
W przypadku rozkładu normalnego lub zbli\onego do normalnego blisko 1/3 wszystkich ob-
serwowanych wartości zmiennej ró\ni się od średniej arytmetycznej o więcej ni\ o ą  , w
xi
przybli\eniu 1 na 20 obserwacji przekracza tę średnią o wielkość równą ą 2 , a tylko 1 na
xi
370 obserwacji przekracza tę średnią o ą 3 .
xi
 - odchylenie standardowe populacji generalnej
27
" Typowy obszar zmienności
w obszarze tym mieści się około 2/3 wszystkich jednostek zbiorowości
konstruuje się go na podstawie średniej arytmetycznej i odchylenia standardowego:
x - S(x) )# xtyp )# x + S(x)
" Współczynnik zmienności (względna miara dyspersji)
wartość niemianowana
jest to stosunek odchylenia standardowego do średniej arytmetycznej:
S( x)
V( x) = "100
x
Vx d" 35% - dyspersja mała  średnia arytmetyczna dobrze charakteryzuje średni po-
ziom badanego zjawiska; mo\na uznać, \e badana zbiorowość jest jed-
norodna
35% < Vx d" 60% - dyspersja umiarkowana  średnia arytmetyczna dość dobrze cha-
rakteryzuje średni poziom badanego zjawiska
60% < Vx d" 75% - dyspersja du\a  średnia arytmetyczna ma małą wartość poznawczą
75% < Vx d" 100% - dyspersja bardzo du\a  średnia arytmetyczna nie jest miarą do-
brze charakteryzującą tendencję centralną; zbiorowość jest
niejednorodna
Miary zmienności pozycyjne
" Obszar zmienności
jest to ró\nica między wartością największą i najmniejszą w badanej zbiorowości:
R = xmax - xmin
stosujemy w statystykach płac, cen, w kontroli jakości
opiera się na dwóch skrajnych wartościach  jest miarą niedoskonałą
28
" Odchylenie ćwiartkowe
jest to połowa ró\nicy między kwartylem III a I:
Q3 -Q1
Q =
2
stosujemy w szeregach z przedziałami otwartymi
" Pozycyjny współczynnik zmienności
wartość niemianowana
jest względną miarą dyspersji
jest to stosunek odchylenia ćwiartkowego do mediany:
Q
VMe = "100
Me
Typy rozkładów empirycznych
Rozkład empiryczny zmiennej  to przyporządkowanie kolejnym wartościom zmiennej od-
powiadających im liczebności;
- rozkład odzwierciedla strukturę badanej zbiorowości z punktu widzenia bada-
nej cechy;
- jest ustalany na podstawie konkretnych obserwacji.
" Rozkład, którego krzywa liczebności ma tylko jedno maksimum to rozkład jednomodalny.
Wśród rozkładów jednomodalnych wyró\niamy:
- rozkłady symetryczne  liczebności rozkładają się proporcjonalnie po obu
stronach liczebności największej,
- rozkłady umiarkowanie asymetryczne,
- rozkłady skrajnie asymetryczne.
Rozkład symetryczny o 1 maksimum jest rozkładem normalnym.
Uwaga: Ka\dy rozkład normalny jest rozkładem symetrycznym, ale nie ka\dy rozkład
symetryczny jest rozkładem normalnym.
np. rozkład spłaszczony  r. symetryczny, ale nie normalny
rozkład wysmukły  r. symetryczny, ale nie normalny
29
ni
r. leptokurtyczny (wysmukły)
r. normalny
r. platokurtyczny (spłaszczony)
xi
" Rozkład bimodalny  to rozkład posiadający dwa maksima.
" Rozkład wielomodalny  rozkład posiadający wiele maksimów.
" Przykłady rozkładów dla cechy ciągłej
ni r. bimodalny ni r. wielomodalny
xi xi
rozkłady umiarkowanie asymetryczne
ni lewostronnie ni prawostronnie ni siodłowy
xi xi xi
30
rozkłady skrajnie asymetryczne
ni lewostronnie ni prawostronnie
xi xi
" Przykłady rozkładów dla cechy skokowej
ni r. jednomodalny ni r. bimodalny ni r. wielomodalny
xi xi xi
rozkłady umiarkowanie asymetryczne
ni ni ni
lewostronnie prawostronnie siodłowy
xi xi xi
rozkłady skrajnie asymetryczne rozkład symetryczny
ni ni ni
lewostronnie prawostronnie
xi xi xi
31
MIARY ASYMETRII
- pozwalają nam zbadać jak układają się w szeregu wartości zmiennej wokół średniej
arytmetycznej
- szereg nazywamy symetrycznym  gdy liczebności rozkładają się proporcjonalnie po
obu stronach średniej arytmetycznej
- szereg nazywamy asymetrycznym  gdy liczebności nie rozkładają się proporcjonalnie
po obu stronach średniej arytmetycznej; szereg mo\e być asymetryczny
prawostronnie lub lewostronne
- miary asymetrii dzielimy na miary absolutne i miary względne:
" miary absolutne  pozwalają określić kierunek asymetrii:
X = D = Me
- szereg symetryczny
D < Me < X
- szereg asymetryczny lewostronnie
X < Me < D
- szereg asymetryczny prawostronnie
" miary względne:
x - D 3" (x - Me)
-1d" Asd"1
As = As =
S( x) S( x)
3
" (Me - D)
2
- 3 d" As d" 3
As =
S(x)
(Q3 - Me)-(Me - Q1)
As =
(Q3 - Me)+ (Me - Q1 )
(stosujemy dla szeregów otwartych lub o nierównych przedzia-
łach klasowych)
gdy As = 0  szereg symetryczny
gdy As > 0  szereg asymetryczny prawostronnie
gdy As < 0  szereg asymetryczny lewostronnie
32
MIARY KONCENTRACJI
" Współczynnik koncentracji
1
" "(xi '-x)4 " ni
N
K =
S(x) 4
(wzór stosujemy dla szeregów rozdzielczych wielostopniowych)
gdy K = 3  szereg normalny
gdy K > 3  szereg wysmukły
gdy K < 3  szereg spłaszczony
Rachunek momentów
- tylko dla szeregów rozdzielczych zamkniętych o równych przedziałach klasowych
" Moment dowolnego stopnia  średnia arytmetyczna z odchyleń wartości zmiennej od
dowolnej liczby podniesionej do dowolnej potęgi
k
- x0 )r ni
"(xi
i=1
M =
r
N
gdzie: xi  wartości zmiennej
x0  dowolna liczba
r  dowolna potęga
ni  liczebności cząstkowe
N  liczebność ogólna
- momenty dzielimy na zwykłe i centralne
" Momenty zwykłe  momentem zwykłym nazywamy sumę odchyleń od dowolnej
liczby podniesioną do dowolnej potęgi
jeśli za dowolną liczbę przyjmiemy 0, to moment zwykły:
k
xir ni
"
i=1
 =
r
N
33
cztery momenty zwykłe:
k k k k
3
xi ni xi2ni ni xi4ni
" " "xi "
i=1 i=1 i=1 i=1
1 =  =  =  =
2 3 4
N N N N
" Momenty centralne  momentem centralnym nazywamy średnią arytmetyczną z od-
chyleń wartości zmiennej od ich średniej arytmetycznej podniesionych
do dowolnej potęgi
ogólna postać:
k
- x)r ni
"(xi
i=1
r =
N
cztery momenty centralne:
k k k k
- x) ni - x)2ni - x)3ni - x)4ni
"(xi "(xi "(xi "(xi
i=1 i=1 i=1 i=1
1 = 2 = 3 = 4 =
N N N N
1 = 0 jest miarą dyspersji stanowi podstawę stanowi podstawę
- jest to wariancja konstrukcji klasycz. konstrukcji wsp.
wsp. asymetrii koncentracji
" Związki między momentami zwykłymi a centralnymi:
2 3 2 4
2 =  -1 3 =  - 3 1 + 21 4 =  - 4 1 + 6 1 - 31
2 3 2 4 3 2
S(x) = 2
3 4
ą3 = ą4 =
3 4
S (x) S (x)
współczynnik asymetrii współczynnik koncentracji
34
ANALIZA STRUKTURY obejmuje wyznaczenie parametrów statystycznych:
gdy szereg jest zamknięty i ma równe przedziały klasowe:
x , S(x) , xtyp , V(x) , As , D
(mo\na zastosować rachunek momentów)
gdy szereg jest otwarty lub ma nierówne przedziały klasowe:
Me , Q1 , Q2 , R , Q , VMe , As


Wyszukiwarka

Podobne podstrony:
Mikroekonomia wykład 6 2010b Podstawowe struktury rynkowe
Wyklad XI Teorie struktury kapitalu
Informatyka Wykład 07 B Teoria języków i automatów
WYKLADY SZ A KORELACJI?zCHI2
351 Wykład SP Język strukturalny ST – Structured Text
WYKLADY SZ A DYNAMIKI
MIKROEKONOMIA WYKŁAD 4 (10 12 2011) struktury rynku,teoria podziału
120123 IK wykład 4 WO SŻ kształt ukł geomet
teoria integracji plan wykladow?
2 wykład pojecie i struktura adminitracji publicznej
Egzamin Teoria Wykład 01 (10) 14 (15) v 0 12 63 BETA
pytania egzaminacyjne do wykladu teoriakultuy

więcej podobnych podstron