OPRACOWANIE MATERIAŁU STATYSTYCZNEGO


OPRACOWANIE MATERIAAU
STATYSTYCZNEGO
SZEREGI
STATYSTYCZNE
Grupowanie
l polega na wyodrębnieniu jednorodnych lub
względnie jednorodnych części w ramach
większej i zróżnicowanej zbiorowości
statystycznej,
Zadaniem grupowania
l jest przejście od informacji o właściwościach
poszczególnych jednostek do informacji o
właściwościach całej zbiorowości.
Z punktu widzenia celu, jakiemu ma służyć
dzielimy je na:
- typologiczne - wyodrębnianie grup jednorodnych
różnych jakościowo (np. według cech terytorialnych,
czasowych, rzeczowych)
- wariacyjne - mające na celu uporządkowanie
badanej zbiorowości i poznanie jej struktury, które
polega na łączeniu w klasy jednostek statystycznych
o odpowiednich wartościach cech statystycznych.
Zliczanie
l czynność ściśle związana z grupowaniem
(ręczne, elektroniczne).
Szereg statystyczny
l jest to zbiór wyników obserwacji
uporządkowanych według określonych cech
(kryteriów), których miernikiem są zmienne.
l Inaczej mówiąc, szeregiem statystycznym
nazywamy ciąg liczbowy monotoniczny,
ograniczony z góry i z dołu (tj. taki, którego
wyrazy występują tylko w pewnym przedziale
wartości).
Najczęściej wyróżnia się dwa kryteria podziału
szeregów:
l kryterium formalne - związane z budową
szeregu, na podstawie którego możemy
wyodrębnić: szeregi szczegółowe, szeregi
rozdzielcze i szeregi skumulowane,
l kryterium merytoryczne - wynikające z typu
badanej cechy zbiorowości, według którego
wyróżnia się: szeregi czasowe i szeregi
przestrzenne.
Sposób grupowania cech zależy od:
l rodzaju badania ,
l rodzaju cechy statystycznej,
l sposobu pomiaru,
l liczby obserwacji .
Szereg szczegółowy
l uporządkowany ciąg wartości badanej cechy
statystycznej, stosowany, gdy przedmiotem
badania jest niewielka liczba jednostek, np.
zmienna X przyjmuje wartości: x1, x2, ..., xn,
wartości cechy porządkujemy rosnąco: x1
Łx2Ł ... Ł xn lub malejąco x1e" x2e" ... e"xn.
Szereg rozdzielczy
l stanowi zbiorowość statystyczną, podzieloną na
części (klasy) według określonej cechy jakościowej
lub ilościowej z podaniem liczebności lub częstości
każdej z wyodrębnionych klas.
l Szeregi rozdzielcze mogą dotyczyć zarówno cechy
jakościowej, jak i ilościowej. Charakteryzują one
strukturę danej zbiorowości stąd nazywane są
czasem szeregami strukturalnymi.
Szeregi Statystyczne
szczegółowe rozdzielcze czasowe
z cecha mierzalną z cechą niemierzalną
momentów okresów
(ilościowe) (jakościowe)
punktowe przedziałowe geograficzne inne
proste skumulowane proste skumulowane
ANALIZA STRUKTURY ZJAWISK MASOWYCH
Rozkład empiryczny- zestawienie wyników w postaci
szeregu rozdzielczego z cechą mierzalną.
Rozkład empiryczny odzwierciedla strukturę badanej
zbiorowości z punktu widzenia określonej cechy
statystycznej
Szereg czasowy
l szereg czasowy - powstaje gdy podstawą
grupowania jest zmiana badanego zjawiska w
czasie:
- szereg czasowy okresów - zawiera informację o
rozmiarach zjawiska w krótszych lub dłuższych
okresach.
- szereg czasowy momentów - ujmuje wielkość
zjawiska w danym momencie, najczęściej na
początku lub końcu np. miesiąca.
W przykładzie mamy następujące szeregi:
 Wypadki - szereg okresów (łączna liczba
wypadków w każdym roku)
 Pojazdy - szereg momentów (w każdym roku
stan na 31.XII)
Pojazdy
Wypadki
t
rok
stan na 31.XII
w roku
(okres lub
[tys.]
moment)
1 1995 11186 56904
2 1996 11766 57911
3 1997 12284 66586
4 1998 12709 61855
5 1999 13169 55106
6 2000 14106 57331
7 2001 14724 53799
razem
409492
Podstawowe oznaczenia, podstawowe wielkości
l n - liczebność próby (zbiorowości próbnej),
l xi - wariant cechy statystycznej (i = 1, 2 , ... , n),
l ni - liczba jednostek o i-tym wariancie
cechy,
l k - liczba klas (wariantów cechy),
przy czym:
k
n =
n
i
i=1
Przykład szeregu szczegółowego
l Dokonano pomiaru wzrostu (w cm) 12
studentów z jednej grupy ćwiczeniowej i
otrzymano następujące wyniki:
165, 166, 166, 167, 170, 170, 171, 172, 173,
175, 177, 181.
Szereg rozdzielczy otrzymujemy wówczas gdy zbiorowość statystyczną podzielimy
na klasy według określonej cechy (jakościowej lub ilościowej) i podamy liczebność
każdej z tych klas.
W pewnym zakładzie przeprowadzono badanie grupy
krwi. Wybrano losowo 50 osób. Wyniki zostały
przedstawione w szeregu rozdzielczym punktowym
LICZEBNOŚĆ ni
GRUPA KRWI
xi
A 7
B 3
AB 10
0 30
Czas reakcji w min Liczba osób
Badano czas reakcji
3-7 3
organizmu osób cierpiących
na pewne schorzenie po
8-12 4
zażyciu nowego leku.
Zbiorowość statystyczną
13-17 15
stanowiło 150 pacjentów
leczonych w szpitalu.
18-22 24
Mierzono czas (w min) od
23-27 70
podania jednorazowej dawki
leku do momentu wystąpienia
28-32 22
pewnego objawu. Zebrane
wyniki przedstawiono w
33-37 7
postaci obok podanego
szeregu rozdzielczego.
38-42 5
RAZEM 150
Wskaznik struktury
W określaniu rozkładu empirycznego zamiast
liczebności ni stosuje się częstości względne
(zwane wskaznikiem struktury) określone
wzorem:
ni
vi = , i =1, 2, ...k
n
Przy czym:
k
v =1, 0 Łvi Ł1
i
i=1
Szeregi rozdzielcze skumulowane
l Uzyskuje się poprzez przyporządkowanie
kolejnym wariantom cechy odpowiadających
im liczebności (częstości ) skumulowanych.
Szereg rozdzielczy skumulowany wg
wieku badanych
NUMER WIEK LICZEBNOŚĆ CZSTOŚĆ
KLASY xi SKUMULOWANA SKUMULOWANA
i nisk i
1 7 189 0,29
2 8 246 0,38
3 9 397 0,62
4 10 505 0,79
5 11 558 0,88
6 12 638 1
Dystrybuanta empiryczna
l To przyporządkowanie kolejnym wartościom
cechy statystycznej (zmiennej)
odpowiadających im częstości
skumulowanych (względnie liczebności
skumulowanych)
Przykład 1
W wybranej grupie studentów przeprowadzono
kolokwium z matematyki.
Studenci otrzymali następujące oceny: 2, 5, 3, 4,
3+, 4, 3, 4+, 3+ , 3+, 5, 4, 3+, 4+, 3+, 3+, 3, 2, 3,
3+, 3, 4, 3+, 4, 3+, 4, 3, 4+, 4+, 3+.
Opracowanie materiału statystycznego
l Zbiorowość (populacja) generalna: & & & & & & & ..
l Zbiorowość próbna (próba): & & & & & & & & & & & .
l Cecha statystyczna: & & & & & & & & & & & & & & & & .
l Liczebność próby n: & & .
l Liczba wariantów cechy k: & & .
l Warianty cechy xi: & & & & & & & & & &
l Szereg szczegółowy:
2; 2; 3; 3; 3; 3; 3; 3; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 4;
4; 4; 4; 4; 4; 4,5; 4,5; 4,5; 4,5; 5; 5;
Opracowanie materiału statystycznego
l Zbiorowość (populacja) generalna: studenci
l Zbiorowość próbna (próba): wybrana grupa studentów
l Cecha statystyczna: ocena z kolokwium z matematyki
Studenci badani są pod względem ocen otrzymanych z kolokwium z
matematyki, "ocena z matematyki" jest cechą mierzalną skokową.
l Liczebność próby n: 30
l Liczba wariantów cechy k: 6
l Warianty cechy xi: 2, 3, 3,5, 4, 4,5, 5
l Szereg szczegółowy:
2; 2; 3; 3; 3; 3; 3; 3; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 4; 4; 4;
4; 4; 4; 4,5; 4,5; 4,5; 4,5; 5; 5;
Szereg rozdzielczy punktowy:
Numer wariantu Liczebność
(klasy) Wariant cechy wariantu
I xi ni
1
2
3
4
5
6
liczebność próby n
Szereg rozdzielczy punktowy:
Liczebność
Numer wariantu Wariant cechy wariantu
i xi ni
1 2 2
2 3 6
3 3,5 10
4 4 6
5 4,5 4
6 5 2
liczebność próby n 30
W przypadku gdy wariantów jest dużo
budujemy szeregi rozdzielcze z
przedziałami klasowymi.
Tworzenie szeregów rozdzielczych z
przedziałami klasowymi-etapy:
-ustalenie liczby klas
-określenie wielkości przedziałów klasowych
- przyporządkowywanie danych przedziałom
klasowym
- zliczanie liczby jednostek w każdej klasie
Ustalanie liczby klas
Liczby klas w zależności od liczebności badanej zbiorowości
Liczba obserwacji Liczba zalecanych klas
n k
40-60 6-8
60-100 7-10
100-200 9-12
200-500 11-17
Wzory na obliczanie niezbędnej liczby
klas
k n
Rozpiętość przedziału klasowego
l Różnicę pomiędzy górną x1i i dolną x0i
granica i- tego przedziału klasowego
nazywamy rozpiętością (szerokością)
przedziału klasowego i oznaczamy przez hi
Wzór na ustalenie rozpiętości przedziałów
klasowych
gdzie:
nazywa się rozstępem, a k oznacza liczbę klas.
Ustalanie granic poszczególnych klas
l Jako dolną granicę najczęściej przyjmuje się
najmniejszą wartość cechy lub bliskiej tej
wartości, czyli:
l Przy cechach ciągłych górne granice klas
poprzednich powinny być dolnymi granicami
klas następnych, aby nie było pomiędzy
przedziałami luk ponadto trzeba ustalić, do
której klasy zaliczyć wartości graniczne.
Przykład
Struktura województw wg liczby gmin dla cechy
skokowej
Szereg szczegółowy:
17, 30, 32, 37, 37, 39, 40, 40, 40, 40, 41, 41, 42, 42,
43, 43, 43, 44, 45,46, 46, 47, 47, 47, 48, 48, 49, 51,
54, 54, 55, 55, 55, 56, 57, 57, 58, 58,58, 59, 59, 62,
63, 63, 65, 69, 74, 78, 91.
ROZWIZANIE
R =
h =
początek pierwszego przedziału klasowego
x01 = xmin =
(przyjmujemy, że rozpiętość przedziałów klasowych
jest taka sama dla wszystkich klas)
ROZWIZANIE
R = 91  17 = 74,
h = 74/7 = 10,57 = 11
początek pierwszego przedziału klasowego
x01 = xmin = 17
(przyjmujemy, że rozpiętość przedziałów klasowych
jest taka sama dla wszystkich klas)
Rozkład empiryczny i dystrybuanta empiryczna 
Struktura województw wg liczby gmin
Skumulowany
Numer Liczba Liczba Wskaznik Liczebność
wskaznik
klasy gmin województw struktury skumulowana
struktury
i xi ni i nisk isk
1 17 - 27 1 0,02 1 0,02
2 28 - 38 4 0,08 5 0,10
3 39 - 49 22 0,45 27 0,55
4 50 - 60 14 0,29 41 0,84
5 61 - 71 5 0,10 46 0,94
6 72 - 82 2 0,04 48 0,98
7 83 - 93 1 0,02 49 1,00
n = 49
Przykład
Struktura badanej zbiorowości dzieci w wieku 7 lat według masy
ciała
Szereg szczegółowy:
16,17,17,18,18,18,18,18,19,19,19,19,20,20,20,20,20,20,20,20,2
0,20,21,21,21,21,21,21,21,21,22,22,22,22,22,22,22,
22,22,22,22,22,23,23,23,23,23,23,23,23,23,23,23,23,23,23,23,2
4,24,24,24,24,24,24, 24,24,24,24,24,24,24,24,24,24,
24,24,24,24,24,25,25,25,25,25,26,26,26,26,26,26,26,27,27,27,2
7,27,2727,28,28,28,28,28,29,29,29,29,29,29,29,2930,30,30,30,
30,30,30,31,31,31,31,31,31,32,32,32,32,33,33,34,34,34,35,35,3
5,35,35,37,40,47.
ROZWIZANIE
k = 144 =12
R = 47-16=31,
h = 31/12=2,58=3
początek pierwszego przedziału klasowego
x01 = xmin = 16
(przyjmujemy, że rozpiętość przedziałów klasowych
jest taka sama dla wszystkich klas)
Rozkład empiryczny i dystrybuanta empiryczna 
Struktura dzieci w wieku 7 lat wg masy ciała
Dolna Górna
isk
Numer granica granica
ni i nisk
klasy klasy klasy
1 16 18 8 0,056 8 0,056
2 19 21 22 0,153 30 0,208
3 22 24 52 0,361 82 0,569
4 25 27 19 0,132 101 0,701
5 28 30 20 0,139 121 0,840
6 31 33 12 0,083 133 0,924
7 34 36 8 0,056 141 0,979
8 37 39 1 0,007 142 0,986
9 40 42 1 0,007 143 0,993
10 43 45 0 0,000 143 0,993
11 46 48 1 0,007 144 1,000
144
Dysrybuanta empiryczna
160
140
120
100
80
60
40
20
0
18 21 24 27 30 33 36 39 42 45 48
16 19 22 25 28 31 34 37 40 43 46
Liczebność przedziałów
ETAP CZWARTY - POLEGA NA:
l opisie statystycznym - dotyczy tylko danej
zbiorowości generalnej lub próby
niekoniecznie losowej,
l lub wnioskowaniu statystycznym - kiedy
badanie jest reprezentacyjne (próba losowa)
i jego wyniki są uogólniane na całą populację
generalną.
Podstawą wnioskowania
statystycznego są empiryczne wyniki
badania reprezentacyjnego (wyniki
losowo wybranej próby)
l Charakterystyki obliczane z próby losowej
nazywamy statystykami (np. średnia
arytmetyczna z próby, odchylenie
standardowe z próby)
l Te same parametry obliczone z populacji
generalnej noszą nazwę parametrów
l W badaniu, opartym na metodzie reprezentatywnej,
badaniu podlega jedynie jej losowo wybrana część,
parametry są szacowane na podstawie wyniku z
próby.
l Wartości tych parametrów zależą od
wyników próby losowej
l Jeżeli próba jest reprezentatywna, to
statystyki są dobrymi estymatorami
parametrów populacji generalnej.
l Wraz ze wzrostem liczebności próby wartość
estymatorów zbliża się do prawdziwych
wartości parametrów
PREZENTACJA GRAFICZNA
MATERIAAU STATYSTYCZNEGO
l Pogrupowany i uporządkowany materiał
statystyczny prezentuje się za pomocą tablic
statystycznych prostych i kombinowanych
oraz odpowiednich wykresów.
Wykres
l jest graficzną formą rejestracji danych oraz
narzędziem prezentacji i analizy
uogólnionych informacji statystycznych.
l Wykresy ujmują zjawiska w sposób
syntetyczny w związku z tym zawierają mniej
szczegółów niż tablice (należy je traktować
jako uzupełnienie tablic statystycznych)
Budowa wykresu
Każdy wykres powinien posiadać:
l Tytuł
l yródło danych, na podstawie których został
sporządzony
l Legendę, czyli wyjaśnienie zastosowanych
symboli, barw oraz przyjętych skal.
W grafice statystycznej wyróżnia się
następujące rodzaje wykresów:
l Liniowe- prezentacja za pomocą linii lub
odcinków
l Powierzchniowe  prezentacja za pomocą
figur płaskich (wykresy słupkowe, kołowe)
l Pasmowe
l Punktowe
l Mapowe- kartogramy
l Kombinowane oraz specjalne
WYKRESY STATYSTYCZNE:
LINIOWY
Ceny akcji spółki Kęty
160,00
140,00
120,00
100,00
80,00
60,00
40,00
20,00
0,00
2000 2001 2002 2003 2004
kwartały
cena
1kw
2kw
3kw
4kw
1kw
2kw
3kw
4kw
1kw
2kw
3kw
4kw
1kw
2kw
3kw
4kw
1kw
2kw
3kw
4kw
WYKRESY STATYSTYCZNE:
SAUPKOWY
Przychody ze sprzedaży
1130
2004
768
2003
lata 2002 576
2001 481
2000 434
0 200 400 600 800 1000 1200
wartość
(mln PLN)
WYKRESY STATYSTYCZNE:
KOAOWY
Udziały w rynku
25%
27%
Spółka A
Spólka B
Spółka C
Spółka D
15%
33%
WYKRESY STATYSTYCZNE:
PUNKTOWY
Przychody ze sprzedaży
1200
1130
1000
800
768
wartość
600
576
(mln PLN)
481
434
400
200
0
1999 2000 2001 2002 2003 2004 2005
lata
WYKRESY STATYSTYCZNE:
WARTSTWOWY
Przychody ze sprzedaży
1200
1000
800
wartość
600
1130
(mln PLN)
400
768
576
481
200434
0
2000 2001 2002 2003 2004
lata
WYKRESY STATYSTYCZNE:
BRYAOWY
Przychody ze sprzedaży
1200
1000
800
wartość
1130
600
(mln PLN)
768
400
576
481
434
200
0
2000 2001 2002 2003 2004
lata
WYKRESY STATYSTYCZNE:
PIERŚCIENIOWY
Przychody ze sprzedaży
434
1130
481
576
768
Mapowe - kartogramy
Kombinowane oraz specjalne
Wykresy opisujące rozkład cechy mierzalnej
w prostokątnym układzie współrzędnych to:
histogramy (wykresy słupkowe) - zbór przylegających
prostokątów, których podstawy, równe rozpiętości
przedziałów klasowych - znajdują się na osi
odciętych, a wysokości są określone na osi
rzędnych przez liczebności (częstości)
odpowiadające poszczególnym przedziałom
klasowym lub przez gęstości liczebności
(częstości) w przypadku nierównych przedziałów
klasowych.
2. diagramy, wykresy liniowe (wielobok liczebności) - jest
łamaną, powstałą przez połączenie punków, których
współrzędnymi są środki przedziałów klasowych i
odpowiadające im liczebności (częstości lub gęstości).
3. krzywe liczebności (częstości) dla cechy ciągłej - gęsta
siatka punktów wyznaczająca wielobok liczebności.
Tablice statystyczne
l Prezentują dane statystyczne
uporządkowane według określonego
kryterium
l Stanowią główną formę prezentacji danych
liczbowych, dlatego powinny spełniać
określone wymogi dotyczące formalnej
budowy oraz merytorycznej spoistości
Budowa tablicy
Każda tablica powinna zawierać:
a) Część opisową
- Tytuł
- Nazwy wierszy (boczek), nazwy kolumn (główka)
- yródła danych
- Ewentualnie inne uwagi wyjaśniające (np. legenda
użytych znaków graficznych)
b) Część liczbową  tabelę właściwą
Obowiązuje zasada bezwzględnego wypełniania
wszystkich kolumn i wierszy tablicy.
Jeżeli wszystkie pola nie mogą być wypełnione znakami, to w polskiej praktyce
statystycznej stosuje się następujące znaki umowne:
- (kreska) Zjawisko nie występuje
0 (zero) Zjawisko występuje, ale w
jednostkach mniejszych niż pół
jednostki miary przyjętej w tablicy
(kropka) Zupełny brak informacji lub brak
informacji wiarygodnych
x (krzyżyk) Wypełnienie pozycji ze względu na
układ tablicy jest niemożliwe lub
niecelowe
W tym Nie podaje się wszystkich
składników sumy
Podział tablic
l Proste  struktura lub dynamika jednej zbiorowości
statystycznej ze względu na jedną cechę (ilościową
lub jakościową), Tablica prosta może być
utożsamiana z szeregiem statystycznym.
l Złożone  opis badanej zbiorowości według kilku
cech, lub opis kilku zbiorowości ze względu na jedną
cechę. Tego rodzaju tablice prezentują zespół
szeregów statystycznych, a stopień ich złożoności
zależy od liczby badanych cech lub zbiorowości.
Przykład tablicy wielodzielczej
l Z populacji mężczyzn urodzonych w 1970 r.
wybrano losowo grupę złożoną z 90 osób i
określono ich wagę i wzrost. Wagę mierzono z
dokładnością do 0,1 kg, a wzrost 0,1 cm.
Otrzymane wyniki zaprezentowano w poniższej
tabeli dwudzielczej.
Waga Wzrost
Granice klas
Granice 161,8- 165,3- 168,7- 172,1- 175,5- 178,9- 182,3-
klas 165,2 168,6 172 175,4 178,8 182,2 185,6
49-54 4 2 1 1 - - 1
54,1-59 2 9 2 - - 2 -
59,1-64 2 4 8 3 1 - -
64,1-69 - - 4 9 5 1 3
69,1-74 1 1 - - 2 9 5
74,1-79 - 1 1 - - - 3
79,1-84 - - - 1 - 1 1


Wyszukiwarka

Podobne podstrony:
opracowanie materialu statystycznego
Wstępna analiza danych Materiał statystyczny i jego porządkowanie Szeregi statystyczne
Opracowana teoria statystyka
TM opracowanie materialu
Wytrzymałość Materiałów SIMR egzamin teoretyczny opracowane pytania
materia y opracowanie do egzaminu
Kamys B Statystyczne metody opracowania pomiarów 1
Ćw 1 Budowa i geometria ostrzy skrawających materiały narzędziowe opracowanie nr 2
Materiały Inżynierskie Opracowanie
Mikołaj Rybaczuk Materiały do ćwiczeń i wykładów ze statystyki Politechnika BIałostocka
WYTRZYMAŁOŚĆ MATERIAŁÓW OPRACOWANIE
WYTRZYMAŁOŚĆ MATERIAŁÓW OPRACOWANIE

więcej podobnych podstron