Wykład II
Wykład II
Grupowanie i porządkowanie
Grupowanie i porządkowanie
wyników, szereg rozdzielczy
wyników, szereg rozdzielczy
zmiennej ciągłej i skokowej
zmiennej ciągłej i skokowej
Grupowanie statystyczne
Grupowanie statystyczne
Polega na podziale zbiorowości na w miarę
Polega na podziale zbiorowości na w miarę
jednorodne grupy ze względu na kryteria
jednorodne grupy ze względu na kryteria
określone w związku z celem badań.
określone w związku z celem badań.
Powinno ono spełniać 2 podstawowe
Powinno ono spełniać 2 podstawowe
kryteria
kryteria
rozłączności -
rozłączności -
poszczególne jednostki o
poszczególne jednostki o
określonych właściwościach powinny być
określonych właściwościach powinny być
przydzielone do klas (grup)
przydzielone do klas (grup)
zupełności
zupełności
– grupy muszą obejmować
– grupy muszą obejmować
wszystkie jednostki danej zbiorowości.
wszystkie jednostki danej zbiorowości.
Rodzaje szeregów
Rodzaje szeregów
statystycznych
statystycznych
szeregi statystyczne
szczegółowe
(wyliczające)
rozdzielcze
(strukturalne)
przestrzenne
(geograficzne)
czasowe
(dynamiczne)
cech mierzalnych
cech niemierzalnych
punktowe
przedziałowe
momentów
okresów
nieskumulowane
skumulowane
nieskumulowane
skumulowane
Zasady budowy szeregów
Zasady budowy szeregów
rozdzielczych
rozdzielczych
:
:
Szereg rozdzielczy zmiennej
Szereg rozdzielczy zmiennej
skokowej
skokowej
Aby zbudować szereg rozdzielczy zmiennej
Aby zbudować szereg rozdzielczy zmiennej
skokowej (z reguły z przedziałami
skokowej (z reguły z przedziałami
jednowariantowymi
jednowariantowymi
)
)
musimy wybrać
musimy wybrać
jednostki statystyczne o takim samym
jednostki statystyczne o takim samym
wariancie badanej cechy np liczba pędów
wariancie badanej cechy np liczba pędów
na roślinie i przyporządkować im
na roślinie i przyporządkować im
liczebności jednostek które odpowiadają
liczebności jednostek które odpowiadają
danej cesze.
danej cesze.
Szereg rozdzielczy zmiennej
Szereg rozdzielczy zmiennej
skokowej
skokowej
Przedziały jednowariantowe
Przedziały jednowariantowe
Liczba
pędów
na
roślinie
(x
i
)
Liczba
roślin
f
Częstość
względn
a
f/N
Odsetek
f/N* 100
1
10
0,106
10,6
2
20
0,212
21,2
3
35
0,373
37,3
4
15
0,160
16,0
5
11
0,117
11,7
6
3
0,032
3,2
Szereg rozdzielczy
Szereg rozdzielczy
skumulowany
skumulowany
Otrzymujemy go w wyniku sumowania liczebności lub
częstości dla kolejnych przedziałów klasowych od
pierwszego począwszy
Liczba pędów
na roślinie (x
i
)
Liczba roślin
f
Częstość
względna
f/N
1
10
0,106
1-2
30
0,318
1-3
65
0,691
1-4
80
0,851
1-5
91
0,968
1-6
94
1,000
Szereg rozdzielczy zmiennej
Szereg rozdzielczy zmiennej
skokowej
skokowej
Przedziały wielowariantowe
Przedziały wielowariantowe
W przypadku gdy ilość wariantów jest
duża to dla cechy skokowej możemy
również utworzyć szereg rozdzielczy z
przedziałami
wielowariantowymi
np.
charakterystyka gospodarstw rolnych
pod względem posiadanych ciągników
(0-25 sztuk), liczba owadów stonki
ziemniaczanej na jednej roślinie (1-50)
czy liczba sztuk bydła w gospodarstwie
indywidualnym (2-100)
Szereg rozdzielczy zmiennej
Szereg rozdzielczy zmiennej
skokowej
skokowej
Przedziały wielowariantowe
Przedziały wielowariantowe
Liczba
ciągników
x
i
Liczba
gospodarstw
f
Częstość
względna
f/N
f/N
1-5
20
0,165
6-10
60
0,496
11-15
35
0,289
16-20
5
0,042,
21-25
1
0,008
Szereg rozdzielczy zmiennej
Szereg rozdzielczy zmiennej
ciągłej
ciągłej
Szereg rozdzielczy składa się z przedziałów
klasowych (c) o określonej długości (h) i liczebności (lub
częstości) przyporządkowanych do tych przedziałów.
Liczebność określamy poprzez określenie ile razy
wartość zmiennej wystąpiła w danym przedziale
klasowym
Częstość przedziału wyliczamy dzieląc liczebność
przedziału przez liczebność szeregu na podstawie
którego zbudowano szereg
Szereg rozdzielczy zmiennej
Szereg rozdzielczy zmiennej
ciągłej
ciągłej
W trakcie budowy szeregu
W trakcie budowy szeregu
rozdzielczego
rozdzielczego
wyłania się kilka
wyłania się kilka
problemów związanych z:
problemów związanych z:
- liczbą przedziałów klasowych
- liczbą przedziałów klasowych
- długością przedziałów klasowych
- długością przedziałów klasowych
- sposobem określania granic
- sposobem określania granic
przedziałów
przedziałów
Określenie liczby przedziałów
Określenie liczby przedziałów
klasowych
klasowych
Liczba przedziałów klasowych zależy od:
Liczba przedziałów klasowych zależy od:
-
obszaru zmienności badanej cechy
obszaru zmienności badanej cechy
-
liczebności n badanej zbiorowości
liczebności n badanej zbiorowości
-
celu badania
celu badania
Można ją określić na podstawie następujących wzorów
Można ją określić na podstawie następujących wzorów
n
c
n
c
n
log
32
,
3
1
2
1
N
c
log
5
Określenie liczby przedziałów
Określenie liczby przedziałów
klasowych
klasowych
Liczebność próby (n)
Liczebność próby (n)
Liczba klas (c)
Liczba klas (c)
30-60
30-60
6-8
6-8
60-100
60-100
7-10
7-10
100-200
100-200
9-12
9-12
200-500
200-500
11-17
11-17
500-1500
500-1500
16-25
16-25
Określenie długości przedziału
Określenie długości przedziału
klasowego
klasowego
Długość przedziału klasowego można
Długość przedziału klasowego można
wyliczyć z wzoru
wyliczyć z wzoru
h= R/c
h= R/c
, gdzie
, gdzie
R
R
oznacza rozstęp
oznacza rozstęp
c
c
– liczbę przedziałów
– liczbę przedziałów
klasowych, przy czym spełniony musi być
klasowych, przy czym spełniony musi być
warunek, że
warunek, że
c * h > R
c * h > R
Długość przedziału powinna być dla
Długość przedziału powinna być dla
wygody obliczeń wartością w miarę
wygody obliczeń wartością w miarę
prostą np. 0,02, 1, 50, 2000 itp
prostą np. 0,02, 1, 50, 2000 itp
Zasady budowy c.d.
Zasady budowy c.d.
c
R
h
x
min
x
max
R
Wyznaczenie granic
Wyznaczenie granic
przedziałów klasowych.
przedziałów klasowych.
Wybór dolnej granicy pierwszego
Wybór dolnej granicy pierwszego
przedziału powinien obejmować
przedziału powinien obejmować
najmniejszą wartość i zapewnić
najmniejszą wartość i zapewnić
prostotę obliczeń.
prostotę obliczeń.
Zwykle przyjmuje się wartość równą
Zwykle przyjmuje się wartość równą
wartości najmniejszej lub niewiele od
wartości najmniejszej lub niewiele od
niej odbiegającą
niej odbiegającą
Szereg rozdzielczy zmiennej ciągłej o
Szereg rozdzielczy zmiennej ciągłej o
równej
równej
liczbie przedziałów klasowych
liczbie przedziałów klasowych
Wiek
Liczba
osób
f
10-15
10
15-20
20
20-25
35
25-30
15
30-35
11
35-40
3
Szereg rozdzielczy zmiennej
Szereg rozdzielczy zmiennej
ciągłej o nierównej długości
ciągłej o nierównej długości
przedziałów klasowych
przedziałów klasowych
Powierzchni
a
gospodarst
wa
ha
Liczba
gospodarstw
f
gęstość
liczebności.
g
2-5
15
5
5-10
50
10
10-20
35
3,5
20-50
7
0,23
50-200
3
0,02
200-500
1
0,003
i
i
i
i
x
x
f
g
0
1
Wyliczenie gęstości liczebności
Wyliczenie środkowych wartości
Wyliczenie środkowych wartości
przedziałów klasowych
przedziałów klasowych
Zmienna skokowa
średnia arytmetyczna dolnej i górnej granicy w danej
klasie
Zmienna ciągła
górna granica przedziału poprzedzającego pokrywa się
z dolna granicą przedziału następującego: - średnia
arytmetyczna z dolnej i górnej granicy w danej klasie
górna granica przedziału poprzedzającego nie pokrywa
się z dolna granicą przedziału następującego
-średnia arytmetyczna z dolnych granic dwóch
sąsiadujących klas
Wyliczenie charakterystyk próby
Wyliczenie charakterystyk próby
na podstawie szeregu
na podstawie szeregu
rozdzielczego
rozdzielczego
Średnia arytmetyczna
Wariancja
f
fx
x
2
2
2
x
f
fx
s
2
2
2
.
12
1
,
h
gdzieD
D
s
s
pop
Wyliczenie charakterystyk próby
Wyliczenie charakterystyk próby
na podstawie szeregu
na podstawie szeregu
rozdzielczego
rozdzielczego
mediana
dolna granica przedziału, w którym występuje wartość środkowa
liczebność przedziału mediany
rozpiętość przedziału mediany
liczebność próby
liczebność skumulowana do przedziału poprze -dzającego przedział
mediany
M
M
M
i
i
M
e
h
n
N
N
x
M
1
1
2
Mediana
e
M
M
x
M
n
M
h
N
1
1
M
i
i
N
Wyliczenie charakterystyk próby
Wyliczenie charakterystyk próby
na podstawie szeregu
na podstawie szeregu
rozdzielczego
rozdzielczego
D
D
D
D
D
D
D
D
h
n
n
n
n
n
n
x
D
)
(
)
(
1
1
1
Moda (dominanta)
D
x
D
n
1
D
n
1
D
n
D
h
dolna granica przedziału, w którym występuje moda
liczebność przedziału mody
liczebność przedziału poprzedzającego przedział mody
liczebność przedziału następującego po przedziale mody
długość przedziału mody
Graficzne przedstawienie
Graficzne przedstawienie
szeregu rozdzielczego
szeregu rozdzielczego
Diagram punktowy
wykres składający się z pionowych linii, których wysokości
odpowiadają liczebnościom przyporządkowanym
poszczególnym wartościom punktowym
Wykres słupkowy (histogram
)
Jest to zbiór prostokątów, których podstawę na osi x stanowią
długości przedziałów klasowych a wysokość określona jest
przez liczebność w danej klasie lub częstość występowania, lub
gęstość liczebności jeśli przedziały klasowe są niejednakowe.
Wykres liniowy (diagram, wielobok liczebności
)
Jest linią łamaną otrzymaną przez połączenie punktów których
współrzędnymi są środkowe wartości przedziałów klasowych
(na osi x) i liczebność w danej klasie lub częstość
występowania. Dla skumulowanego szeregu rozdzielczego linia
łamana łączy górne granice klas.
Diagram punktowy
Diagram punktowy
1 2 3 4 5 6 7
f
130
120
110
100
90
80
70
Liczba pędów na roślinie jęczmienia
Histogram i diagram szeregu
Histogram i diagram szeregu
rozdzielczego zmiennej ciągłej
rozdzielczego zmiennej ciągłej
1 2 3 4 5 6 7 g
f
130
120
110
100
90
80
70
histogram
diagram
Waga ziarna z 1 rośliny pszenżyta
Moda
Histogram i diagram skumulowanego
Histogram i diagram skumulowanego
szeregu rozdzielczego zmiennej ciągłej
szeregu rozdzielczego zmiennej ciągłej
1 2 3 4 5 6 7 g
f/N* 100
100
90
75
60
45
30
15
diagram
histogram
50%
Mediana
Waga ziarna z 1 rośliny pszenżyta