Analiza struktury
Analiza struktury
W analizie struktury, tzn. dokonując
W analizie struktury, tzn. dokonując
ilościowego
opisu
właściwości
ilościowego
opisu
właściwości
badanej zbiorowości statystycznej,
badanej zbiorowości statystycznej,
dane statystyczne prezentowane są
dane statystyczne prezentowane są
najczęściej w formie:
najczęściej w formie:
1.
1.
szeregu szczegółowego,
szeregu szczegółowego,
2.
2.
szeregu punktowego,
szeregu punktowego,
3.
3.
szeregu przedziałowego.
szeregu przedziałowego.
Materiał pierwotny
Materiał pierwotny
Dysponując materiałem pierwotnym, tzn.
Dysponując materiałem pierwotnym, tzn.
po zebraniu danych statystycznych
po zebraniu danych statystycznych
wyłącznie dla celów prowadzonego
wyłącznie dla celów prowadzonego
badania, najczęstszą formą prezentacji
badania, najczęstszą formą prezentacji
jest szereg szczegółowy.
jest szereg szczegółowy.
Z punktu widzenia statystyka pierwotne
Z punktu widzenia statystyka pierwotne
dane indywidualne z uwagi na ich
dane indywidualne z uwagi na ich
aktualność, wiarygodność, kompletność i
aktualność, wiarygodność, kompletność i
porównywalność są najwartościowszym
porównywalność są najwartościowszym
źródłem informacji.
źródłem informacji.
Materiał wtórny
Materiał wtórny
Wysoka
czasochłonność,
Wysoka
czasochłonność,
pracochłonność
pracochłonność
i kosztochłonność przy zbieraniu
i kosztochłonność przy zbieraniu
danych pierwotnych powoduje, że
danych pierwotnych powoduje, że
często
korzysta
się
często
korzysta
się
z materiału wtórnego a wówczas
z materiału wtórnego a wówczas
forma
prezentacji
danych
forma
prezentacji
danych
statystycznych
(rzadko
szereg
statystycznych
(rzadko
szereg
szczegółowy, czasami – punktowy,
szczegółowy, czasami – punktowy,
najczęściej – przedziałowy) zostaje
najczęściej – przedziałowy) zostaje
nam niejako narzucona.
nam niejako narzucona.
Klasyfikacja statystyczna
Klasyfikacja statystyczna
Grupowanie statystyczne
Grupowanie statystyczne
– to całokształt
– to całokształt
czynności związanych z wyodrębnieniem
czynności związanych z wyodrębnieniem
jednorodnych lub względnie jednorodnych
jednorodnych lub względnie jednorodnych
grup w ramach większej i zróżnicowanej
grup w ramach większej i zróżnicowanej
zbiorowości statystycznej.
zbiorowości statystycznej.
Wyróżnia się dwa rodzaje grupowania:
Wyróżnia się dwa rodzaje grupowania:
grupowanie
typologiczne
grupowanie
typologiczne
-
jest
-
jest
wydzieleniem grup ze względu na warianty
wydzieleniem grup ze względu na warianty
cechy jakościowej,
cechy jakościowej,
grupowanie
wariancyjne
grupowanie
wariancyjne
–
jest
–
jest
wydzieleniem grup ze względu na wartości
wydzieleniem grup ze względu na wartości
cechy ilościowej.
cechy ilościowej.
Grupowanie typologiczne
Grupowanie typologiczne
Grupowanie typologiczne sprowadza się
Grupowanie typologiczne sprowadza się
jedynie
do
zliczenia
jednostek
jedynie
do
zliczenia
jednostek
statystycznych
posiadających
dany
statystycznych
posiadających
dany
wariant cechy jakościowej.
wariant cechy jakościowej.
Przykład empiryczny
Przykład empiryczny
Posłowie I kadencji Sejmu RP wg wykształcenia
Posłowie I kadencji Sejmu RP wg wykształcenia
Wykształcenie
Wykształcenie
Liczba posłów
Liczba posłów
podstawowe
podstawowe
2
2
zasadnicze zawodowe
zasadnicze zawodowe
14
14
średnie
średnie
89
89
wyższe
wyższe
355
355
Grupowanie wariancyjne
Grupowanie wariancyjne
Najczęstszą
formą
prezentacji
Najczęstszą
formą
prezentacji
pierwotnego materiału statystycznego
pierwotnego materiału statystycznego
z uwagi na dane indywidualne jest
z uwagi na dane indywidualne jest
szereg
szczegółowy.
szereg
szczegółowy.
Budowa
Budowa
szeregu punktowego
szeregu punktowego
sprowadza się
sprowadza się
jedynie
do
zliczenia
jednostek
jedynie
do
zliczenia
jednostek
statystycznych
posiadających
daną
statystycznych
posiadających
daną
wartość cechy ilościowej.
wartość cechy ilościowej.
Należy jednak pamiętać, że szereg
Należy jednak pamiętać, że szereg
punktowy budowany jest jedynie dla
punktowy budowany jest jedynie dla
cechy skokowej.
cechy skokowej.
Przykład empiryczny
Przykład empiryczny
Losowo wybranych studentów tej uczelni
Losowo wybranych studentów tej uczelni
w dniu 15.01.2007r. zapytano o liczbę
w dniu 15.01.2007r. zapytano o liczbę
rodzeństwa otrzymując wyniki:
rodzeństwa otrzymując wyniki:
2, 1, 0, 0, 1, 0, 3, 0, 1, 1, 0, 2, 0, 1, 0, 1, 2,
2, 1, 0, 0, 1, 0, 3, 0, 1, 1, 0, 2, 0, 1, 0, 1, 2,
1,
1,
1, 1, 1, 1, 0, 5, 2, 0, 0, 1, 1, 0, 1, 0, 1, 3, 2.
1, 1, 1, 1, 0, 5, 2, 0, 0, 1, 1, 0, 1, 0, 1, 3, 2.
Chcąc zbudować szereg punktowy należy
Chcąc zbudować szereg punktowy należy
przeprowadzić następujące grupowanie:
przeprowadzić następujące grupowanie:
Porządkując niemalejąco podany w
Porządkując niemalejąco podany w
badaniu
szereg
szczegółowy
badaniu
szereg
szczegółowy
otrzymujemy:
otrzymujemy:
0,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,
0,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,
1,1,1,1,1,1,2,2,2,2,2,3,3,5
1,1,1,1,1,1,2,2,2,2,2,3,3,5
i ostatecznie
i ostatecznie
szereg punktowy
szereg punktowy
:
:
Liczba rodzeństwa
Liczba rodzeństwa
Liczba studentów
Liczba studentów
0
0
12
12
1
1
15
15
2
2
5
5
3
3
2
2
5
5
1
1
Grupowanie wariancyjne
Grupowanie wariancyjne
Budowa szeregu przedziałowego
Budowa szeregu przedziałowego
wymaga
wymaga
na wstępie odpowiedzi na następujące pytania:
na wstępie odpowiedzi na następujące pytania:
1.
1.
Ile ma być przedziałów?
Ile ma być przedziałów?
2.
2.
Jaka ma być rozpiętość przedziałów?
Jaka ma być rozpiętość przedziałów?
3.
3.
Jaka jest dolna granica pierwszego przedziału?
Jaka jest dolna granica pierwszego przedziału?
1
min
max
k
x
x
h
h
x
x
5
,
0
min
01
n
k
Przykład empiryczny
Przykład empiryczny
Wydajność pracowników pewnego zakładu
Wydajność pracowników pewnego zakładu
mierzona liczbą wyprodukowanych sztuk
mierzona liczbą wyprodukowanych sztuk
wyrobów
wyrobów
w ciągu dnia prezentowała się następująco:
w ciągu dnia prezentowała się następująco:
25, 31, 48, 21, 23, 23, 25, 30, 29, 27, 27, 23,
25, 31, 48, 21, 23, 23, 25, 30, 29, 27, 27, 23,
28, 23, 16,
28, 23, 16,
24, 27, 42, 36, 31, 29, 36, 34, 32, 23, 39, 28,
24, 27, 42, 36, 31, 29, 36, 34, 32, 23, 39, 28,
33, 37, 30.
33, 37, 30.
Chcąc zbudować szereg przedziałowy należy
Chcąc zbudować szereg przedziałowy należy
przeprowadzić następujące grupowanie:
przeprowadzić następujące grupowanie:
Porządkując niemalejąco podany w
Porządkując niemalejąco podany w
badaniu
szereg
szczegółowy
badaniu
szereg
szczegółowy
otrzymujemy:
otrzymujemy:
16,21,23,23,23,23,23,24,25,25,27,27,27,28,28,
16,21,23,23,23,23,23,24,25,25,27,27,27,28,28,
29,29,30,30,31,31,32,33,34,36,
29,29,30,30,31,31,32,33,34,36,
36,37,39,42,48.
36,37,39,42,48.
1.
1.
Ile ma być przedziałów?
Ile ma być przedziałów?
2.
2.
Jaka ma być rozpiętość przedziałów?
Jaka ma być rozpiętość przedziałów?
3.
3.
Jaka jest dolna granica pierwszego przedziału?
Jaka jest dolna granica pierwszego przedziału?
5
30
n
k
8
1
5
16
48
1
min
max
k
x
x
h
12
8
5
,
0
16
5
,
0
min
01
h
x
x
Wykorzystując powyższe wyniki obliczeń
Wykorzystując powyższe wyniki obliczeń
oraz zliczając jednostki statystyczne
oraz zliczając jednostki statystyczne
należące do poszczególnych przedziałów
należące do poszczególnych przedziałów
(
(
w badaniach statystycznych jeżeli nie
w badaniach statystycznych jeżeli nie
jest wskazane inaczej to przedziały
jest wskazane inaczej to przedziały
domknięte
są
lewostronnie
domknięte
są
lewostronnie
)
)
otrzymujemy
otrzymujemy
szereg przedziałowy
szereg przedziałowy
:
:
Wydajność
Wydajność
(w sztukach w ciągu
(w sztukach w ciągu
dnia)
dnia)
Liczba
Liczba
pracowników
pracowników
12-20
12-20
1
1
20-28
20-28
12
12
28-36
28-36
11
11
36-44
36-44
5
5
44-52
44-52
1
1
Kontrola poprawności
Kontrola poprawności
grupowania
grupowania
Grupowanie
statystyczne
zostało
Grupowanie
statystyczne
zostało
przeprowadzone poprawnie jeżeli spełniona
przeprowadzone poprawnie jeżeli spełniona
jest nierówność:
jest nierówność:
gdzie:
gdzie:
- środek i-tego przedziału
- środek i-tego przedziału
- średnia arytmetyczna z pomiarów należących
- średnia arytmetyczna z pomiarów należących
do i-tego przedziału
do i-tego przedziału
h
x
x
k
i
i
i
2
1
1
0
0
i
x
i
x
Niezbędne wyniki obliczeń zawiera poniższa tabela:
Niezbędne wyniki obliczeń zawiera poniższa tabela:
pomiary i-tego
pomiary i-tego
przedziału
przedziału
12-20
12-20
1
1
16
16
16
16
16
16
0
0
20-28
20-28
12
12
21,23,23,23,23,23,24,25,25,
21,23,23,23,23,23,24,25,25,
27,27,27
27,27,27
24
24
24,25
24,25
0,25
0,25
28-36
28-36
11
11
28,28,29,29,30,30,31,31,32,
28,28,29,29,30,30,31,31,32,
33,34
33,34
32
32
30,45
30,45
45
45
1,545
1,545
5
5
36-44
36-44
5
5
36,36,37,39,42
36,36,37,39,42
40
40
38
38
2
2
44-52
44-52
1
1
48
48
48
48
48
48
0
0
SUM
SUM
A
A
30
30
3,79
3,79
55
55
i
i
x
x
0
i
x
0
i
x
i
n
i
x
4
7955
,
3
2
1
1
0
h
x
x
k
i
i
i
Uwaga praktyczna
Uwaga praktyczna
W przypadku danych pogrupowanych –
W przypadku danych pogrupowanych –
przede wszystkim w formie szeregu
przede wszystkim w formie szeregu
przedziałowego – uzyskane informacje są
przedziałowego – uzyskane informacje są
jedynie przybliżone i mogą niekiedy się
jedynie przybliżone i mogą niekiedy się
znacząco różnić od wyników uzyskanych
znacząco różnić od wyników uzyskanych
z
danych
indywidualnych
(szereg
z
danych
indywidualnych
(szereg
szczegółowy).
szczegółowy).
Dysponując szeregiem przedziałowym,
Dysponując szeregiem przedziałowym,
przy
braku
danych
jednostkowych,
przy
braku
danych
jednostkowych,
parametry opisowe możemy jedynie
parametry opisowe możemy jedynie
szacować a zatem nie mogą one być tak
szacować a zatem nie mogą one być tak
wiarygodne jak charakterystyki liczbowe
wiarygodne jak charakterystyki liczbowe
uzyskane
z
danych
uzyskane
z
danych
w formie szeregu szczegółowego.
w formie szeregu szczegółowego.
Dziękuję za uwagę
Dziękuję za uwagę
Zapraszam do współpracy
Zapraszam do współpracy
dr Rafał Klóska
dr Rafał Klóska
tel.: 0-602-484847
tel.: 0-602-484847
e-mail:
e-mail:
r_kloska@poczta.onet.pl
r_kloska@poczta.onet.pl