2007-10-08
1
Podstawy analizy
Podstawy analizy
statystycznej
statystycznej
dla potrzeb
dla potrzeb
administracji publicznej
administracji publicznej
wykład 2
wykład 2
Szereg rozdzielczy przedziałowy
x
0i
– x
1i
n
i
x
01
-x
11
n
1
x
0k
– x
1k
n
k
Razem
N
2
1
0
0
1
i
i
i
i
x
x
x
x
x
h
i
i
+
=
−
=
o
h
i
- długość przedziału,
rozpiętość, interwał
– środek przedziału
Przed zbudowaniem szeregu rozdzielczego
przedziałowego należy zadecydować o:
1. Liczbie przedziałów klasowych.
2. Długości przedziałów klasowych.
3. Sposobie domykania końców przedziałów.
Liczba przedziałów klasowych
Liczba przedziałów klasowych
n
k ≈
Gdzie:
k - liczba przedziałów klasowych
n - liczebność zbiorowości
Dla przykładu 2:
6
32 ≈
≈
k
Długość przedziałów klasowych
Długość przedziałów klasowych
k
x
x
h
min
max
−
=
Gdzie:
h - długość przedziału (interwał)
x
max
- największy wariant cechy X
x
min
- najmniejszy wariant cechy X
k - liczba przedziałów klasowych
Dla danych z przykładu 2:
n = 32 komputery
Y - koszt naprawy (w zł)
y
max
= 545; y
min
= 0; k = 6
zatem
100
83
,
90
6
0
545
≈
=
−
=
h
2007-10-08
2
Szereg rozdzielczy przedziałowy dla przykładu 2:
n = 32 komputery
Y - koszt naprawy (w zł) (cecha ciągła)
<Y0i - Y1i)
ni
0-100
9
100-200
6
200-300
3
300-400
7
400-500
5
500-600
2
suma
32
Koszt naprawy (w zł)
<y0i-y1i)
Liczba
komputerów
ni
Wskaźnik
struktury
wi
Wskaźnik
struktury
wi(%)
0-100
9
0,28
28
100-200
6
0,19
19
200-300
3
0,09
9
300-400
7
0,22
22
400-500
5
0,16
16
500-600
2
0,06
6
suma
32
1,00
100
Szereg rozdzielczy przedziałowy
ze wskaźnikami struktury
0
1
2
3
4
5
6
7
8
9
10
0-100
100-200
200-300
300-400
400-500
500-600
Koszt naprawy
L
ic
z
b
a
k
o
m
p
u
te
ró
w
Graficzna prezentacja danych
- histogram
Zbadano
100
studentów
studiów
dziennych
na
pewnym
Uniwersytecie.
Rozkład
ich
wg
czasu
dojazdu od miejsca zamieszkania do czytelni był
następujący:
Czas
dojazdu
(w minutach)
Liczba
studentów
5 - 15
15 - 25
25 - 35
35 - 45
45 - 55
6
34
30
20
10
Razem
100
5 - 15
15 - 25
25 - 35
35 - 45
45 - 55
6
34
30
20
10
6
40
70
90
100
Razem
100
i
n
)
i
i
x
x
1
0
−
s
i
n
Przykład 4
Histogram (wykres słupkowy)
0
5
10
15
20
25
30
35
i
n
5
15
25
35
45
55
i
x
Diagram (wielobok) liczebności
0
5
10
15
20
25
30
35
i
n
5
15
25
35
45
55
i
x
10
20
30
40
50
60
2007-10-08
3
Diagram (wielobok) liczebności skumulowanych
0
10
20
30
40
50
60
70
S
i
n
80
90
100
5
15
25
35
45
55
i
x
10
20
30
40
50
60
Szereg rozdzielczy przedziałowy
Wiek wychowanków rodzinnych
placówek opiekuńczo-
wychowawczych
Liczba
wychowanków
0 - 3
63
4 - 6
180
7 - 13
748
14 - 16
353
17 - 18
112
powyżej 18
74
Szereg rozdzielczy przedziałowy
Wiek wychowanków rodzinnych
placówek opiekuńczo-
wychowawczych
Wskaźnik
struktury
0-3
4
4-6
12
7-13
49
14-16
23
17-18
7
powyżej 18
5
Prezentacja graficzna szeregu
Prezentacja graficzna szeregu
przedziałowego
przedziałowego
0
100
200
300
400
500
600
700
800
0-3
4-6
7-13
14-16
17-18
powyżej 18
W iek wychowanków rodzinnych placówek opiekuńczo-
wychowawczych
Prezentacja graficzna szeregu
Prezentacja graficzna szeregu
przedziałowego
przedziałowego
Wiek w ychow anków rodzinnych placów ek
opiekuńczo-w ychow aw czych
0
100
200
300
400
500
600
700
800
1,5
5
10
15
17,5
20
Prezentacja graficzna szeregu
przedziałowego
W iek wychowanków rodzinnych placówek opiekuńczo-
wychowawczych
0-3
4-6
7-13
14-16
17-18
powyżej 18
2007-10-08
4
w kształcie litery U
jednomodalny
wielomodalny
leptokurtyczny
normalny
platokurtyczny
symetryczny
asymetryczny
prawostronnie
asymetryczny
lewostronnie
Typy rozkładów
Miary przeciętne
Miary zmienności
Miary asymetrii
Miary koncentracji
Analiza struktury
Analiza dynamiki
•
Analiza zależności dwóch cech
•
Przyrosty
•
Indeksy
Miary przeciętne
klasyczne
pozycyjne
średnie:
arytmetyczna
geometryczna
harmoniczna
dominanta
kwantyle
Miary przeciętne
klasyczne
pozycyjne
średnie:
arytmetyczna
geometryczna
harmoniczna
dominanta
kwantyle
∑
∑
∑
∑
∑
=
=
=
=
=
=
=
=
=
=
k
i
i
i
k
i
i
i
k
i
i
i
k
i
i
i
N
i
i
w
x
N
n
x
x
w
x
N
n
x
x
N
x
x
1
1
1
1
1
o
o
nieważona (z szeregu prostego)
ważona (z szeregu
rozdzielczego punktowego)
ważona (z szeregu
rozdzielczego przedziałowego)
Średnią arytmetyczną ( ) nazywamy sumę wartości
zmiennej wszystkich jednostek badanej zbiorowości
podzieloną przez liczbę tych jednostek.
x
Własności średniej
Własności średniej
arytmetycznej:
arytmetycznej:
jako miara klasyczna jest wypadkową wszystkich
wartości zmiennej i spełnia nierówność: x
min
< < x
max
,
suma odchyleń poszczególnych wartości zmiennej od
średniej arytmetycznej jest równa zeru,
jeżeli wszystkie wartości zmiennej powiększymy
(pomniejszymy, podzielimy lub pomnożymy) o pewną
stałą, to średnia arytmetyczna będzie równa sumie
(różnicy, iloczynowi lub ilorazowi) średniej
arytmetycznej wyjściowych zmiennych i tej stałej.
x
Przykład 1. Obliczyć średnią liczbę
Przykład 1. Obliczyć średnią liczbę
napraw badanych komputerów
napraw badanych komputerów
n = 32 komputery
X - liczba napraw (cecha skokowa)
19
,
2
32
70
=
=
x
Interpretacja: Średnia
liczba napraw dla badanych
komputerów wynosi 2,19.
x
i
n
i
x
i
*n
i
0
5
0
1
5
5
2
10
20
3
5
15
4
5
20
5
2
10
suma
32
70
2007-10-08
5
Przykład 2. Obliczyć średni koszt
naprawy badanych komputerów
n = 32 komputery
Y - koszt napraw (w zł) (cecha ciągła)
88
,
246
32
7900
=
=
x
Interpretacja: Średni koszt
naprawy badanych komputerów
wynosi 246,88 zł
<Y0i - Y1i)
ni
0-100
9
50
450
100-200
6
150
900
200-300
3
250
750
300-400
7
350
2450
400-500
5
450
2250
500-600
2
550
1100
suma
32
X
7900
o
i
y
i
i
o
n
y ⋅
(zł)
1. Rozstęp wynosi 100, a wyliczona liczba
przedziałów 4. Długość przedziału będzie
równa:
a)
4
b)
25
c)
20
0
1
2
3
4
5
6
1
3
5
2. Szereg rozdzielczy, dla którego utworzono
poniższy histogram to:
a)
x
i
n
i
b)
x
0i
-x
1i
n
i
c)
x
0i
-x
1i
n
i
1
4
0-2
4
0-2
6
3
6
2-4
6
2-4
5
5
5
4-6
5
4-6
4
3.
Średnia
arytmetyczna
odznacza
się
następującymi własnościami:
a) zawiera się w przedziale
b) zawiera się w przedziale
c) suma odchyleń poszczególnych
wartości zmiennej od średniej
arytmetycznej jest równa zeru
max
min
x
x
x
≤
≤
min
max
x
x
x
≤
≤