Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
Procesy masowe to zjawiska, które rozpatrywane w masie
charakteryzują się prawidłowością niedającą się
zaobserwować na podstawie pojedyńczej obserwacji.
Przyczyny główne - działają we wszystkich przypadkach.
Składnik systematyczny to część procesu masowego, która jest
wynikiem działania zespołu przyczyn głównych.
Przyczyny uboczne - działają tylko w poszczególnych
(indywidualnych) przypadkach.
Składnik przypadkowy to część, która jest wynikiem działania
przyczyn ubocznych.
Prawidłowość statystyczna to splot przyczyn głównych
(prawidłowość absolutna) i ubocznych (prawidłowość
przybli\ona).
Rodzaje praw (zale\ności):
a. przyczynowe po pewnym określonym zdarzeniu stale
następuje inne określone zdarzenie;
b. współwystępowanie stałe łączne występowanie dwóch
lub więcej zdarzeń;
c. funkcyjne związek między ilościowo wymiernymi
zdarzeniami, które mo\na przedstawić za pomocą funkcji
matematycznej.
Statystyka zajmuje się metodami pozyskiwania, prezentacji,
opisu i analizy danych oraz interpretacją wyników.
1
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
Etapy badań statystycznych
1. planowanie i organizacja badania
2. obserwacja statystyczna
3. opracowanie zebranego materiału
4. analiza wyników badania
ad.1 planowanie i organizacja badania
- cel badania:
diagnostyczny praktyczny
- przedmiot badania:
merytoryczny terytorialny czasowy
- cechy (zmienne) opisujące badaną zbiorowość:
jakościowa ilościowa
(skokowa; ciągła)
- zródło informacji (danych):
pierwotne wtórne
- określenie czasu trwania badania:
ciągłe okresowe dorazne
- zakres badania:
pełne częściowe (próba)
2
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
ad.2 obserwacja statystyczna
metody obserwacji badanie pilota\owe
badanie podstawowe
ad.3 opracowanie zebranego materiału
- kontrola materiału:
formalna merytoryczna
- mo\liwe błędy:
systematyczne przypadkowe losowe
ad.4 analiza wyników badania
interpretacja miar
wnioski końcowe
3
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
STATYSTYKA OPISOWA
Rozkład empiryczny cechy
X cecha (zmienna) statystyczna;
xi - warianty zmiennej
N liczebność badanej zbiorowości;
ni - liczebność odpowiadająca danemu wariantowi cechy
n
i
wi = - częstość względna odpowiadająca danemu
n
k
wariantowi cechy, gdzie w =1
"
i
i=1
--------------------------------------------------------------------------------
k
ns = n(x d" xk)= n1 + n2 +...nk = ni - skumulowana liczebność
"
i=1
n1 + n2 + ... + ns
l
Fs (x) = w(X < ws )= = ws - dystrybuanta
"
n
i=1
empiryczna
0 dla x < x1
i
Fn (x) = d" x d"
d" d"
d" d"
"w dla xi d" d" x1+1
s
s=1
1 dla xi e"
e" x k
e"
e"
własności dystrybuanty:
a. funkcja ciągła;
b. zwykle prawostronnie rosnąca;
c. przyjmująca wartości z przedziału < 0; 1 >.
4
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
Rozkład empiryczny to przyporządkowanie kolejnym
(uporządkowanym według pewnego kryterium) wartościom
przyjmowanym przez cechę liczebności lub częstości ich
występowania.
--------------------------------------------------------------------------------
A. zapis tabelaryczny danych
szereg rozdzielczy punktowy np.
xi ni wi Fn (x) = ws xi ni wi
x1 n1 w1 w1 1 2 0,10
x2 ni w2 w1+w2 3 4 0,20
: : : : 4 5 0,25
: : : : 7 3 0,15
xk nk wk w1+w2 +...+wk =1 8 6 0,30
N 1 ------- 20 1,00
Ł Ł
Ł Ł
Ł Ł
Ł Ł
dane punktowe - xj, dla i= 1, 2, ... , k
szereg rozdzielczy przedziałowy np.
x0i x1i ni wi Fn (x) = ws x0i x1i ni wi
x01 - x11 n1 w1 w1 1-2 5 0,25
x02 - x12 ni w2 w1+w2 2-3 2 0,10
: : : : 3-4 3 0,15
: : : : 4-5 7 0,35
x0k - x1k nk wk w1+w2 +...+wk =1 5-6 3 0,15
N 1 ------- 20 1,00
Ł Ł
Ł Ł
Ł Ł
Ł Ł
dane pogrupowane {xi, ni dla i= 1, 2, ... , k, gdzie k < n}
5
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
zasady budowy szeregu rozdzielczego przedziałowego:
- wskazane jest, aby rozpiętość przedziałów była
jednakowa;
- przedziały nie mogą mieć zerowej liczebności (częstości);
- wskazane jest, aby pierwszy i ostatni przedział w szeregu
rozdzielczym był domknięty;
- rozpiętość klas nie mo\e być zbyt szeroka, aby zbytnio nie
uogólnić posiadanych informacji, ani zbyt wąska, aby
zbytnio ich nie uszczegółowić.
--------------------------------------------------------------------------------
Tablice statystyczne składają się n-szeregów rozdzielczych.
Oznaczenia w tablicach:
- kreska (-) dane zjawisko nie występuje;
- kropka (" brak informacji;
" )
"
"
- krzy\yk (x) wypełnienie danej kratki jest niemo\liwe;
- zero (0) dane zjawisko istnieje, ale w ilościach
mniejszych od przyjętego rzędu liczb
w tablicy.
6
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
B. graficzna prezentacja danych: histogram, diagram, krzywa,
pudełko z wąsami itp.
tytuł wykresu
tytuł wykresu
6
6
5
5
1
4 1
4
2
2
3
3
3
3
2
2
4 4
1
8 1 8
0
0
warianty cechy
warianty cechy
yródło: yródło:
tytuł wykresu
tytuł wykresu
0,35
20,4 20,4
0,3
1
0,25
2
0,2
3
0,15 27,4
4
0,1
8
1
0,05
2
0
3
4
warianty cechy
90
yródło: yródło:
tytuł wykresu
tytuł wykresu
100
50
80
40
60
30
40
20
20
10
0
0
1990 1991 1992 1993
lata
1989 1990 1991 1992 1993 1994
Wsch. Zach. Płn. Zach. Płn.
yródło: yródło:
7
liczebno
ść
liczebno
ść
cz
ę
sto
ść
liczebno
ść
w procentach
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
Opis statystyczny badanej zbiorowości
= analiza struktury zjawiska
(opis rozkładu empirycznego = charakterystyka rozkładu)
I. Miary poło\enia rozkład
I.1 średnia arytmetyczna (x)
średnia arytmetyczna niewa\ona:
n n
1
dane niepogrupowane: x =
i
"x = "w
i
n
i =1 i = 1
np. dane: 2; 4; 6; 2; 4; 5; 5; 2; 5; 5
1
x =10 "[2 + 4 + 6 + 2 + 4 + 5 + 5 + 2 + 5 + 5] = 4
średnia arytmetyczna wa\ona:
k k
1
dane pogrupowane punktowe: x =
"x "n ="x "w
i i i i
n
i=1
i =1
np. dane punktowe pogrupowane
xi 2 4 5 6
"
"
"
"
ni 3 2 4 1 10
1
x =10[2"3+ 4"2 + 5"4 + 6"1] = 4
8
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
o o
k k
1
dane przedziałowe: x = xi" w = xi"ni ,
" "
i
n
i=1 i=1
o
gdzie: x - środek i-tego przedziału klasowego;
o
xi1 + xi0
xi = (i =1,..., k)
2
np. dane przedziałowe
xi (0-2> 2-4 4-6 6-8
"
"
"
"
o
1 3 5 7 x
x
ni 3 2 4 1 10
1
x =10[1"3+ 3"2 + 5"4 + 7"1] = 3,6
--------------------------------------------------------------------------------
własności średniej arytmetycznej:
n n
1. x"n =
"x 2. "(x -x)=0
i i
i = 1 i = 1
n
3.
"(x - c)2 =min dla c = x
i
i = 1
--------------------------------------------------------------------------------
czy zawsze mo\na wyznaczyć średnią arytmetyczną?
14 25
12
20
10
15
8
6
10
4
5
2
0 0
9
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
Momentem zwykłym rzędu k (k = 1,2,...) rozkładu empiry-
cznego nazywamy wielkość:
n
1
k
" dla danych indywidualnych: M = x
"
"
"
"
k j
n
j=1
r r
1
" dla danych pogrupowanych: M = xik "wi = xik ni
"
"
"
" "
k
n
i=1 i=1
I.2 kwantyl rzędu p (0 < p < n)
Kwartyle Qp - miary dzielące badaną zbiorowość na cztery
równe części
dane punktowe:
Fn (Q1 ) e" 0,25; Fn (Q2 ) e" 0,50; Fn (Q3 ) e" 0,75
e" e" e"
e" e" e"
e" e" e"
kwartyl rzędu 2 nazywany jest medianą (me)
dane punktowe:
xn+1
ńł
, gdy n jest nieparzyste,
ł
2
gdzie n to nr danej
ł
ł
me =
ł w uporządkowanym
n
łx + xn+2
ciągu liczb
ł 2 2
, gdy n jest parzyste
ł
ół 2
np. dane pierwotne : 2; 4; 6; 2; 4; 5; 5; 2; 5; 5
dane uporządkowane: 2; 2; 2; 4; 4; 5; 5; 5; 5; 6
n = 10 me = (4 + 5) / 2 = 4,5
10
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
szereg rozdzielczy punktowy
xi ni wi ws
1 2 0,10 0,10
3 4 0,20 0,30
! Q1 = 3
!
!
!
4 5 0,25 0,55
! Q2 = 4
!
!
!
7 3 0,15 0,70
8 6 0,30 1,00
! Q3 = 8
!
!
!
20 1,00 x
Ł
Ł
Ł
Ł
dane przedziałowe:
h
Q1
Q = x + (0,25 - F (x ) )
1 oQ1 n oQ1
w
Q1
h
Q2
Q = me = x + (0,50 - F (x ) )
2 oQ2 n oQ2
w
Q2
h
Q3
Q = x + (0,75 - F (x ) )
3 oQ3 n oQ3
w
Q3
x0Q - dolna granica przedziału, w którym znajduje się wartość
kwartyla,
n(x0Q-1) / Fn(x0Q-1) skumulowana liczebność / częstość w
przedziale poprzedzającym klasę kwartyla,
hQ / nQ, / wQ - rozpiętość / liczebność / częstość
przedziału, w którym znajduje się kwartyl.
11
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
szereg rozdzielczy przedziałowy
(x0i x1i> ni wi ws
1-2 5 0,25 0,25
! Q1 = 2
!
!
!
2-3 2 0,10 0,35
3-4 3 0,15 0,50
! Q2 = 4
!
!
!
4-5 7 0,35 0,85
! Q3 = ?
!
!
!
5-6 3 0,15 1,00
20 1,00 x
Ł
Ł
Ł
Ł
1
Q = 4 + (0,75 - 0,50 ) = 4,29
3
0,85
--------------------------------------------------------------------------------
czy zawsze mo\na wyznaczyć medianę?
14 25
12
20
10
15
8
6
10
4
5
2
0 0
--------------------------------------------------------------------------------
z jakiej postaci wykresu mo\emy odczytać kwartyle ?
1,2
1
0,9
1
0,8
0,7
0,8
0,6
0,5
0,6
0,4
0,3
0,4
0,2
0,1
0,2
0
0
0 2 4 6 8
12
liczebno
ś
ci
liczebno
ś
ci
cz
ę
sto
ść
skumulowana
cz
ę
sto
ść
skumulowana
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
I.3 dominanta (do)
dane punktowe:
do = xk dla której
nk = max { ni } lub wk = max { wi }
szereg rozdzielczy punktowy
xi ni wi
1 2 0,10
3 4 0,20
4 5 0,25
7 3 0,15
8 6 0,30
! do = 8
!
!
!
20 1,00
Ł
Ł
Ł
Ł
dane przedziałowe:
n - n w - w
d d - 1 d d - 1
do = xod +
h = xo + h
do d
2" n - n - n ) 2" w - w - w )
d d - 1 d + 1 d d - 1 d + 1
x0d - dolna granica przedziału, w którym występuje
dominanta,
hd - rozpiętość tego przedziału,
nd / wd / nd-1 / wd-1 / nd+1 / wd+1 - liczebność / częstość
przedziału w którym występuje dominanta, przedziału
poprzedniego i następnego po klasie, w której występuje
dominanta.
13
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
szereg rozdzielczy przedziałowy
(x0i x1i> ni wi
1-2 5 0,25
2-3 2 0,10
3-4 3 0,15
4-5 7 0,35
! do = ?
!
!
!
5-6 3 0,15
20 1,00
Ł
Ł
Ł
Ł
7 - 3
do = 4 + "1= 4,5
2"7 -3-3
--------------------------------------------------------------------------------
czy zawsze mo\na wyznaczyć dominantę?
14 25
12
20
10
15
8
6
10
4
5
2
0 0
--------------------------------------------------------------------------------
z jakiej postaci wykresu mo\emy odczytać dominantę ?
1,2
0,4
1
0,8 0,3
0,6
0,2
0,4
0,1
0,2
0
0
0 2 4 6 8
14
cz
ę
sto
ść
cz
ę
sto
ść
skumulowana
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
II. Miary zró\nicowania cechy
S
S
S
S
X
X
X
X
2
2
2
2
II.1 Wariancja (odchylenie standardowe) ; S(X)
--------------------------------------------------------------------------------
jak interpretować odchylenie standardowe ?
25
20
15
Wschód
Zachód
10
5
0
-S(X) -S(Y) S(Y) S(X)
--------------------------------------------------------------------------------
k
1
2
dane niepogrupowane: S = " (xi - x)2
"
n -1
i-1
np. dane: 2; 4; 6; 2; 4; 5; 5; 2; 5; 5 x = 4
1
S2(X ) = "[(2 - 4)2 + (4 - 4)2 + (6 - 4)2 +...+ (5 - 4)2 = 2,22
10 -1
2(X
S ) = S(X ) =1,49
15
((((
))))
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
dane pogrupowane punktowe:
k k
1
S2(X ) = " (xi - x)2 "ni = (xi - x)2 " wi
" "
n -1
i-1 i-1
np. dane punktowe pogrupowane
xi 2 4 5 6
"
"
"
"
ni 3 2 4 1 10 x = 4
1
S2(X ) = [(2 - 4)2 "3+ (4 - 4)2 "2 + (5 - 4)2 "4 + (6 - 4)2 "1= 2,22
10 - 9
dane pogrupowane przedziałowe:
o o
k k
1
S2(X ) = " (x - x)2 " ni = (x - x)2 " wi
" "
n -1
i i
i-1 i-1
np. dane punktowe pogrupowane
o
2 4 5 6
"
"
"
"
x
x = 4
wi 0,3 0,2 0,4 0,1 1,0
S2(X ) = [(2 - 4)2 "0,3+ (4 - 4)2 "0,2 + (5 - 4)2 "0,4 + (6 - 4)2 "0,1= 2,22
--------------------------------------------------------------------------------
czy zawsze mo\na wyznaczyć odchylenie standardowe ?
14 25
12
20
10
15
8
6
10
4
5
2
0 0
16
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
II.2 współczynnik zmienności V(X)
S(X )
V (X ) =
x
np. waga (X) x = 70,5 S(X) = 7,05 V(X) = 0,10
wzrost (Y) y = 170,5 S(Y) = 7,05 V(Y) = 0,04
waga
wzrost
II.3 rozstęp; rozstęp ćwiartkowy
R = xmin - xmax R = Q3 - Q1
--------------------------------------------------------------------------------
czy zawsze mo\na wyznaczyć rozstęp ?
25
20
15
Wschód
Zachód
10
5
0
17
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
Q3 - Q1
II.4 odchylenie ćwiartkowe Q =
2
Q3 -Q1
II.5 pozycyjny współczynnik zmienności V =
2 "Q2
III. asymetria rozkładu A(X)
--------------------------------------------------------------------------------
rozkład symetryczny rozkład prawostronny
x = me = do x > me > do
--------------------------------------------------------------------------------
rozkład lewostronny
x < me < do
18
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
III.1 skośność
współczynnik skośności Vs = x - do
trzeci moment centralny
n
1
'
dane punktowe M = (x - x)3
"
3
i
n
i = 1
n n
1
'
dane przedziałowe M = (x - x)3 "n = (x - x)3 " w
" "
3
i i i i
n
i = 1 i = 1
III.2 asymetria
klasyczny współczynnik asymetrii
n n
1
(x
" - x)3 " n = (x - x)3 " w
"
i i i i
n -1i =1
i = 1
A = A "
" (-2; +2)
"
"
S3(X )
pozycyjny współczynnik asymetrii
(Q3 - Q ) - (Q - Q1)
2 2
A = A "
" (-1; +1)
"
"
(Q3 - Q1)
klasyczno-pozycyjny współczynnik asymetrii
x - do
V = A "
" (-1; +1)
"
"
S(X )
19
Wykład ze statystyki nr I dr Małgorzata Podogrodzka, SGH, ISiD
IV. koncentracja wartości cechy
Krzywa koncentracji Lorenza
T
P
skumulowana częstość jednostek (w)
współczynnik Giniego K "
" < 0; 1 >
"
"
k i
k i
i
i
1
1
k i
k i
i
i
1
1
K 1 1 zz
K 1 1 zz
2 2 w
2 2 w
T P
T P
K 1 1 zz
K 1 1 zz
2 2 w
2 2 w
T P
T P
-
s s
s s
s s
s s
i
i
i
i
s 1
s
1
1
i s
1 1
1 1
s
s
1
1
i s
i s
1+ "
1 1
= " = - " = - i s
" " "
= = =
np. koncentracja wkładów oszczędnościowych
częstość skumulowana częstość
i - 1 i i - 1 i
i
l.p. klientów (w)
z + z ( z + z ) " w
" " " "
wkładu zs
"
s s s s i
s = 1 s = 1 s = 1 s = 1
s=1
1 0,12 0,10 0,10 0,0120
2 0,14 0,24 0,34 0,0476
3 0,30 0,38 0,62 0,1860
4 0,24 0,82 1,20 0,2880
5 0,20 1,00 1,82 0,3640
1,00 x x 0,8976
"
"
"
"
K = 1 0,8976 = 0,1024
20
warto
ś
ci cechy (z)
skumulowane cz
ę
sto
ś
ci
((((
))))
Wyszukiwarka
Podobne podstrony:
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 6Tikhonenko O Wykłady ze statystyki matematycznej Wykład 2Tikhonenko O Wykłady ze statystyki matematycznej Wykład 3Tikhonenko O Wykłady ze statystyki matematycznej Wykład 7Mikołaj Rybaczuk Materiały do ćwiczeń i wykładów ze statystyki Politechnika BIałostockaBoratyńska A Wykłady ze statystyki matematycznejTikhonenko O Wykłady ze statystyki matematycznej Wykład 5Wyklady ze statystykiTikhonenko O Wykłady ze statystyki matematycznej Wykład 1wyklad 1 wprowadzenie statystyki oisowepraca ze statystykiWykłady z metod statystycznych100 pytań i odpowiedzi ze statystyki (5)więcej podobnych podstron