Statystyka
- zbiór metod służących pozyskiwaniu,
prezentacji oraz analizie danych.
Podstawowe zadanie statystyki: analiza i
interpretacja danych
Współautorką poniższych slajdów jest
dr Katarzyna Kocot-Górecka
Zbiorowość statystyczna
Zbiorowość generalna (populacja
generalna) - kompletny zbiór elementów
lub wyników procesu.
populacja generalna skończona,
populacja generalna nieskończona
Cechy statystyczne
Typy cech statystycznych
cechy mierzalne: posiadające charakter
ilościowy,
o charakterze ciągłym
o charakterze skokowym (dyskretnym)
cechy niemierzalne: posiadające charakter
jakościowy
Metody statystyczne:
" statystyka opisowa - syntetyczny
liczbowy opis właściwości zbioru danych
" wnioskowanie statystyczne
statystyka matematyczna
Losowy dobór próby
" każda jednostka populacji generalnej ma
dodatnie znane prawdopodobieństwo
znalezienia się w próbie,
Losowanie proste: wszystkie elementy mają
jednakowe prawdopodobieństwo dostania się
do próby i prawdopodobieństwo dostania się do
próby poszczególnych elementów nie zmienia
się w trakcie losowania.
Rozkład empiryczny cechy
przyporządkowanie
" dane indywidualne
" xj - wartości cechy, gdzie j=1,2,...,n ;
n liczebność
"
" dane pogrupowane
xi, ni dla i= 1, 2, ... , k, gdzie k < n
Rozkład empiryczny cechy
skokowej
xi - cecha przyjmuje k wartości, dla i= 1,2, ... ,k,.
gdzie ..,k (1Łk
ni - liczba jednostek zbiorowości, dla których
cecha przyjmuje wartość xi,
r
ni = n
przy czym zachodzi: ,
i=1
wi - udział jednostek o wartości xi cechy w ogólnej
liczebności zbiorowości, czyli częstość
względna (częstość jej występowania w ogólnej
zbiorowości) określana jako:
r
ni
wi =1
wi =
i = 1,2,..., k
; ,oraz
n
i=1
Szereg rozdzielczy
Wartości cechy Dystrybuanta
Liczebności Częstości
empiryczna
xi
ni wi
Fn(xi) = S ws
x1 n1 w1 w1
x2 n2 w2 w1+w2
x3 n3 w3 w1+w2+ w3
. . . .
. . .
xk nk wk w1+ ... +wk =1
Ogółem n 1
-------
Rozkład empiryczny cechy ciągłej
podział obszaru zmienności cechy na
przedziały klasowe
określenie liczby przedziałów klasowych k
(kŁ5),
ustalenie rozpiętości przedziału klasowego hi:
i = 1,2,..., k
hi = x1i - x0i
x0i, x1i - odpowiednia dolna i górna granica
przedziału klasowego.
Dystrybuanta empiryczna cechy X
" jest to funkcja Fn (x) określona na zbiorze liczb
rzeczywistych w następujący sposób:
0 dla x < x1
i
dla xi Ł x < x
i+1
ws
s=1
Fn (x) =
1 dla xi ł x k
gdzie (i=1, 2,. .,k-1)
własności dystrybuanty:
1) Fn (xó ) ł Fn (x ), dla x ó > x
0 Ł Fn (x) Ł 1
Opis rozkładu empirycznego
charakterystyki rozkładu
miary położenia rozkładu
miary zróżnicowania
miary asymetrii
Średnia arytmetyczna (miara klasyczna):
dane indywidualne ,
n
1
formuła nieważona x =
x
j
n
j =1
w rozkładzie cechy skokowej, dane pogrupowane,
k
1
formuła ważona x =
x n
i i
n
i =1
w rozkładzie z przedziałami klasowymi,
k
1
&
formuła ważona x
x n
i i
n
i =1
o
o
xi1 + xi0
xi =
x - środek i-tego przedziału klasowego
2
Miary pozycyjne
" kwantyl rzędu p (0 < p <1) w
rozkładzie empirycznym to taka wartość
kp cechy, dla której - jako pierwszej -
dystrybuanta empiryczna spełnia
warunek:
" Fn (kp) ł p
" mediana to środkowa wartość w uporządkowanym
rosnąco zbiorze wartości cechy.
dane indyw idualne
x
n + 1
2
m e =
x + x
n n
+ 1
2
2
2
M ediana w rozkładzie cechy skokow ej - pierw sza
w artość cechy xi , dla której jest spełniony
w arunek
F (xi) ł 0,5
n
M ediana w rozkładzie z przedziałam i klasow ym i
(interpolacja)
h
m
me = x + (0,5 - Fn (x ) )
o m o m
w
m
kwartyle Q1 , Q2 , Q3
w rozkładzie cechy skokowej
Fn (Q1 ) ł 0,25;
Q2=me;
Fn (Q3 ) ł 0,75
dominanta w rozkładzie empirycznym to taka wartość
cechy, której odpowiada największa liczebność (częstość)
w rozkładzie cechy skokowej
do = xk dla której:
nk = max { ni } lub wk = max { wi }
w rozkładzie cechy ciągłej
nd - nd -1
do = nd + hd
(nd - nd -1) + (nd - nd +1)
Klasyczne miary zróżnicowania
wariancja z próby, to suma kwadratów odchyleń wartości
cechy od jej średniej podzielona przez n-1
" dane indywidualne, formuła nieważona
n
2 2
1
-x)
S =
(xj
n-1
j =1
n
2 2
1
S = ( xj 2 -n(x) )
n-1
j =1
" w rozkładzie cechy skokowej, formuła ważona
k
2 2
1
S = -x) ni
(xi
n-1
i =1
k
2 2
1
n
S = ( xi 2 -n(x) )
i
n-1
i =1
" odchylenie standardowe
2
S = S
" typowy obszar zmienności cechy
x-S Ł xtyp Ł x+S
(miary pozycyjne)
" rozstęp = xmax xmin
" rozstęp międzykwartylowy I = Q3 - Q1
" odchylenie ćwiartkowe
Q3-Q1
Q=
2
Miary względne
współczynnik zmienności (miara klasyczna )
S
V = *100%
x
współczynnik zmienności (miara pozycyjna )
Q
V =
me*100%
rozkład symetryczny rozkład prawostronny
x = me = do x > me > do
rozkład lewostronny
x < me < do
Miary asymetrii
m3
współczynnik asymetrii (miara klasyczna)
A=
S3
3
m =1(x -x)
gdzie
3
n
j
dla danych indywidualnych, formuła nieważona
n
3
M3=1 (x -x)
n
j
j =1
w rozkładzie cechy skokowej, formuła ważona
n
3
M3 =1 (x -x) *ni
n
i
j =1
w rozkładzie z przedziałami klasowymi, formuła
ważona
n
3
&
M3 1 (x -x) *ni
n
i
j =1
Wyszukiwarka
Podobne podstrony:
WYKLAD 6 stud 13
wyklad 3 STUD
wyklad 4 STUD
Wykład 4 stud
wyklad 7 STUD
wyklad 2 STUD
wyklad 9 STUD
Wyklad 1 CIAGI 12 wer stud
Wyklad 8?LKA OZNACZONA Biol wer stud
ochr srod wyklad 1 biologia dla stud
Biomedyka Pedagog 1 Wykład 04 stud
WYKŁAD 3 el aut3 stud
JBZ Wyklad2 dla stud
Psychopatologia UW Wykład III RS cz II dla stud
Wyklad ZMIENNA LOSOWA Biol 2012 wer stud
ArchKomp CISC RISC Wyklad Gotowy PKos SKoz Stud
Wyklad 6?LKA NIEOZNACZONA Biol wer stud
więcej podobnych podstron