1
Podstawowe pojęcia statystyki
matematycznej.
Statystyka opisowa
Pracownia Doświadczalnictwa
Prof. dr hab. Sławomir Stankowski
ul. Pawła VI 3, pok. 117
2
Zalecana literatura
Literatura:
Podstawowa:
Sobczyk M.,2007: Statystyka. PWN,
Warszawa
Luszniewicz A., 1997: Metody
wnioskowania statystycznego,
PWE, Warszawa.
3
Wprowadzenie
Geneza statystyki matematycznej
jako dziedziny naukowej
Definicja statystyki – jest to nauka
zajmująca się badaniem
prawidłowości w masowych
zjawiskach przypadkowych i
opisywaniem ich za pomocą liczb.
4
Działy statystyki
S ta ty s t y k a o p i s o w a
W n io s k o w a n i e s t a ty s t y c z n e
S t a ty s t y k a m a te m a ty c z n a
5
Statystyka opisowa
Zajmuje się metodami
gromadzenia, opisu i
przedstawiania danych w postaci
sumarycznej
Opis statystyczny dokonywany jest
za pomocą określonych
charakterystyk (miar)
6
Wnioskowanie
statystyczne
Oparte jest na rachunku
prawdopodobieństwa, będącego działem
matematyki
Zajmuje się - na podstawie prób
statystycznych -szukaniem reguł o
właściwościach populacji i relacjach
między populacjami w celu wyciągania
uogólnionych wniosków o nich.
7
Pojęcia i definicje:
Zbiorowość statystyczna – zbiór elementów (osób,
przedmiotów, zdarzeń) objętych badaniem.
Populacja generalna – zbiór danych (najczęściej
liczbowych) charakteryzujących zjawisko.
Próba (populacja próbna) – podzbiór populacji
generalnej.
Jednostka statystyczna – element zbiorowości
statystycznej.
Cecha – właściwość jednostki statystycznej.
Materiał statystyczny – wyniki pomiarów lub
obserwacji z jednostek statystycznych.
Szereg statystyczny – uporządkowany zbiór
wartości cechy.
8
Podział cech
Cechy
jakościowe
(niemierzalne)
ilościowe
(mierzalne)
ciągłe
skokowe
quasi-ilościowe
9
Rodzaje charakterystyk
populacji (prób)
Miary skupienia
Miary rozproszenia
Miary kształtu
10
Miary skupienia
(koncentracji)
ś r e d n ia a r y tm e t y c z n a
ś r e d n ia a r y tm a t y c z n a w a ż o n a
ś r e d n i a g e o m e t r y c z n a
ś r e d n i a h a r m o n i c z n a
k la s y c z n e
m o d a ( d o m i n a n t a )
m e d i a n a
k w a r t y le
d e c y le
k w a n t y le
p o z y c y j n e
ś r e d n ie
11
Miary rozproszenia
(zmienności, dyspersji)
r o z s te p ( a m p li t u d a w a h a ń )
o d c h y le n i e ć w i a r tk o w e
p o z y c y j n e
o d c h y le n i e p r z e c i ę t n e
o d c h y le n i e s ta n d a r d o w e
w a r ia n c ja
b łą d s t a n d a r d o w y
k la s y c z n e
w s p ó łc z y n n i k z m i e n n o ś c i
m i e s z a n e
m ia r y r o z p r o s z e n ia
12
Miary kształtu
s k o ś n o ś ć
b e z w z g lę d n e
w s p ó łc z y n n ik s k o ś n o ś c i
w z g lę d n e
m i a r y a s y m e t r ii
w s p ó łc z y n n i k s p ła s z c z e n ia
w s p ó łc z y n n i k k o n c e n t r a c ji
L o r e n z a
m ia r y z r ó ż n ic o w a n ia
m i a r y k s z t a łtu
13
Średnia
arytmetyczna:
n
x
x
n
i
i
1
•
X
min
< średnia < X
max
• Suma odchyleń poszczególnych
wartości zmiennej od średniej
arytmetycznej jest równa 0
14
Średnia arytmetyczna c.d.
•Jeżeli każdą z wartości szeregu liczbowego
zwiększymy (zmniejszymy, podzielimy,
pomnożymy) o stałą, to średnia arytmetyczna
będzie równa sumie (różnicy, ilorazowi,
iloczynowi) średniej arytmetycznej pierwotnych
danych i tej stałej.
•Na wartość średniej arytmetycznej duży
wpływ mają wartości skrajne
(ekstremalne)
15
Średnia arytmetyczna
ważona:
•Jest stosowana, gdy warianty zmiennej (x
i
)
występują z różną częstotliwością. Wtedy
poszczególnym wariantom odpowiadają różne
liczebności tzw. wagi (f
i
).
i
i
i
f
f
x
x
·
16
Średnia harmoniczna
•Średnią tą stosujemy przy wyliczaniu
średniego tempa zjawisk, gdy mamy do
czynienia z wielkością stosunkową w której
zmienny jest mianownik. Jako wielkość
stosunkową rozumiemy stosunek dwóch
różnych wielkości (każda z nich mogłaby być
niezależnie analizowana) np. wydajność pracy,
prędkość, gęstość zaludnienia.
i
H
x
n
x
1
17
Średnia geometryczna
n
n
G
x
x
x
x
·....·
·
2
1
•Średnią tą stosujemy przy wyliczaniu średniej
z szeregów dynamicznych (czasowych), cech
przedstawionych w liczbach względnych
•Średnia ta jest mniej wrażliwa na wartości
skrajne.
średnia arytmetyczna > średnia
geometryczna > średnia harmoniczna
18
Moda (dominanta,
wartość najczęstsza)
•W przypadku cechy liczbowej skokowej jest to
wartość powtarzająca się najczęściej.
•W przypadku cechy liczbowej ciągłej jest to
wartość, wokół której jest najwyższa
koncentracja (gęstość) wyników.
D
,
Mo
19
Mediana (wartość
środkowa)
•Jest to wartość środkowa uporządkowanego
szeregu liczbowego.
parzyste
gdy
2
e
nieparzyst
gdy
1
2
2
2
1
n
x
x
Me
n
x
Me
n
n
n
20
Kwartyle
•dzielą uporządkowany szereg liczbowy na
cztery równe części
•drugi kwartyl jest jednocześnie medianą
•pierwszy kwartyl jest „medianą pierwszej
połowy szeregu”
•trzeci kwartyl jest „medianą drugiej połowy
szeregu”
Me
Q
2
Q
1
Q
3
x
min
x
max
21
Rozstęp (amplituda
wahań)
Klasyczny
Kwartylowy
1
3
min
max
Q
Q
R
x
x
R
22
Odchylenie ćwiartkowe
2
1
3
Q
Q
Q
•Określa poziom zróżnicowania części szeregu
liczbowego po odrzuceniu skrajnych 25 %
obserwacji. Oznacza to, że odchylenie
ćwiartkowe określa średnią rozpiętość wartości
cechy w dwóch wewnętrznych ćwiartkach
zbiorowości.
23
Odchylenie przeciętne
n
x
x
d
i
24
Wariancja
1
1
2
2
2
2
2
2
1
2
n
n
x
x
s
n
x
x
s
n
x
x
s
n
i
i
Estymator obciążony, stosować dla dużych prób
Estymator nieobciążony, stosować dla małych prób
25
Odchylenie standardowe
2
s
s
26
Błąd standardowy (błąd
średniej arytmetycznej)
n
s
s
x
27
Współczynnik zmienności
(4)
V
(3)
%
100
V
(2)
%
100
)
1
(
%
100
(%)
1
3
1
3
Q3
-
Q1
Q
Q
Q
Q
Q
Me
Q
x
d
V
x
s
V
d
28
Współczynnik zmienności
c.d.
• określa stopień zróżnicowania wyników w
stosunku do średniej
• wyliczony ze wzorów (1) i (2) jest określany
jako klasyczny
• wyliczony ze wzorów (3) i (4) jest określany
jako pozycyjny
• wykorzystywany jest do:
a) określania ścisłości wykonania
doświadczenia
b) porównania stopnia zmienności kilku cech w
obrębie jednej populacji
c) porównania stopnia zmienności tej samej
cechy w obrębie kilku populacji
29
MIARY KSZTAŁTU
Miary asymetrii
Skośność – liczona tradycyjnie
Q
Me
Q
Q
A
s
Me
x
A
s
Mo
x
A
Q
Me
Mo
2
2
3
3
1
A=0 dla rozkładu symetrycznego, A<0 - dla rozkładów o
lewostronnej asymetrii (wydłużone lewe ramię rozkładu)
i A>0 dla rozkładów o prawostronnej asymetrii
(wydłużone prawe ramię rozkładu).