Podstawowe poj臋cia i definicje statystyczne
STATYSTYKA jest to zbi贸r metod i system贸w s艂u偶膮cych do:
pozyskiwania danych
przetwarzania tych danych
ich analizy
Jako skutek tego powstaje zbi贸r danych u偶ytecznych i uog贸lnione informacje
o zjawiskach i problemach kt贸re by艂y przedmiotem bada艅
Pozyskiwanie danych:
pomiary - por贸wnywanie danych wielko艣ci ze wzorem
Podzia艂 fizykalny
badania statystyczne ( maj膮 charakter ankietowy ) - dzielimy je na wymierne
i niewymierne dane. S膮 badania niszcz膮ce ( np. RTG ) i nieniszcz膮ce
Dok艂adno艣膰 pomiar贸w - pomiar winien by膰 wynikiem analizy
5%-8% - badniania ekspolatacyjne
0,1%-1% - badania naukowe
Urz膮dzenia pomiarowe powinny by膰 o klas臋 wy偶sze ni偶 warto艣c mierzona
B艂膮d bezwzgl臋dny
xm - x mierzome
xo - wielko艣膰 rzeczywista
W praktyce technicznej przyjmuje si臋 wielko艣膰 xo dokonan膮 urz膮dzeniem pomiarowym wy偶szej klasy.
B艂膮d wzgl臋dny
B艂臋dy systematyczne - b艂臋dy zwi膮zane ze z艂ym doborem metody lub poszczeg贸lnych parametr贸w.
Badanie ankietowe - spisy kontrolne trzody chlewnej gospodarstw ch艂opskich. Wysy艂a si臋 ankiety. W tych badaniach trzeba zwr贸ci膰 uwag臋 na weryfikacj臋 danych
Pr贸by losowe - mog膮 by膰 bardzo r贸偶ne
Metoda losowania prostego ( metoda zwrotna ) - polega na tym, 偶e kolejne losowania pr贸by maj膮 identyczne warunki, tzn. warunki losowania s膮 niezmienne ( los po wylosowaniu wraca do puli )
Prezentacja wynk贸w
Przedstawianie danych
Tabelaryczne - zbi贸r wynik贸w danych przetworzonych i usystematyzowanych
w pewne klasy grupuj膮ce cechy lub charakterystyki wsp贸lne. Te tabele s膮 cz臋sto przetworzone
Liczebno艣膰 pracownik贸w
|
Ilo艣膰 godzin wypracowanych |
Roboczogodziny |
|
|
liczebno艣膰 |
|
|
|
Gdy podzielimy ilo艣膰 roboczogodzin przez liczebno艣膰 to w ten spos贸b tworzone s膮 pewne dane z jednej strony. Potem dane s膮 przetwarzane.
Graficzne
Histogram
Wykres
Zadanie:
Zbadano liczb臋 b艂臋d贸w znajduj膮cych si臋 na r贸偶nych stronach maszynopisu
i otrzymano nast臋puj膮ce wyniki
4 |
4 |
4 |
3 |
1 |
2 |
0 |
5 |
6 |
1 |
5 |
5 |
3 |
2 |
2 |
1 |
3 |
2 |
3 |
0 |
3 |
1 |
2 |
5 |
3 |
2 |
4 |
2 |
4 |
4 |
2 |
4 |
3 |
2 |
1 |
3 |
2 |
3 |
4 |
5 |
4 |
3 |
0 |
0 |
3 |
3 |
2 |
2 |
2 |
2 |
3 |
1 |
2 |
2 |
3 |
2 |
4 |
3 |
1 |
2 |
Zbiorowo艣膰 stystyczna - zbi贸r stron maszynopisu n=60
Cecha statystyczna - liczba b艂臋d贸w ( cecha skokowa )
Punktowy szereg rozdzielczy:
xi |
Ni |
wi |
n(xi) |
Fn(xi) |
0 |
3 |
0,05 |
3 |
0,05 |
1 |
7 |
0,12 |
10 |
0,17 |
2 |
19 |
0,32 |
29 |
0,49 |
3 |
15 |
0,25 |
44 |
0,74 |
4 |
10 |
0,17 |
54 |
0,91 |
5 |
5 |
0.08 |
59 |
0,99 |
6 |
1 |
0,01 |
60 |
1,00 |
|
60 |
1,00 |
|
|
,
,
,
,
,
Graficzna prezentacja rozk艂adu cechy skokowej
Poj臋cie liczebno艣ci
Liczebno艣膰 skumulowana
Dystrybutanta empiryczna
Dane przedstawiamy za pomoc膮 szereg贸w statystycznych
Rozk艂ad empiryczny
- dane
Rozk艂ad empiryczny cechy - nazywamy przyporz膮dkowaniem kolejnym warto艣ciom tej cechy odpowiadaj膮cym ich liczebno艣ci lub cz臋sto艣ci wzgl臋dnych
- r贸偶ne warto艣ci cechy
- liczebno艣膰
Cz臋sto艣膰 wzgl臋dna
Warto艣膰 skumulowana
Dystrybutanta empiryczna cechy skokowej
Zadanie:
Zbiorowo艣膰 statystyczna: uczniowie klasy VII
Cecha statystyczna: liczba punkt贸w w te艣cie na inteligencje
Tworzenie szeregu rozdzielczego dla cechy ci膮g艂ej
xmin = 21,5
xmax = 129,5
n = 100
Rozst臋p=xmax - xmin = 180
LP |
Przedzia艂y klasowe |
|
|
|
|
1 |
|
2 |
0,02 |
30 |
0,02 |
2 |
|
7 |
0,07 |
50 |
0,09 |
3 |
|
20 |
0,20 |
70 |
0,29 |
4 |
|
36 |
0,36 |
90 |
0,65 |
5 |
|
25 |
0,25 |
110 |
0,90 |
6 |
|
10 |
0,10 |
130 |
1,00 |
|
|
100 |
1,00 |
|
|
Warto艣膰 w punktach pocz膮tkoych dystrybutanty empirycznej Fn(xi)
Miary Po艂o偶enia
Warto艣膰 艣rednia
pr贸ba nieuporz膮dkowana:
szereg punktowy o grupach
o liczebno艣ciach wyznaczonych przez warto艣ci
szereg podzia艂owy
r - liczba podzia艂贸w
n - liczba element贸w
ni - liczebno艣膰 i-tego przedzia艂u
- 艣rodek i-tego przedzia艂u
Warto艣膰 medialna ( 艣rodkowa )
Warto艣c medialna - warto艣膰 艣rodkowa w uporz膮dkowanym ci膮gu danych, tzn. 50% obeserwacji jest mniejszych do me i 50% wi臋kszych.
pr贸ba uporz膮dkowana
, szereg punktowy
szereg rozdzielczy podzia艂owy
xk - dolna granica podzia艂u, gdzie znajduje si臋 mediana
nk - liczebno艣c tego przedzia艂u
h - d艂ugo艣膰 przedzia艂u klasowego
k - liczba przedzia艂贸w klasowych
k = 5,6
h - d艂ugo艣膰 przedzia艂u klasowego
Przedzia艂y
xmin = 21,5
xmax = 129,5
r = 6
n = 100
Odp. 艢rednia wynosi 91 punkt贸w
Odp. W te艣cie na inteligencje uczniowie najcz臋艣ciej uzyskiwali 91 punkt贸w
Odp. 艢rednia wynosi 91,94
Analiza zmienno艣ci
Wynagrodzenie roczne w z艂
I |
II |
III |
16335 |
14850 |
8910 |
17820 |
17820 |
17820 |
19305 |
20790 |
26730 |
Miary zmienno艣ci ( rozproszenia )
Obszary zmienno艣ci ( rozst臋p )
Odchylenie standardowe
danie nieuporz膮dkowane
szereg punktowy
szereg rozdzielczy
Wsp贸艂czynnik zmienno艣ci
Wsp贸艂czynnik asymetrii
1)
2)
Poj臋cia i definicje
11
x
mo
A>0
asymetria prawostronna
x = mo
A=0
rozk艂ad symetryczny
艢redniej nie liczymy, gdy w szeregu wyst臋puj膮 przedzia艂y otwarte
1,0
0,5
140
120
100
80
60
40
20
D艂ugo艣膰 przedzia艂u w kt贸rym ta warto艣膰 si臋 znajduje
x
ni
40
36
25
20
10
7
2
140
120
100
80
60
40
20
Diagram
Histogram
Fn(x)
x
0,91
0,74
0,49
0,17
0,05
0
1
2
3
4
5
6
7
8
ni - liczba stron
xi - liczba b艂臋d贸w
8
7
6
5
4
3
2
1
0
1
3
5
10
15
17
19
xi
ni
L
P
L
P
+ cz臋艣ciowe przetwarzanie
Ankiety, czujniki pomiarowe inne dane osi膮gane z bada艅
przetwarzanie
transmisja
nadajnik
Po艣rednie - przez pewn膮 wielko艣膰 okre艣lamy inn膮 wielko艣膰
Bezpo艣rednie - pomiar przez miar臋 odpowiedniej wielko艣ci np. linijk膮
Pomiary
STATYSTYKA MATEMATYCZNA
STATYSTYKA OPISOWA
STATYSTYKA