Pojęcie i definicje
STATYSTYKA jest to zbiór metod i systemów służących do:
pozyskiwania danych
przetwarzania tych danych
ich analizy
Jako skutek tego powstaje zbiór danych użytecznych i uogólnione informacje
o zjawiskach i problemach które były przedmiotem badań
Pozyskiwanie danych:
pomiary - porównywanie danych wielkości ze wzorem
Podział fizykalny
badania statystyczne ( mają charakter ankietowy ) - dzielimy je na wymierne
i niewymierne dane. Są badania niszczące ( np. RTG ) i nieniszczące
Dokładność pomiarów - pomiar winien być wynikiem analizy
5%-8% - badniania ekspolatacyjne
0,1%-1% - badania naukowe
Urządzenia pomiarowe powinny być o klasę wyższe niż wartośc mierzona
Błąd bezwzględny
xm - x mierzome
xo - wielkość rzeczywista
W praktyce technicznej przyjmuje się wielkość xo dokonaną urządzeniem pomiarowym wyższej klasy.
Błąd względny
Błędy systematyczne - błędy związane ze złym doborem metody lub poszczególnych parametrów.
Badanie ankietowe - spisy kontrolne trzody chlewnej gospodarstw chłopskich. Wysyła się ankiety. W tych badaniach trzeba zwrócić uwagę na weryfikację danych
Próby losowe - mogą być bardzo różne
Metoda losowania prostego ( metoda zwrotna ) - polega na tym, że kolejne losowania próby mają identyczne warunki, tzn. warunki losowania są niezmienne ( los po wylosowaniu wraca do puli )
Prezentacja wynków
Przedstawianie danych
Tabelaryczne - zbiór wyników danych przetworzonych i usystematyzowanych
w pewne klasy grupujące cechy lub charakterystyki wspólne. Te tabele są często przetworzone
Liczebność pracowników
|
Ilość godzin wypracowanych |
Roboczogodziny |
|
|
liczebność |
|
|
|
Gdy podzielimy ilość roboczogodzin przez liczebność to w ten sposób tworzone są pewne dane z jednej strony. Potem dane są przetwarzane.
Graficzne
Histogram
Wykres
Zadanie:
Zbadano liczbę błędów znajdujących się na różnych stronach maszynopisu
i otrzymano następujące wyniki
4 |
4 |
4 |
3 |
1 |
2 |
0 |
5 |
6 |
1 |
5 |
5 |
3 |
2 |
2 |
1 |
3 |
2 |
3 |
0 |
3 |
1 |
2 |
5 |
3 |
2 |
4 |
2 |
4 |
4 |
2 |
4 |
3 |
2 |
1 |
3 |
2 |
3 |
4 |
5 |
4 |
3 |
0 |
0 |
3 |
3 |
2 |
2 |
2 |
2 |
3 |
1 |
2 |
2 |
3 |
2 |
4 |
3 |
1 |
2 |
Zbiorowość stystyczna - zbiór stron maszynopisu n=60
Cecha statystyczna - liczba błędów ( cecha skokowa )
Punktowy szereg rozdzielczy:
xi |
Ni |
wi |
n(xi) |
Fn(xi) |
0 |
3 |
0,05 |
3 |
0,05 |
1 |
7 |
0,12 |
10 |
0,17 |
2 |
19 |
0,32 |
29 |
0,49 |
3 |
15 |
0,25 |
44 |
0,74 |
4 |
10 |
0,17 |
54 |
0,91 |
5 |
5 |
0.08 |
59 |
0,99 |
6 |
1 |
0,01 |
60 |
1,00 |
|
60 |
1,00 |
|
|
,
,
,
,
,
Graficzna prezentacja rozkładu cechy skokowej
Pojęcie liczebności
Liczeność skumulowana
Dystrybutanta empiryczna
Dane przedstawiamy za pomocą szeregów statystycznych
Rozkład empiryczny
- dane
Rozkład empiryczny cechy - nazywamy przyporządkowaniem kolejnym wartościom tej cechy odpowiadającym ich liczebności lub częstości względnych
- różne wartości cechy
- liczebność
Częstość względna
Wartość skumulowana
Dystrybutanta empiryczna cechy skokowej
Zadanie:
Zbiorowość statystyczna: uczniowie klasy VII
Cecha statystyczna: liczba punktów w teście na inteligencje
Tworzenie szeregu rozdzielczego dla cechy ciągłej
xmin = 21,5
xmax = 129,5
n = 100
Rozstęp=xmax - xmin = 180
LP |
Przedziały klasowe |
|
|
|
|
1 |
|
2 |
0,02 |
30 |
0,02 |
2 |
|
7 |
0,07 |
50 |
0,09 |
3 |
|
20 |
0,20 |
70 |
0,29 |
4 |
|
36 |
0,36 |
90 |
0,65 |
5 |
|
25 |
0,25 |
110 |
0,90 |
6 |
|
10 |
0,10 |
130 |
1,00 |
|
|
100 |
1,00 |
|
|
Wartość w punktach początkoych dystrybutanty empirycznej Fn(xi)
Miary Położenia
Wartość średnia
próba nieuporządkowana:
szereg punktowy o grupach
o liczebnościach wyznaczonych przez wartości
szereg podziałowy
r - liczba podziałów
n - liczba elementów
ni - liczebność i-tego przedziału
- środek i-tego przedziału
Wartość medialna ( środkowa )
Wartośc medialna - wartość środkowa w uporządkowanym ciągu danych, tzn. 50% obeserwacji jest mniejszych do me i 50% większych.
próba uporządkowana
, szereg punktowy
szereg rozdzielczy podziałowy
xk - dolna granica podziału, gdzie znajduje się mediana
nk - liczebnośc tego przedziału
h - długość przedziału klasowego
k - liczba przedziałów klasowych
k = 5,6
h - długość przedziału klasowego
Przedziały
xmin = 21,5
xmax = 129,5
r = 6
n = 100
Odp. Średnia wynosi 91 punktów
Odp. W teście na inteligencje uczniowie najczęściej uzyskiwali 91 punktów
Odp. Średnia wynosi 91,94
Analiza zmienności
Wynagrodzenie roczne w zł
I |
II |
III |
16335 |
14850 |
8910 |
17820 |
17820 |
17820 |
19305 |
20790 |
26730 |
Miary zmienności ( rozproszenia )
Obszary zmienności ( rozstęp )
Odchylenie standardowe
danie nieuporządkowane
szereg punktowy
szereg rozdzielczy
Współczynnik zmienności
Współczynnik asymetrii
1)
2)
STATYSTYKA
STATYSTYKA OPISOWA
STATYSTYKA MATEMATYCZNA
Pomiary
Bezpośrednie - pomiar przez miarę odpowiedniej wielkości np. linijką
Pośrednie - przez pewną wielkość określamy inną wielkość
nadajnik
transmisja
przetwarzanie
Ankiety, czujniki pomiarowe inne dane osiągane z badań
+ częściowe przetwarzanie
P
L
L
P
ni
xi
19
17
15
10
5
3
1
0
1
2
3
4
5
6
7
8
ni - liczba stron
xi - liczba błędów
8
7
6
5
4
3
2
1
0
0,05
0,17
Diagram
0,49
0,74
Histogram
0,91
x
Fn(x)
20
40
60
80
100
120
140
2
7
10
20
25
36
40
ni
x
Długość przedziału w którym ta wartość się znajduje
x
Średniej nie liczymy, gdy w szeregu występują przedziały otwarte
1,0
x = mo
0,5
mo
A>0
asymetria prawostronna
A=0
rozkład symetryczny
140
120
100
80
60
40
20