STATYSTYSTYKA OPISOWA pierwszy wykład 14.02.2009
Literatura obowiązkowa
1) A. Luszniewicz T. Słaby, Statystyka z pakietem komputerowym STATISTICA PL. Teoria i zastosowania. C. H. Beck Warszawa 2008, wyd. 3
2) Statystyka w zarządzaniu red. Naukowa A. Luszniewicz, WSFiZ Białystok 2006
Statystyka - to dyscyplina wiedzy zajmująca się metodami analizy danych ilościowych, które odnoszą się do powtarzalnych masowych zjawisk (zjawisk występujących wielokrotnie) lub wyników eksperymentów.
Badania empiryczne (oparte na doświadczeniu) poświęcone ujawnianiu i ustalaniu prawidłowości w świecie zjawisk masowych nazywać będziemy badaniami statystycznymi, a metody prowadzenia tych badań metodami statystycznymi.
Podstawowe zadanie statystyki to analiza i interpretacja danych. Wykorzystanie do tego celu środki określa się mianem metod opisu statystycznego.
W wielu przypadkach zebranie wszystkich potencjalnych danych nie jest możliwe. W takiej sytuacji należy wypowiadając się o danym zjawisku na podstawie zebranych w odpowiedni sposób danych. Jest to przedmiotem tzw. statystyki matematycznej.
Podstawowe pojęcia statystyczne:
Zbiorowość statystyczna - zbiór danych elementów (osób, rzeczy, zjawisk) objętych badaniem statystycznym.
Liczebność zbiorowości - (n) liczba wszystkich jednostek w zbiorowości statystycznej.
Populacja generalna - (zbiorowość generalna) pojecie związane ze skończonym lub nieskończonym zbiorem jednostek, które zamierzamy poddać obserwacji empirycznej tzw. badaniu pełnym (wyczerpującym).
Próba - część (podzbiór) zbiorowości generalnej, która podlega bezpośrednio badaniu empirycznemu ze względu na ustaloną cechę w celu wyciągnięcia wniosku o kształtowaniu się wartości tej cechy w całej populacji generalnej.
Próba losowa - próba, po której jednostki dobrane zostały z całej populacji w sposób losowy, tzn. w taki sposób, że tylko przypadek decyduje o tym, którym elementem populacji generalnej znalazł się w próbie, a który nie.
Jednostki wchodzące w skład badanej zbiorowości oznacza się pewnymi własnościami. Własności te określone są mianem cech statystycznych (xi)
Cechy |
STAŁE- warianty są takie same dla wszystkich jednostek(nie podlegają badaniu statystycznemu) |
|
ZMIENNE- różnicują badanie jednostki (podlegają badaniom statystycznym) |
MIERZALNE ( ilościowe ) - warianty są wyrażane w liczbach (wiek, wzrost) |
|
SKOKOWE - przyjmuje pewne określone warianty zmieniające się skokami |
|
CIĄGŁE - może przyjąć dowolną wartość z pewnego określonego przedziału liczbowego np. wzrost, wiek |
|
QUOSI -ilościowe |
Etapy badań statystycznych:
Projektowanie badania statystycznego
Zebranie materiału statystycznego i kontrola pod względem prywatności i komplementarności
Opracowanie zebranego materiału
Przedmiotowa i metodologiczna analiza wniosków
Szereg statystyczny - to zestawienie wartości zmiennych cechy badanej, uporządkowanie według logicznego kryterium z przyporządkowanymi im odpowiednio częstościami ich występowania.
Rodzaje szeregów statystycznych:
Szeregi statystyczne |
Szereg szczegółowy - jest to materiał statystyczny uporządkowany wyłącznie według wartości badanej cechy (np. w kolejności rosnącej lub malejącej).
Szereg rozdzielczy (rozkład empiryczny) jest to zbiór wartości liczbowych uporządkowanych według wartości badanej cechy mierzalnej lub niemierzalnej, przy czym poszczególnym wartościom zmiennej przyporządkowane są odpowiadające im liczebności.
Dla cechy skokowej budujemy szereg rozdzielczy - punktowy zaś dla cechy ciągłej szereg rozdzielczy - przedziałowy.
Budowa szeregu rozdzielczo - punktowego:
cecha |
liczebność |
xi |
ni |
x1 |
n1 |
x2 |
n2 |
… |
… |
xk |
nk |
suma |
ni |
Liczebność zbiorowości
Szereg rozdzielczo - punktowy dla przykładu 1
n= 32 komputery
x - liczba napraw (cecha skokowa)
liczba napraw |
liczba komputerów |
|
|
xi |
ni |
wi |
wi% |
0 |
5 |
0,16 |
16 |
1 |
6 |
0,19 |
19 |
2 |
10 |
0,31 |
31 |
3 |
5 |
0,16 |
16 |
4 |
4 |
0,13 |
13 |
5 |
2 |
0,06 |
6 |
suma |
32 |
1,00 |
100 |
Budowa szeregu rozdzielczo - przedziałowego:
xoi - x1i |
ni |
xo1 - x1i |
n1 |
xo2 - x12 |
n2 |
… |
… |
xok - x1k |
nk |
suma |
n |
Szereg rozdzielczo - przedziałowy dla przykłady 1
Przed zbudowaniem szeregu rozdzielczo przedziałowego musimy zdecydować o:
liczbie przedziałów klasowych
długości przedziałów klasowych
sposobie domykania końców przedziałów
liczba przedziałów klasowych
k≈
gdzie:
k - liczba przedziałów klasowych
n- liczebność zbiorowości
Dla przykłady 2
Długość przedziałów klasowych
Gdzie:
h- długość przedziału (interwall)
Xmax - największy wariant cechy x
Xmin - najmniejszy wariant cechy
k- liczba przedziałów klasowych
dla danych z przykładu 2
n=32 komputery
Y - koszt naprawy (zł)
<5 - 10> zamknięty z 5 i 10
(5- 10) otwarty bez 5 i 10
<5 - 10) z 5 i 10
(5 - 10> bez 5 z 10
Yoi - Y1i |
ni |
wi |
wi% |
0 - 100 |
9 |
0,28 |
28 |
100 - 200 |
6 |
0,19 |
19 |
200 - 300 |
3 |
0,09 |
9 |
300 - 400 |
7 |
0,22 |
22 |
400 -500 |
5 |
0,16 |
16 |
500- 600 |
2 |
0,06 |
6 |
suma |
32 |
|
|
Wskaźniki struktury (częstości) -
Procentowe wskaźniki struktury -
Szczegółowe (wyliczające)
Rozdzielcze (strukturalne)
Przestrzenne (geograficzne)
Czasowe (dynamiczne)
Cech mierzalnych
Cech niemierzalnych
punktowe
przedziałowe