Statystyka- nauka badająca prawidłowości w zjawiskach masowych, do badań prawidłowości wykorzystywane są określone metody badawcze:
metody badania struktury zjawisk
metody badania współzależności zjawisk
metody badania dynamiki zjawisk
Prawidłowości występują w zbiorowościach statystycznych ponieważ na zjawiska działają przyczyny główne( działają one w sposób jednakowy, w ściśle określonym kierunku)
Odchylenia od prawidłowości spowodowane są działaniem przyczyn ubocznych( które działają na każde zjawisko w sposób odmienny, źródłem tych przyczyn są czynniki zewnętrzne).
Zbiorowość określamy tzw. cechami stałymi, każda jednostka zbiorowości ma 3 cechy stałe:
rzeczową( kto? co?)
czasową( kiedy?)
przestrzenną( gdzie?)
Przedmiotem badań statystycznych są cechy zmienne, których wartości mogą różnić się w różnych jednostkach.
Cechy zmienne dzielimy na:
mierzalne( ilościowe) np. wzrost, liczba osób na utrzymaniu
niemierzalne( jakościowe, opisowe) np. płeć, ukończona szkoła
Cechy mierzalne:
ciągłe
skokowe
Cecha ciągła- gdy pomiędzy dwiema wartościami może się zmieścić jeszcze jedna wartość np. wzrost. Niektóre z tych cech mogą być półciągłe np. pieniądze.
Cecha skokowa- np. godzina, liczba osób w rodzinie.
Badania statystyczne mogą obejmować wszystkie jednostki zbiorowości i wtedy mówimy o badaniu całkowitym, np. spis statystyczny, inwentaryzacja.
Obok badań całkowitych wyróżniamy badania częściowe, np. badania statystyczne metodą reprezentacyjną, polegającą na tym, że z populacji pobieramy próbę statystyczną w sposób losowy. Wyniki badań z próby uogólniamy na całą zbiorowość( populację).Badanie ankietowe jest również badaniem częściowym.
Bardzo ważna jest wiarygodność materiału statystycznego, należy sprawdzić czy w materiale statystycznym nie występują błędy:
przypadkowe( które w dużej liczbie obserwacji nie odgrywają bardzo ważniej roli),
systematyczne( które należy bezwzględnie wyeliminować).
Materiały statystyczne( dane statystyczne) mogą mieć charakter:
pierwotny
wtórny
Dane pierwotne są bezpośrednio zbierane dla celów statystycznych w trakcie organizacji badania statystycznego.
Dane zebrane dla innych celów to dane wtórne( wtórny materiał statystyczny).
W badaniach statystycznych posługujemy się szeregami statystycznymi. Dane statystyczne opracowujemy w postaci szeregów statystycznych.
Wyróżniamy szeregi:
szczegółowe( wyliczające)
rozdzielcze
jednostopniowe
wielostopniowe
Szereg Szczegółowy
Xi
Badamy cechę statystyczną, może ona mieć różne warianty
xi Czas dojazdu
do pracy
studentów
x1 30
x2 45
x3 35
x4 60
....
xn 120
Jest nieuporządkowany, można go uporządkować rosnąco lub malejąco.
Szereg rozdzielczy jednostopniowy(2 kolumny)
xi ni
Liczba os. w gosp. dom Liczba gospodarstw
20
50
70
140
100
30
10
Najczęściej takie szeregi budujemy dla cech skokowych.
Szereg rozdzielczy wielostopniowy
xi 0 - xi 1 ni
15
40
10
12
10
8
70- 1
i więcej
Szeregi rozdzielcze budujemy również dla cech niemierzalnych.
Szereg rozdzielczy niemierzalny
Płeć Liczba studentów
K 1200
M 2100
Razem 3300
W opracowaniu danych statystycznych wykorzystujemy wykresy statystyczne:
liniowe
powierzchniowe
obrazkowe
Należy w wykresach unikać błędów, które powodują sugestię statystyczną.
Roczniki statystyczny jest zbiorem tablic statystycznych.
Tablica statystyczna zawiera:
tytuł
tablicę właściwą
źródło
Tytuł
Główka tablicy
|
|
Tablica właściwa
|
Boczek tablicy |
Źródło
Źródła badań:
własne(ankiety)
rocznik statystyczny
dokumenty firmy
Średnia arytmetyczna
Dyspersja
Miary asymetrii
Miary koncentracji wokół przeciętnych
Średnia arytmetyczna
Średnie arytmetyczne możemy obliczać dla szeregów szczegółowych oraz rozdzielczych jedno i wielostopniowych.
x1+x2+x3+....+x10
x = szereg szczegółowy
10
Czas wykorzystany przez 50 turystów na wypoczynek i turystykę
xi0-xi1 |
ni |
n |
Wi=n1
|
° x1 |
° x1*n |
°
|
°
|
°
|
°
|
°
|
°
|
0-2 |
5 |
0,10 |
10% |
1 |
5 |
-3 |
9 |
45 |
15 |
-27 |
-135 |
2-4 |
25 |
0,50 |
50% |
3 |
75 |
-1 |
1 |
25 |
25 |
-1 |
-25 |
4-6 |
12 |
0,24 |
24% |
5 |
60 |
1 |
1 |
12 |
12 |
1 |
12 |
6-8 |
6 |
0,12 |
12% |
7 |
42 |
3 |
9 |
54 |
18 |
27 |
162 |
8-10 |
2 |
0,04 |
4% |
9 |
18 |
5 |
25 |
50 |
10 |
125 |
250 |
Σ |
50 |
1,00 |
100% |
X |
200 |
X |
X |
186 |
80 |
X |
264 |
º
∑ xi* n1 200
x = n = = 4
50
int. W badanej zbiorowości 50 turystów średnia arytmetyczna czasu wykorzystanego na wypoczynek wynosi 4 godziny.
Odchylenie standardowe
Dla szeregu szczegółowego
°
Se= ∑(xi-x)²
√ N
Dla szeregu rozdzielczego wielostopniowego
°
Se= Σ (xi-x )²ni = 186 = 1,93
√ N √ 50
1,93
Vx=
*100= 48%
Miary asymetrii
asymetria
Do badania asymetrii wykorzystujemy względną miarę asymetrii i bezwzględną miarę asymetrii.
Dla szeregu rozdzielczego
º
(x1-x )³ ni
µ3= = 264 = 5,28 bezwzględna miara asymetrii
N 50
Wyróżniamy asymetrię dodatnią i ujemną.
Względna miara asymetrii
ά3= μ3
se3
5,28
ά 3= 1,933 = 0,734; (-2<ά3< 2)
symetria
Koncentracja wokół przeciętnej
Do analizy koncentracji od średniej arytmetycznej wykorzystamy bezwzględną i względną miarę koncentracji.
°
( x1-x)ni
μ4=
N bezwzględna miara koncentracji
μ4
ά4= se4
2178 = 43,5
μ4= 50
43,5
ά4= 1,934= 3,14 ( ά4 = 3, rozkład normalny)
Rozkład dzwonowy( symetryczny)
Funkcja regresji ma charakter zależności między konkretnymi wartościami jednej cechy( np. cechy Y), a średnimi wartościami innej cechy( np. cechy X).
|
Lata |
Yi |
Xi |
Yi- YA
|
Xi- XA |
|
i |
|
|
|
|
2006 |
IV |
30,8 |
9335,8 |
-4,42 |
-3602,7 |
2007 |
I |
30,2 |
8854,4 |
-5,02 |
-4170,74 |
|
II |
38,0 |
13875,4 |
2,78 |
848,43 |
|
III |
46,0 |
22187,8 |
10,78 |
9160,0 |
|
IV |
32,0 |
1005,9 |
-3,22 |
299,27 |
2008 |
I |
38,6 |
9348,2 |
-5,02 |
-3718,57 |
|
II |
45,6 |
14712,6 |
3,38 |
1685,4 |
|
III |
34,3 |
22481,8 |
10,38 |
9454,63 |
|
IV |
29,5 |
10142,8 |
-3,92 |
-2884,53 |
2009 |
I |
|
9837,6 |
-5,72 |
-3689,57 |
Razem |
|
362,2 |
302747,0 |
0 |
0 |
Współczynniki regresji, które należy oszacować na podstawie obserwacji wielkości cechy X i cechy Y( ay,by).
by- informuje nas o ile się zmieni wielkość cechy y, jeżeli wielkość cechy x wzrośnie o jednostkę.
ˆ ˆ ˆ
Yi= ay+ by· xi
Sx 6,950477
by= rxy· _ = 0,98883· = 0,0011991
sy 5026,159
xi będzie funkcją regresji yi
sx- odchylenie standardowe cechy x
ˆ _ ˆ _
ay= YA- by· XA= 35,22- 0,061991· 13027,47= 19,599
ˆ
Yi= 19,59+ 0,0011991·xi
Jeżeli wielkość cechy Xi wzrośnie o jednostkę( 1000 miejsc to środek rzeczy biorąc wykorzystanie miejsc noclegowych) liczone w % wzrośnie o 0,0011991( czyli 12%).
Do badanie dynamiki wykorzystujemy indeksy proste o podstawie stałej oraz indeksy o podstawie łancuchowej.
Okresy lub momenty czasu
YT- liczba turystów przybywających do obszaru liczona w tysiącach osób.
Lata |
YT |
2005 |
200 |
2006 |
220 |
2007 |
260 |
2008 |
240 |
2009 |
250 |
Indeks wartości
YT
Iw= Y0
YT
Ix= YD -1·100
Funkcja tendencji
ay+by·T
Zjawisko y jest funkcją czasu
Zmienna czasowa( T) przyjmuje wartości wzrastające o jednostkę( czyli przyjmuje wartości kolejnych liczb naturalnych).
Wielkość zjawiska jest funkcją czasu
Bardzo często obok tendencji rozwojowej występują wahania sezonowe powtarzające się w okresie co czwarty kwartał albo 12 miesięcy w kolejnych latach.
Statystyczne badanie współzależności zjawisk
współczynnik korelacji liniowej Persona- przyjmuje wartości (-1;1)
Jeżeli przyjmuje wartości ujemne mamy do czynienia z korelacją ujemną( -1;0).
Jeżeli współczynnik przyjmuje wartości dodatnie(0;1) to mamy do czynienia z korelacją dodatnią.
Wzrostowi wartości jednej cechy towarzyszy wzrost drugiej cechy, spadkowi wartości jednej cechy towarzyszy spadek drugiej cechy.
Im współczynnik korelacji jest bliższy co do modułu( wartości bezwzględnej)liczby 1 tym zależność jest ściślejsza. Im współczynnik jest bliższy liczby 0 tym zależność będzie mniejsza.
-1<rxy<1
0 nie ma współzależności między jedną cechą a drugą.
n
Σ (Xi-XA)*( Yi-YA)
rxy=
n*sx*sy
sy
Yi= oy+by*Xi; by= rxy* sx =
oxy = YA- by* XA=
Funkcja regresji- zależność między wartościami konkretnymi jednej cechy a średnimi wartościami drugiej cechy.
Cecha objaśnianaYi= ay+ by* xi cecha objaśniająca
Współczynniki regresji
Parametry strukturalne
by- informuje o ile zmieni się...