STATYSTYKA (28.02.2010r.)
STATYSTYKA - badanie prawidłowości w zjawiskach masowych, do badań wykorzystuje się określone metodologie badawcze.
Odchylenia od prawidłowości - spowodowane działaniem czynników ubocznych/ przypadkowych/ losowych.
Zbiorowość określamy tzw. cechami stałymi. Każda jednostka zbiorowości ma 3 cechy stałe:
Rzeczowa (kto, co?)
Czasowa (kiedy?)
Przestrzenna (gdzie?)
Przedmiotem badań statystycznych są cechy zmienne, których wartości mogą różnić się w różnych jednostkach.
Mierzalne (wzrost, wielkość dochodu)
Ciągłe (wzrost), quasi-ciągłe
Skokowe (ilość osób w rodzinie) - najczęściej mają wartości liczb naturalnych (plus 0)
Niemierzalne (płeć, pochodzenie społeczne)
Badania statystyczne mogą obejmować wszystkie jednostki zbiorowości i wówczas mówimy o badaniach całkowitych (np. narodowy spis powszechny, rejestry, inwentaryzacja).
Obok badań całkowitych wyróżniamy badania częściowe:
badanie statystyczne metodą reprezentacyjną, polegające na tym, że z populacji pobieramy próbę statystyczną w sposób losowy; ustala się minimalną liczebność próby; wyniki badań próby uogólniamy na całą zbiorowość/populację; wbrew pozorom uznaje się za dokładniejsze od badań całkowitych;
badanie ankietowe - powyżej 30 jednostek - próba dostateczna
Bardzo ważną rzeczą w badaniach jest sprawdzenie wiarygodności materiału statystycznego. Należy sprawdzić czy nie występują tam błędy. Mogą to być błędy:
Przypadkowe - które w dużej liczbie obserwacji nie odgrywają bardzo ważnej roli.
Systematyczne - które należy bezwzględnie wyeliminować
Dane statystyczne/materiał statystyczny może mieć charakter:
pierwotny - są bezpośrednio zbierane dla celów statystycznych w trakcie organizacji badania statystycznego
wtórny - zebrane przedtem do innych celów
W badaniach statystycznych posługujemy się szeregami statystycznymi. Dane statystyczne opracowujemy w postaci szeregów statystycznych. Wyróżniamy:
szeregi szczegółowe (wyliczające) - określamy cechę zmienną xi, wyróżniamy poszczególne warianty - x1, x2, … ,xn . Możemy ten szereg uporządkować rosnąco (niemalejąco) - każda następna wartość będzie równą bądź większa od poprzedniej; malejąco. Budujemy ten szereg stosunkowo rzadko.
szeregi rozdzielcze - w rocznikach statystycznych;
jednostopniowe - występują 2 kolumny - w pierwszej warianty, bądź ich przedziały (xi), druga - liczebności (ni). Najczęściej takie szeregi budujemy dla cech skokowych
wielostopniowe - 2 kolumny - w pierwszej przedziały wariantów (xi0 - dolna granica przedziału, xi1 - górna granica przedziału; w drugiej liczebności (ni)
dla cech niemierzalnych - badanie wg płci, typu ukończenia szkoły średniej.
W opracowaniu danych statystycznych wykorzystujemy wykresy statystyczne (są w rocznikach statystycznych):
liniowe
powierzchniowe
obrazkowe
Należy pamiętać, żeby nie popełniać błędów powodujących sugestię statystyczną (np. zamalowanie jednego elementu wykresu na jaskrawy kolor - może zasugerować większą wartość danej wielkości).
Rocznik statystyczny - dane statystyczne są ujmowane w tablicach statystycznych.
Tablica statystyczna - musi mieć tytuł(powinny być uwzględnione 3 cechy stałe), numer, tablica składa się z główki, boczku i tablicy właściwej; musi być podane źródło badania.
(odczytać znaki umowne, które są wykorzystane w tablicach) * !!!
09.05.2010r.
STATYSTYCZNE BADANIE WSPÓŁZALEŻNOŚCI ZJAWISK
Rodzaje metod statystycznych:
Współczynnik korelacji wg momentu iloczynowego Pearsona (współczynnik korelacji liniowej) - jest on miarą unormowaną przyjmującą wielkości od -1 do +1. Jeżeli przyjmuje wartości ujemne, to mamy do czynienia z korelacją ujemną (wzrost cen wpływa na spadek obrotów); jeżeli współczynnik korelacji przyjmuje wartości od 0 do +1 - korelacja dodatnia (współzależność dodatnia) - wzrost/spadek wielkości jednej cechy będzie odpowiadał wzrost/spadek wielkości innej cechy. Im współczynnik korelacji jest bliższy co do modułu (wartości bezwzględnej) liczby 1, tym zależność jest ściślejsza. Im współczynnik co do modułu będzie bliższy liczby 0, tym zależność będzie słabsza.
-1 ≤ rxy ≤ 1. Jeśli współczynnik = 0, to powiemy, że nie ma zależności pomiędzy cechą x a y. Jeśli współczynnik przyjmie wartości skrajne * -1 lub 1, to nie będziemy mieli do czynienia z korelacją liniową, a punktową.
rxy= i=1nXi-XA(Yi-YA)n∙Sx∙Sy
Gdzie
n * liczba par obserwacji
Sx* odchylenie standardowe cechy x
0,0 - 0,3 * zależność słaba
0,3 - 0,5 * zależność duża
0,5 - 0,7 * zależność bardzo duża
0,7< * zależność wysoce ścisła
Funkcja regresji - określa zależności pomiędzy konkretnymi wartościami jednej cechy, a średnimi wartościami innej cechy.
Pomiędzy dwoma cechami - jeżeli występują współzależności pomiędzy cechą y a cechą x, wówczas możemy zaproponować 2 funkcje regresji:
Yi= ay+by ∙ Xi
Gdzie
Yi - cecha objaśniana
Xi - cecha objaśniająca
ax