Funkcje statystyki:
STATYSTYKA DLA FiR UMCS
·ð Informacyjna dostarczenie wiarygodnych danych dajÄ…cych peÅ‚ny i
obiektywny obraz badanych zjawisk
·ð Analityczna wskazanie czynników ksztaÅ‚tujÄ…cych procesy i zjawiska
1. WIADOMOŚCI OGÓLNE.
·ð Prognostyczna przewidywanie poziomu i struktury zjawisk w przyszÅ‚oÅ›ci
Statystyka jako:
Zbiorowość (populacja) statystyczna zbiór elementów dowolnych
·ð Zbiór danych liczbowych prezentujÄ…cych ksztaÅ‚towanie siÄ™ zjawisk i
(osób, przedmiotów, faktów), podobnych (ale nie identycznych) pod względem
procesów
określonych cech i poddanych badaniom statystycznym.
·ð Nazwa prac obejmujÄ…cych gromadzenie, opracowywanie i prezentacjÄ™
Jednostka statystyczna element składowy zbiorowości statystycznej
danych liczbowych
poddanej bezpośredniej obserwacji lub pomiarowi (obiekt badania).
·ð Nazwa charakterystyk liczbowych wyznaczanych na podstawie obserwacji
Zbiorowość generalna wszystkie jednostki statystyczne, co do
zbiorowości próbnych
których formułowane są wnioski ogólne.
·ð Nazwa dyscypliny naukowej
Zbiorowość próbna (próba) podzbiór populacji generalnej,
Statystyka w ostatnim znaczeniu jest naukÄ… zajmujÄ…cÄ… siÄ™ badaniem
obejmujący część jej elementów wybranych w określonych sposób. próba
prawidłowości zjawisk masowych.
podlega badaniu statystycznemu, a jego wynik jest uogólniany na zbiorowość
Zjawiska masowe to takie, które często się powtarzają i poprzez to
ogólną.
wykazują określone prawidłowości. Prawidłowości nie są możliwe do
Z uwagi na różne uwarunkowania, analizie poddawana jest cała
zaobserwowania w pojedynczych przypadkach. PowstajÄ… one w wyniku
zbiorowość (badanie pełne, kompletne, całkowite) lub tylko jej część (badanie
oddziaływania na zjawiska przyczyn głównych (systematycznych) oraz
częściowe).
ubocznych (przypadkowych). Przyczyny główne oddziaływają jednakowo lub
Badanie kompletne dostarcza pełnej informacji o populacji.
podobnie na wszystkie jednostki badanej zbiorowości, natomiast uboczne
Badanie częściowe przeprowadza się w przypadkach, gdy nie ma
wpływają różnokierunkowo, przy czym w dużej liczbie przypadków wykazują
możliwości wykonania badania pełnego lub jest ono nieracjonalne z
tendencjÄ™ do znoszenia siÄ™.
ekonomicznego punktu widzenia. Brak możliwości może wynikać z
Przykłady zdarzeń masowych:
konieczności wyniszczenia populacji lub gdy jest ona nieskończona. Druga
·ð Produkcja przedsiÄ™biorstw
sytuacja występuje gdy przewidywane koszty badania pełnego przekroczyłyby
·ð Ceny dóbr
spodziewane korzyści (zyski).
·ð Kursy akcji
W takich przypadkach przeprowadza się badanie częściowe, do którego
·ð Konsumpcja gospodarstw domowych
wybiera się tylko część elementów badanej populacji, tzw. próbę. Bardzo
ważną sprawą jest by potrafić rozróżnić próbę od populacji oraz by dobrać
Metody wykorzystywane do badania zjawisk masowych służą różnym
próbę tak, aby była ona reprezentatywna dla populacji by stanowiła jej
celom. Pozwala to na wyodrębnienie dwóch głównych działów statystyki:
miniaturę (struktura próby zbliżona do struktury populacji).
a) statystyki opisowej zajmuje siÄ™ metodami opisu danych statystycznych
Reprezentatywność próby zapewnia jej losowy wybór czyli taki, w
zebranych podczas badania statystycznego. Obejmuje ona programowanie
którym każdy element populacji ma jednakowe prawdopodobieństwo trafienia
badań statystycznych, metody obserwacji statystycznych, opracowanie i
do próby. Natomiast próba losowa jest podzbiorem elementów populacji
prezentację materiału statystycznego oraz sumaryczny opis danych
wylosowanych w taki sposób, że każdy podzbiór n elementów populacji ma
statystycznych. Celem statystyki opisowej jest podsumowanie zbioru
jednakowe szanse wylosowania.
danych i wyciągnięcie wniosków i uogólnień na temat badanego zbioru.
b) Statystyki matematycznej zajmuje się metodami wnioskowania o całej
Przedmiotem badania statystycznego są cechy, które mogą mieć różny
zbiorowości generalnej na podstawie wyników uzyskanych z wybranej jej
charakter.
części, zwanej próbą. Do tego celu wykorzystywany jest rachunek
prawdopodobieństwa i inne działy matematyki.
Strona 1 z 6
Podział cech statystycznych: c. Czasowa: wrzesień 2009
1) Stałe są wspólne dla wszystkich jednostek danej zbiorowości i nie 2) Zmienna:
podlegają badaniu, a jedynie decydują o zaliczeniu jednostki do określonej a. Wydatki na podręczniki (zł): cecha ilościowa, quasi-ciągła, mierzalna
zbiorowości; b. Ilość zakupionych podręczników (szt.): mierzalna, ilościowa, skokowa.
a. Rzeczowe określają co lub kto jest poddawany badaniu
b. Przestrzenne wykazuje gdzie odbywa siÄ™ badanie
c. Czasowe informujÄ… jaki okres obejmuje badanie lub w jakim
2. PROCES BADANIA STATYSTYCZNE GO .
momencie siÄ™ ono odbywa
2) Zmienne właściwości różnicujące poszczególne elementy zbiorowości;
Etapy badania statystycznego:
podlegają badaniu; występują w co najmniej dwóch odmianach zwanych
·ð Projektowanie badania statystycznego:
wariantami (wartościami) cechy:
-ð OkreÅ›lenie celu badania
a. Niemierzalne (jakościowe, kwalitatywne) ich warianty ustala się w
-ð Zdefiniowanie zbiorowoÅ›ci i jednostki statystycznej
sposób opisowy (np. płeć)
-ð Wybór cech statystycznych
b. Mierzalne (ilościowe, kwantytatywne) zwane również zmiennymi;
-ð Dobór metody badania statystycznego
można je zmierzyć i wyrazić za pomocą liczb (wiek, wzrost itp.)
-ð Wskazanie zródeÅ‚ pozyskania danych
·ð Skokowe (dyskretne) przyjmujÄ… skoÅ„czony lub przeliczony
-ð Opracowanie formularzy statystycznych i wzorów tablic wynikowych
zbiór wartości na danej skali liczbowej, przy czym najczęściej
oraz zapewnienie kontroli materiału statystycznego
jest to zbiór liczb całkowitych nieujemnych (np. liczba dzieci)
·ð Obserwacja statystyczna
·ð CiÄ…gÅ‚e mogÄ… przyjąć dowolnÄ… wartość z okreÅ›lonego
·ð Opracowanie i prezentacja materiaÅ‚u statystycznego
przedziału liczbowego, przy czym ilość miejsc po przecinku
·ð Opis lub wnioskowanie statystyczne.
zależy od dokładności pomiaru (waga, wzrost)
·ð Quasi-ciÄ…gÅ‚e ze swej natury sÄ… cechami skokowymi, natomiast
Cele badania statystycznego:
traktowane są jako ciągłe ze względu na bardzo dużą skalę
-ð Poznanie rozkÅ‚adu zbiorowoÅ›ci pod wzglÄ™dem wybranych cech (analiza
wartości jakie mogą przyjmować (np. wydatki gospodarstw
struktury)
domowych na konsumpcjÄ™)
-ð Ocena rodzajów zwiÄ…zków wystÄ™pujÄ…cych pomiÄ™dzy cechami (analiza
c. Quasi-ilościowe (porządkowe) kwantyfikują natężenie badanej
współzależności)
właściwości przedstawionej w sposób opisowy, porządkując w ten
-ð Poznanie zmian zbiorowoÅ›ci w czasie (analiza dynamiki).
sposób zbiorowość (np. oceny szkolne)
Opracowanie i prezentacja materiału statystycznego:
Przykład: 200 wybranych losowo uczniów LO w Krakowie poddano
Opracowany materiał należy odpowiednio zaprezentować wykorzystując jedną
badaniu ze względu na poziom wydatków i ilość zakupionych podręczników w
z form:
miesiącu wrześniu 2009 r.
-ð Szereg statystyczny
Zbiorowość stat.: uczniowie LO w Krakowie
-ð Tablica statystyczna
Zbiorowość generalna: wszyscy uczniowie LO w Krakowie
-ð Wykres statystyczny
Jednostka stat.: uczeń LO w Krakowie
Rodzaj badanej zbiorowości: zbiorowość próbna (próba)
Szereg statystyczny ciąg wartości liczbowych badanej cechy, uporzą-
Liczebność próby: 200
dkowanych według ściśle określonych kryteriów. Sposoby podziału szeregów
Cechy:
zależą od rodzaju badania, rodzaju cechy, sposobu pomiaru oraz liczby
1) Stałe:
obserwacji.
a. Rzeczowa: uczniowie LO
b. Przestrzenna: Kraków
Strona 2 z 6
Typy szeregów: Szereg rozdzielczy punktowy pogrupowany materiał statystyczny
wg rosnących lub malejących wariantów cechy, którym przyporządkowuje się
-ð Szczegółowy
odpowiadające im liczebności bezwzględne lub względne.
-ð Rozdzielczy:
o Punktowy
o Przedziałowy x w
x n i i
i i
Lub
-ð Przestrzenny (geograficzny)
x n x w
1 1 1 1
-ð Czasowy (dynamiczny).
x n x w
2 2 2 2
W przypadku gdy badana zbiorowość jest nieliczna to uporządkowany
& & & &
ciąg wartości cechy tworzy szereg szczegółowy (wyliczający). Warianty cechy
porzÄ…dkuje siÄ™ rosnÄ…co lub malejÄ…co: x n x w
k k k k
Szereg rozdzielczy przedziałowy grupujemy materiał statystyczny
x d" x d" & d" x lub x e" x e" & e" x
(1) (2) (n) (1) (2) (n)
według przedziałów wartości cechy, którym przyporządkowuje się odpowia-
dające im liczebności względne lub bezwzględne.
x i-ty wariant cechy
i
x i-ty uporzÄ…dkowany wariant cechy
(i)
x
0i-x n
1i i
n liczebność zbiorowości statystycznej.
w
x
0i-x i
1i
Lub
x
01-x n
11 1
w
x
11
01-x 1
Jeżeli mamy do czynienia z liczną zbiorowością wtedy budujemy szeregi
x n
02-x
12 2
w
x 2
02-x
12
rozdzielcze, czyli określonym wariantom x lub przedziałom cechy wartości x
i 0i-
& &
x przyporządkowuje się odpowiadające im liczebności bezwzględne n lub
1i i
&
&
liczebności względne (wskazniki struktury) w .
i
x n
0k-x
1k k
w
x k
0k-x
1k
Wskaznik struktury (liczebność względna, częstość, frakcja odsetek)
jest ilorazem liczby jednostek odpowiadajÄ…cych danemu wariantowi lub
x
0i- dolna granica i-tego przedziału
przedziałowi wartości cechy do liczebności badanej zbiorowości statystycznej.
x górna granica i-tego przedziału
1i
Obliczamy go:
Przy określaniu liczby przedziałów bierze się pod uwagę
zmienność cechy (różnicę pomiędzy max a min wartością), liczebność
zbiorowości oraz cel badania. Do ustalenia liczby przedziałów można
n liczba jednostek zbiorowości o wartości cechy x lub z przedziału x
i i 0i-x
1i
wykorzystać następujące wzory:
k liczba przedziałów (klas)
k H" 1 + 3,322 logn
Wskaznik struktury określa udział liczby jednostek zbiorowości
k d" 5logn
charakteryzujących się określonym wariantem lub wariantami cechy w
całkowitej liczebności badanej zbiorowości.
Po ustaleniu liczby przedziałów rozpiętość przedziałów określa się przy
Dokonując wyboru rodzaju szeregu rozdzielczego należy wziąć pod
pomocy wzoru:
uwagę typ badanej cechy (skokowa, ciągła) oraz liczbę wariantów cechy. Jeżeli
h e" R : k
badana cecha przyjmuje małą liczbę wariantów tworzy się szeregi rozdzielcze
R = x
max - x
min
punktowe, a przy dużej liczbie przyjmowanych wartości przedziałowe.
Strona 3 z 6
Internały powinny być jednakowe. W uzasadnionych przypadkach Szereg przestrzenny (geograficzny, terytorialny) obrazuje
tworzy się szeregi o nierównych internałach np. dla struktury gospodarstw rozmieszczenie badanych zjawisk wg jednostek administracyjnych (gminy,
rolnych. powiaty itp.), a także krajów i części świata.
W przypadku cech ciągłych górna granica przedziału może być dolną Szereg dynamiczny (chronologiczny, czasowy) prezentuje zmiany
granicą następnego przedziału (2-4; 4-6) lub może być niższa (2-3,9 lub 3,99 w poziomu zjawiska w czasie. Jeżeli szereg dotyczy poziomów zjawiska w
zależności od dokładności pomiaru). Dla cech skokowych górną granicę przedziałach czasowych (miesiąca) określa się go mianem szeregu czasowego
przedziału ustala się na poziomie o jednostkę niższym niż dolna granica okresów, a jeśli odnosi się do konkretnych momentów (np. 31.01 każdego
kolejnego przedziału (2-4; 5-7). Konstruując szereg ważne jest by każda roku) to jest to szereg czasowy momentów.
wartość znalazła się w jednym i tylko jednym przedziale oraz by unikać Tablica statystyczna forma prezentacji materiału statystycznego
budowy pustych przedziałów. Gdy w badanej zbiorowości występują wartości zawierająca liczbowy opis zbiorowości wg jednej (tablice proste) lub większej
ekstremalne (znacznie odbiegające od pozostałych) dopuszczalne jest liczby cech (tablice złożone). Powinny one spełniać określone warunki
budowanie otwartych przedziałów klasowych. formalne i merytoryczne, a ich zakres i układ zależny jest od cech
Do przedstawionych powyżej reguł nie należy się bezwzględnie prowadzonego badania.
stosować i dlatego często szeregi buduje się metodą prób i błędów tak, aby
liczebności w sąsiednich przedziałach nie odbiegały znacznie od siebie oraz aby TABLICA NR & [TYTUA TABLICY]
rozkład charakteryzował się jednym maksimum (rozkład jednomodalny). TYTUA GAÓWKI
TYTUA BOCZKA RAZEM:
Oprócz szeregów rozdzielczych buduje się dodatkowo szeregi rozdziel-
POZYCJE GAÓWKI
cze skumulowane przyporzÄ…dkowuje siÄ™ kolejnym wariantom cechy odpo-
POZYCJE
wiadające im liczebności bądz częstości skumulowane. Przyporządkowanie to
BOCZKA
określane jest mianem dystrybuanty empirycznej. Liczebność skumulowana
n jest liczbą jednostek badanej zbiorowości o wariancie cechy nie większym
cum.i
RAZEM:
od x lub nie mniejszym od x w zależności od sposobu kumulacji (rosnąca lub
i i
yRÓDAO: &
malejÄ…ca).
Skumulowany wskaznik struktury:
Stosowane znaki umowne:
( - ) zjawisko nie występuje
( 0 ) zjawisko występuje, ale w ilościach mniejszych niż pół jednostki miary
Przy kumulacji rosnącej liczebność skumulowaną obliczamy wg formuły:
przyjętej w tablicy
( . ) zupełny brak informacji lub brak informacji wiarygodnych
( x ) rubryki nie można uzupełnić ze względu na układ tablicy
Przy malejÄ…cej:
Wykresy statystyczne wizualna forma prezentacji danych
statystycznych oraz wyników analizy statystycznej. Wyróżniamy wykresy:
-ð Liniowy
x n x n -ð Kolumnowy, sÅ‚upkowy
i i i i
-ð KoÅ‚owy, pierÅ›cieniowy
x n n n +n +n +n 3 2 2 18
1 1 1 1 2 3 4
-ð Punktowy
x n n +n n +n +n 4 5 7 16
2 2 1 2 2 3 4
-ð Warstwowy, powierzchniowy
x n n +n +n n +n 5 8 15 11
3 3 1 2 3 3 4
-ð BÄ…belkowy
x n n +n +n +n n 6 3 18 3
4 4 1 2 3 4 4
-ð Radarowy
Strona 4 z 6
W przypadku szeregów rozdzielczych do ich przedstawienia dkowaniem (na podstawie zebranych w badaniu statystycznym danych)
wykorzystujemy wykresy: liczebności do wariantów cechy.
a) Słupkowe (histogramy) - to zbiór przylegających prostokątów, których Parametry służące do syntetycznego opisu struktury zbiorowości:
podstawy są równe długościom przedziałów klasowych, a wysokości
Parametry:
Grupa miar:
odpowiadają liczebnościom (częstościom) tych przedziałów. W przypadku
Klasyczne: Pozycyjne:
histogramów skumulowanych wartości są odpowiednimi liczebnościami
- średnia arytmetyczna
skumulowanymi.
Miary - kwantyle
- średnia harmoniczna
b) Liniowe (diagramy, wielobok liczebności) - to łamana powstała przez
położenia - dominanta
- średnia geometryczna
połączenie punktów, których współrzędnymi są środki przedziałów
- wariancja - odchylenie ćwiartkowe
klasowych i odpowiadające im liczebności (częstości) wielobok. W
Miary
- odchylenie standardowe - pozycyjny współczynnik
przypadku diagramu liczebności skumulowanej łączy się punkty, których
rozproszenia
- współczynnik zmienności zmienności
współrzędnymi są górne granice przedziałów klasowych i odpowiadające
im liczebności skumulowane. Diagram liczebności skumulowanych jest
Miary pozycyjny współczynnik
współczynnik asymetrii
jednocześnie wykresem dystrybuanty empirycznej.
asymetrii asymetrii
c) Krzywe liczebności bezwzględnych lub względnych (krzywa częstości) -
- kurtoza
Miary
jest szczególnym przypadkiem diagramu dla cech ciągłych. Powstaje ona w
- współczynnik koncentracji
koncentracji
wyniku zmniejszania rozpiętości przedziałów i tym samym zwiększania ich
Lorenza
liczby, co prowadzi do otrzymania gęstej siatki punktów. W praktyce
krzywa liczebności jest otrzymywana tylko w przybliżeniu ponieważ do
3.1. Miary położenia (przeciętne).
otrzymania jej dokładnej postaci wymagana jest nieskończona liczba
Wśród miar przeciętnych wyróżnia się miary klasyczne i pozycyjne.
obserwacji.
Klasyczne oblicza się na podstawie wszystkich wartości szeregu i są to przede
wszystkim średnia arytmetyczna, geometryczna i harmoniczna. Miary
Opis i wnioskowanie statystyczne:
pozycyjne charakteryzują szereg pod względem pewnych wyróżniających się
-ð Opis statystyczny to syntetyczna charakterystyka zbiorowoÅ›ci i co najwa-
wartości i wyróżnia się wśród nich dominantę i kwantyle.
żniejsze dotyczy tylko i wyłącznie badanej zbiorowości. Przeprowadza się
go przy wykorzystaniu odpowiednich charakterystyk liczbowych zwanych
3.1.1. Średnia arytmetyczna iloraz sumy wartości zmiennej wszystkich
parametrami. W opisie tym zastosowanie znajdują następujące metody:
jednostek badanej zbiorowości do ich liczby.
o Analiza struktury zjawisk
o Analiza współzależności zjawisk
o Analiza dynamiki zjawisk
Dla szeregu wyliczajÄ…cego:
-ð Wnioskowanie statystyczne ma miejsce gdy badaniu podlega próba
wybrana zgodnie z metodami reprezentacyjnymi i polega na uogólnieniu
wyników z próby na populację generalną.
Dla szeregu rozdzielczego punktowego:
Dla szeregu rozdzielczego przedziałowego:
3. METODY ANALIZY STRUKTURY ZBIOROWOÅšCI.
przy czym jest środkiem danego przedziału
Analiza danych statystycznych powinna doprowadzić do zwięzłego
przedstawienia wyników badań za pomocą odpowiednio dobranych parame-
W przypadku gdy zbiorowość podzielona jest na kilka podgrup średnią
trów. Dobór parametrów powinien być jak najpełniejszy i opierać się na
arytmetyczną dla całej zbiorowości oblicza się jako tzw. średnią ze średnich za
rozkładzie empirycznym badanej cechy. Rozkład empiryczny jest przyporzą-
pomocÄ… wzoru:
Strona 5 z 6
Gdzie:
- średnia arytmetyczna całej zbiorowości
średnia arytmetyczna dla j-tej podgrupy w zbiorowości
n
j liczebność j-tej podgrupy zbiorowości
3.1.2. Średnia harmoniczna odwrotność średniej arytmetycznej dla
odwrotności wariantów cechy. Stosowana jest gdy wartości cechy
wyrażone są w liczbach względnych, a wagi podane są w jednostkach
liczników tych cech. Liczby względne są wielkościami stosunkowymi,
otrzymywanymi w wyniku podzielenia dwóch wielkości absolutnych np.
gęstość zaludnienia obliczane jako
Strona 6 z 6
Wyszukiwarka
Podobne podstrony:
Metody statystyczne dla opornych cz 2Metody statystyczne dla opornych cz 1statystyka dla opornychpytania badawcze statystyka DLA STATYSTYKAwięcej podobnych podstron