podstawowe zagadnienia statystyki 2, statystyka


1. 4 znaczenia statystyki:

- jako zbiór informacji (roczniki statystyczne)

- jako proces zbierania informacji

- jako parametr statystyczny ( liczba która syntetycznie opisuje pewien zbiór informacji np.: średnica arytmetyczna)

- jako nauka zajmuje się ona badaniem procesów masowych opisując je najczęściej za pomocą liczb w ustaleniu prawidłowości charakteryzujących te procesy.

Procedura sprawdzania informacji , analizy oraz ustalania prawidłowości nosi nazwę badania statystycznego

Jednostka - każdy pojedynczy element podlegający badaniu( osoba , rzecz , zjawisko)

Zbiorowość - zbiór wszystkich rzeczy podlegających badaniu.

Etapy badania

statystycznego:

1. programowanie badania:

Etap o charakterze przygotowawczym obejmujący następujące czynności:

- sformułowanie celu badania statystycznego

- - określenie zakresu rzeczowego badania

- określenie zakresu czasowego badania

- określenie zakresu przestrzennego badania

- określenie cech statystycznych , ze względu na które będzie prowadzone badanie

- wybór metody badania statystycznego

- wybór sposobu gromadzenia informacji i ewentualnie opracowanie formularzy.

2. gromadzenie danych:

Etap zazwyczaj najbardziej pracochłonny. Odbywa się właściwe gromadzenie informacji. Powinno być ono zakończone kontrolą kompletności i wiarygodności.

3. opis statystyczny:

następuje opracowanie zgromadzonego materiału w celu określenia prawidłowości

Klasyfikacja zbiorowości: (do punktu 2)

1. - statyczne ( zbiorowość badana na określony moment czasowy)

-dynamiczna (zbiorowość badana w pewnym przedziale czasowym)

2. - skończenie liczne (składa się z przeliczonej liczby jednostek)

- nieskończenie liczna ( nieskończona liczba jednostek)

3. - proste (składa się z jednostek tego samego typu)

- złożone (jednostki zróżnicowane jakościowo)

4. - całkowita (jest zbiór wszystkich jednostek tworzących taką zbiorowość)

- częściowa ( próba statystyczna) wyodrębniona część zbiorowości całkowitej.

Moment czasowy lub przedział badania zależy od charakteru badania.

Z jakiego obszaru pochodzi badana zbiorowość.

Cecha statystyczna- właściwość zbiorowości podlegająca badaniu statystycznemu

Klasyfikacja cech statystycznych: (do p. 2)

- ze względu na podział zapisu wartości cechy:

a. opisowe (ich wartości zapisywane są słownie)

b. liczbowo (ich wartości zapisywane są liczbami)

- ze względu na mierzalność wartości cechy:

a. mierzalne (takie których wartości są wynikiem pomiaru za pomocą odpowiednich urządzeń lub aparatu)

b. pośrednio mierzalne (takie których wartości są wyrażone liczbowo ale liczby te są jedynie wynikiem oszacowania lub oceny)

- niemierzalne = opisowe

- ze względu na liczebność zbioru wartości cechy:

a. stałe( zbiór wartości cechy jest jednoelementowy , wszystkie jednostki cechy posiadają ten sam wariant cechy)

b. zmienne (zbiór wartości cechy jest co najmniej dwu elementowy ), jednostki różnią się między sobą , dlatego też badanie statystyczne dotyczy cech ( zmiennych)

- dotyczy cech opisowych:

a. dwuwariantowe (przyjmuje tylko dwie wartości)

b. wielowariantowe

- dotyczy cech liczbowych

a. skokowe (takie które przyjmują wartości ze zbioru liczb naturalnych )

b. ciągłe ( wartości ze zbioru liczb rzeczywistych)

Klasyfikacja metod opisu: (do punktu 3)

- ze wzgl. na postać opisu :

a. tabelaryczny (zgromadzone informacje umieszczane w postaci szeregów lub tablic statystycznych)

b. graficzny (zgromadzone inf. Prezentowane w postaci wykresu)

c. parametryczne (zgromadzone informacje zastępujemy zestawem określonych parametrów statystycznych)

2. - ze wzgl. na cel opisu:

a. struktury zbiorowości ze wzgl. na określoną cechę.

b. współzależności między wybranymi cechami charakterystycznymi badanej zbiorowości.

c. opis dynamiki w którym dokonujemy analizy tendencji rozwojowej określonego zjawiska.

4. wnioskowanie statystyczne:

Występuje dodatkowo tylko w badaniu częściowym. Zwane jest inaczej wnioskowaniem statystycznym.

Badaniem obejmujemy próby statystyczne i na podstawie prawidłowości ustalonych dla tej próby wnioskujemy o prawidłowościach występujących w zbiorowości całkowitej.

Szereg rozdzielczy punktowy (eliminuje wartości powtarzające)

X - cecha staty. ; x - wartość cechy ; N - liczebność ogólna zbiorowości ; n - liczebność wariantów ; k - liczba klas

Szereg rozdzielczy z podziałami klasowymi- przy badaniu tego typu szeregu należy rozstrzygnąć kilka problemów:

1. ustalenie liczby przedziałów klasowych ( zależy od liczebności badanej zbiorowości ) może być ustalana z wzór 1

2. ustalenie rozpiętości przedziałów klasowych:

- wskazane jest tworzenie klas o jednakowych rozpiętościach, gdyż znacznie ułatwia to dalszą analizę materiału statystycznego.

- w szeregu nie mogą występować klasy puste.

- rozpiętość klas ustalana jest jako iloraz rozpiętości wartości cechy i przyjętej liczby klas. R(x) = x max. - x mini

rozpiętość klasy: wzór.2

- w przypadku cech typu ciągłego łączne

rozpiętość klas musi przekraczać rozpiętość wartości cech.

3. W przypadku cech typu ciągłego należy ustalić zasady zamykania przedziałów klasowych.

Częstość - odsetek lub udział procentowy

Wzór. 3 i 4

Zbiorowość jest opisywana ze wzgl. Na dwie lub więcej cech tablicą statystyczną.

Elementy składowe tablicy statystycznej:

- tytuł tablicy( zakres rzeczowy , zakres czasowy , zakres przestrzenny, cechy staty.)

- materiał tablicy ( wiersze i kolumny , tytuły wierszy i kolumn , informacje statystyczne zawarte w tablicy, ewentualne znaki umowne )

- źródło danych zawartych w tablicy

Znaki umowne:

- zjawisko nie występuje

X - wypełnienie danego pola jest niemożliwe lub bezcelowe

• - brak danych lub brak danych wiarygodnych

0 - (zero) zjawisko występuje w niewielkich ilościach zbliżonych do zera

w tym : - zapisem takim wyróżniamy pewną część badanej zbiorowości

Opis graficzny: stanowi zwykle uzupełnienie opisu tabelarycznego i parametrycznego. Wykorzystuje on różnego rodzaju wykresy statystyczne. Najczęściej wykorzystywane typy to:

- wykres powierzchniowy - które wykorzystują różnego rodzaju figury geometryczne (prostokątny , kołowy) Za pomocą tego rodzaju wykresów prezentujemy zwykle szeregi strukturalne.

- Liniowe - Najpopularniejszy diagram. Prezentuje on najczęściej rozwój zjawisk w czasie - tzw. szeregi dynamiczne

- Bryłowe- wykorzystują takie bryły jak sześcian prostopadłościan. Prezentują szeregi strukturalne.

- Mapowe - wykorzystywane są do prezentacji przestrzennego rozmieszczenia zjawisk.

Najbardziej wykorzystywane;

Obrazkowe, kombinowane

Wykres słupkowy ( histogram :

Należy do grupy wykresów powierzchniowych

Wykres1

Diagram nanoszony na histogram

Wkres 2

Opis parametryczny wykorzystuje parametry i momenty statystyczne. Jest to najbardziej zsyntetyzowana forma opisu statystycznego.

Parametr statystyczny to liczba, przy pomocy której opisujemy określoną własność badanej zbiorowości.

Możemy opisywać:

3. Do opisu określonego typu własności wykorzystujemy odpowiednią grupę parametrów statystycznych:

1.Miary/parametry średnie:

Przy pomocy tych parametrów opisujemy średni poziom wartości.

Dzielimy je na:

Do miar średnich klasycznych zaliczamy:

Do pozycyjnych:

2.Miary/parametry zmienności (zróżnicowania, rozproszenia)

Przy pomocy tych miar mierzymy poziom zróżnicowania wartości cechy.

Dzielimy:

Absolutne:

względne: - współczynnik zmienności

3.Miary skośności (asymetrii)

Badamy nimi poziom odchylenia rozkładu cechy od rozkładu symetrycznego ( miary asymetrii)

Dzielimy je na:

a. różnica między wartością średnią a wartością dominującą

b. trzeci moment centralny

a. współczynnik skośności (asymetrii)

b. trzeci moment centralny standaryzowany

4.Miary koncentracji:

Koncentracja może być dwojako interpretowana:

1. Oznacza skupienie wartości cechy wokół ich średniej arytmetycznej. Tak rozumianą koncentrację mierzymy za pomocą miary kurtozy, czyli, czwartego momentu centralnego standaryzowanego.

2. Oznacza nierównomierne rozłożenia globalnego funduszu wartości cechy wśród jednostek statystycznych badanej zbiorowości. Mierzymy ją za pomoc ą współczynnika koncentracji.

Średnia arytmetyczna:

1). szereg szczegółowy: wzór 5 ; 2). szereg rozdzielczy-pónktowy : wzór 6 ; 3). Szereg z przedziałami klasowymi: wzór 7

Własności:

1.średnia arytm. Jako parametr klasyczny liczona jest na podstawie wszystkich wartości cechy

2.suma odchyleń poszczególnych wartości cechy od ich średniej arytmetycznej wynosi zawsze zero wzór 8:

3.suma kwadratów odchyleń poszczególnych wartości cechy od ich średniej arytmetycznej jest najmniejsza z możliwych. Wzór 9:

4.suma wartości cechy dla badanej zbiorowości jest równa i iloczynowi liczebności tej zbiorowości oraz średniej aryt. Wzór 10

5.Jeśli w szeregu rozdzielczym wszystkie liczebności pomnożymy lub podzielimy przez ten sam czynnik (q) to średnia arytmetyczna nie ulegnie zmianie

6.Jeśli wszystkie wartości cechy pomnożymy lub podzielimy przez ten sam czynnik (q) to średnia arytmetyczna tak zmienionych wartości cechy będzie q-krotnie większa lub mniejsza od średniej pierwotnej

7.Jeżeli do wszystkich wartości cechy dodamy lub odejmiemy tę samą wielkość (q) to średnia arytmetyczna tak zmienionych wartości cechy będzie o wielkość q większa / mniejsza od średniej pierwotnej

8.Jeśli badaną zbiorowość podzielimy na kilka podzbiorowości to średnia arytm. dla cechy zbiorowości może być liczona jako średnia ze średnich dla tych zbiorowości

Średniej arytmetycznej nie wyznaczamy kiedy:

a. .w szeregu występują otwarte przedziały klasowe.

b .w szeregu występuje skrajna asymetria (skośność) tzn wyraźnie dominuje jedna z klas krańcowych w takiej sytuacji korzystamy z dominanty

4. Wartość najczęstsza (dominata, wartość modalna, dominująca) - 0(x)

To wartość cechy, która występuje najliczniej w badanej zbiorowości

Sposoby wyznaczania:

- w szeregu szczegółowym i rozdzielczym punktowym wskazując wartość cechy występującej najczęściej.

Dominata nie zawsze musi występować

- w szeregu rozdzielczym z podziałem klasowym

wyznaczamy ją 2 metodami

- graficzną: wykres 3

xD - dolna granica przedziału dominanty

hD - rozpiętość przedziału dominanty

nD - liczebność przedziału dominanty

nD-1 - liczebność przedziału poprzedzającego przedziału dominanty

nD+1 - liczebność przedziału następnego po przedziale dominanty

Dominanta ma charakter szacunkowy. W przypadku wyznaczenia dominanty w szeregu z przedziałami . Przedział dominaty i dwa sąsiadujące muszą posiadać tę samą rozpiętość.

Wartość środkowa (mediana)

To wartość cechy, która zajmuje środkowe miejsce w szeregu uporządkowanym

Sposoby wyznaczania:

- szeregu szczegółowym, rozdzielczym, punktowym

1. zbiorowość obejmuje nieparzystą liczbę jednostek. W takim przypadku mediana będzie wartością cechy występującej u jednostki o numerze: wzór 12

2.zbiorowość składa się z parzystej liczby jednostek.

Mediana jest średnią arytmetyczną z wartości cechy występującej u jednostek o numerach: wzór 13

Metody:

x0 - dolna granica przedziału mediany

n0 - liczebność przedziału mediany

h0 - rozpiętość przedziału mediany

cumno-1 - liczebność skumulowana do przedziału poprzedzającego przedział mediany

Z mediany korzystamy:

Mediana stanowi uzupełnienie średniej arytmetycznej

Jako parametr wykorzystywana jest głównie, gdy w szeregu występują otwarte przedziały klasowe

Kwartyle:

a.) Kwartyl 1 [ Q 1 (x)]

b.) Kwartyl 3 [ Q 3 (x)]

a) i b) - miary położenia

Wykres 5

Kwartyle dzielą uporządkowaną zbiorowość na ćwiartki. W każdej ćwiartce będzie się znajdowała zbliżona liczba jednostek statystycznych

Kwartyl 1 oddziela 1-szą ćwiartkę od 3 pozostałych

Kwartyl 2 oddziela ćwiartkę 2 od 3, czyli dzieli zbiorowości na 2 równe części jest to mediana

Kwartyl 3 oddziela ćwiartkę 3 od 4

Wyznaczanie kwartyli w szeregu z przedziałami klasowymi:

- metoda graficzna - wykorzystujemy w niej histogram i diagram kumulacyjny: wykres 6

- metoda analityczna:

wzór 15

x0 - dolna granica przedziału zawierającego kwartyl 1 bądź 3

n0 - liczebność przedziału zawierającego kwartyl 1 bądź 3

h0 - rozpiętość przedziału zawierającego kwartyl 1 bądź 3

cumn0-1 - liczebność skumulowana do przedziału poprzedzającego przedział zawierającego kwartyl 1 bądź 3

Miary zmienności: (zróżnicowania, rozproszenia)

Przy ich pomocy badamy poziom zróżnicowania wartości cechy w badanej zbiorowości.

W przypadku cechy stałej zróżnicowanie nie występuje.

Badanie zróżnicowania dotyczy cechy zmiennej.

* Miary pozycyjne

- obszar zmienności

R(x) = xmax - xmin

Jeśli zbiorowość jest w miarę jednolita to można wykorzystać tą miarę do pomiaru zmienności.

Jeżeli w zbiorowości występują jednostki nietypowe, tzn. takie, dla których wartości 5. cechy wyraźnie odbiegają od pozostałych, wtedy miara ta niewłaściwie odzwierciedla poziom zmienności .

- odchylenie ćwiartkowe

W przypadku występowania jednostek nietypowych wykorzystujemy odchylenia ćwiartkowe.

Miara ta pozwala na wyeliminowanie wpływu jednostek nietypowych na wartość miary zmienności.

Wzór 16 ; wykres 7

Miary klasyczne:

- wariancja [S2(x)]

Jest drugim momentem centralnym

Sposoby liczenia:

* wariancja w szeregu szczegółowym

wzór 17

Wariancja to średnia kwadratów odchyleń poszczególnych wartości cechy od ich średniej arytmetycznej.

* szereg rozdzielczy punktowy

wzór 18

* szereg rozdzielczy z przedziałami klasowymi.

Wzór 19

Wariancji nie dają się logicznie interpretować ze względu na nienaturalne miano jakie przy niej występuje.

- odchylenie standardowe [S(x)]

wzór 20

Jeśli znamy wartość średnią i odchylenia standardowe określonej cechy to możemy wyznaczyć dla niej typowy obszar zmienności.

Obejmuje wartości cechy należące do przedziału. Wzór 21

Obszar ten nazywamy typowym ponieważ obejmuje on ok. 70% badanej zbiorowości.

Osoby, których waga należy do tego przedziału można uznać za typowe dla tej zbiorowości.

Osoby spoza tego przedziału za nietypowe dla danej zbiorowości.

Własności odchylenia standardowego:

1) Jako klasyczna miara zmienności wyznaczana jest na podstawie wszystkich wartości cechy. Odczytane standardowe to najczęściej wykorzystywane miarę zmienności.

2) Przyjmuje wartości nieujemne

S(x) >= 0

Wartość równą 0 przyjmuje w przypadku cechy stałej.

3) Jeśli w szeregu rozdzielczym wszystkie liczebności pomnożymy przez tą samą wielkość lub podzielimy to odchylenie standardowe przy tak zmienionych wartościach będzie identyczne jak odchylenie standardowe pierwotne.

4) Jeśli wszystkie wartości cechy pomnożymy lub podzielimy przez q to odchylenie standardowe tak zmienionych wartości cechy będzie q-krotnie większe jeśli pomnożymy lub q-krotnie mniejsze od odchylenia standardowego pierwotnego.

5) Jeśli do (od) wszystkich wartości cechy dodamy lub odejmiemy tą samą wielkość q to odchylenie standardowe tak zmienionej wartości cechy będzie identyczne jak odchylenie standardowe pierwotne.

- odchylenie przeciętne [d(x)]

Sposoby obliczenia:

* szereg szczegółowy

wzór 22

Odchylenie przeciętne to średnia bezwzględnych odchyleń poszczególnych wartości cechy od ich średniej arytmetycznej.

* szereg rozdzielczy punktowy

wzór 23

* szereg z przedziałami klasowymi

wzór 24

Miara względna zmienności - współczynnik zmienności [Wz(x)]

wzór 25 0<=Wz(x)<=1

Współczynnik zmienności informuje jaka część wartości średniej odpowiedniej cechy stanowi jej odchylenie standardowe.

Umożliwia to ocenę natężenia zmienności .

- zamknięty przedział

Wz(x) <= 33,3% zmienność niewielka

33,4% <= Wz(x) <= 66,6% zmienność wyraźna

66,7% <= Wz(x) zmienność duża

1.

-4 znaczenia statystyki

-badanie statystyczne

-Jednostka

-Zbiorowość

-Etapy badania statystycznego

-Klasyfikacja zbiorowości (do etapu 2)

-Cecha statystyczna

-Klasyf. cech statystycznych (do et. 2)

-Klasyfikacja metod opisu (do etapu 3)

2.

-Klasyf.a metod opisu (do etapu 3) cd.

-Wnioskowanie statystyczne

-Szereg rozdzielczy punktowy

-Szereg rozdzielczy z podziałami klasowymi

-Częstość

-Elementy składowe tablicy statystycznej:

-Znaki umowne

-Opis graficzny

-Histogram

-Opis parametryczny

-Parametr statystyczny

3.

-grupa parametrów statystycznych:

-Miary/parametry średnie

-Miary/parametry zmienności

-Miary skośności (asymetrii)

-Miary koncentracji

-Średnia arytmetyczna:

-Własności

4.

-Wartość najczęstsza (dominata) - Sposoby wyznaczania

-Wartość środkowa (mediana)

-Sposoby wyznaczania

-Korzystanie z mediany

-Kwartyle

-Miary zmienności: (zróżnicowania, rozproszenia)

-Miary pozycyjne

5.

-Miary pozycyjne CD.

-Miary klasyczne

-Własności odchylenia standardowego

-Miara względna zmienności

-Współczynnik zmienności [Wz(x)]



Wyszukiwarka

Podobne podstrony:
podstawowe zagadnienia statystyki 1, statystyka
podstawowe zagadnienia statystyki 4, statystyka
podstawowe zagadnienia statystyki 3, statystyka
Rodowód, przedmiot?dań i podstawowe pojęcia statystyczne Uwagi na temat organizacji?dań stat
Podstawowe pojęcia statystyki
Statystyka - podstawowe wzory, Statystyka wzory
Zagadnienia statystyczne konstruowania testów, Psychologia, biologia, Psychometria
Podstawowe pojęcia statystyki
podstawowe pojęcia statystyka, ŚCIĄGI Z RÓŻNYCH DZIEDZIN, Statystyka
zagadnienia statystyka, socjologia, skrypty i notatki, statystyka
Podstawy analizy statystycznej 2
Podstawowe pojęcia statystyczne, Statystyka - ćwiczenia - Rumiana Górska
PODSTAW WNIOSKOWANIA STATYSTYCZNEGO (Automatycznie zapisany)
Podstawowym celem statystyki jako nauki jest konstrukcja metod liczbowego opisu, Statystyka podstawy
Wyklad 4 Podstawy wnioskowania statystycznego + dodatkowe przyklady
Podstawowe pojecia statystyczne, ekonomia, logika, biznes, info
FORMY PRAWNO-ORGAN FIRM, Podstawy ekonomii, statystyki i organizacji

więcej podobnych podstron