statystyka - wykłady cz. 1, statystyka

Wykład 1

Krótki rys historyczny

Słowo STATYSTYKA wywodzi się od łacińskiego słowa STATUS oznaczającego „stan rzeczy”. W łacinie średniowiecznej słowa status używano dla opisania politycznego stanu rzeczy.

Termin STATYSTYKA został wprowadzony w połowie XVII w. przez Gotfrieda Achenwalla, który rozumiał statystykę jako PAŃSTWOZNAWSTWO, tzn. naukę o państwie prezentującą podstawowe wiadomości niezbędne dla tych, którzy kierowali państwem. Nauka ta wyrosła z potrzeb administracji państwowej- zajmowała się gromadzeniem danych liczbowych i opisem stanu państwa na podstawie tych danych.

Podobną działalność prowadzono już w starożytności. W Egipcie, Babilonii, Persji, Rzymie czy Indiach sporządzano spisy ludności na potrzeby władających tymi państwami (patrz historia narodzin Jezusa z Nazaretu). W średniowieczu oprócz spisów ludności gromadzono również dane dotyczące dóbr kościelnych lub klasztornych.

Rozbudowa struktur państwowych i rozwój gospodarczy spowodowały, że znaczenie terminu STATYSTYKA uległo istotnym zmianom:

Wyodrębniły się ze STATYSTYKI nauki zajmujące się opisem i analizą działalności państwa takie jak EKONOMIA, FINANSE, RACHUNKOWOŚĆ;
Statystycy w opisie państwa zaczęli posługiwać się różnego rodzaju rozbudowanymi zestawieniami liczbowymi, prezentowanymi głównie w postaci graficznej TABLIC I WYKRESÓW. Zawierały one w miarę szczegółowe informacje dotyczące ludności, majątku, sił zbrojnych i przemysłu danego państwa.

Sprawiło to, że wszelkie zestawienia liczbowe zaczęto obejmować nazwą STATYSTYKA. Nacisk na liczbowe ujmowanie zjawisk spowodował, że punkt ciężkości zainteresowań statystyków i statystyki jako nauki przesunął się ku problemom związanym z GROMADZENIEM, OBRÓBKĄ I ODPOWIEDNIĄ PREZENTACJĄ DANYCH ORAZ WYSUWANIEM WNIOSKÓW NA PODASTAWIE WIELKOŚCI LICZBOWYCH.

Za twórców statystyki we współczesnym rozumieniu tego słowa uznaje się Anglików Johna Graunta i Williama Petty'ego (XVII w. Prowadzili badania na potrzeby powstających wówczas towarzystw ubezpieczeniowych). Podwaliny pod metody współczesnej statystyki położył Carl Gauss, który stworzył teorię według której na podstawie szeregu pomiarów można oszacować rzeczywisty wymiar jakiegoś obiektu. (im większa liczba pomiarów, tym mniejszy błąd)

Przedmiot i zadania statystyki

Współcześnie terminu STATYSTYKA używa się w czterech różnych znaczeniach:

nazwa zbioru danych liczbowych prezentujących kształtowanie się określonych zjawisk i procesów;
nazwa wszelkich prac związanych z gromadzeniem i opracowywaniem danych liczbowych;
nazwa pewnych charakterystyk liczbowych obliczanych ze zbiorowości próbnych (np. średnia arytmetyczna z próby, odchylenie standardowe z próby);
nazwa dyscypliny naukowej, mającej własne, zróżnicowane metody badawcze.

Metody służące do badań zjawisk masowych mogą w zależności od rodzaju posiadanych informacji i preferencji stawianych przez użytkownika służyć różnym celom, dlatego też wyróżnia się: STATYSTYKĘ OPISOWĄ, MATEMATYCZNĄ, EKONOMICZNĄ oraz tzw. STATYSTYKI BRANŻOWE (przemysłu, rolnictwa, transportu, piłki nożnej).

S. OPISOWA - zajmuje się problemami badań statystycznych, metodami obserwacji statystycznej, sposobami opracowywania i prezentacji materiału statystycznego oraz sumarycznym opisem danych statystycznych.

S. MATEMATYCZNA - jest nauką zajmującą się metodami wnioskowania o całej zbiorowości na podstawie zbadania wybranej, w sposób losowy pewnej części całości zwanej próbą.

S. EKONOMICZNA - przedmiotem jej badań są zjawiska i procesy zachodzące w gospodarce na różnych szczeblach jej agregacji. Do ich opisu i analizy wykorzystuje ona metody wypracowane przez S. Opisową i Matematyczną.

S. BRANŻOWE (STOSOWANE) - zajmują się badaniem poszczególnych działów lub gałęzi gospodarki wykorzystując do tego celu metody wypracowane przez ww. statystyki.

Zastosowanie metod statystycznych od badania zjawisk masowych (występujących w dużej liczbie przypadków) pozwala na wykrycie prawidłowości statystycznych. Prawidłowości te są wypadkową oddziaływania na zbiorowość przyczyn głównych (oddziałujących systematycznie) i ubocznych (przypadkowych).

STATYSTYKA JEST NAUKĄ TRAKTUJĄCĄ O ILOŚCIOWYCH METODACH BADANIA ZJAWISK (PROCESÓW) MASOWYCH.

SPEŁNIA ONA TRZY PODSTAWOWE FUNKCJE:

INFORMACYJNĄ (pełny i obiektywny obraz badanych zjawisk),

ANALITYCZNĄ (możliwe jest określenie czynników kształtujących procesy i zjawiska),

PROGNOSTYCZNĄ (pozwala na przewidywanie poziomu i struktury zjawisk w przyszłości)

Podstawowe pojęcia statystyczne

ZBIOROWOŚĆ STATYSTYCZNA (populacja, masa statystyczna)- zbiór dowolnych elementów (osób, przedmiotów, faktów) podobnych - ale nie identycznych - pod względem właściwości objętych badaniem.

JEDNOSTKA STATYSTYCZNA (j. badania)- element składowy zbiorowości poddany obserwacji lub pomiarowi. W tej samej zbiorowości mogą wystąpić różne jednostki statystyczne - wybór jednostki zależy od celu badania.

Zbiorowości statystyczne powinny być ściśle określone pod względem rzeczowym (kto lub co jest przedmiotem badania), przestrzennym (gdzie znajduje się zbiorowość) oraz czasowym (jakiego momentu dotyczy badanie). Jeżeli przedmiotem badania są wszystkie jednostki statystyczne, co do których chcemy formułować wnioski, to zbiorowość tą nazywamy generalną. Podzbiór zbiorowość generalnej, obejmujący część jej elementów wybranych w określony sposób nazywamy zbiorowością próbną (próbą). Wnioski uzyskane z badania próby uogólniamy na całą zbiorowość generalną jeżeli próba była reprezentatywna. Zależy to od: 1) sposobu doboru próby (losowy, celowy); 2) liczebności grupy. Jeżeli próba została wybrana w sposób losowy i jest dostatecznie liczna - jest próbą reprezentatywną.

CECHY STATYSTYCZNE - właściwości jednostek statystycznych. Właściwości jednakowe dla wszystkich jednostek nazywamy cechami stałymi (rzeczowe co?, przestrzenne gdzie? i czasowe kiedy?). Nie podlegają one badaniu a decydują jedynie o zaliczeniu do określonej zbiorowości. Właściwości różnicujące poszczególne elementy zbiorowości nazywamy cechami zmiennymi. Dzielimy je na jakościowe (niezmierzalne) i ilościowe (mierzalne). Cechy jakościowe można tylko określić słownie (płeć, kolor włosów), cechy ilościowe można wyrazić za pomocą liczb o różnych mianach (cm, lata, euro). Dzielimy je na quasi-ilościowe, skokowe i ciągłe. Cecha quasi-ilościowa (porządkowa) określa natężenia badanej właściwości w sposób opisowy, porządkując w ten sposób badaną zbiorowość (oceny z egzaminu - można je wyrazić słownie lub liczbowo). Cecha skokowa może być wyrażona wyłącznie liczbami zmieniającymi się skokami, bez wartości pośrednich (liczba studentów w grupie). Cecha ciągła może przyjmować każdą wartość z określonego przedziału liczbowego (wzrost, wiek, waga). W praktyce podział na cechy skokowe i ciągłe jest płynny ponieważ pomiaru dokonuje się z określoną dokładnością. Cechy charakteryzujące poszczególne zbiorowości mogą mieć różne warianty (rodzaje) - cecha płeć - może mieć dwa warianty: kobieta, mężczyzna. Liczba wariantów danej cechy może być najwyżej równa liczbie jednostek wchodzących w skład określonej zbiorowości, a w praktyce jest niższa gdyż te same warianty mogą występować u kilku jednostek. Stosując to kryterium zbiorowości statystyczne możemy podzielić na jednowymiarowe (jednocechowe) i wielowymiarowe (wielocechowe).

Wielkość (nasilenie) badanej cechy określana jest w procesie POMIARU, polega on na przyporządkowaniu cechom statystycznym określonych symboli, którymi mogą być: liczby, litery, formy geometryczny itp. W naukach społecznych wyróżnia się różne poziomy pomiaru tzw. skale pomiarowe, S. Stevens wyróżnił cztery:

Nominalną - najmniej precyzyjna, liczby pełnią tu rolę znaków umownych służących do identyfikacji jednostek statystycznych i ich klasyfikacji do wyróżnionych kategorii. Podstawą do zaliczenia jednostki do danej kategorii jest wyłącznie fakt posiadania określonego wariantu cech. Np. numery pokoi w hotelu, gatunek sera, numer na koszulce piłkarza.

Porządkowa (rangowa) - posiada wszystkie cechy skali nominalnej i pozwala dodatkowo na porządkowanie jednostek w ramach wyróżnionych kategorii pod względem natężenia badanej cechy. Pozwala (określeniem równy, różny), również na stopniowanie mniej niż, więcej niż. W skali tej liczby zwane rangami wyznaczają kolejność występowania jednostek ale nie odległość między nimi. Porządkowanie wg badanej cechy może być słabe, relacja „<” „>” (sok A jest równie słodki jak sok B), kilka jednostek może mieć tą samą rangę - wyznacza się wówczas tzw. rangi wiązane czyli średnie arytmetyczne z sumy kolejnych rang przypadających na jednostki. Porządkowanie mocne charakteryzuje relacja „<” „>” (samochód A jest szybszy niż samochód B). Skala ta jest bardziej precyzyjna niż skala nominalna gdyż oprócz grupowania umożliwia porządkowanie klas.

Np. skala Richtera, stopnie wojskowe, miejsce Małysza na Olimpiadzie w Salt Lake City.

Przedziałowa (interwałowa) - oprócz właściwości skali porządkowej umożliwia określenie odległości (dystansu) między jednostkami. W skali tej jednakowym różnicom między stopniami właściwości badanych obiektów odpowiadają jednakowe różnice między porządkowanymi liczbami. W skali tej punkt zerowy jest ustalony umownie.

Np. skala Celsjusza, lata kalendarzowe, indeksy cen.

Stosunkowa (ilorazowa) - ma właściwości trzech poprzednich skal, a jej cechą charakterystyczną jest posiadanie naturalnego punktu zerowego. Punkt ten oznacza brak (fizyczny poziom zerowy) danej cechy. W skali stosunkowej równym różnicom pomiędzy właściwościami badanych jednostek odpowiadają równe różnice między przyporządkowanymi im liczbami, ale przyporządkowanie to ma charakter proporcjonalny do stopnia w jakim jednostkom odpowiadają mierzone właściwości.

Np. wiek, dochody, wielkość sprzedaży, długość, liczba gości w dyskotece.

Rodzaje badań statystycznych

Aby określone badanie można było uznać za statystyczne, musi ono spełniać następujące warunki:

musi dotyczyć zbiorowości statystycznej;
musi określać prawidłowości charakteryzujące całą zbiorowość (nie właściwości poszczególnych jednostek);
prawidłowości te muszą dotyczyć zmiennych (cech ) tej zbiorowości.

Każde badanie statystyczne wymaga ustalenia właściwej metody. Wybór metody jest uzależniony od : celu badania; rodzaju zbiorowości; tematu badania; jego szczegółowości; środków, jakimi dysponujemy (tj. liczby osób przeprowadzających badanie, zasobów finansowych, możliwości technicznych i materiałowych)

Wyróżniamy dwie zasadnicze metody badań: badanie PEŁNE (całkowite, wyczerpujące - obejmuje wszystkie jednostki zbiorowości) i badanie CZĘŚCIOWE (niekompletne - obejmujące niektóre jednostki zbiorowości tzw. próbę; jest znacznie tańsze a po zastosowaniu odpowiednich technik wyniki można uogólnić na całą zbiorowość).

Badania pełne to:

SPIS STATYSTYCZNY - jednorazowe lub cykliczne badanie, odzwierciedlające szczegółowy stan danej zbiorowości statystycznej z punktu widzenia określonych cech. Spisy są badaniami bardzo drogimi i wymagają odpowiedniego przygotowania technicznego i organizacyjnego (formularze, rachmistrze, opracowanie materiału). Ich wyniki są wykorzystywane w działalności m.in. gospodarczej przez długi okres czasu, a po pewnym czasie nabierają trwałej wartości historycznej. Np. narodowy spis powszechny ludności Polski.

REJESTRACJA BIEŻĄCA - polega na systematycznym notowaniu ściśle określonych zdarzeń, będących przedmiotem badania statystycznego. Jest to forma spisu, która dotyczy jedynie specyficznych zagadnień, dzięki czemu nie wymaga - rozbudowanej struktury organizacyjnej. Np. ewidencja urodzin i zgonów, rejestracja przedsiębiorstw (REGON).

SPRAWOZDAWCZOŚĆ STATYSTYCZNA - sporządzanie sprawozdań na jednolitych formularzach. Formularze, instrukcje i terminy ich wypełniania są opracowywane przez instytucje prowadzące badanie. Sprawozdawczość może dotyczyć ściśle określonych lub wielu różnych zjawisk oraz różnych okresów. Np. sprawozdania roczne, kwartalne.

Badania częściowe to:

BADANIA REPREZENTACYJNE - polegają na wybraniu z całej zbiorowości próby, przeprowadzeniu dokładnych badań jednostek wchodzących w jej skład, a następnie przenosi się wyniki badania próby na całą zbiorowość. Dobór próby może być losowy lub celowy. W doborze celowym (subiektywnym) wybór jednostek uzależniony jest od wiedzy i poglądów prowadzącego badanie. Istnieje wiele sposobów losowego doboru próby np. losowanie (różnego typu: zespołowe, indywidualne, ograniczone itp.). Np. badania opinii publicznej.

METODA MONOGRAFICZNA - jest to wielostronny opis i szczegółowa analiza wybranej jednostki lub niewielkiego zespołu. Wybrana świadomie jednostka powinna być typową lub wyróżniającą się (wzorzec). Z uwagi na subiektywny dobór badanej jednostki wyników badania nie można uogólnić na całą zbiorowość. Np. monografia rynku pracy w woj. Podkarpackim.

METODA ANKIETOWA - badanie opinii dotyczących określonego problemu lub zjawiska według ustalonego zestawu pytań. Stosując tą metodę badania nie prowadzi się bezpośrednich obserwacji, ale zawierający pytania kwestionariusz kierowany jest do wybranej grupy osób (respondentów). Badanie może mieć charakter otwarty (ankieta w gazecie) bądź być skierowane do wytypowanego lub wybranego losowo grona respondentów. Istotnym czynnikiem rzutującym na wyniki badań jest konstrukcja kwestionariusza. Pytania powinny być tak skonstruowane aby stwarzały możliwość do formułowania własnych opinii, wniosków i spostrzeżeń. Jedną z podstawowych zasad stosowanych w tego typu badaniach jest anonimowość respondentów.

Jeżeli nie ma możliwość przeprowadzenia żadnego z ww. typów badań stosuje się tzw. SZACUNEK STATYSTYCZNY. Jest to postępowanie, w którym liczebność zbiorowości jest ustalana na podstawie informacji o innej zbiorowości logicznie powiązanej z badaną. Np. liczbę turystów w danej miejscowości można oszacować na podstawie ilości sprzedanego pieczywa. Szczególnymi metodami szacunku statystycznego są rachunki interpolacyjne i ekstrapolacyjne. Interpolacja polega na szacowaniu nieznanych wartości badanej cechy na podstawie znajomości jej wcześniejszych i późniejszych realizacji (wartości). Ekstrapolacja pozwala na ustalenie nieznanych wartości znajdujących się poza przedziałem wartości znanych. Interpolacja i ekstrapolacja mogą mieć charakter liniowy (zmiana w równych odstępach czasu o taką samą wielkość absolutną) lub nieliniowy (zmiana w równych odstępach czasu o wielkość stosunkową - tzw. stopa wzrostu).

Organizacja badań statystycznych

Celem badania statystycznego jest realizacja jednego lub kilku wymienionych warunków:

poznanie rozkładu zbiorowości pod względem wybranej lub wybranych cech (analiza struktury);
ocena znajomości związków występujących między cechami (analiza współzależności);
poznanie zmian zbiorowości w czasie (analiza dynamiki).

Niezależnie od celu badania, całość prac związanych z jego realizacją można podzielić na cztery etapy:

przygotowanie (programowanie) badania
obserwacja statystyczna
opracowanie i prezentacja materiału statystycznego
opis i wnioskowanie statystyczne

PROGRAMOWANIE BADANIA - oznacza szczegółowo rozpisaną koncepcję przedsięwzięcia. Obejmuje on czynności przygotowawcze - ustalenie celu, przedmiotu i zakresu badania, właściwe określenie jednostki sprawozdawczej - osoby fizycznej lub prawnej, która posiada odpowiednie źródła danych niezbędnych w badaniu.

OBSERWACJA STATYSTYCZNA - jest to proces zbierania informacji (danych) statystycznych. Zbiór danych zgromadzonych w wyniku obserwacji tworzy materiał statystyczny. Jeżeli dane są gromadzone specjalnie dla celów badania - mówimy o materiale pierwotnym. (np. dane zebrane w czasie spisu powszechnego), dane zgromadzone w innych powodów a wykorzystane w badaniach statystycznych tworzą materiał wtórny (np. publikacje statystyczne). Zebrane materiały statystyczne w swojej pierwotnej postaci tworzą tzw. surowy materiał statystyczny. Jest on z reguły obciążony błędami, dlatego też poddaje się go kontroli merytorycznej i formalnej.

OPRACOWANIE MATERIAŁU STATYSTYCZNEGO - obejmuje dwie zasadnicze czynności: grupowanie i zliczanie. GRUPOWANIE polega na wyodrębnianiu jednorodnych lub względnie jednorodnych części obejmujących jednostki o takich samych lub zbliżonych właściwościach. Wyróżnia się dwa podstawowe rodzaje grupowania: typologiczne i wariacyjne. Celem grupowania typologicznego (np. wg cech przestrzennych, rzeczowych czy czasowych) jest wyodrębnienie różnych jakościowo grup. Niekiedy grupowanie ma charakter naturalny - grupowanie wg płci, często jednak osoba prowadząca badanie może sama zdecydować na ile i jakich grup podzielić daną zbiorowość. Grupowanie wariacyjne opiera się na cesze ilościowej i polega na łączeniu w klasy jednostek statystycznych o takich samych lub zbliżonych wartościach cech. Jednolity system grupowania nazywa się klasyfikacją. Dzielenie materiału statystycznego wg jednej cechy nosi nazwę grupowania prostego (np. podział zbiorowości wg płci). Grupowanie na podstawie kilku cech wzajemnie ze sobą powiązanych i uzupełniających się to grupowanie złożone (np. podział wg stażu pracy). ZLICZANIE danych odbywa się w rozmaity sposób - od ręcznego do komputerowego.

PREZENTACJA MATERIAŁU STATYSTYCZNEGO - odbywa się za pomocą szeregów statystycznych, tablic statystycznych oraz wykresów statystycznych.

SZEREG STATYSTYCZNY - jest to ciąg wartości liczbowych badanej cechy uporządkowanych wg określonych kryteriów (np. rodzaju badania czy rodzaju cechy) [zbiór wyników obserwacji jednostek według pewnej cechy]

Rodzaje szeregów statystycznych:

Szczegółowe (wyliczające)

Rozdzielcze (strukturalne) - cech mierzalnych (punktowe; przedziałowe) / cech niemierzalnych

Przestrzenne (geograficzne)

Czasowe (dynamiczne) - momentów / okresów

SZEREG SZCZEGÓŁOWY - to materiał uporządkowany wyłącznie wg badanej cechy. Porządkowanie polega na ustawianiu wartości według kolejności rosnącej lub malejącej. Najczęściej wartości są podawane od najmniejszej do największej.

dla wartości cechy x1, x2, xn

rosnąco: x1 < x2 < ... < xn; malejąco: x1 > x2 > ... > xn

SZEREG ROZDZIELCZY - jest to zbiór wartości liczbowych uporządkowanych wg wariantów badanej cechy mierzalnej lub niemierzalnej, przy czym poszczególnym wariantom badanej cechy przyporządkowane są odpowiadające im liczebności. Szeregi rozdzielcze określają strukturę badanej zbiorowości. Tworząc szeregi rozdzielcze na podstawie cechy mierzalnej, jej warianty możemy określać punktowo lub przedziałowo.

Szeregi rozdzielcze punktowe buduje się dla cechy skokowej

np. liczba sklepów 1 3 5 7

liczba sprzedawców 4 10 5 9

Szeregi rozdzielcze przedziałowe buduje się dla cech mierzalnych ciągłych. Na początku należy ustalić liczbę przedziałów klasowych ich rozpiętość i sposób określania granic przedziałów. Teoria statystyki nie dostarcza w tym względzie uniwersalnych zaleceń, tym niemniej szereg rozdzielczy przedziałowy powinien być tak zbudowany, aby klasyfikacja danych statystycznych była przeprowadzona w sposób rozłączny (poszczególne przedziały nie mogą zachodzić na siebie) i wyczerpujący (klasy powinny obejmować wszystkie jednostki badanej zbiorowości). Liczba przedziałów (klas) w szeregu jest wypadkową obszaru zmienności badanej cechy, tj. różnicy miedzy maksymalną i minimalną wartością cechy; liczebności zbiorowości oraz celu badania. Im większy obszar zmienności i liczniejsza zbiorowość, tym więcej powinno być przedziałów. Zarówno zbyt mała jak i zbyt duża liczba przedziałów utrudniają analizę i wyciąganie wniosków dotyczących rozkładu cechy (za mało - materiał zbyt rozproszony; za dużo - zacieranie się prawidłowości rozkładu danej cechy). Rozpiętość przedziału (interwał, rozstęp przedziałowy) jest różnicą między górną i dolną granicą badanej cechy. Jest uwarunkowana obszarem zmienności cechy, a tym samym liczbą ustalonych klas. Jeżeli nie ma uzasadnionych przeciwwskazań, interwały przedziałów powinny być jednakowe, ułatwia to wykonywanie działań matematycznych na szeregach a także analizę struktury, szczególnie przy porównaniach z innymi zbiorowościami. (w praktyce celowo tworzy się szeregi o nierównych interwałach w celu lepszej egzemplifikacji prezentowanego materiału np. w szeregu prezentującym strukturę indywidualnych gospodarstw rolnych wyodrębnia się klasy 0,51-2 ha, 2-5 ha, 5-7 ha, 7-10 ha, 10-15 ha, powyżej 15 ha). Granice przedziałów oznaczane są w dwojaki sposób: 2-4 , 4-6 itd.; lub 2-4 , 5-7 itd. W wariancie pierwszym górna granica przedziału jest jednocześnie dolna granicą klasy wyższej, dlatego też w celu uniknięcia nieporozumień przy zliczaniu jednostek o wartościach granicznych należy wyraźnie zaznaczyć do którego przedziału klasyfikujemy wartości graniczne. Oznakowanie takie odczytujemy: „od 2 do mniej niż 4, od 4 do mniej niż 6” lub „od ponad 2 do 4 włącznie, od ponad 4 do 6 włącznie”. W drugim przypadku górna granica klasy niższej jest o jednostkę mniejsza od granicy klasy wyższej, czyli „od 2 do 4,99”. Jeżeli w badanej zbiorowości występują wartości ekstremalne (duże lub małe) celowe jest stosowanie przedziałów otwartych („do 4, ... , 15 i więcej”), umożliwia to zmniejszenie ilości klas i wyeliminowanie tzw. klas pustych. Jednocześnie ogranicza to istotnie możliwości stosowania ilościowych metod analizy

Omówione powyżej szeregi charakteryzują stan badanej zbiorowości w ściśle określonym momencie czasu (statycznie).

SZEREGI PRZESTRZENNE (GEOGRAFICZNE) - przedstawiają rozmieszczenie wielkości statystycznych według jednostek administracyjnych, części świata, regionów gospodarczych itp.

SZEREGI DYNAMICZNE (CZASOWE, CHRONOLOGICZNE) - prezentują rozwój zjawisk w czasie, przy czym może tu być ściśle określony moment np. konkretny dzień konkretnego roku (szeregi czasowe momentów), lub pewien przedział jak lata czy miesiące (szeregi czasowe okresów).

TABLICE STATYSTYCZNE - wykorzystywane są do prezentacji danych uporządkowanych wg określonego kryterium. Stanowią one główną formę prezentacji danych liczbowych, dlatego też powinny spełniać określone wymogi dotyczące budowy - formalne oraz merytoryczne. Z formalnego punktu widzenia tablica powinna zawierać:

Część liczbową (tabela właściwa),

Część opisową : tytuł tablicy, nazwy wierszy (boczek), nazwy kolumn (główka), źródła danych, ewentualne uwagi wyjaśniające (np. legenda użytych znaków graficznych)

Obowiązuje zasada bezwzględnego wypełniania wszystkich kolumn i wierszy tablicy. Jeżeli wszystkie pola nie mogą być wypełnione liczbami stosuje się odpowiednie znaki umowne:

oznacza, że dane zjawisko nie występuje;

oznacza, że zjawisko występuje, ale w jednostkach mniejszych niż pół jednostki miary przyjętej w tablicy.

. (kropka) oznacza zupełny brak informacji lub brak informacji wiarygodnych

x oznacza, że danej rubryki nie można wypełnić ze względu na układ tablicy

* (gwiazdka) stawiana jest w tablicy obok liczby, dal zaznaczenie, że została ona zmieniona w stosunku do poprzednio publikowanej

„w tym” (napis) oznacza, ze nie podaje się wszystkich składników sumy ogólnej.

WYKRESY STATYSTYCZNE - liniowe (prezentacja za pomocą linii lub odcinków); powierzchniowe (prezentacja za pomocą figur płaskich - wykresy słupkowe i kołowe)

HISTOGRAM - wykres słupkowy

DIAGRAM - wielobok liczebności

KRZYWA LICZEBNOŚCI (CZĘSTOŚCI)

OPIS I WNIOSKOWANIE STATYSTYCZNE - Opis statystyczny ma charakter sumaryczny i dotyczy tylko i wyłącznie danej zbiorowości statystycznej. Przedmiotem opisu statystycznego są obserwacje badania pełnego, a jego narzędziem odpowiednie miary tzw. charakterystyki opisowe (np. średnia arytmetyczna, odchylenie standardowe, współczynnik korelacji). Metody analizy badań pełnych wchodzą w zakres statystyki opisowej. W szczególności metodami tymi są opis struktury, współzależności i dynamiki zjawisk masowych. Wnioskowanie statystyczne ma miejsce kiedy badanie jest reprezentacyjne (próba losowa) a jego wyniki uogólniane są na całą populację generalną, z której pochodzi próba. Podstawą wnioskowania statystycznego są empiryczne wyniki badania reprezentacyjnego (wyniki obserwacji losowo wybranej próby). Charakterystyki obliczane z próby losowej nazywamy statystykami (np. średnia arytmetyczna z próby, odchylenie standardowe z próby). Te same charakterystyki obliczane z obserwacji populacji generalnej noszą nazwę parametrów. Ponieważ w metodzie reprezentatywnej badaniu podlega jedynie, jej wybrana losowo część - parametry są szacowane w oparciu o wynik próby. Wartości zależą od wyników próby losowej. Jeżeli próba jest reprezentatywna, to statystyki są dobrymi estymatorami parametrów populacji generalnej. Wraz ze wzrostem liczebności próby wartość estymatorów zbliża się prawdziwych wartości parametrów.

Wyszukiwarka