Statystyka
Ć
wiczenia – wymiar godzin : 18
Harmonogram zajęć –
według wyznaczonego planu (od 2-4 godzin)
Forma zaliczenia końcowego –
kolokwium na ostatnich
zajęciach (po uzgodnieniu z grupą) z oceną
Cele ćwiczeń do wykładu Statystyka
•
Wyjaśnienie
•
Ugruntowanie wiedzy przekazanej na wykładach
•
Uzupełnienie wiedzy w oparciu o przykłady
•
Przećwiczenie sposobów obliczania podstawowych wielkości statystycznych
•
Sprawdzenie nabytej wiedzy i umiejętności (kolokwium na ocenę )
W ciągu semestru na ćwiczeniach nie ma ocen
Kolokwium zaliczeniowe składa się z:
- części „zadaniowej”
-
części „teoretycznej’ (głownie rozumienie pojęć statystycznych - test)
Uzyskanie z kolokwium ocen 3,5; 4,0; 4,5; 5,0 uprawnia do uzyskania oceny z egzaminu
odpowiednio o 0,5 punktu niższej.
Literatura do ćwiczeń:
•
Podgórski J., Statystyka dla studiów licencjackich, PWE, Warszawa 2010.
•
Sobczyk M., Statystyka, Wydawnictwo Naukowe PWN, Warszawa 2010.
•
Rocznik Statystyczny GUS (na bieżąco).
Treści ćwiczeń :
Rozkład cechy i jego prezentacja
Dane pierwotne.
Grupowanie statystyczne.
Szeregi statystyczne.
Tablice statystyczne.
Prezentacja graficzna szeregów statystycznych
Miary położenia
Ś
rednia arytmetyczna.
Ś
rednia arytmetyczna prosta.
Ś
rednia arytmetyczna ważona.
Ś
rednia geometryczna.
Ś
rednia harmoniczna.
Dominanta. Graficzne wyznaczanie dominanty.
Dominanta dla szeregu rozdzielczego.
Kwartyle i mediana. Kwartyl pierwszy i trzeci.
Mediana dla szeregu prostego.
Mediana dla szeregu rozdzielczego
Miary zmienności
Rozstęp.
Odchylenie standardowe.
Wariancja.
Współczynnik zmienności.
Odchylenie przeciętne.
Odchylenie ćwiartkowe
Spłaszczenie i koncentracja rozkładu
Bezwzględne i względne miary spłaszczenia.
Krzywa koncentracji Lorenza
Statystyka ćwiczenia– dr Waldemar Gulczyński
Treści ćwiczeń:
Analiza korelacji i regresji
Diagramy korelacyjne.
Współczynnik korelacji liniowej Persona.
Tablica korelacyjna.
Liniowe funkcje regresji dwóch zmiennych
Analiza dynamiki zjawisk
Wskaźniki statystyczne.
Współczynniki natężenia.
Wskaźniki struktury.
Wskaźniki dynamiki zjawisk.
Agregatowe indeksy dynamiki.
Rozkład cechy i jego prezentacja
Użyteczność znajomości statystyki
Cecha. Zmienna.
Dane pierwotne.
Tablice statystyczne.
Statystyka (statistics)
-
dyscyplina traktująca o tym, jak zbierać dane (procedury zbierania danych)
-
dyscyplina traktująca o sposobach (metodach) poszukiwania (na podstawie zgromadzonych
danych) prawidłowości występujących w zjawiskach masowych
Przedmiotem badań statystyki są zbiorowości statystyczne
zjawiska masowego
•
nie można uchwycić na podstawie pojedynczej obserwacji
•
można je zauważyć dopiero przy uwzględnieniu odpowiednio dużej liczby informacji
(pojawia się w procesie masowym)
Prawidłowość statystyczna
w procesie masowym pojawienie się zjawiska wynika z jednokierunkowego działania na
wszystkie jednostki danej zbiorowości tego samego splotu istotnych (ważnych) przyczyn
systematycznych
oraz równoczesnego pojawienia się w każdej jednostce odmiennych, różnokierunkowych
przyczyn przypadkowych (których wpływ wzajemnie znosi się)
Zbiorowość statystyczna (populacja) – existent population
ma skończona liczbę jednostek (elementów, punktów na wykresie) zwaną liczebnością
ogólną
Zbiór jednostek obserwacji nie identycznych, ale stanowiących jedną logiczną całość.
Jednostki te wyróżnia się ze względu na podane w badaniu charakterystyczne własności
Zbiorowość generalna
(populacja generalna)
-skończony lub nieskończony zbiór jednostek, które zamierzamy poddać obserwacji empirycznej
w badaniu pełnym (wyczerpującym)
Cecha statystyczna (badania)
(characteristic, item, variable)
wyróżniona własność (właściwość), pod względem której badane są jednostki zbiorowości
statystycznej, np.:
-gospodarcze lub społeczne
-istotne lub nieistotne
-indywidualne lub agregatowe
-kwantytatywne (ilościowe) lub werbalne (jakościowe)
-skokowe lub ciągłe
Cecha jakościowa (qualitative character)
Nie może być bezpośrednio wyrażona liczbą, jednostka statystyczna, która ją posiada,
bezpośrednio może być tylko zaliczona do pewnej kategorii (zbioru) jednoznacznie
zdefiniowanego zjawiska
Przykład:
płeć, zawód, pochodzenie społeczne, kolor oczu,
(także cechy alternatywne: „zatrudniony” lub „niezatrudniony”)
Cecha ilościowa skokowa
(discrete variable)
może przybierać tylko skończoną, przeliczalną liczbę wartości (tworząc rozkład punktowy)
Przykład:
-liczba pojazdów samochodowych konkretnej firmy
-liczba osób zatrudnionych w firmie
-liczba osób, które zginęły w wypadkach samochodowych w określonym dniu
-pogłowie konkretnego stada bydła rogatego
Cecha ilościowa ciągła
(continues variable)
Wystąpi, gdy jej wartość w zasadzie może być wyrażona przez każdą z liczb rzeczywistych. W
praktyce jednak wystąpią ograniczenia.
Przykład:
-ciężar transportowanych towarów,
-czas wykonania jakiejś pracy
Zmienna ( quantitative variable )
Cecha zbiorowości generalnej, w obrębie której, w konsekwencji pomiaru poszczególnych
jednostek można im przyporządkować konkretne wartości liczbowe.
Przykład:
Produktywność można wyrazić przez:
-pomiar „czasochłonności produkcji”: ilość czasu potrzebną do wykonania 1 sztuki wyrobu
-pomiar „wydajności pracy”: ilość sztuk wyrobu wyprodukowanego w ustalonej jednostce
czasu
W tym przypadku to samo zjawisko może być scharakteryzowane przez - co najmniej - dwie
zmienne.
Materiał statystyczny
-zbiór indywidualnych konkretnych zapisów liczbowych o wartościach cech badanych jednostek
zbiorowości
Badanie wyczerpujące (pełne) – w którym obserwacji podlegają wszystkie jednostki zbiorowości
generalnej, a wyniki obserwacji stanowią charakterystykę tej zbiorowości.
Badanie nie wyczerpujące (częściowe) – w którym obserwacji poddajemy część jednostek
zbiorowości generalnej, czyli próbę
Materiały statystyczne - ze względu na źródło pochodzenia
Materiał pierwotny
– spełnia wszelkie wymogi merytoryczne i formalne, jakie stawia wiedza statystyczna, a
uzyskane informacje wykorzystuje się tylko dla potrzeb analizy statystycznej i nie są
udostępniane postronnym osobom (instytucjom)
Materiał wtórny
– wszelkie dokumenty i materiały, które powstają w toku działalności władz czy
przedsiębiorstw, a zbierane są dla innych celów niż statystyczne (np. dane księgowości), ale
są wykorzystywane w badaniach o charakterze statystycznym.
Sposoby zbierania pierwotnego materiału statystycznego
1. Badania wyczerpujące
•
Rejestracja bieżąca
•
Spis powszechny
2. Badania nie wyczerpujące
•
Monografia
•
Ankieta
•
Metoda reprezentacyjna
Sposoby prezentacji danych
Tablica (tabela) statystyczna (statistical table)
Stanowi uporządkowaną formę systematycznego przedstawienia danych liczbowych,
będących efektem badań statystycznych.
Zawiera liczbowy opis zbiorowości statystycznej według:
•jednej cechy (tablice proste)
•większej liczby cech (tablice złożone)
Każda tablica składa się z trzech zasadniczych elementów:
•
Tytułu – określa treść tablicy, zakres czasowy i przestrzenny
•
Tablicy właściwej - opis poszczególnych wierszy (boczek) i kolumn (główka) , prezentacja
materiału statystycznego
•
Źródła
Cechy statystyczne
Właściwości jednostek, będące przedmiotem badania.
Konkretne wartości jakie przyjmuje cecha określamy jako warianty (odmiany) cechy.
Przykład:
Cecha: wiek
Warianty (odmiany) cechy: 25 lat, 30 lat, 45 lat, 60 lat.
Cecha: płeć
Warianty (odmiany) cechy: kobieta, mężczyzna
Cecha: dochód
Warianty (odmiany) cechy: nieskończenie wiele wartości
Cechy statystyczne stałe i zmienne
Cechy stałe nie podlegają badaniu statystycznemu, ale decydują o zaliczeniu jednostek do
określonej kategorii (np. pracownicy konkretnej firmy)
Cechy pod względem których jednostki różnią się między sobą nazywamy cechami
zmiennymi (pracownicy różnią się: wykształceniem, kwalifikacjami, dochodem, stażem
pracy…)
Zaobserwowane w badaniach cechy przyjmują określony rozkład.
Rozkład – zaprezentowany w formie:
•
par
•
tabelarycznej
•
graficznej
zbiór wariantów cechy i odpowiadających im liczebności (częstości)
Opracowanie i prezentacja materiału statystycznego:
Podstawowy problem z dużymi zbiorami danych.
Konieczne uporządkowanie zebranych danych oraz redukcja informacji.
Grupowanie jako czynność systematyzowania materiału statystycznego
Grupowanie polega na podziale zbiorowości na możliwie jednorodne grupy zgodnie z
przyjętymi kryteriami.
Można tego dokonać za pomocą:
-
jednej cechy (grupowanie proste)
-
kilku cech jednocześnie (grupowanie złożone)
Grupowanie powinno być:
•
wyczerpujące
•
rozłączne
•
efektywne
Zebrany materiał statystyczny analizujemy, poddając go grupowaniu statystycznemu i
uporządkowaniu.
Efektem grupowania statystycznego według jednej cechy są szeregi statystyczne.
Efektem grupowania statystycznego według wielu cech są tablice statystyczne.
Szereg statystyczny
Ciąg wariantów cechy uporządkowanej rosnąco lub malejąco, pogrupowany według
określonych kryteriów.
Rodzaje szeregów statystycznych:
•
Szczegółowe (wyliczające)
•
Rozdzielcze (strukturalne)
•
Przestrzenne (geograficzne)
•
Czasowe (dynamiczne)
Szereg
szczegółowy
(wyliczający):
uporządkowany –rosnąco/malejąco - ciąg wartości liczbowych badanej cechy
Zastosowanie szeregu szczegółowego:
-ograniczone, ze względu na jego niską wartość informacyjną
-stosujemy go wtedy, gdy przedmiotem obserwacji jest niewielka liczba jednostek
-niewygodne w wykrywaniu prawidłowości statystycznych
-w tego rodzaju szeregach występują zwykle powtarzające się cechy
Szereg
rozdzielczy
(strukturalny):
-ciąg wartości liczbowych badanej cechy mierzalnej/niemierzalnej, którym
przyporządkowane są odpowiadające im liczebności
Szereg
rozdzielczy
(strukturalny) punktowy
-niewielka liczba
wariantów cechy
Szereg rozdzielczy przedziałowy powstaje z pogrupowania wartości szeregu szczegółowego w
pewna liczbę rozłącznych przedziałów zwanych klasami.
Mniejsza z dwóch liczb: dolna granica klasy (kres dolny przedziału)
Większa z dwóch liczb: górna granica klasy (kres górny przedziału)
Różnica: interwał (rozstęp klasowy)
Przedziały klasowe: domknięty lub otwarty
Ustalanie przedziałów klasowych w szeregach rozdzielczych
Szereg przestrzenny
Narzędzie służące uchwyceniu różnic zachodzących w rozmieszczeniu terytorialnym zjawisk
masowych.
Podstawą budowy tego rodzaju szeregów jest zwykle podział administracyjny kraju
(województwa, powiaty, gminy)
Szereg rozdzielczy (strukturalny) przedziałowy
Zastosowanie szeregu rozdzielczego:
-
przydatne do opisu struktury
-
można w tej formie przedstawić zarówno cechy mierzalne jak i niemierzalne
Szeregi dynamiczne (czasowy)
Opisują zmiany zachodzące w poziomie badanych zjawisk w różnych okresach lub
momentach czasu.
Ze względu na to wyróżnia się:
-szereg czasowy momentów – wartości badanej cechy w ściśle określonym momencie czasu,
zjawiska, które nie przyjmuje stanu zerowego (stan zapasów, ludność Polski)
-szereg czasowy okresów – w którym obserwuje się przyrost lub spadek poziomu zjawiska
w kolejnych jednostkach czasu (wartość eksportu, liczba wypadków przy pracy)
Tablice statystyczne
Zawierają opis zbiorowości statystycznej:
-według jednej cechy (tablice proste)
-według większej liczby cech (tablice złożone)
Tablice zbiorcze – opisują kilka zbiorowości statystycznych za pomocą jednej cechy
Tablice kombinowane – jedna zbiorowość ze względu na kilka cech jednocześnie
Wykres – elementy
•
Tytuł
•
Pole wykresu
•
Skala wykresu
•
Legenda wykresu
•
Źródła danych statystycznych
Skala – linia, której poszczególne punkty mogą być odczytane jako określone liczby
Podziałka skali – długość odcinka przyjęta za jednostkę miary, najczęściej wyrażoną w
układzie CGS
Skale:
Prostoliniowe – linijka centymetrowa
Krzywoliniowe – skale kołowe, paraboliczne,…
Rodzaje wykresów:
•
Kołowe
•
Słupkowe
•
Liniowe