Podstawowe pojęcia i metody statystyki.
Statystyka - jest to nauka zajmująca się metodami badania przedmiotów i zjawisk w ich
masowych przejawach oraz analizą ilościową lub jakościową z punktu widzenia
tej nauki, do którego zakresu te przedmioty i zjawiska należą.
Statystyka to metoda wydobywania informacji z danych i logika podejmowania decyzji w
warunkach niepewności.
Pierwsza część tej definicji wskazuje na przedmiot statystyki opisowej, zaś druga część
wskazuje na przedmiot statystyki matematycznej ( empirycznej ).
Pomiar, skale pomiarowe i rodzaje zmiennych.
Pomiar to przyporządkowanie obiektom badanym ( rzeczy, zdarzenia ) symboli
( słowa, cyfry, znaki ) w taki sposób, by relacjom między obiektami odpowiadały relacje
między symbolami. Sposób przyporządkowania musi podlegać empirycznej weryfikacji.
System symboli zastosowanych w pomiarze nazywamy skalą pomiarową.
Wyodrębnimy cztery hierarchicznie ułożone skale od najsłabszej do najmocniejszej pod
względem dopuszczalnych działań.
Skala
Właściwość
Możliwe działania
Nominalna
Identyfikacja badanej jednostki ze względu na
posiadanie lub nie posiadanie określonych
wariantów ( typów ) cech
Porządkowa
Jak wyżej + porządkowanie, przypisywanie
badanej jednostce określonego wariantu cechy
zgodnie z intensywnością posiadania danej cechy;
intensywność nie jest dokładnie zmierzona
Randowanie ( zamiana
wyników ze skal
wyższych na wyniki
porządkowe )
Przedziałowa
(interwałowa)
Jak wyżej + jednostka miary do ustalania różnic
między poszczególnymi wariantami cechy,
odstępy na skali takie same; początek skali
stanowi tzw. zero względne
Dodawanie, odejmowanie
Ilorazowa
(stosunkowa)
Jak wyżej + naturalna jednostka miary z zerem
absolutnym, do ustalania stosunku pomiaru dwóch
jednostek
Wszystkie
Skala
Własności
Przykład1
Przykład2
Nominalna
Klasy jakościowe
Deklaracja
zainteresowań
Podział na kobiety i nie
kobiety
Porządkowa j.w.+ hierarchia klas
Skala stopni szkolnych
Przemysłowe klasy jakości
Przedziałowa j.w. + jednostka
pomiaru
Skale znormalizowane
Lata kalendarzowe
Ilorazowa
j.w. + zero
bezwzględne
Wyniki testów
szybkości
Długość odcinka
1
Na podstawie skal możemy zdefiniować trzy rodzaje zmiennych, których wartości ustalamy
na drodze pomiaru:
1) jakościowe
2) porządkowe
3) ilościowe
Mając zmienną jakościową pomiaru dokonujemy na skali nominalnej, bądź
dokonujemy normalizacji danych z wyższych skal, np.: zamiast liczby punktów na
kolokwium wprowadzamy kategorie: zaliczył, nie zaliczył.
Mając zmienną porządkową pomiaru dokonujemy na skali porządkowej, bądź gdy
dane pochodzą z wyższych skal poddajemy randowaniu, np.: zamiana liczby punktów w
teście na oceny.
Mając zmienną ilościową pomiaru dokonujemy na skali interwałowej lub
stosunkowej. Zmienne ilościowe możemy podzielić na dyskretne ( np.: dzietność rodziny
studenta – bez ułamków ), bądź ciągłe ( np.: wzrost studentów ).
W statystyce opisowej poddajemy analizie strukturę zbiorowości, analizujemy
współzależność zjawisk oraz ich dynamikę. Aby przejść od danych do informacji stosujemy
miary statystyczne. Ich definicje zależą od rodzaju zmiennych, których dotyczą.
Ograniczając się do analizy struktury zjawisk, a w niej do miar:
1) tendencji centralnej
2) dyspersji
3) asymetrii
możemy wyodrębnić kilkanaście wskaźników zależnie od typu skali pomiarowej:
Skala
Miara tendencji
centralnej
Miara dyspersji
Miara asymetrii
Nominalna
Dominanta ( modalna )
Dyspersja względna
klasyfikacji
Porządkowa
j.w. + mediana, kwartyle j.w. + rozstęp, MAD,
odchylenie kwartylowe,
Współczynnik YULE’A
Przedziałowa
( interwałowa )
j.w. + średnie:
arytmety-czna,
harmoniczna,
chronologiczna
j.w. + wariancja,
odchylenie:
standardowe, medialne,
przeciętne, ćwiartkowe
j.w. + współczynniki
asymetrii klasyczne i
pozycyjne
Ilorazowa
( stosunkowa )
j.w. + średnia
geometryczna
j.w. + współczynniki
zmienności klasyczne i
pozycyjne
j.w.
MAD – dyspersja absolutna na medianie
Pytania kontrolne:
1. Uniwersalną miarą tendencji centralnej jest:
a. rozstęp
b. średnia geometryczna
c. dominanta
TAK
d. średnia arytmetyczna
2. Jeśli wprowadzą do skali porządkowej zero względne to uzyskam skalę interwałową?
Odp. NIE
2
Analiza pozycyjna struktur zbiorowości.
Analiza zmiennych ilościowych w dużych zbiorowościach ( n > 30 ) dotyczy tzw.
szeregów przedziałowych, które powstały w wyniku grupowania wariancyjnego.
Dane przedstawione są tu w postaci klas zwykle o tej samej długości. Miary pozycyjne w tych
szeregach to dominanta ( modalna ) oraz mediana, które określają tendencje centralną, czyli
taki punkt na skali pomiarowej względem którego skupiają się wartości zmiennych.
Jeśli stosujemy zapis taki, iż górna granica danego przedziału pokrywa się z dolną
następnego, to przyjmujemy, iż klasa jest lewostronnie domknięta, a prawostronnie otwarta
poza ostatnią klasą, która jest obustronnie domknięta.
Długość klasy ( c ) to różnica między górną i dolną granicą przedziału.
Klasą modalną nazwiemy taką klasę, której odpowiada największa liczebność ( odsetek ).
Oszacowanie modalnej graficznie polega na wyznaczeniu przecięcia się dwóch odcinków
łączących wierzchołki trzech kolejnych klas.
liczba oszczędzających
∆
x
oszczędności
x
0
M
o
Szacowanie modalnej jest tylko możliwe dla histogramów jednowypiętrzonych i
posiadających dwie niepuste klasy wokół modalnej. Modalną można określić wzorem:
c
n
n
n
n
n
n
x
x
x
M
d
d
d
d
d
d
*
)
(
)
(
1
1
1
0
0
0
+
−
−
−
+
−
−
+
=
∆
+
=
gdzie n
d
– liczebność w klasie dominanty
n
d-1
– liczebność w klasie poprzedzającej modalną
n
d+1
– liczebność w klasie następnej po modalnej
3