STATYSTYKA
Zbiorowość statystyczna - zbiór dowolnych jednostek, które mają przynajmniej jedną wspólną właściwość, a różnią się z innych punktów widzenia
zbiorowość pełna (populacja generalna) - zbiór wszystkich jednostek, co do których chcemy wnioskować o charakterystykach ich właściwości (N) skończona lub nieskończona
zbiorowość częściowa (próba) - podzbiór populacji generalnej, którego elementy zostały dobrane w sposób losowy lub nielosowy (n)
Określenie jednostki statystycznej pod względem: rzeczowym, czasowym, terytorialnym, zakresowym.
Cechy statystyczne:
mierzalne (ilościowe) - mogą przyjmować określone wartości wyrażone liczbowo
skokowe (o zmienności skokowej, bez wartości pośrednich)
ciągłe (o zmienności ciągłej, każda wartość z określonego przedziału)
niemierzalne (jakościowe) - ich wariantów nie można zmierzyć przy pomocy liczb
nominalne (nie ma hierarchii ich wariantów)
porządkowe (dają się ustawić w pewnej kolejności)
Metody statystyczne:
według kryterium formalno-statystycznego
metody opisu statystycznego
metody wnioskowania statystycznego
estymacja
weryfikacja hipotez
według kryterium zakresowo-przedmiotowego
metody analizy struktury
metody analizy współzależności
metody analizy dynamiki
Badanie statystyczne - ogół prac, których celem jest poznanie prawidłowości charakteryzujących określoną zbiorowość statystyczną
częściowe (dotyczące próby)
całkowite (odnośnie do populacji generalnej)
częstotliwość dokonywania
ciągłe
okresowe
doraźne (sporadyczne, jednorazowe)
Badania pełne (całkowite, generalne) - obejmują wszystkie jednostki określonej zbiorowości statystycznej m.in. spis statystyczny, rejestracje statystyczne, sprawozdawczość statystyczna
Badania częściowe (niepełne) - obejmują tylko pewną wybraną część populacji generalnej (próbę)
Dobór próby:
losowy
warstwowy
prosty
losowanie
dobór za pomocą liczb losowych
dobór systematyczny
dobór wielostopniowy
dobór celowy
dobór jednostek typowych
dobór proporcjonalny
dobór przez eliminację
Szacunek statystyczny (ocena statystyczna):
- na podstawie pewnych, znanych nam cech zbiorowości ustalamy wartości innych, nieznanych cech tej zbiorowości
- na podstawie cech znanej zbiorowości ustalamy te same lub pokrewne cechy zbiorowości nieznanej
- na podstawie wielkości zjawiska w okresach poprzednich ustalamy wielkość tego zjawiska w przyszłości
Etapy badań statystycznych:
- projektowanie badania
- obserwacja statystyczna
- opracowanie i prezentacja materiału statystycznego
- analiza statystyczna (opis lub wnioskowanie statystyczne)
Kontrola materiału statystycznego:
kontrola formalna
kontrola kompletności materiału statystycznego
kontrola zupełności zapisów
kontrola zgodności rachunkowej
kontrola merytoryczna
Szeregi statystyczne (rozkład empiryczny):
szeregi szczegółowe - uporządkowany rosnąco lub malejąco ciąg wartości badanej cechy; uporządkowanie następuje według wartości badanej cechy
szeregi rozdzielcze (strukturalne) - zbiór wartości liczbowych uporządkowanych według wariantów badanej cechy mierzalnej lub niemierzalnej; poszczególnym wariantom cechy przyporządkowane są odpowiadające im liczebności
cech mierzalnych
szeregi rozdzielcze punktowe
szeregi rozdzielcze przedziałowe
o przedziałach zamkniętych
o przedziałach otwartych
cech niemierzalnych
szeregi przestrzenne (geograficzne)
szeregi czasowe
momentów
okresów
Dystrybuanta empiryczna - szereg rozdzielczy skumulowany
Graficzna prezentacja danych:
- wykresy słupkowe
- wykresy kołowe
- wykresy liniowe
- kartogramy
- wykresy w układzie współrzędnych (histogramy, krzywe liczebności, diagramy)
Analiza struktury - badanie budowy określonej zbiorowości, z jakich elementów się składa i jaką część stanowią te elementy w całości zbiorowości
Wskaźnik struktury - częstość względna
Miary przeciętne:
klasyczne
średnia arytmetyczna - przeciętny poziom badanej cechy w populacji
średnia harmoniczna
średnia geometryczna
pozycyjne
dominanta
mediana
Średnia arytmetyczna:
xmin ≤ średnia arytmetyczna ≤ xmax
suma odchyleń poszczególnych wartości cechy od średniej arytmetycznej = 0
suma odchyleń poszczególnych wartości cechy od średniej arytmetycznej jest minimalna
suma wartości cechy jest równa iloczynowi średniej arytmetycznej i liczebności zbiorowości
wartość średniej arytmetycznej zależy nie od absolutnych wielkości wag, ale od ich proporcji
Dominanta - wartość, która w zbiorowości występuje najczęściej
W szeregu rozdzielczym przedziałowym, aby wyznaczyć dominantę:
- musi występować jeden przedział klasowy z wyraźniej dominującą w stosunku do pozostałych liczebnością
- przedział klasowy, w którym znajduje się dominanta oraz dwa przedziały z nią sąsiadujące muszą mieć jednakowe rozpiętości
- szereg nie może być skrajnie asymetryczny z otwartym przedziałem dominującym
Mediana - wartość, która jest umieszczona dokładnie w środku, pod warunkiem, że mamy do czynienia z uporządkowaną zbiorowością według wielkości jej elementów
Mediana:
- może być wyznaczana w szeregach o otwartych przedziałach klasowych
- można ją wyznaczyć do opisania zbiorowości, których nie można określić liczbowo
- jest jedyną średnią, którą można wyznaczyć dla rozkładów skrajnie asymetrycznych
- nie jest wrażliwa na wartości skrajne
- może być wyznaczana w szeregach o nierównych rozpiętościach przedziałów klasowych
Miary zróżnicowania (zmienności, rozproszenia, dyspersji):
bezwzględne
klasyczne
odchylenie przeciętne - średnie odchylenie od średniej arytmetycznej
odchylenie standardowe - o ile przeciętnie różnią się wartości cechy poszczególnych jednostek od ich średniej arytmetycznej
pozycyjne
obszar zmienności (rozstęp)
odchylenie ćwiartkowe
względne
klasyczne
współczynnik zmienności
pozycyjne
współczynnik zmienności
Obszar wartości typowych - typowy klasyczny obszar zmienności cechy (średnia arytmetyczna +/- odchylenie standardowe; w tym przedziale mieści się 68% jednostek badanej zbiorowości)
Asymetria (skośność szeregu):
- symetria (średnia arytmetyczna = mediana = dominanta)
- asymetria prawostronna (dodatnia; dominanta ≤ mediana ≤ średnia arytmetyczna)
- asymetria lewostronna (ujemna; średnia arytmetyczna ≤ mediana ≤ dominanta)
Koncentracja - nierównomierny podział ogólnej sumy wartości cechy pomiędzy poszczególne jednostki zbiorowości
- metoda graficzna (krzywa Lorenza)
- metoda numeryczna (współczynnik koncentracji Lorenza K)
Korelacja dwóch cech mierzalnych (zależność między dwoma cechami):
Współczynnik korelacji liniowej Pearsona (rxy)
jest miarą symetryczną, co oznacza, że siła i kierunek zależności są takie same ja w odwrotnym oznaczeniu cech (rxy = ryx)
jest miarą niemianowaną
jest miarą unormowaną (-1 ≤ rxy ≤ 1)
pozwala na określenie nie tylko siły, ale i kierunku zależności między zmiennymi
+ dodatnia korelacja, - ujemna korelacja
Współczynnik korelacji równy 0 może świadczyć o zupełnym braku związku korelacyjnego między badanymi cechami (albo o braku liniowej zależności)
|rxy| = 0 brak
|rxy| ≤ 0,2 niewyraźna
0,2 ≤ |rxy| ≤ 0,4 niska
0,4 ≤ |rxy| ≤ 0,7 umiarkowana
0,7 ≤ |rxy| ≤ 0,9 znacząca
|rxy| > 0,9 silna
|rxy| = 1 zależność funkcyjna
Współczynnik korelacji rang Spearmana:
dane przedstawione w szeregu korelacyjnym
cechy mierzalne lub niemierzalne porządkowe
nieduża liczba badanych jednostek
-1 ≤ rs ≤ 1
Analiza regresji - metoda badania wpływu zmiennych uznanych za niezależne (objaśniające) na zmienną uznaną za zależną (objaśnianą)
Funkcja regresji ŷi = a + bxi
Współczynnik regresji (b) - wskazuje o ile przeciętnie zmieni się wartość zmiennej zależnej, jeśli wartość zmiennej niezależnej zmieni się o jednostkę
Średni błąd szacunku (Se, średni błąd resztowy) - o ile przeciętnie różnią się wartości zmiennej zależnej wyznaczone na podstawie funkcji regresji od jej wartości empirycznych
Współczynnik determinacji (0≤R2≤1) miara dopasowania funkcji regresji do danych empirycznych
Miary korelacji dla danych pogrupowanych w tablicy korelacyjnej:
Stosunek korelacji (eyx)
obliczany dla zależności prostoliniowej i krzywoliniowej
jedna cecha mierzalna, druga mierzalna lub niemierzalna porządkowa
0 ≤ eyx ≤ 1
eyx ≠ exy
|ryx| ≤ eyx
Współczynnik współzależności C-Pearsona
Oblicza się głównie dla cech jakościowych i dla tablic wielopolowych (>2x2)
0 ≤ C ≤ 1
skorygowany współczynnik C-Pearsona liczony w celu unormowania miary dla tablic o różnej wielkości
Współczynnik współzależności Φ-Yule'a
obliczany dla tablic czteropolowych i cech najczęściej jakościowych
-1 ≤ Φ ≤ 1
Miary dynamiki:
Przyrosty absolutne (w jednostkach mianowanych)
jednopodstawowe
łańcuchowe
Przyrosty względne (w jednostkach niemianowanych)
jednopodstawowe
łańcuchowe
Indeksy indywidualne (dla kategorii wewnętrznie jednorodnych)
jednopodstawowe
łańcuchowe
Indeksy agregatowe (zespołowe; stosowane do kategorii będących niejednorodnym agregatem, składającym się z różnych składników)
agregatowy indeks wartości
agregatowy indeks ilości
Według formuły Laspeyres'a (cena blokowana na poziomie 0)
Według formuły Paasche'go (cena blokowana na poziomie 1)
agregatowy indeks cen
Według formuły Laspeyres'a (ilość blokowana na poziomie 0)
Według formuły Paasche'go (ilość blokowana na poziomie 1)
Średniookresowe tempo zmian
średni indeks wyznaczony jako średnia geometryczna
średniookresowe tempo zmian wyrażone w procentach
Na zmiany zjawiska w czasie mają wpływ:
tendencja rozwojowa (trend) - systematyczne jednokierunkowe zmiany poziomu badanego zjawiska, zachodzące w długim okresie
Funkcja trendu: ŷt = b1*t + b0 (ŷ - teoretyczne wartości Y wyliczone z funkcji trendu; b1 - współczynnik funkcji trendu; t(czas) = 1,2…,n; b0 - wyraz wolny)
wahania okresowe (sezonowe) - rytmiczne wahania o określonym cyklu
wahania koniunkturalne -systemowe, falowe wahania rozwoju gospodarki w długim okresie
wahania przypadkowe
Dekompozycja - wyodrębnienie wszystkich możliwych elementów szeregu czasowego
metoda mechaniczna (wykorzystująca średnie ruchome)
metoda analityczna (polegająca na dopasowaniu oszacowania parametrów równania funkcji opisującej dany szereg czasowy
Created by Ues