Statystyka – zajmuje się badaniem zjawisk masowych i wykrywaniem prawidłowości które w tych zjawiskach zachodzą
Działy:
Statystyka | |||
---|---|---|---|
opisowa | matematyczna | ||
Rachunek | |||
prawdopodobieństwa |
Statystyka opisowa – zajmuje się wszechstronnym opisem zbiorowości statystycznej przy użyciu dostępnych statystycznych metod ilościowych
Statystyka matematyczna – zajmuje się wnioskowaniem o populacji generalnej na podstawie wyników badania próby losowej
Zbiorowość statystyczna – ogół jednostek podobnych do siebie (nie koniecznie takich samych) wyróżnionych ze względu na pewną właściwość wspólną wszystkim jednostkom tworzącym zbiorowość
Jednostka statystyczna – to najmniejszy element zbiorowości statystycznej
Cecha statystyczna – właściwości zbiorowości ze względu na która tą zbiorowość badamy (wzrost, waga)
Rodzaje cech statystycznych:
Ilościowa – da się bezpośrednio wyróżnić liczbowo – waga wzrost
Jakościowa – nie da się bezpośrednio wyrazić liczbowo jedynie opisem słownym, skrótem literackim, kodem (kolor oczu)
Zbiorowość statystyczna – może mieć charakter populacji (generalna) lub próby (losowa)
Populacja – zbiorowość złożona ze wszystkich jednostek wyróżnionych ze względu na pewną cechę np. populacja mieszkańców Polski
Próba – pewna część podzbiorowości populacji:
Badanie populacji to padanie pełne – wyczerpujące – czyli każda jednostka bierze udział w badaniu np. Narodowy spis ludności
Badanie próby to badanie częściowe – jeżeli wylosowana próba jest reprezentowana to wyniki badania próby nie będą znacząco odbiegały od wyniku badania populacji. Reprezentatywność gwarantujemy poprzez odpowiednią ilość i losowy dobór jednostki
W ramach cech ilościowych wyróżnić można cechy:
Skokowe – ich wartość należy do zbioru skończonego lub przeliczalnego (0,1,2,3..)
Ciągłe – wartość należy do zbioru nieskończonego lub nieprzeliczalnego – wzrost – dokładność pomiaru
Mierzenie – polega na przypisaniu wartościom cechy bądź kategoriom cechy: liczb, opisów słownych, znaków
4 podstawowe skale metryczne
Nominalna – najmniej precyzyjna, mierzenie polega na przepisaniu wartości kategorii: cechy, kodów, cyfr – jeżeli służą tylko do identyfikacji
Głównie mierzymy skalą jakościową. Wolno jedynie porównywać, zliczać jednostki należące do tej kategorii
Porządkowa – czyli skala nominalna + możliwość podporządkowania obiektów np. natężenie wartości cechy, mogą to być cechy jakościowe i ilościowe – wykształcenie
Cechy ilościowe – skala ocen, gatunki owoców – możemy porządkować obiekty, nie da się określić o ile coś jest lepsze – nie wolno odejmować
Skala przedziałowa – skala porządkowa + można odejmować, nie można dzielić, gdyż skala ta nie posiada tzw. Pkt odniesienia czyli zera bezwzględnego np. mówimy że coś jest o 20oC cieplejsze a nie 2 razy cieplejsze gdyż 0 to nie zero bezwzględne
Ilorazowa – skala przedziałowa + ma punkt odniesienia – zero absolutne – co umożliwia dzielenie skali
Szeregi statystyczne – forma uporządkowania danych według określonego kryterium
Rodzaje szeregów:
Szczególny prosty – wartości cechy są uporządkowane nie malejąco lub nie rosnąco według określonego kryterium (np. zbiór ocen)
Szczególny ważony – wartości cechy przepisujemy liczebności z którymi te wartości występują
Rozdzielczy przedziałowy – tworzony gdy cecha ma charakter ciągły lub jest skończona ale ma dużo wariantów. Wartości cechy są pogrupowane w przedziale liczbowym
Miary położenia zbiorowości statystycznej:
Średnie klasyczne - wyrażają przeciętny poziom cechy zbiorowości - arytmetyczna , geometryczna , harmoniczna , potęgowa
Własności średniej arytm – suma odchyleń wartości cechy średniej arytmetycznej wynosi zawsze 0
Własności o dodaniu stałej – jeżeli do każdej wartości cechy w szeregu statystycznym dodamy pewną stałą C to średnia arytmetycznej tego szeregu wzroście o wartość stałej C
Własność o mnożeniu przez stałą – jeżeli wartość każdej cechy w szeregu statystycznym pomnożymy przez pewną stałą C to średnia arytmetyczna z takiego szeregu wzrośnie C-krotnie
Suma kwadratów odchyleń wartości cechy od średniej arytmetycznej jest najmniejsza – zastosowanie dla metody najmniejszych kwadratów
Średnia geometryczna – stosujemy gdy w szeregu statystycznym występują wartości odstające np. 1,2,2,6,529
+- w mniejszym stopniu przekształca nam przeciętny poziom cechy
Średnia harmoniczna – średnie tempo zmian zjawiska w czasie – liczymy gdy wartość cechy wyrażona jest w jednostkach bezwzględnych
Modalna – to taka wartość cechy która w szeregu statystycznym występuje najczęściej
Miary pozycyjne
Medialna – wartość cechy która dzieli zbiorowość na takie dwie części, że połowa jednostek ma wartość cechy nie większą od mediany oraz druga połowa nie mniejszą od mediany
Kwartyl I – dolny – wartość cechy która dzieli zbiorowość w ten sposób, że 25% jednostek ma wartość cechy nie mniejszą od Kwartyla I a 75% jednostek ma wartości cechy większe lub równe kwartylowi I
Kwartyl II – górny – wartość cechy która dzieli zbiorowość w ten sposób, że 75% jednostek ma wartość cechy nie większą od Kwartyla III a 25% jednostek ma wartości cechy nie mniejsze od kwartyla III
Miary zróżnicowania zbiorowości statystycznej – miary rozproszenia
Rozstęp – max i min – wartość cechy (xi) - informuje o maksymalnej wartości cechy w zbiorowości statystycznej. Natomiast nie informuje co się dzieje ze zmienności w pozostałych jednostkach znajdujących się pomiędzy Min i max
Wariancja – średnia z kwadratu odchyleń wartości cechy od średniej arytmetycznej – nie interpretujemy
Odchylenie standardowe – informuje o ile przeciętnie wartość cechy różni się od średniej arytmetycznej, czyli jakie jest przeciętne zróżnicowanie cechy
Współczynnik zmienności – ocenia czy odchylenie standardowe jest duże. Informuje jaki jest udział odchylenia standardowego w średnim poziomie cechy X. Im wartość Vs jest większa tym większe zróżnicowanie wartości cechy.
Współczynnik asymetrii – informuje jaki jest kierunek asymetrii i jakie jest jej natężenie.
Rozkład asymetrii prawostronnej – informuje że większość jedn. Stat. Ma mniejszą wartość cechy niż średnia wartość zbiorowości
Rozkład asymetrii lewostronnej – inf że większość jedn. Ma wyższą wartość cechy niż średnia
Rozkład Symetrii – większość jednostek ma wartość różną średniej
Współczynnik skośności – przyjmuje wartość na ogół As=[-1;1] natężenie jest tym wyższe im bliżej jest tego przedziału
Koncentracja – K>3 – wartość cechy wykazuje silniejszą koncentracje niż w tzw rozkładzie normalnym
K<3 – wartość cechy ma słabsza koncentracje niż rozkład dominalny
K=3 – stopień koncentracji wartości cechy w rozkładzie empirycznym jest taki jak w rozkładzie normalnym
Rozkład normalny – większość zjawisk posiada cechy zbliżone do rozkładu normalnego
Kurtoza – współczynnik ekscesu
Ku > 0 – rozdział bardziej wysmukły niż rozkład normalny od danej średniej i danym odchyleniu standardowym
Ku < 0 – rozkład bardziej spłaszczony niż rozkład normalny od danej średniej i danym odchyleniu standardowym
Ku = 0 – stopień spłaszczenia rozkładu jest taki jak w rozkładzie normalnym
Odchylenie ćwiartkowe – wartość odchylenia informuje o zróżnicowaniu 50% jednostek statystycznych których wartości cechy znajdują się pomiędzy kwartylem I i kwartylem II
Liniowa funkcja represji – matematyczny model opisujący liniową zależność cechy objaśnionej Y od cechy objaśniającej x przy pomocy następującego równania
Współczynnik represji b – informuje o ile zmieni się wartość cechy Y gdy wartość cechy X wzrośnie o jednostkę
b>0 – wartość cechy Y wzrośnie średnio o b jednostek przy jednostkowym wzroście cechy x
b<0 – oznacza że wartość cechy Y zmniejszą się średnio o b jednostek przy jednostkowym wzroście cechy X
Metoda najmniejszych kwadratów – służy do szacowania parametrów funkcji represji
Odchylenie standardowe reszt – informuje o ile średnio rzeczywiste wartości cechy różnią się od wartości teoretycznej y^
Współczynnik zbieżności – przyjmuje wartość z przedziału [0;1] – podaje jaką część zmienności cechy objaśnionej y została wyjaśniona w przyjętym modelu represji zmiennością x
Współczynnik determinacji – informuje jaka część zmienności cechy Y została wyjaśniona w przyjętym modelu represji zmiennością cechy X
Współczynnik zmienności resztowej – informuje jaki jest udział w odchylenia standardowego reszt w średnim poziomie cechy Y. Im mniejsze tym dopasowanie modelu do danych jest lepsze
Macierz korelacji – kwadratowa, symetryczna i nieujemna
Współczynnik korelacji cząstkowej – mierzymy kierunek i natężenie współzależności dwiema wyróżnionymi cechami przy eliminacji wpływu cechy pozostałej
Współczynnik korelacji wielorakiej – mierzy łączny wpływ grupy cech na jedną wyróżnioną cechę
Analiza dynamiki zjawisk
Szeregi czasowe – uporządkowane w sposób chronologiczny wartość cechy
Okresów – rejestrujemy wielkość danego zjawiska za dany okres czasowy
Momentów – rejestrujemy wielkość zjawiska w danym momencie
Trend – tendencja rozwojowa, stałe systematyczne zmiany zjawiska zachodzące w czasie pod wpływem przyczyn głównych – trwale oddziałujących na dane zjawisko
Mechaniczne – średnie ruchome
– dla nieparzystej n – ciąg średniej kroczącej jest mniejszy o 2 od liczby n wahania są, ale mniejsze niż w oryginalnym szeregu wahania zredukowane
Analityczne – za pomocą parametrów odpowiedniej funkcji analitycznej
Wahania sezonowe – w regularnych odstępach czasu systematycznie pod wpływem przyczyn o charakterze sezonowym
Wahania przypadkowe – nie da się ich przewidzieć wywołane np. zjawiska przypadnicze
Mierniki dynamiki zjawisk w szeregu czasowym
Przyrosty
Absolutne łańcuchowe-informuje o ile jednostek zmienia się wielkość zjawiska w okresie biegnących t w stosunku do okresu poprzedniego.
Absolutne jednopodstawowe – o ile jednostek zmieni się wielkość zjawiska w okresie bieżącym w stosunku do okresu bazowego
Względne łańcuchowe – informuje o ile procent zmieni się wielkość zjawiska w okresie bieżącym w stosunku do poprzedniego
Względne jednopodstawowe – przyrosty te informują o ile procent zmieni się wielkość zjawiska w okresie bieżącym w stosunku do okresu bazowego
Indeksy
Łańcuchowe – informują o ile procent zmienia się wielkość zjawiska w okresie bieżącym w stosunku do okresu bieżącego
Jednopodstawowe – informuje o ile procent zmieni się wielkość zjawiska w okresie bieżącym w stosunku do okresu bazowego
Średniookresowe tempo wzrostu zjawisk w czasie – wskaźnik ten informuje o ile procent z okresu na okres zmienia się wielkość zjawiska w czasie
Wskaźnik sezonowości – informuje o ile % średnio w tym okresie jednoimiennym zmieniła się wielkość zjawiska w stosunku do średniej wielkości zjawiska w całym badanym okresie
Absolutny poziom odchylenia wyniku sezonowości (gi) – informuje o ile jednostek średnio zmieniła się wielkość zjawiska i tym okresie jednoimiennym w stosunku do średniej wielkości zjawiska w całym okresie
Indeks wartości koszyka – informuje o ile % zmieni się wartość koszyka towarów w okresie bieżącym w stosunku do okresu bazowego
Indeksy ilościowe :
Laspiresa – informuje o ile % zmieniła się wartość koszyka w okresie bieżącym w stosunku do okresu bazowego przy założeniu że ceny w okresie bieżącym są takie jak w okresie bazowym
Paasche - informuje o ile % zmieniła się wartość koszyka w okresie bieżącym w stosunku do okresu bazowego przy założeniu że ceny w okresie bazowym były by takie jak w okresie bieżącym