Zamiana szeregu punktowego w szereg z przedziałami klasowymi:
K = liczba przedziałów
i = rozpiętość klasy
Analiza struktury i zbiorowości
Wskaźnik natężenia kształtowanie wlk. 1 zjawiska na tle innego
$W = \ \frac{n}{m}\text{\ \ }$n –liczebność jednej zbiorowości/ m - drugiej
$$wskaznik\ gestosci\ zaludnienia = \ \frac{liczba\ mieszkancow}{\text{powierzchnia\ danego\ kraju}}$$
Wskaźnik struktury
$$W_{i} = \ \frac{n_{i}}{n}\text{\ \ }\left( 10\% \right)\ \ \ \ \ \ 0 \leq W_{i} \leq 1$$
Wskaźnik podobieństwa struktur
$$W_{p} = \ \sum_{i = 1}^{k}{min(W_{1}i\ ,\ W_{2}i})\ \ \ \ \ \ 0 \leq W_{p} \leq 1$$
Miary średnie (tendencji centralnej) – opisują˛ przeciętne położenie wartości liczbowych danej cechy statystycznej.
Klasyczne miary średnie
$$\overset{\overline{}}{x} = \ \frac{x_{1} + \ x_{2} + \ldots + \ x_{n}}{n}\ \ \ \ lub\ krocej\ \overset{\overline{}}{x} = \ \frac{\sum_{}^{}\text{xi}}{N}$$
$$\overset{\overline{}}{x} = \ \left\{ \begin{matrix}
\frac{\sum_{}^{}\text{xi}\ \bullet \ n_{i}}{N}\text{\ \ dla\ szeregu\ punktowego} \\
\frac{\sum_{}^{}\dot{\text{xi}}\ \bullet \ n_{i}}{N}\ dla\ szeregu\ z\ przedzialami\ kladowymi \\
\end{matrix} \right.\ $$
- średnia harmoniczna (stosowana w odniesieniu do cech stosunkowych – wydajność, prędkość – jest odwrotnością średniej arytmetycznej z odwrotności zaobserwowanych wartości)
szeregów szczegółowych prostych$\text{\ \ \ }{\overset{\overline{}}{x}}_{h} = \ \frac{n}{\sum_{i = 1}^{n}\frac{1}{x_{i}}}$
$${\overset{\overline{}}{X}}_{h} = \ \left\{ \begin{matrix}
\frac{n}{\sum_{i = 1}^{k}\frac{1}{x_{i}n_{i}}} \\
\frac{n}{\sum_{i = 1}^{k}{\frac{1}{x_{i}}n_{i}\ }}\ \ \ przedzialami\ klasowymi \\
\\
\end{matrix} \right.\ \text{\ \ punktowego}$$
- średnia geometryczna (G) stosowana np. w odniesieniu do wskaźników dynamiki, inaczej średnie tempo zmian
Pozycyjne miary średnie
- wartość modalną inaczej nazywana dominanta˛ (Do). nazywamy tę wartość´ cechy, która w badanej zbiorowości występuje najczęściej.
$D_{o} = \ X_{s} + \ h_{s}\frac{n_{s} - \ n_{s - 1}}{n_{s} - \ n_{s - 1} + \ n_{s} - \ n_{s + 1\ }}$ Xs – początek przedziału dominanty, hs – rozpiętość przedziału dominanty,
ns, ns-1, ns+1 – liczebności odpowiednio przedziału dominanty, przedziału poprzedniego i następnego.
- kwartyle (kwartyl pierwszy, kwartyl drugi-mediana, kwartyl trzeci)
mediana pełni funkcję średniej arytmetycznej tam gdzie nie możemy jej użyć.
szereg szczegółowy:
n=7, nieparzysta liczba jednostek – Me = 11; Q1 = 7; Q3 = 14
n=8, parzysta liczba jednostek –
szereg rozdzielczo-pktowy i z przedziałami:
obliczamy liczebności skumulowane (nisk), a później numer kwartyla/mediany ze wzoru:
$N_{Q1} = \ \frac{N}{4}$ $N_{Q3} = \ \frac{N}{4}$ $\text{\ \ \ N}_{\text{ME}} = \ \frac{N}{2}\text{\ \ \ }$patrzymy w której l. skumulowanej zawiera się ta liczba, otrzymujemy nr kwartyla/mediany, dalej liczymy ze wzoru (dotyczy on także kwartyli): $Me = xs + \ \frac{\text{hs}}{\text{ns}}\left( N_{ME} - \ M_{isk - 1} \right)$
hS = rozpiętość przedziału mediany; nS = liczebność przedziału mediany; NMe = numer mediany; nisk-1 = wartość skumulowana przedziału poprzedzającego przedział mediany
xs-dolna granica przedziału mediany
Miary zróżnicowania, zmienności - (dyspersji, rozrzutu, zmienności, rozproszenia) – opisują˛ stopień rozproszenia wartości badanej cechy wokół średniej.( Miary, które pozwalają ocenić stopień heterogeniczności danej zbiorowości (czyli stopień zróżnicowania) nazywamy miarami zmienności lub zamiennie).
Miary zróżnicowania (zmienności, dyspersji, rozrzutu, rozproszenia) |
---|
bezwzględne |
1. klasyczne |
a. odchylenie przeciętne, dX |
szer. szczegół. |
b. odchylenie standardowe, sX |
c. wariancja - wzory j.w. tylko bez pierwiastka |
2. pozycyjne |
a. odchylenie ćwiartkowe, QX – jeśli nie możemy wyznaczyć śr.arytm. |
|
Miary asymetrii
IV. Miary asymetrii
szereg symetryczny asym. prawostronna asym. lewostronna
- wskaźnik skośności - Znak tego wskaźnika informuje o kierunku asymetrii. W przypadku szeregów symetrycznych mamy Ms = 0. jest miarą mianowana˛ o jego wartości decyduje nie tylko stopień skośności szeregu, ale również ogólny poziom cechy w danej zbiorowości. Z tego powodu częściej obliczany jest (względny) współczynnik skośności.
$$M_{s} = \ \overset{\overline{}}{x} - Do$$
- współczynnik skośności $W_{s} = \ \frac{M_{s}}{s_{x}} = \ \frac{\overset{\overline{}}{x} - Do}{s_{x}}\text{\ \ \ lub}W_{s} = \ \frac{M_{s}}{d_{x}} = \ \frac{\overset{\overline{}}{x} - Do}{d_{x}}\ $ < -1 ; 1 >
- klasyczny współczynnik asymetrii $A_{s} = \ \frac{\mu_{3}}{s_{x}^{3}}$ sx oznacza odchylenie standardowe, natomiast μ3 jest tzw. momentem centralnym trzeciego rzędu, który definiujemy następująco:
$$\mu^{3} = \ \left\{ \begin{matrix}
\frac{1}{n}\sum_{i = 1}^{n}{{(x_{i} - \ \overset{\overline{}}{\text{x\ }})}^{3}\ \ \ szczegolowego} \\
\frac{1}{n}\sum_{i = 1}^{k}{\left( x_{i} - \ \overset{\overline{}}{x} \right)^{3}n_{i}}\text{\ \ punktowego} \\
\frac{1}{n}\sum_{i = 1}^{k}{(x_{i} - \ \overset{\overline{}}{x})}^{3}n_{i}\ z\ przedzialami \\
\end{matrix} \right.\ $$
Współczynnik As przyjmuje na ogół wartości z przedziału [-2, 2] (w przypadku skrajnej asymetrii jego wartość może wykroczyć poza ten przedział).
- pozycyjny współczynnik asymetrii określa siłę i kierunek asymetrii dla tych jednostek zbiorowości, które znajdują˛ się˛ między pierwszym i trzecim kwartylem, a więc w zawężonym obszarze zmienności cechy. $A_{Q} = \ \frac{\left( Q_{3} - Me \right) - \ \left( Me - \ Q_{1} \right)}{\left( Q_{3} - Me \right) + \ \left( Me - \ Q_{1} \right)} = \frac{Q_{3} - 2Me + \ Q_{1}}{Q_{3} - \ Q_{1}}$ Współczynnik AQ przyjmuje wartość z przedziału [-1, 1]. Podobnie, jak mierniki Ws i As, jego znak informuje o kierunku, a wartość bezwzględna – o sile asymetrii.
Korelacja
Współczynnik korelacji liniowej Pearsona – współczynnik do pomiaru siły związku między cechami X i Y w k™órych występuje zależność korelacyjna o charakterze liniowym. Współczynnik r korelacji liniowej Pearsona przyjmuje zawsze wartości z przedziału [-1, 1]. Znak współczynnika informuje o kierunku korelacji (liniowa ujemna lub liniowa dodatnia). Wartość bezwzględna |r | informuje o sile korelacji liniowej. W szczególnym przypadku, gdy |r | = 1, wówczas mamy do czynienia z korelacja˛ funkcyjna˛ (tzn. zależność´ Y od X można wyrazić´ za pomocą˛ funkcji Y = aX + b, gdzie a, b są˛ pewnymi stałymi). Współczynnik r mierzy tylko korelację o charakterze prostoliniowym. Gdy r = 0, wówczas mówimy, że nie ma korelacji liniowej (ale może być krzywoliniowa).
$r_{\text{xy}} = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{\sqrt{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)^{2} \bullet \ \sum_{}^{}\left( y_{i} - \ \overset{\overline{}}{y} \right)^{2}}}}$ $\text{\ \ \ }r_{\text{xy}} = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{sx\ \bullet \ \ sy}$
Współczynnik korelacji rang Spearmana obliczana dla danych rangowych jest współczynnik korelacji rang Spearmana. Współczynnik rS przyjmuje wartości z przedziału [-1, 1].
Wartość rS = 1 oznacza, że istnieje całkowita zgodność uporządkowań wg rang ai i bi . Wartość rS = -1 oznacza z kolei pełna˛ przeciwstawność uporządkowań między rangami.
Wartość rS = 0 oznacza brak korelacji rang.
$r_{s} = 1 - \ \frac{6\sum_{}^{}d_{i}^{2}}{n\left( n^{2} - 1 \right)}\ \ \ \ - 1 \leq rs\ \leq 1$ Gdzie di = ai − bi
Linia regresji
Zmienna objaśniana (zmienna zależna) – zmienna będąca przedmiotem badania. Na ogół oznaczamy ja˛ symbolem Y. Zmienne objaśniające (zmienne niezależne) – zmienne, za pomocą˛ których chcemy objaśnić´ zmiany zmiennej zależnej. Na ogół oznaczamy je symbolami X1,X2,….Xs Funkcja regresji – funkcja odwzorowująca zależność pomiędzy zmienna˛ objaśnianą Y a zmiennymi objaśniającymi.
W przypadku wielu zmiennych objaśniających mówimy o regresji wielorakiej, natomiast w przypadku jednej zmiennej objaśniającej – o regresji jednej zmiennej.
Funkcję f (x) = a + bx nazywamy prosta˛ regresji. Parametr a – wyraża o ile przeciętnie zmieni się zmienna zależna jeżeli zmienna niezależna wzrośnie o jednostką. Parametr b – wskazuje poziom zmiennej zależnej przy x=0, ale interpretujemy go wtedy gdy ma to uzasadniony sens ekonomiczny.
$a = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{\sum_{}^{}\left( x_{i} - \ \overset{\overline{}}{x} \right)^{2}}$ $b = \ \overset{\overline{}}{y} - a\overset{\overline{}}{x}$
Relacja łącząca współczynnik regresji i współczynnik korelacji liniowej Pearsona. Współczynniki a i r maja˛ zawsze ten sam znak, przy czym współczynnik b nie musi należeć do przedziału [-1, 1], w przeciwieństwie do współczynnika r korelacji liniowej Pearsona.
$r_{\text{xy}} = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{sx\ \bullet \ \ sy}$ $a = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{\sum_{}^{}\left( x_{i} - \ \overset{\overline{}}{x} \right)^{2}}$ $\ \ \ \ \ \ a = r\ \frac{\text{sy}}{\text{sx}}$
Współczynnik determinacji – określa stopień dopasowania prostej regresji do danych empirycznych. R2 < 0; 1>. Im punkty są bliżej prostej to R2 jest bliższe 1, dopasowanie jest lepsze.
$R^{2} = \ \frac{\text{SSR}}{\text{SST}} = \ \frac{\sum_{}^{}\left( \hat{y_{i}} - \ \overset{\overline{}}{y} \right)^{2}}{\sum_{}^{}\left( y_{i} - \ \hat{y_{i}} \right)^{2}}$ W przypadku regresji liniowej jednej zmiennej współczynnik determinacji R2 równy jest kwadratowi współczynnika korelacji liniowej Pearsona R2= (rxy)2
Średni błąd szacunku (przewidywania) – o ile przeciętne wartości zmiennej zależnej $\left( \hat{y} \right)odchylaja\ sie\ od\ wartosci\ emipirycznych.\ $
$S_{(y)} = \ \sqrt{\frac{\sum_{}^{}\left( y_{i} - \ \hat{y_{i}} \right)^{2}}{n - k}}$ n –liczba badanych, k –liczba parametrów w linii regresji k różne od 2
Szeregi czasowe
Szereg czasowy momentów, to szereg zawierający informacje o poziomach badanego zjawiska w określonych momentach pewnego przedziału czasowego, np. liczba ludności na dany moment (stosujemy średnią arytmetyczną). Z kolei szereg czasowy okresów zawiera informacje o rozmiarach zjawiska w ciągu kolejnych okresów danego przedziału czasowego (liczba małżeństw, liczba urodzeń i zgonów) – średnia chronologiczna.
Średnia chronologiczna
${\overset{\overline{}}{y}}_{\text{ch}} = \ \frac{\frac{1}{2}y_{1} + \ y_{2} + \ldots + \frac{1}{2}y_{n}\ }{n - 1}$ $\ y_{\min}\ \leq \ {\overset{\overline{}}{y}}_{\text{ch}}\ \leq \ y_{\max}$
Przyrosty absolutne – różnica w poziomach zjawiska y = yt − yt*
Przyrosty względne – o ile procent wyższy / niższy jest poziom zjawiska w czasie t w porównaniu do t* (moment bazowy) $\frac{y_{t} - \ y_{t*}}{y_{t*}}\ ( \bullet 100\ \%)$
Indywidualnym indeksem dynamiki nazywamy iloraz poziomów badanego zjawiska yt1 oraz yt0 zanotowanych w dwóch okresach (lub momentach) t1 oraz t0. Jednopodstawowe, dostarczające oceny dynamiki zjawiska w kolejnych okresach (momentach) czasu w porównaniu do stałego okresu (momentu) przyjętego za podstawę porównań, łańcuchowe, dostarczające oceny dynamiki zjawisk w kolejnych okresach (momentach) czasu w porównaniu do okresów (momentów) szeregu bezpośrednio poprzedzających. $i_{\left. \ t_{1} \right|t_{o}} = \ \frac{y_{t1}}{y_{t0}} \rightarrow \ \frac{\text{badany}}{\text{bazowy}}$ $i_{1\left| 0 \right.\ } = \ \frac{y_{1}}{y_{0}}$
Średnie tempo zmian (średnia geometryczna z indeksów łańcuchowych)
$G = \ \sqrt[n]{i_{\left. \ t_{1} \right|t_{o}\text{\ \ }} \bullet \ i_{\left. \ t_{2} \right|t_{1\ }} \bullet \ \ldots.\ \ \bullet \ i_{\left. \ t_{n} \right|t_{n - 1}}}$ $\ \ G = \ \sqrt[n]{\frac{y_{\text{tn}}}{y_{t0}}}$ G – 1 (100%)- > mierzy tempo zmian (średnie) wzrosty lub spadki poziomu zjawiska z okresu na okres w badanym przedziale czasowym.
Indeksy zespołowe (agregatowe) stosowane są w przypadku zjawisk złożonych, tj. zespołami zjawisk niejednorodnych
- Agregatowe indeksy wartości $I_{w} = \ \frac{\sum_{}^{}{q_{1}p_{1}}}{\sum_{}^{}{q_{0}p_{0}}}$ p1, p0 – ceny jednorodne produktu w okresie badanym/bazowym q1,q0 – ilość produktów w okresie badanym/bazowym
- Agregatowe indeksy ilości – o ile zmieniła się wartość agregatu, jeżeli zmieniły się ceny
Formuła Paaschego: $pI_{q} = \ = \ \frac{\sum_{}^{}{q_{1}p_{1}}}{\sum_{}^{}{q_{0}p_{0}}}$ z okresu badanego Formuła Laspeyresa: L$I_{q} = \ = \ \frac{\sum_{}^{}{q_{1}p_{1}}}{\sum_{}^{}{q_{0}p_{0}}}$ z okresu podstawowego
- Agregatowe indeksy cen
Formuła Paaschego: $\text{pI}_{q} = \ = \ \frac{\sum_{}^{}{q_{1}p_{1}}}{\sum_{}^{}{q_{0}p_{0}}}$ z okresu badanego Formuła Laspeyresa: L$I_{q} = \ = \ \frac{\sum_{}^{}{q_{1}p_{1}}}{\sum_{}^{}{q_{0}p_{0}}}$ z okresu podstawowego
Między agregatowymi indeksami wartości, ilości i cen zachodzi jednak związek określany mianem równości indeksowej. Iw = Ip • pIq = pIp • Iq
Indeks ilości (indeksy cen) wg formuły Paaschego informują, o ile zmieniłaby się, tj. wzrosła lub spadła, wartość całego agregatu produktów w porównywanych okresach, gdyby ceny (ilości) produktów były stałe na poziomie z okresu badanego. / Indeksy ilości (indeksy cen) wg formuły Laspeyresa informują, o ile zmieniłaby się, tj. wzrosła lub spadła, wartość całego agregatu produktów w porównywanych okresach, gdyby ceny (ilości) produktów były stałe na poziomie z okresu podstawowego.
Wyodrębnienie tendencji rozwojowe metodą analityczną
Trend – własność szeregu czasowego.
$\hat{\mathbf{y}}\mathbf{= a + b \bullet t}$ $\mathbf{\text{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ }}\hat{y}\ $– szacowany poziom zjawiska, t – zmienna czasowa, a – wyraz wolny, b- współczynnik kierunkowy linii trendu
$b = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{\sum_{}^{}\left( x_{i} - \ \overset{\overline{}}{x} \right)^{2}}$ $a = \ \overset{\overline{}}{y} - b\ \bullet \overset{\overline{}}{t}$
b – mówi o przeciętnych zmianach zjawiska w pewnych okresach czasu.
a – poziom zjawiska w okresie poprzedzającym okres badany.
$R^{2} = \ \frac{\text{SSR}}{\text{SST}} = \ \frac{\sum_{}^{}\left( \hat{y_{i}} - \ \overset{\overline{}}{y} \right)^{2}}{\sum_{}^{}\left( y_{i} - \ \hat{y_{i}} \right)^{2}}$ $S_{(y)} = \ \sqrt{\frac{\sum_{}^{}\left( y_{i} - \ \hat{y_{i}} \right)^{2}}{n - 2}}$