statystyka wzory czesc zadaniowa

Zamiana szeregu punktowego w szereg z przedziałami klasowymi:

K = liczba przedziałów

i = rozpiętość klasy

Analiza struktury i zbiorowości

Wskaźnik natężenia kształtowanie wlk. 1 zjawiska na tle innego

$W = \ \frac{n}{m}\text{\ \ }$n –liczebność jednej zbiorowości/ m - drugiej


$$wskaznik\ gestosci\ zaludnienia = \ \frac{liczba\ mieszkancow}{\text{powierzchnia\ danego\ kraju}}$$

Wskaźnik struktury


$$W_{i} = \ \frac{n_{i}}{n}\text{\ \ }\left( 10\% \right)\ \ \ \ \ \ 0 \leq W_{i} \leq 1$$

Wskaźnik podobieństwa struktur


$$W_{p} = \ \sum_{i = 1}^{k}{min(W_{1}i\ ,\ W_{2}i})\ \ \ \ \ \ 0 \leq W_{p} \leq 1$$

Miary średnie (tendencji centralnej) – opisują˛ przeciętne położenie wartości liczbowych danej cechy statystycznej.

Klasyczne miary średnie


$$\overset{\overline{}}{x} = \ \frac{x_{1} + \ x_{2} + \ldots + \ x_{n}}{n}\ \ \ \ lub\ krocej\ \overset{\overline{}}{x} = \ \frac{\sum_{}^{}\text{xi}}{N}$$


$$\overset{\overline{}}{x} = \ \left\{ \begin{matrix} \frac{\sum_{}^{}\text{xi}\ \bullet \ n_{i}}{N}\text{\ \ dla\ szeregu\ punktowego} \\ \frac{\sum_{}^{}\dot{\text{xi}}\ \bullet \ n_{i}}{N}\ dla\ szeregu\ z\ przedzialami\ kladowymi \\ \end{matrix} \right.\ $$

- średnia harmoniczna (stosowana w odniesieniu do cech stosunkowych – wydajność, prędkość – jest odwrotnością średniej arytmetycznej z odwrotności zaobserwowanych wartości)

szeregów szczegółowych prostych$\text{\ \ \ }{\overset{\overline{}}{x}}_{h} = \ \frac{n}{\sum_{i = 1}^{n}\frac{1}{x_{i}}}$


$${\overset{\overline{}}{X}}_{h} = \ \left\{ \begin{matrix} \frac{n}{\sum_{i = 1}^{k}\frac{1}{x_{i}n_{i}}} \\ \frac{n}{\sum_{i = 1}^{k}{\frac{1}{x_{i}}n_{i}\ }}\ \ \ przedzialami\ klasowymi \\ \\ \end{matrix} \right.\ \text{\ \ punktowego}$$

- średnia geometryczna (G) stosowana np. w odniesieniu do wskaźników dynamiki, inaczej średnie tempo zmian

Pozycyjne miary średnie

- wartość modalną inaczej nazywana dominanta˛ (Do). nazywamy tę wartość´ cechy, która w badanej zbiorowości występuje najczęściej.

$D_{o} = \ X_{s} + \ h_{s}\frac{n_{s} - \ n_{s - 1}}{n_{s} - \ n_{s - 1} + \ n_{s} - \ n_{s + 1\ }}$ Xs – początek przedziału dominanty, hs – rozpiętość przedziału dominanty,

ns, ns-1, ns+1 – liczebności odpowiednio przedziału dominanty, przedziału poprzedniego i następnego.

- kwartyle (kwartyl pierwszy, kwartyl drugi-mediana, kwartyl trzeci)

mediana pełni funkcję średniej arytmetycznej tam gdzie nie możemy jej użyć.

szereg szczegółowy:

n=7, nieparzysta liczba jednostek – Me = 11; Q1 = 7; Q3 = 14

n=8, parzysta liczba jednostek –

szereg rozdzielczo-pktowy i z przedziałami:

obliczamy liczebności skumulowane (nisk), a później numer kwartyla/mediany ze wzoru:

$N_{Q1} = \ \frac{N}{4}$ $N_{Q3} = \ \frac{N}{4}$ $\text{\ \ \ N}_{\text{ME}} = \ \frac{N}{2}\text{\ \ \ }$patrzymy w której l. skumulowanej zawiera się ta liczba, otrzymujemy nr kwartyla/mediany, dalej liczymy ze wzoru (dotyczy on także kwartyli): $Me = xs + \ \frac{\text{hs}}{\text{ns}}\left( N_{ME} - \ M_{isk - 1} \right)$

hS = rozpiętość przedziału mediany; nS = liczebność przedziału mediany; NMe = numer mediany; nisk-1 = wartość skumulowana przedziału poprzedzającego przedział mediany

xs-dolna granica przedziału mediany

Miary zróżnicowania, zmienności - (dyspersji, rozrzutu, zmienności, rozproszenia) – opisują˛ stopień rozproszenia wartości badanej cechy wokół średniej.( Miary, które pozwalają ocenić stopień heterogeniczności danej zbiorowości (czyli stopień zróżnicowania) nazywamy miarami zmienności lub zamiennie).

Miary zróżnicowania (zmienności, dyspersji, rozrzutu, rozproszenia)
bezwzględne
1. klasyczne
a. odchylenie przeciętne, dX
szer. szczegół.
b. odchylenie standardowe, sX
c. wariancja - wzory j.w. tylko bez pierwiastka
2. pozycyjne
a. odchylenie ćwiartkowe, QX – jeśli nie możemy wyznaczyć śr.arytm.

b. rozstęp, RX = xMAX – xMIN

Miary asymetrii

  1. IV. Miary asymetrii

szereg symetryczny asym. prawostronna asym. lewostronna

- wskaźnik skośności - Znak tego wskaźnika informuje o kierunku asymetrii. W przypadku szeregów symetrycznych mamy Ms = 0. jest miarą mianowana˛ o jego wartości decyduje nie tylko stopień skośności szeregu, ale również ogólny poziom cechy w danej zbiorowości. Z tego powodu częściej obliczany jest (względny) współczynnik skośności.


$$M_{s} = \ \overset{\overline{}}{x} - Do$$

- współczynnik skośności $W_{s} = \ \frac{M_{s}}{s_{x}} = \ \frac{\overset{\overline{}}{x} - Do}{s_{x}}\text{\ \ \ lub}W_{s} = \ \frac{M_{s}}{d_{x}} = \ \frac{\overset{\overline{}}{x} - Do}{d_{x}}\ $ < -1 ; 1 >

- klasyczny współczynnik asymetrii $A_{s} = \ \frac{\mu_{3}}{s_{x}^{3}}$ sx oznacza odchylenie standardowe, natomiast μ3 jest tzw. momentem centralnym trzeciego rzędu, który definiujemy następująco:


$$\mu^{3} = \ \left\{ \begin{matrix} \frac{1}{n}\sum_{i = 1}^{n}{{(x_{i} - \ \overset{\overline{}}{\text{x\ }})}^{3}\ \ \ szczegolowego} \\ \frac{1}{n}\sum_{i = 1}^{k}{\left( x_{i} - \ \overset{\overline{}}{x} \right)^{3}n_{i}}\text{\ \ punktowego} \\ \frac{1}{n}\sum_{i = 1}^{k}{(x_{i} - \ \overset{\overline{}}{x})}^{3}n_{i}\ z\ przedzialami \\ \end{matrix} \right.\ $$

Współczynnik As przyjmuje na ogół wartości z przedziału [-2, 2] (w przypadku skrajnej asymetrii jego wartość może wykroczyć poza ten przedział).

- pozycyjny współczynnik asymetrii określa siłę i kierunek asymetrii dla tych jednostek zbiorowości, które znajdują˛ się˛ między pierwszym i trzecim kwartylem, a więc w zawężonym obszarze zmienności cechy. $A_{Q} = \ \frac{\left( Q_{3} - Me \right) - \ \left( Me - \ Q_{1} \right)}{\left( Q_{3} - Me \right) + \ \left( Me - \ Q_{1} \right)} = \frac{Q_{3} - 2Me + \ Q_{1}}{Q_{3} - \ Q_{1}}$ Współczynnik AQ przyjmuje wartość z przedziału [-1, 1]. Podobnie, jak mierniki Ws i As, jego znak informuje o kierunku, a wartość bezwzględna – o sile asymetrii.

Korelacja

Współczynnik korelacji liniowej Pearsona – współczynnik do pomiaru siły związku między cechami X i Y w k™órych występuje zależność korelacyjna o charakterze liniowym. Współczynnik r korelacji liniowej Pearsona przyjmuje zawsze wartości z przedziału [-1, 1]. Znak współczynnika informuje o kierunku korelacji (liniowa ujemna lub liniowa dodatnia). Wartość bezwzględna |r | informuje o sile korelacji liniowej. W szczególnym przypadku, gdy |r | = 1, wówczas mamy do czynienia z korelacja˛ funkcyjna˛ (tzn. zależność´ Y od X można wyrazić´ za pomocą˛ funkcji Y = aX + b, gdzie a, b są˛ pewnymi stałymi). Współczynnik r mierzy tylko korelację o charakterze prostoliniowym. Gdy r = 0, wówczas mówimy, że nie ma korelacji liniowej (ale może być krzywoliniowa).

$r_{\text{xy}} = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{\sqrt{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)^{2} \bullet \ \sum_{}^{}\left( y_{i} - \ \overset{\overline{}}{y} \right)^{2}}}}$ $\text{\ \ \ }r_{\text{xy}} = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{sx\ \bullet \ \ sy}$

Współczynnik korelacji rang Spearmana obliczana dla danych rangowych jest współczynnik korelacji rang Spearmana. Współczynnik rS przyjmuje wartości z przedziału [-1, 1].

Wartość rS = 1 oznacza, że istnieje całkowita zgodność uporządkowań wg rang ai i bi . Wartość rS = -1 oznacza z kolei pełna˛ przeciwstawność uporządkowań między rangami.

Wartość rS = 0 oznacza brak korelacji rang.

$r_{s} = 1 - \ \frac{6\sum_{}^{}d_{i}^{2}}{n\left( n^{2} - 1 \right)}\ \ \ \ - 1 \leq rs\ \leq 1$ Gdzie di =  ai −  bi

Linia regresji

Zmienna objaśniana (zmienna zależna) – zmienna będąca przedmiotem badania. Na ogół oznaczamy ja˛ symbolem Y. Zmienne objaśniające (zmienne niezależne) – zmienne, za pomocą˛ których chcemy objaśnić´ zmiany zmiennej zależnej. Na ogół oznaczamy je symbolami X1,X2,….Xs Funkcja regresji – funkcja odwzorowująca zależność pomiędzy zmienna˛ objaśnianą Y a zmiennymi objaśniającymi.

W przypadku wielu zmiennych objaśniających mówimy o regresji wielorakiej, natomiast w przypadku jednej zmiennej objaśniającej – o regresji jednej zmiennej.

Funkcję f (x) = a + bx nazywamy prosta˛ regresji. Parametr a – wyraża o ile przeciętnie zmieni się zmienna zależna jeżeli zmienna niezależna wzrośnie o jednostką. Parametr b – wskazuje poziom zmiennej zależnej przy x=0, ale interpretujemy go wtedy gdy ma to uzasadniony sens ekonomiczny.

$a = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{\sum_{}^{}\left( x_{i} - \ \overset{\overline{}}{x} \right)^{2}}$ $b = \ \overset{\overline{}}{y} - a\overset{\overline{}}{x}$

Relacja łącząca współczynnik regresji i współczynnik korelacji liniowej Pearsona. Współczynniki a i r maja˛ zawsze ten sam znak, przy czym współczynnik b nie musi należeć do przedziału [-1, 1], w przeciwieństwie do współczynnika r korelacji liniowej Pearsona.

$r_{\text{xy}} = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{sx\ \bullet \ \ sy}$ $a = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{\sum_{}^{}\left( x_{i} - \ \overset{\overline{}}{x} \right)^{2}}$ $\ \ \ \ \ \ a = r\ \frac{\text{sy}}{\text{sx}}$

Współczynnik determinacji – określa stopień dopasowania prostej regresji do danych empirycznych. R2 < 0; 1>. Im punkty są bliżej prostej to R2 jest bliższe 1, dopasowanie jest lepsze.

$R^{2} = \ \frac{\text{SSR}}{\text{SST}} = \ \frac{\sum_{}^{}\left( \hat{y_{i}} - \ \overset{\overline{}}{y} \right)^{2}}{\sum_{}^{}\left( y_{i} - \ \hat{y_{i}} \right)^{2}}$ W przypadku regresji liniowej jednej zmiennej współczynnik determinacji R2 równy jest kwadratowi współczynnika korelacji liniowej Pearsona R2= (rxy)2

Średni błąd szacunku (przewidywania) – o ile przeciętne wartości zmiennej zależnej $\left( \hat{y} \right)odchylaja\ sie\ od\ wartosci\ emipirycznych.\ $

$S_{(y)} = \ \sqrt{\frac{\sum_{}^{}\left( y_{i} - \ \hat{y_{i}} \right)^{2}}{n - k}}$ n –liczba badanych, k –liczba parametrów w linii regresji k różne od 2

Szeregi czasowe

Szereg czasowy momentów, to szereg zawierający informacje o poziomach badanego zjawiska w określonych momentach pewnego przedziału czasowego, np. liczba ludności na dany moment (stosujemy średnią arytmetyczną). Z kolei szereg czasowy okresów zawiera informacje o rozmiarach zjawiska w ciągu kolejnych okresów danego przedziału czasowego (liczba małżeństw, liczba urodzeń i zgonów) – średnia chronologiczna.

Średnia chronologiczna

${\overset{\overline{}}{y}}_{\text{ch}} = \ \frac{\frac{1}{2}y_{1} + \ y_{2} + \ldots + \frac{1}{2}y_{n}\ }{n - 1}$ $\ y_{\min}\ \leq \ {\overset{\overline{}}{y}}_{\text{ch}}\ \leq \ y_{\max}$

Przyrosty absolutne – różnica w poziomach zjawiska y =  yt −  yt*

Przyrosty względne – o ile procent wyższy / niższy jest poziom zjawiska w czasie t w porównaniu do t* (moment bazowy) $\frac{y_{t} - \ y_{t*}}{y_{t*}}\ ( \bullet 100\ \%)$

Indywidualnym indeksem dynamiki nazywamy iloraz poziomów badanego zjawiska yt1 oraz yt0 zanotowanych w dwóch okresach (lub momentach) t1 oraz t0. Jednopodstawowe, dostarczające oceny dynamiki zjawiska w kolejnych okresach (momentach) czasu w porównaniu do stałego okresu (momentu) przyjętego za podstawę porównań, łańcuchowe, dostarczające oceny dynamiki zjawisk w kolejnych okresach (momentach) czasu w porównaniu do okresów (momentów) szeregu bezpośrednio poprzedzających. $i_{\left. \ t_{1} \right|t_{o}} = \ \frac{y_{t1}}{y_{t0}} \rightarrow \ \frac{\text{badany}}{\text{bazowy}}$ $i_{1\left| 0 \right.\ } = \ \frac{y_{1}}{y_{0}}$

Średnie tempo zmian (średnia geometryczna z indeksów łańcuchowych)

$G = \ \sqrt[n]{i_{\left. \ t_{1} \right|t_{o}\text{\ \ }} \bullet \ i_{\left. \ t_{2} \right|t_{1\ }} \bullet \ \ldots.\ \ \bullet \ i_{\left. \ t_{n} \right|t_{n - 1}}}$ $\ \ G = \ \sqrt[n]{\frac{y_{\text{tn}}}{y_{t0}}}$ G – 1 (100%)- > mierzy tempo zmian (średnie) wzrosty lub spadki poziomu zjawiska z okresu na okres w badanym przedziale czasowym.

Indeksy zespołowe (agregatowe) stosowane są w przypadku zjawisk złożonych, tj. zespołami zjawisk niejednorodnych

- Agregatowe indeksy wartości $I_{w} = \ \frac{\sum_{}^{}{q_{1}p_{1}}}{\sum_{}^{}{q_{0}p_{0}}}$ p1, p0 – ceny jednorodne produktu w okresie badanym/bazowym q1,q0 – ilość produktów w okresie badanym/bazowym

- Agregatowe indeksy ilości – o ile zmieniła się wartość agregatu, jeżeli zmieniły się ceny

Formuła Paaschego: $pI_{q} = \ = \ \frac{\sum_{}^{}{q_{1}p_{1}}}{\sum_{}^{}{q_{0}p_{0}}}$ z okresu badanego Formuła Laspeyresa: L$I_{q} = \ = \ \frac{\sum_{}^{}{q_{1}p_{1}}}{\sum_{}^{}{q_{0}p_{0}}}$ z okresu podstawowego

- Agregatowe indeksy cen

Formuła Paaschego: $\text{pI}_{q} = \ = \ \frac{\sum_{}^{}{q_{1}p_{1}}}{\sum_{}^{}{q_{0}p_{0}}}$ z okresu badanego Formuła Laspeyresa: L$I_{q} = \ = \ \frac{\sum_{}^{}{q_{1}p_{1}}}{\sum_{}^{}{q_{0}p_{0}}}$ z okresu podstawowego

Między agregatowymi indeksami wartości, ilości i cen zachodzi jednak związek określany mianem równości indeksowej. Iw =   Ip  • pIq =   pIp  •    Iq

Indeks ilości (indeksy cen) wg formuły Paaschego informują, o ile zmieniłaby się, tj. wzrosła lub spadła, wartość całego agregatu produktów w porównywanych okresach, gdyby ceny (ilości) produktów były stałe na poziomie z okresu badanego. / Indeksy ilości (indeksy cen) wg formuły Laspeyresa informują, o ile zmieniłaby się, tj. wzrosła lub spadła, wartość całego agregatu produktów w porównywanych okresach, gdyby ceny (ilości) produktów były stałe na poziomie z okresu podstawowego.

Wyodrębnienie tendencji rozwojowe metodą analityczną

Trend – własność szeregu czasowego.

$\hat{\mathbf{y}}\mathbf{= a + b \bullet t}$ $\mathbf{\text{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ }}\hat{y}\ $– szacowany poziom zjawiska, t – zmienna czasowa, a – wyraz wolny, b- współczynnik kierunkowy linii trendu

$b = \ \frac{\sum_{}^{}{\left( x_{i} - \ \overset{\overline{}}{x} \right)\left( y_{i} - \ \overset{\overline{}}{y} \right)}}{\sum_{}^{}\left( x_{i} - \ \overset{\overline{}}{x} \right)^{2}}$ $a = \ \overset{\overline{}}{y} - b\ \bullet \overset{\overline{}}{t}$

b – mówi o przeciętnych zmianach zjawiska w pewnych okresach czasu.

a – poziom zjawiska w okresie poprzedzającym okres badany.

$R^{2} = \ \frac{\text{SSR}}{\text{SST}} = \ \frac{\sum_{}^{}\left( \hat{y_{i}} - \ \overset{\overline{}}{y} \right)^{2}}{\sum_{}^{}\left( y_{i} - \ \hat{y_{i}} \right)^{2}}$ $S_{(y)} = \ \sqrt{\frac{\sum_{}^{}\left( y_{i} - \ \hat{y_{i}} \right)^{2}}{n - 2}}$


Wyszukiwarka

Podobne podstrony:
statystyka wzory zadania duze
Kordecki W, Jasiulewicz H Rachunek prawdopodobieństwa i statystyka matematyczna Przykłady i zadania
statystyka--Zarys statystyki wzory , Administracja
Calki wzory podstawowe zadania
podstawy statystyki wzory id 36 Nieznany
statystyka ogólna zad. 1,2, Zadanie
Statystyka matematyczna, 4-część, Analiza regresyjna
Statystyka - podstawowe wzory, Statystyka wzory
statystyka - wzory 1 , 1
Statystyka wzory
statystyka wzory 2
statystyka ćw, regresja - zadania Zarz+Soc, Zadanie 2
Zaliczenie dzienne statystyka 2 marca 2003 zadania, ZAD
19OptymalizacjaSQL czesc 2 zadania
WSEI Statystyka Analiza.struktury.zadania
19OptymalizacjaSQL czesc 2 zadaniaid 18608
zadania dodatkowe - wzory, chemia, zadania dodatkowe
19OptymalizacjaSQL czesc 1 zadania

więcej podobnych podstron