Średnia arytmetyczna:
$\frac{\sum_{}^{}x_{i}}{N}$ - dla szeregu szczegółowego.
$\frac{\sum_{}^{}{x_{i}n_{i}}}{N}$ - dla szeregu rozdzielczego punktowego.
$\frac{\sum_{}^{}{{\dot{x}}_{i}n_{i}}}{N}$ - dla szeregu rozdzielczego przedziałowego.
Średnia arytmetyczna z 2 (lub więcej) średnich:
ni |
$$\overset{\overline{}}{x}$$ |
|
---|---|---|
I | n1 |
$$\overset{\overline{}}{x_{1}}$$ |
II | n2 |
$$\overset{\overline{}}{x_{2}}$$ |
… | … | … |
$$\overset{\overline{}}{x} = \frac{n_{1}\overset{\overline{}}{x_{1}} + \ldots + n_{n}\overset{\overline{}}{x_{n}}}{n_{1} + \ldots + n_{n}} = \frac{n_{1}\overset{\overline{}}{x_{1}} + \ldots + n_{n}\overset{\overline{}}{x_{n}}}{N}$$
Średnia harmoniczna:$\frac{N}{\sum_{}^{}{\frac{1}{x_{i}}n_{i}}}$
Średnia geometryczna: $\sqrt[N]{\prod_{}^{}{x_{i}}^{n_{i}}}$
Średnia ucinana: $\frac{\sum_{i = 1 + l}^{n - k}x_{i}}{N - l - k}$
Dominanta:
Odczytujemy wartość cechy dla największej liczebności – dla szeregu szczegółowego.
Odczytujemy wartość cechy dla największej liczebności – dla szeregu rozdzielczego punktowego.
$D = x_{D} + \frac{n_{D} - n_{D - 1}}{\left( n_{D} - n_{D - 1} \right)\left( n_{D} - n_{D + 1} \right)}i_{D}$ - dla szeregu rozdzielczego przedziałowego, gdzie:
xD – dolna granica przedziału, w którym znajduje się dominanta,
nD – liczebność przedziału, w którym znajduje się dominanta,
nD − 1 – liczebność przedziału poprzedzającego przedział dominanty,
nD + 1 – liczebność przedziału następnego po przedziale dominanty,
iD – rozpiętość przedziału dominanty.
Mediana:
$Me = \left\{ \begin{matrix} x_{\frac{N + 1}{2}} - \ gdy\ N\ jest\ nieparz\text{yste\ \ \ \ \ \ \ \ \ \ \ \ } \\ \frac{1}{2}\left( x_{\frac{N}{2}} + x_{\frac{N}{2} + 1} \right) - \ gdy\ N\ jest\ parzyste \\ \end{matrix} \right.\ $ – szeregi szczegółowy i punktowy,
$Q_{2} = Me = x_{\text{Me}} + \ \frac{\frac{N}{2} - \sum_{i = 1}^{k - 1}n_{i}}{n_{\text{Me}}}i_{\text{Me}}$ - dla szeregu rozdzielczego przedziałowego.
Kwartyle:
$Q_{1} = x_{Q_{1}} + \frac{\frac{N}{4} - \sum_{i = 1}^{k - 1}n_{i}}{n_{Q_{1}}}i_{Q_{1}}$
Q2 = Me
$Q_{3} = x_{\text{Me}} + \frac{\frac{3N}{4} - \sum_{i = 1}^{k - 1}n_{i}}{n_{Q_{3}}}i_{Q_{3}}$
xQ1, xMe, xQ3 - dolna granica przedziału, w którym znajduje się kwartyl,
$\sum_{i = 1}^{k - 1}n_{i}$ – suma liczebności przedziałów poprzedzających ten, w którym znajduje się kwartyl,
nQ1, nMe, nQ3 – liczebność przedziału, w którym znajduje się kwartyl,
iQ1, iMe, iQ3 – rozpiętość przedziału, w którym znajduje się kwartyl.
Kwantyle rzędu p:
$k_{p} = x_{p} + \left\lbrack p - F_{n}\left( x_{p} \right) \right\rbrack\frac{i_{p}}{W_{p}}$, gdzie:
xp – dolna granica przedziału następującego po tym, w którym znajduje się kwantyl (jeżeli p = Fn(x) )
p − rząd kwantyla,
Fn(xp) –dystrybuanta empiryczna przedziału, w którym znajduje się kwantyl,
ip – rozpiętość przedziału, w którym znajduje się kwantyl,
Wp - częstość przedziału, w którym znajduje się kwantyl ($W_{i} = \frac{n_{i}}{N}$).
Aby wyznaczyć, w którym przedziale znajduje się kwantyl – bierzemy rząd i szukamy go w $F_{n}\left( x \right) = \frac{n_{\text{SK}}}{N}$.
Wariancja:
$S^{2} = \ \frac{\sum_{}^{}{\left( x_{i} - \overset{\overline{}}{x} \right)^{2}n_{i}}}{N}$ - dla szeregów szczegółowego i rozdzielczego punktowego.
$S^{2} = \ \frac{\sum_{}^{}{\left( \dot{x_{i}} - \overset{\overline{}}{x} \right)^{2}n_{i}}}{N}$ - dla szeregu rozdzielczego przedziałowego.
Odchylenie standardowe:
$S = \sqrt{S^{2}} = \sqrt{\frac{\sum_{}^{}{\left( x_{i} - \overset{\overline{}}{x} \right)^{2}n_{i}}}{N}}$ - dla szeregów szczegółowego i rozdzielczego punktowego.
$S = \sqrt{S^{2}} = \sqrt{\frac{\sum_{}^{}{\left( \dot{x_{i}} - \overset{\overline{}}{x} \right)^{2}n_{i}}}{N}}$ - dla szeregu rozdzielczego przedziałowego.
Typowy obszar zmienności: $\overset{\overline{}}{x} - S\left( x \right) < x_{\text{typ}} < \overset{\overline{}}{x} + S\left( x \right)$
Empiryczny obszar zmienności (rozstęp): R = xmax − xmin
Odchylenie przeciętne:
$d = \frac{\sum_{}^{}{\left| x_{i} - \overset{\overline{}}{x} \right|n_{i}}}{N}$ - dla szeregów szczegółowego i rozdzielczego punktowego,
$d = \frac{\sum_{}^{}{\left| x_{i} - \overset{\overline{}}{x} \right|n_{i}}}{N}$ - dla szeregu rozdzielczego przedziałowego.
Odchylenie ćwiartkowe: $Q = \frac{Q_{3} - Q_{1}}{2}$
Typowy obszar zmienności przy pomocy miar pozycyjnych: Me − Q < xtyp < Me + Q
Współczynnik zmienności:
V < 15% - słabe zróżnicowanie
15% < V < 30% - średnie zróżnicowanie
30% < V - duże zróżnicowanie
Klasyczny:
$V_{s} = \frac{S\left( x \right)}{\overset{\overline{}}{x}}$
$V_{d} = \frac{\text{dx}}{\overset{\overline{}}{x}}$
Pozycyjny:
$V_{Q} = \frac{\text{Qx}}{\text{Me}}$
$V_{Q_{1},Q_{2}} = \frac{Q_{3} - Q_{1}}{Q_{3} + Q_{1}}$
Wskaźniki (M3, MP, Mm) mówią nam o kierunku asymetrii, tzn.:
Jeżeli M>0 to → asymetria prawostronna,
Jeżeli M<0 → asymetria lewostronna.
Współczynniki (AK, AP, AM) mówią nam o sile asymetrii, tzn.:
Im bliżej 0 tym asymetria słabsza,
Im bliżej ±1 tym asymetria silniejsza.
Miary klasyczne:
Moment centralny trzeciego rzędu (wskaźnik):
$M_{3} = \frac{\sum_{}^{}{\left( x_{i} - \overset{\overline{}}{x} \right)^{3}n_{i}}}{N}$ - dla szeregu szczegółowego i rozdzielczego punktowego,
$M_{3} = \frac{\sum_{}^{}{\left( \dot{x_{i}} - \overset{\overline{}}{x} \right)^{3}n_{i}}}{N}$ - dla szeregu rozdzielczego przedziałowego.
Współczynnik asymetrii (moment standaryzowany trzeciego rzędu):
$A_{k} = \frac{M_{3}}{S^{3}\left( x \right)}$ ∈[-2,2]; 0 – idealna asymetria.
Miary pozycyjne:
Miara asymetrii (wskaźnik): MP = (Q3−Q2) − (Q2−Q1)
Współczynnik asymetrii: $A_{P} = \frac{M_{A}}{2Q}$ ∈[-1,1]
Miary mieszane:
Miara asymetrii (wskaźnik): $M_{M} = \overset{\overline{}}{X} - D$
Współczynnik asymetrii: $A_{M} = \frac{\overset{\overline{}}{X} - D}{S\left( x \right)}$ ∈[-1,1]
Współczynnik koncentracji Lorentza → kartka.
Moment czwartego rzędu:
Czwarty moment centralny (kurtoza):
$M_{4} = \frac{\sum_{}^{}{\left( \dot{x_{i}} - \overset{\overline{}}{x} \right)^{4}n_{i}}}{N}$ - dla szeregu szczegółowego i rozdzielczego punktowego,
$M_{4} = \frac{\sum_{}^{}{\left( \dot{x_{i}} - \overset{\overline{}}{x} \right)^{4}n_{i}}}{N}$ - dla szeregu rozdzielczego przedziałowego.
Współczynnik koncentracji: $K_{k} = \frac{M_{4}}{S^{4}\left( x \right)}$
Jeżeli Kk = 3 - rozkład normalny (identyczny),
Jeżeli Kk < 3 - rozkład platokurtyczny (spłaszczony),
Jeżeli Kk > 3 - rozkład leptokurtyczny (wysmukły).
Pozycyjna miara koncentracji (rozstęp kwartylowy): $\frac{Q_{3} - Q_{1}}{2\left( D_{9} - D_{1} \right)}$
Kowariancja: $\text{cov}_{\text{xy}} = \frac{\sum_{}^{}{\sum_{}^{}\left( x_{i} - \overset{\overline{}}{x} \right)\left( y_{j} - \overset{\overline{}}{y} \right)n_{\text{ij}}}}{N}$ ∈ [– ∞, ∞]
Współczynnik korelacji liniowej Pearsona: $r_{\text{xy}} = \frac{\text{cov}_{\text{xy}}}{S\left( X \right)S\left( Y \right)}$ ∈ [-1, 1]
Im bliżej 0, tym bardziej jedna cecha jest stochastycznie niezależna od drugiej,
Im bliżej 1 to zależność jest dodatnia (wzrost jednej cechy powoduje wzrost drugiej),
Im bliżej -1 to zależność jest ujemna (wzrost jednej cechy powoduje spadek drugiej).
A
Współczynnik determinacji rxy2 * 100% określa, w jakim procencie zmiany wartości jednej cechy wpływają na zmianę wartości drugiej cechy.