Wzory Statystyka

Rozstęp R = xmax − xmix

Ustalanie rozpiętości przedziały klasowego $h\left( i \right) = \frac{x_{\max} - x_{\text{mix}}}{k} = \frac{R}{k}\ gdzie\ k = \sqrt{n}$

Średnia arytmetyczna dla szeregu rozdzielczego z przedziałami klasowymi:

Dominanta $D = x_{\text{om}} + \frac{n_{m} - n_{m - 1}}{\left( n_{m} - n_{m - 1} \right) + \left( n_{m} - n_{m + 1} \right)}h_{m}$

Kwartyl dolny (Q1):
Pozycja: $Q_{1} = \frac{n}{4}$ Wartość: $Q_{1} = x_{Q1} + \frac{\frac{n}{4} - n_{skQ1 - 1}}{n_{Q1}} \bullet h$

Mediana (Me):

Pozycja: $Me = \frac{n}{2}$ Wartość: $Me = x_{\text{Me}} + \frac{\frac{n}{2} - n_{skMe - 1}}{n_{\text{Me}}} \bullet h$

Kwartyl górny (Q3):

Pozycja: $Q_{3} = \frac{3n}{4}$ Wartość: $Q_{3} = x_{Q3} + \frac{\frac{3n}{4} - n_{skQ3 - 1}}{n_{Q3}} \bullet h$

Wariacja dla szeregu klasowego przedziałowego: $s^{2} = \frac{1}{n}\sum_{i = 1}^{n}\left( {\dot{x}}_{i} - \overset{\overline{}}{x} \right)^{2} \bullet n_{i}$

Odchylenie standardowe: $S = \sqrt{S^{2}}$

Typowy obszar zmienności cechy: $\overset{\overline{}}{x} - s < x_{\text{typ}} < \overset{\overline{}}{x} + s$

Odchylenie przeciętne d (dewiata): $d = \frac{1}{n}\sum_{i = 1}^{n}{|{\dot{x}}_{i}} - \overset{\overline{}}{x}| \bullet n_{i}$

Współczynnik zmienności: $V_{s} = \frac{s}{\overset{\overline{}}{x}} \bullet 100\%\ lub\ V_{d} = \frac{d}{\overset{\overline{}}{x}} \bullet 100\%$

Odchylenie ćwiartkowe: $Q = \frac{Q_{3} - Q_{1}}{2}$

Typowy obszar zmienności: Me − Q < xtyp < Me + Q

Asymetria: Szereg symetryczny: $D = Me = \overset{\overline{}}{x}$

Szereg dodatni (prawostronny): $D < Me < \overset{\overline{}}{x}$

Szereg ujemny (lewostronny): $D > Me > \overset{\overline{}}{x}$

Wskaźnik asymetrii: $A_{s} = \frac{\overset{\overline{}}{x} - D}{s}\text{\ \ \ lub\ \ \ }A_{d} = \frac{\overset{\overline{}}{x} - D}{d}\text{\ \ \ }$

Określenie asymetrii za pomocą miar pozycyjnych:

Rozkład symetryczny: (Q3Me) − (MeQ1) = 0

Rozkład asym. prawostronny: (Q3Me) − (MeQ1) > 0

Rozkład asym. lewostronny: (Q3Me) − (MeQ1) < 0

Kurtoza: $K = \frac{m_{4}}{s^{4}}$


$$m_{4} = \ \frac{1}{\text{n\ }} \times \ \sum_{i = 1}^{n}{({\dot{x}}_{i} - \overset{\overline{}}{x})}^{4} \bullet n_{i}$$

Standaryzacja: $Z = \frac{x - \overset{\overline{}}{x}}{s}$

Współczynnik korelacji liniowej Pearsona: $r_{\text{xy}} = \frac{\sum_{i = 1}^{n}{\left( x_{i} - \overset{\overline{}}{x} \right)\left( y_{i} - \overset{\overline{}}{y} \right)}}{\sqrt{\sum_{i = 1}^{n}\left( x_{i} - \overset{\overline{}}{x} \right)^{2} \bullet \sum_{i = 1}^{n}\left( y_{i} - \overset{\overline{}}{y} \right)^{2}}}$

Funkcja regresji: Y = ax + b $a = \frac{\sum_{i = 1}^{n}{\left( x_{i} - \overset{\overline{}}{x} \right)\left( y_{i} - \overset{\overline{}}{y} \right)}}{\sum_{i = 1}^{n}\left( x_{i} - \overset{\overline{}}{x} \right)^{2}}$ $b = \overset{\overline{}}{y} - a \bullet \overset{\overline{}}{x}$

Różnice pomiędzy wartościami empirycznymi, a teoretycznymi funkcjami regresji:

$e_{t} = y_{t} - \hat{y}$ gdzie: yt – wartość empiryczna; $\hat{y}$ – wartość teoretyczna

Wariancja składnika resztowego:

$s^{2}\left( e_{t} \right) = \frac{\sum_{i = 1}^{n}\left( y_{t} - \hat{y} \right)^{2}}{n - k}$ gdzie: n – liczba obserwacji; k – liczba szacowanych parametrów

Współczynnik determinacji: R2 = 1 − φ2

Prosta regresji do danych:


$$\varphi^{2} = \frac{\sum_{i = 1}^{n}\left( y_{t} - \hat{y} \right)^{2}}{\sum_{i = 1}^{n}\left( y_{t} - \overset{\overline{}}{y} \right)^{2}}$$

Współczynnik rang Spearmana:

$r_{s} = 1 - \frac{6\sum_{i = 1}^{n}d_{i}^{2}}{n\left( n^{2} - 1 \right)}$ gdzie: di – oznacza różnicę między rangami x i y

Rozkład dwumianowy: B(n,p,k) = P(X=4) =  Cn kpk qn − k

Dystrybuanta: $\sum_{i = 1}^{n}{C_{\text{n\ }}^{k}p^{k}\ q^{n - k}}$

Wartość oczekiwana: E(x) =  n p

Wariancja: V(x) =  n p q


Wyszukiwarka