Statystyka inżynierska projekt część 1
Zbiór C14
Przygotował: Dawid Toporczyk
Zbiór X:
Przedstawienie danych za pomocą szeregu rozdzielczego przedziałowego. Histogram i funkcja dystrybuanty zbioru X:
Liczebność próby:
n = 500
Najmniejsza wartość:
xmin = 48
Największa wartość:
xmax = 233
Rozrzut:
R = xmax − xmin = 185
Liczba przedziałów w szeregu rozdzielczym przedziałowym oraz histogramie (zaokrąglona do liczby całkowitej:
k = 1 + 3, 322 Log(n) = 10
Szerokość tych przedziałów (zaokrąglona o rząd dokładności więcej od wartości w zbiorze):
$$dx = \frac{R}{k} = 18,5$$
Początek przedziału | Koniec przedziału | Liczba wartości należących do przedziału (ni) |
Środki przedziałów (xi) |
---|---|---|---|
48,0 | 66,5 | 8 | 57,3 |
66,5 | 85,0 | 16 | 75,8 |
85,0 | 103,5 | 38 | 94,3 |
103,5 | 122,0 | 85 | 112,8 |
122,0 | 140,5 | 87 | 131,3 |
140,5 | 159,0 | 120 | 149,8 |
159,0 | 177,5 | 65 | 168,3 |
177,5 | 196,0 | 53 | 186,8 |
196,0 | 214,5 | 16 | 205,3 |
214,5 | 233,0 | 12 | 223,8 |
Tabela danych do funkcji dystrybuanty:
nk skum | fk skum |
---|---|
8 | 0,02 |
24 | 0,05 |
62 | 0,12 |
147 | 0,29 |
234 | 0,47 |
354 | 0,71 |
419 | 0,84 |
472 | 0,94 |
488 | 0,98 |
500 | 1,00 |
Gdzie:
nk skum oznacza wartości skumulowane. Pierwsza wartość jest równa pierwszej wartości ni, a każda następna jest sumą poprzedniej nk skum oraz kolejnej ni, inaczej:
$$\left\{ \begin{matrix}
n_{\text{k\ skum}} = n_{k - 1\ skum} + \ n_{i}\ ,\ \text{\ \ \ }\ gdzie\ k = i > 1 \\
n_{k} = n_{i}\ ,\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ gdzie\ k = i = 1 \\
\end{matrix} \right.\ $$
fk skum oznacza stosunek nk skum do ilości wszystkich danych, czyli:
$$f_{\text{k\ skum}} = \ \frac{n_{\text{k\ skum}}}{n}$$
Analiza Danych liczbowych:
Miary położenia:
Średnia wartość:
$$x_{sr}\ = \frac{\sum_{i = 1}^{n}x_{i}}{n} = \ 142,59$$
Wartość środkowa (Mediana):
$$M_{e}\ = \left\{ \begin{matrix}
x_{\frac{n + 1}{2}\ }\ ,\ \text{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ }\text{dla\ n\ nieparzystego} \\
\frac{x_{\frac{n}{2}} + x_{\frac{n}{2} + 1}}{2},\ \ \ \ \text{dla\ n\ parzystego} \\
\end{matrix} \right.\ = \ 143,00$$
Wartość najczęściej występująca (Modalna):
Mo = 145, 00
Miary zmienności:
Rozrzut:
R = 185, 00
Wariancja:
$$s^{2}\ = \frac{\sum_{i = 1}^{n}\left( x_{i} - x_{sr} \right)^{2}}{n} = \ 1181,98$$
Odchylenie standardowe:
$$s\ = \sqrt{s^{2}} = \ 34,38$$
Współczynnik zmienności:
$$V_{s}\ = \frac{s}{x_{sr}} \bullet 100\% = \ 24,11\%$$
Vs mniejsze od 10% - mała zmienność danych
Vs w zakresie 10 - 20% - umiarkowana zmienność danych
Vs większe od 20% - duża zmienność danych
Miary kształtu:
Moment centralny trzeciego rzędu:
$$M^{3}\ = \frac{\sum_{i = 1}^{n}\left( x_{i} - x_{sr} \right)^{3}}{n} = \ 383,91$$
Współczynnik asymetrii:
$$As\ = \frac{M^{3}}{s^{3}} = \ 0,01$$
As < 0 - asymetria lewostronna (wydłużona lewa strona rozkładu)
As = 0 - rozkład symetryczny
As < 0 - asymetria prawostronna (wydłużona prawa strona rozkładu)
Moment centralny czwartego rzędu:
$$M^{4}\ = \frac{\sum_{i = 1}^{n}\left( x_{i} - x_{sr} \right)^{4}}{n} = \ 4000979,99$$
Współczynnik koncentracji:
$$K\ = \frac{M^{4}}{s^{4}} = \ 2,86$$
K < 3 - dane skoncentrowane mniej niż w rozkładzie normalnym
K = 3 - koncentracja danych taka jak w rozkładzie normalnym
K > 3 - dane skoncentrowane bardziej niż w rozkładzie normalnym
Opis:
Średnia arytmetyczna wartości w zbiorze X wynosi 142,59. Jego wartość środkowa to 143,00, a wartość najczęściej występująca to 145,00. Rozrzut wynosi 185,00, zaś Współczynnik zmienności pokazuje, że przeciętnie wielkości różnią się od siebie o 24,11%, co wskazuje na dużą zmienność danych. Dodatni współczynnik asymetrii (0,01) wskazuje na bardzo małą asymetrię prawostronną, a współczynnik koncentracji niewiele mniejszy od trzech (2,86) pokazuje lekkie spłaszczenie rozkładu, w stosunku do rozkładu normalnego.
Zbiór Y (stosowane wzory takie same, jak dla zbioru X):
Przedstawienie danych za pomocą szeregu rozdzielczego przedziałowego. Histogram i funkcja dystrybuanty zbioru Y:
Liczebność próby:
n = 500
Najmniejsza wartość:
ymin = 109
Największa wartość:
ymax = 422
Rozrzut:
R = 313
Liczba:
k = 10
Szerokość tych:
dx = 31, 3
Początek przedziału | Koniec przedziału | Liczba wartości należących do przedziału (ni) |
Środki przedziałów (yi) |
---|---|---|---|
109,0 | 140,3 | 8 | 124,7 |
140,3 | 171,6 | 16 | 156,0 |
171,6 | 202,9 | 38 | 187,3 |
202,9 | 234,2 | 85 | 218,6 |
234,2 | 265,5 | 87 | 249,9 |
265,5 | 296,8 | 120 | 281,2 |
296,8 | 328,1 | 65 | 321,5 |
328,1 | 359,4 | 53 | 343,8 |
359,4 | 390,7 | 16 | 375,1 |
390,7 | 422,0 | 12 | 406,4 |
Tabela danych do funkcji dystrybuanty:
nk skum | fk skum |
---|---|
7 | 0,01 |
24 | 0,05 |
77 | 0,15 |
168 | 0,34 |
275 | 0,55 |
386 | 0,77 |
454 | 0,91 |
482 | 0,96 |
496 | 0,99 |
500 | 1,00 |
Analiza Danych liczbowych:
Miary położenia:
Średnia wartość:
ysr = 258, 49
Mediana:
Me = 275, 00
Modalna:
Mo = 275, 00
Miary zmienności:
Rozrzut:
R = 313, 00
Wariancja:
s2 = 2913, 04
Odchylenie standardowe:
s = 53, 97
Współczynnik zmienności:
Vs = 20, 88%
Miary kształtu:
Moment centralny trzeciego rzędu:
M3 = 18002, 66
Współczynnik asymetrii:
As = 0, 11
Moment centralny czwartego rzędu:
M4 = 24996232, 67
Współczynnik koncentracji:
K = 2, 95
Opis:
Średnia arytmetyczna wartości w zbiorze Y wynosi 258,49. Jego wartość środkowa to 258,50, a wartość najczęściej występująca to 275,00. Rozrzut wynosi 313,00, zaś Współczynnik zmienności pokazuje, że przeciętnie wielkości różnią się od siebie o 20,88%, czyli zmienność danych jest duża (powyżej 20%). Dodatni współczynnik asymetrii (0,11) wskazuje na małą, lecz mimo to większą niż w poprzednim zbiorze asymetrię prawostronną, a współczynnik koncentracji mniejszy, ale prawie równy 3 (2,95) pokazuje, że rozkład jest lekko spłaszczony, ale koncentracja danych prawie nie różni się od rozkładu normalnego.