Zad 3 i 4
Do zadania 3 i 4 używałem danych z pliku "Wbus.xls" udostępnionego przez prowadzących zajęcia.
3a)
Histogram liczby pracowników
|
197,71 |
1 |
213,71 |
2 |
411,42 |
3 |
609,14 |
4 |
806,85 |
5 |
1004,57 |
6 |
1202,28 |
7 |
1400 |
3b)
Obliczenia
|
x |
logX |
Min |
16 |
1,20 |
Max |
1400 |
3,14 |
Średnia |
135,54 |
1,83 |
Odchylenie standardowe |
256,08 |
0,43 |
Skośność |
4,11 |
1,10 |
Kurtoza |
17,52 |
1,31 |
Mediana |
51,5 |
1,71 |
kwantyl0,25 |
32,5 |
1,51 |
kwantyl0,75 |
125 |
2,09 |
Rozstęp międzykwartylowy |
92,5 |
0,58 |
4a)
Histogram zmiennej Y=logX
|
0,27 |
1 |
1,48 |
2 |
1,75 |
3 |
2,03 |
4 |
2,31 |
5 |
2,59 |
6 |
2,86 |
7 |
3,14 |
Wnioski:
Zmienna X: Dużą uwagę zwraca różnica między medianą a średnią, średnia jest prawie trzy razy większa od mediany, co wskazuje że są firmy o dużej liczbie pracowników, które zawyżają tą średnią. Skośność jest dużo większa od zera co wskazuje na asymetrię prawostronną. Kurtoza jest także dużo większa od zera, więc rozkład jest bardziej wysmukły od normalnego.
Zmienna "logX": jest bardziej zbliżona do rozkładu normalnego, ponieważ średnia jest bliska medianie oraz kurtoza i skośność są bliższe zeru niż w zmiennej X, również z histogramu wynika że jest bardziej symetryczny.