|
Politechnika Opolska |
Sprawozdanie 2 - Statystyka opisowa
Przedmiot: |
Statystyka Matematyczna |
Kierunek studiów: |
INFORMATYKA |
Rok studiów: |
II |
||
Semestr: |
III |
Rok akademicki: |
2008/2009 |
Temat: |
Pomiar czasu trwania algorytmu generacji konkretnej liczby pierwszej ( 5009 )
|
Sprawozdanie wykonał:
Nazwisko: |
Imię: |
Łukaszewski |
Szymon |
Termin zajęć: |
|||
Dzień tygodnia: |
Środa
|
Godzina: |
17:15 - 18:00 |
Ocena |
Data: |
Uwagi: |
|
|
|
Prowadzący: mgr inż. Marek Szmechta
Wykresy
Wszystkie wykresy zostały wykonane przy pomocy programu Microsoft Excel.
Histogramy, łamane częstości, dystrybuanty, wykresy czasowe odpowiednich pomiarów znajdują się na ostatnich stronach sprawozdania.
Zostały również wyznaczone: średnia arytmetyczna, mediana, wartość modalna, wariancja, odchylenie standardowe dla odpowiednich serii danych (oczywiście wskaźniki statystyki opisowej są podane w milisekundach [ms] ). Wymienione wskaźniki statystyki opisowej zestawiam w tabeli:
|
Seria 1 (10 pomiarów) |
Seria 2 (100 pomiarów) |
Seria 3 (1000 pomiarów) |
Seria 4 (10 000 pomiarów) |
Średnia arytmetyczna |
2359,30
|
2366,10
|
2298,98
|
2247,16
|
Mediana
|
2343
|
2354
|
2313
|
2344
|
Wartość modalna |
2333 i 2343
|
2343
|
2313
|
2053
|
Wariancja
|
4191,78
|
1413,92
|
1449,86
|
23888,84
|
Odchylenie standardowe |
64,74
|
37,60
|
38,07
|
154,56
|
Wnioski
Średnie arytmetyczne dla wszystkich 4 serii pomiarowych są zbliżone do siebie, przy czym różnica między największą (dla 100 pomiarów - 2366,10 [ms] ),a najmniejszą z nich (dla 10 000 pomiarów - 2247,16 ) wynosi 118,94 [ms]. Można zauważyć, że średnia ta maleje wraz z ilością wykonywanych pomiarów (jeśli nie brać pod uwagę 1 serii pomiarów, gdzie zostało wykonanych tylko 10 pomiarów).
Mediany, czyli inaczej wartości środkowe dla poszczególnych serii pomiarowych są zbliżone do siebie i wynoszą powyżej 2300 [ms]. Przy czym dla 100 pomiarów mediana ma wartość największą i wynosi 2354 [ms], dla 1000 najmniejszą równą 2313 [ms].
Dla 10 pomiarów istnieją dwie wartości modalne. Wynoszą one 2333[ms] i 2343[ms]. Wynika to zapewne z bardzo malej ilości przeprowadzonych pomiarów.
Wartości modalne trzech pierwszych serii pomiarowych są zbliżone wartościami do siebie. Warto tutaj zauważyć, że dla 10 000 pomiarów wartość modalna odbiega wartością od pozostałych serii o ponad 260 [ms] (jest ona równa 2053[ms] ).
Wariancja dla 10 000 pomiarów jest prawie 16 razy większa od wariancji dla 100 i 1000 pomiarów i 5 razy większa od wariancji dla serii pierwszej.
Odchylenie standardowe ma wartość największa wynoszącą aż 154,5601[ms] dla 10 000 pomiarów, co jest z pewnością podyktowane dużą ilością przeprowadzonych pomiarów.
Dla drugiej i trzeciej serii pomiarów wartości odchylenia standardowego są najbardziej zbliżone i mniejsze o prawie 4 razy od serii 4.
Warto jeszcze zwrócić uwagę, ze dla 10 000 pomiarów wystąpiły dwa pomiary, które bardzo odbiegają od pozostałych. Dobrze widać to na wykresie czasowym. Te wartości to 1051 [ms] i 6629 [ms].
Obserwując histogramy i łamane częstości możemy zauważyć, że dla każdej serii danych oczekiwany czas wykonania się algorytmu waha się w przedziale (2300 - 2400] milisekund. Dla 10 000 oczekiwany czas waha się jeszcze w przedziale (2050-2100]
Z otrzymanych wykresów wynika, że otrzymałem rozkład normalny dla każdej serii danych.
Widzimy zatem, że im większa ilość pomiarów tym dokładniejsze dane otrzymujemy.
Wykresy dla 10 pomiarów
Wykresy dla 100 pomiarów
Wykresy dla 1000 pomiarów
Wykresy dla 10 000 pomiarów
Fragmenty wykresów czasowych dla 1000 i 10 000 pomiarów
2