|
Politechnika Opolska |
Sprawozdanie 4
Przedmiot: |
Statystyka Matematyczna |
Kierunek studiów: |
INFORMATYKA |
Rok studiów: |
II |
||
Semestr: |
III |
Rok akademicki: |
2008/2009 |
Temat: |
Pomiar wielkości pliku
|
Sprawozdanie wykonał:
Nazwisko: |
Imię: |
Mindewicz |
Iga |
Termin zajęć: |
|||
Dzień tygodnia: |
Środa
|
Godzina: |
17:15 - 18:00 |
Ocena |
Data: |
Uwagi: |
|
|
|
Prowadzący: mgr inż. Marek Szmechta
Wykresy:
Dla serii 10 pomiarów
b) Dla serii 100 pomiarów.
c)Dla serii 1000 pomiarów.
d) Dla serii 10000 pomiarów.
Klasy mają odpowiedni zakres:
1. 0-10 [KB]
2. 10-100 [KB]
3. 100-1000 [KB]
4. 1000-10000 [KB]
5. 10000-100000 [KB]
6. 100000-10000000 [KB]
7. 1000000-100000000 [KB]
2. Elementy statystyki opisowej:
a) Dla serii 10 pomiarów
średnia arytmetyczna = 177659.2
mediana = 461.
wariancja = 2.947D+11
odchylenie standardowe = 542889.39
dominanta = nie istnieje
b) Dla serii 100 pomiarów
średnia arytmetyczna = 50815.71
mediana = 43.5
wariancja = 5.922D+10
odchylenie standardowe = 243345.42
dominanta = 7
c) Dla serii 1000 pomiarów
średnia arytmetyczna = 46422.42
mediana = 42941.
wariancja = 5.319D+09
odchylenie standardowe = 72932.058
dominanta = 2
d) Dla serii 10000 pomiarów
średnia arytmetyczna = 5399.2251
mediana = 77.
wariancja = 4.539D+08
odchylenie standardowe = 21305.594
dominanta = 17
3. Skrypty użyte do stworzenia wykresów oraz obliczenia elementów statystyki opisowej (przykłady dla 10 pomiarów, dla pozostałych serii wykonywane analogicznie).
a) Wykres czasowy
dane=dane1
clf;
plot(dane);
xtitle('Wykres Czasowy');
a = get("current_axes");
a.grid = [1 1 -1];
title = a.title
title.font_size = 4;
xlabel = a.x_label;
xlabel.text = 'Numer pomiaru';
ylabel = a.y_label;
ylabel.text = 'Wielkość pliku [KB]';
b) Histogram
dane=dane1(:,2)
granice=[10,100,1000,10000,100000,1000000,10000000];
n=10;
for i=1:7,
L(i)=0;
for j=1:n,
if (dane(j)>=granice(i) & dane(j)<granice(i+1)) ,L(i)=L(i)+1;end,
end,
end;
clf;
bar(L);
xtitle(' Histogram');
a = get("current_axes");
a.grid = [1 1 -1];
title = a.title
title.font_size = 4;
xlabel = a.x_label;
xlabel.text = 'Klasa';
ylabel = a.y_label;
ylabel.text = 'Liczebność';
c) Łamana częstości
dane=dane1(:,2)
granice=[1,10,100,1000,10000,100000,1000000,10000000];
n=10;
for i=1:7,
L(i)=0;
for j=1:n,
if (dane(j)>=granice(i) & dane(j)<granice(i+1)) L(i)=L(i)+1;end,
end,
end;
clf;
C=L*(1/n);
plot(C);
xtitle('Łamana częstości');
a = get("current_axes");
a.grid = [1 1 -1];
title = a.title
title.font_size = 4;
xlabel = a.x_label;
xlabel.text = 'Klasa';
ylabel = a.y_label;
ylabel.text = 'Częstość';
e) Dystrybuanta
dane=dane1(:,2)
granice=[1,100,1000,10000,100000,1000000,10000000];
n=10;
for i=1:7,
L(i)=0;
for j=1:n,
if (dane(j)>=granice(i) & dane(j)<granice(i+1)) L(i)=L(i)+1;end,
end,
end;
clf;
C=L*(1/n);
D(1)=0;
for i=2:7,
D(i)=D(i-1)+C(i-1);
end;
plot(D);
xtitle('Wykres dystrybuanty');
a = get("current_axes");
a.grid = [1 1 -1];
title = a.title
title.font_size = 4;
xlabel = a.x_label;
xlabel.text = 'Klasa';
ylabel = a.y_label;
ylabel.text = 'Prawdopodobieństwo';
f) Średnia arytmetyczna, mediana, wariancja, odchylnie standardowe,dominanta
dane = dane1
srednia=mean(dane(:,2))
mediana=median(dane(:,2))
wariancja=variance(dane(:,2))
odchylenie=stdev(dane(:,2))
dominanta=mode(dane(:,2))
4. Wnioski:
Po przeprowadzeniu analizy danych widoczne są dość duże różnice w otrzymanych wynikach dla
różnej ilości pomiarów.
Rozkład we wszystkich przypadkach był asymetryczny. Dla serii 10 i 1000 pomiarów asymetria była
lewo stronna a dla serii 100 i 10000 pomiarów była prawostronna.
Duże wartości odchylenia standardowego i wariancji wynikają z rozbieżności danych.