Politechnika Opolska |
---|
Sprawozdanie 3
Przedmiot: | Statystyka Matematyczna |
---|
Kierunek studiów: | INFORMATYKA |
Rok studiów: | II |
---|---|---|---|
Semestr: | III | Rok akademicki: | 2008/2009 |
Temat: |
---|
Pomiar wielkości pliku |
Sprawozdanie wykonał:
Nazwisko: | Imię: |
---|---|
Mindewicz |
Iga |
Termin zajęć: |
---|
Dzień tygodnia: |
Ocena | Data: | Uwagi: |
---|---|---|
Prowadzący: mgr inż. Marek Szmechta
Wykresy:
Dla serii 10 pomiarów
b) Dla serii 100 pomiarów.
c)Dla serii 1000 pomiarów.
d) Dla serii 10000 pomiarów.
Klasy mają odpowiedni zakres:
1. 0-10 [KB]
2. 10-100 [KB]
3. 100-1000 [KB]4. 1000-10000 [KB]
5. 10000-100000 [KB]
6. 100000-10000000 [KB]
7. 1000000-100000000 [KB]
2. Elementy statystyki opisowej:
a) Dla serii 10 pomiarów
średnia arytmetyczna = 177659.2
mediana = 461.
wariancja = 2.947D+11
odchylenie standardowe = 542889.39
dominanta = nie istnieje
b) Dla serii 100 pomiarów
średnia arytmetyczna = 50815.71
mediana = 43.5
wariancja = 5.922D+10
odchylenie standardowe = 243345.42
dominanta = 7
c) Dla serii 1000 pomiarów
średnia arytmetyczna = 46422.42
mediana = 42941.
wariancja = 5.319D+09
odchylenie standardowe = 72932.058
dominanta = 2
d) Dla serii 10000 pomiarów
średnia arytmetyczna = 5399.2251
mediana = 77.
wariancja = 4.539D+08
odchylenie standardowe = 21305.594
dominanta = 17
3. Skrypty użyte do stworzenia wykresów oraz obliczenia elementów statystyki opisowej (przykłady dla 10 pomiarów, dla pozostałych serii wykonywane analogicznie).
a) Wykres czasowy
fid = file ('open','E:\wyniki\dane1.txt','unknown');plik = read (fid, -1, 2);
dane=plik(:,2)
clf;
plot(dane);
xtitle('Wykres Czasowy');
a = get("current_axes");
a.grid = [1 1 -1];
title = a.title
title.font_size = 4;
xlabel = a.x_label;
xlabel.text = 'Numer pomiaru';
ylabel = a.y_label;
ylabel.text = 'Wielkosc pliku [KB]';
b) Histogram
fid = file ('open','E:\wyniki\dane1.txt','unknown');
plik = read (fid, -1, 2);
dane=plik(:,2)
granice=[10,100,1000,10000,100000,1000000,10000000];
n=10;
for i=1:7,
L(i)=0;
for j=1:n,
if (dane(j)>=granice(i) & dane(j)<granice(i+1)) then,L(i)=L(i)+1;end,
end,
end;
clf;
bar(L);
xtitle(' Histogram');
a = get("current_axes");
a.grid = [1 1 -1];
title = a.title
title.font_size = 4;
xlabel = a.x_label;
xlabel.text = 'Klasa';
ylabel = a.y_label;
ylabel.text = 'Liczebność';
c) Łamana częstości
fid = file ('open','E:\wyniki\dane1.txt','unknown');
plik = read (fid, -1, 2);
dane=plik(:,2)
granice=[1,10,100,1000,10000,100000,1000000,10000000];
n=10;
for i=1:7,
L(i)=0;
for j=1:n,
if (dane(j)>=granice(i) & dane(j)<granice(i+1)) then,L(i)=L(i)+1;end,
end,
end;
clf;
C=L*(1/n);
plot(C);
xtitle('Lamana czestosci');
a = get("current_axes");
a.grid = [1 1 -1];
title = a.title
title.font_size = 4;
xlabel = a.x_label;
xlabel.text = 'Klasa';
ylabel = a.y_label;
ylabel.text = 'Czestosc';
e) Dystrybuanta
fid = file ('open','E:\wyniki\dane1.txt','unknown');
plik = read (fid, -1, 2);
dane=plik(:,2)
granice=[1,100,1000,10000,100000,1000000,10000000];
n=10;
for i=1:7,
L(i)=0;
for j=1:n,
if (dane(j)>=granice(i) & dane(j)<granice(i+1)) then,L(i)=L(i)+1;end,
end,
end;
clf;
C=L*(1/n);
D(1)=0;
for i=2:7,
D(i)=D(i-1)+C(i-1);
end;
plot(D);
xtitle('Wykres dystrybuanty');
a = get("current_axes");
a.grid = [1 1 -1];
title = a.title
title.font_size = 4;
xlabel = a.x_label;
xlabel.text = 'Klasa';
ylabel = a.y_label;
ylabel.text = 'Dystrybuanta';
f) Średnia arytmetyczna, mediana, wariancja, odchylnie standardowe
fid = file ('open','E:\wyniki\dane1.txt','unknown');
dane = read (fid, -1, 2);
srednia=mean(dane(:,2))
mediana=median(dane(:,2))
wariancja=variance(dane(:,2))
odchylenie=stdev(dane(:,2))
g) Dominanta
fid = file ('open','E:\wyniki\dane1.txt','unknown');
plik = read (fid, -1, 2);
dane=plik(:,2)
n=10;
[maximum]=max(dane);
[minimum]=min(dane);
A=0;
B=0;
dominanta=0;
for i=minimum:maximum,
for j=1:n,
if (dane(j)==i) then, A=A+1; end,
end,
if (A>B) then, B=A; dominanta=i;end,
A=0;
end;
4. Wnioski:
Po przeprowadzeniu analizy danych widoczne są dość duże różnice w otrzymanych wynikach dla
różnej ilości pomiarów.
Rozkład we wszystkich przypadkach był asymetryczny. Dla serii 10 i 1000 pomiarów asymetria była
lewo stronna a dla serii 100 i 10000 pomiarów była prawostronna.
Duże wartości odchylenia standardowego i wariancji wynikają z rozbieżności danych.