2258


1Wszystkie obliczenia sporządziłem na podstawie danych z roku 1999. Dane te wraz z obliczeniami dołączone są jako załącznik do niniejszego projektu na jego końcu.

Zadaniem w tej części jest opracowanie statystyczne i interpretacja wyników dotyczące ładunku BZT5 i CHZT w ściekach dopływających do oczyszczalni ścieków „Czajka” z Żerania.

Otrzymane dane przedstawiają pomiary uporządkowane w szereg statystyczny wyliczający, stąd wszystkie zastosowane wzory odnoszą się do takiego właśnie szeregu.

Na wstępie sporządziłem dwa wykresy (Rys.1.1 i Rys.1.2), oddzielnie dla BZT5 i CHZT, aby lepiej poznać rozkład ładunków w czasie. Wykresy te załączone są na końcu projektu. Graficzna metoda przedstawienia tego rozkładu jest przejrzysta i pozwala na szybką ocenę skali zjawiska, jego zmienności czy niezmienności.

Sporządziłem również histogramy (Rys.1.3 i Rys1.4) na podstawie których można stwierdzić, czy rozkład jest jednomodalny, czy jest symetryczny.

0x01 graphic

0x01 graphic

Dzięki ww. graficznym obrazom rozłożenia ładunków łatwiej można wychwycić jakieś wyjątkowe, odstające od normy, sytuacje, które miały miejsce w badanym okresie:

Na podstawie wykresów podzieliłem badany okres na sezony, w celu przeprowadzenia analizy sezonowości. Najpierw jednak policzyłem podstawowe miary statystyczne dla całego okresu:

Średnią arytmetyczną liczę ze wzoru:

0x01 graphic
. (1.1)

Dla BZT5 wynosi ona 324,7[mg/dm3], a dla CHZT 886,3[mg/dm3].

Kwantyle (i medianę) odczytuję z wykresów skumulowanych częstości względnych. Wykresy te (rys.1.5 i rys.1.6) załączone są na końcu tej części projektu.

Empiryczny obszar zmienności, będący różnicą między największą i najmniejszą wartością zmiennej w badanej zbiorowości, obliczam tylko dla wstępnej orientacji, na jakim obszarze rozciągają się wartości badanej zmiennej.

Wynosi on RBZT = 647,5[mg/dm3], a RCHZT = 1443,8[mg/dm3].

Wariancja pozwala na określenie zróżnicowania zbiorowości, im wyższa jest jej wartość, tym bardziej zbiorowość jest zróżnicowana. Do wyznaczenia tej wartości stosuję wzór:

0x01 graphic
. (1.3)

s2BZT = 14042,1[(mg/dm3)2]; s2CHZT = 71241,1[(mg/dm3)2].

Odchylenie standardowe określa, o ile wszystkie jednostki danej zbiorowości różnią się średnio od średniej arytmetycznej badanej zbiorowości. Korzystam tu ze wzoru:

0x01 graphic
. (1.4)

Dla BZT5 wynosi ono 118,5[mg/dm3], a dla CHZT 266,9[mg/dm3]

Współczynniki zmienności informują o sile dyspersji. Duże ich wartości świadczą o niejednorodności zbiorowości. Za ich pomocą można porównywać cechy tej samej zbiorowości będące na różnym poziomie. Korzystam tu ze wzoru:

0x01 graphic
. (1.5)

BZT5: Vs = 36,5[%]; CHZT: Vs = 82,2[%] .

W przypadku BZT5 na podstawie graficznych wykresów nie ma powodu, który wskazywałby na podział na sezony w jakiś konkretny sposób. Dlatego do analizy sezonowości podzieliłem rok na dwie połowy (po 6 miesięcy).

Dla CHZT rok dzielę na początku VI miesiąca. Przed tą datą brak znacznych przyrostów czy spadków, po niej natomiast obserwuje bardzo duży rozrzut pomiarów.

Zgodnie z poleceniem zadania, analiza statystyczna badanego zjawiska zawiera wyniki:

  1. analizy zmienności sezonowych na podstawie wartości średnich i wariancji;

  2. przedziały ufności dla wartości średnich;

  3. analizę trendu.

Ad. A

Do zbadania istotności różnicy dwóch średnich przez weryfikację H0: 0x01 graphic
=0x01 graphic
zastosowałem statystykę:

0x01 graphic
. (1.6)

Dla BZT5:

0x01 graphic
.

Dla CHZT:

0x01 graphic
.

Wartość t odczytana z tablic rozkładu t-Studenta (=0,01, ss=n1+n2-2=118) wynosi, dla obu wskaźników, około 2,617.

Ponieważ |t|>|t| nie ma podstaw do odrzucenia H0. Oznacza to, że w obu przypadkach brak jest istotnej różnicy w wielkościach średnich.

Zweryfikowałem następnie hipotezę o jednakowym stopniu rozproszenia wartości badanej cechy. Do tego celu zakładam jednorodność wariancji w porównywanych populacjach.

H0: 0x01 graphic
; H1: 0x01 graphic
; test istotności służący do weryfikacji hipotezy zerowej:

0x01 graphic
. (1.8)

Statystyka ta ma rozkład F Snedecora z n1-1 oraz n2-1 stopniami swobody, pamiętając, że koniecznym jest aby 0x01 graphic
. Współczynnik  przyjąłem 0,01.

Dla BZT5:

0x01 graphic
.

Dla CHZT:

0x01 graphic
.

Z tablic rozkładu F Snedecora odczytałem wartość F=1,89. Z uwagi na to, że wartości krytyczne w tablicy są podane dla stopni swobody 40-60 i 60-60 wartość F jest tylko przybliżona. O tym, że nie spowoduje to błędnej weryfikacji hipotezy zerowej świadczy fakt, że w stosunku do BZT5 wartość krytyczna, przy niewielkich zmianach wartości, będzie na pewno większa, a dla CHZT mniejsza.

W przypadku BZT5 niema podstaw do odrzucenia H0 , co oznacza, że wariancje na poziomie istotności  są sobie równe.

Dla CHZT odrzucam hipotezę zerową o równości rozproszenia badanej cechy.

Ad. B

Przedziały ufności wyznaczyłem ze wzoru:

0x01 graphic
; (1.7)

t odczytałem z tablicy rozkładu t-Studenta dla n-1 liczby stopni swobody.

Tablica 1.1. dane do obliczeń.

BZT5

CHZT

sezon I

sezon II

sezon I

sezon II

Σ

18588,8

20369,6

36651,5

69710,0

n

54

66

44

76

0x01 graphic

344,2

308,6

833,0

917,2

s2

10577,8

16305,9

21448,7

97465,8

t

2,010

1,999

2,020

1,997

przedziały ufności:

lewy

315,8

276,9

787,9

845,2

prawy

372,6

340,3

878,1

989,2

Ad. C

Test Spearmana.

H0: Rsp=0 brak trendu;

H1: Rsp≤0 \

≥0 /linia trendu;

Skorzystałem ze statystyki:

0x01 graphic
, (1.9)

gdzie:

0x01 graphic
, (1.10)

0x01 graphic
. (1.11)

Krytyczne wartości t odczytane są z rozkładu t-Studenta dla n-2 stopni swobody:

t118,0.025 = 1,980

t118,0.975 =-1,980.

Tablica 1.2. Wyniki obliczeń.

BZT5

CHZT

Rsp

-0,0623

0,2091

t

-0,6586

2,5538

W przypadku BZT5 obliczona wartość t zawiera się w przedziale (tn-2,0.025;tn-2,0.975) co oznacza, że nie ma podstaw do odrzucenia hipotezy zerowej - brak jest linii trendu.

Test Spearmana pozwala stwierdzić na podstawie wyniku t>tkr, że dla rozkładu CHZT w ściekach, występuje trend wzrostowy, przy współczynniku Rsp=0,21.

Interpretacja wyników:

Na podstawie histogramów (rys.1.1 i rys.1.2), jak i wartości średniej arytmetycznej, widać, że ładunek w dopływających ściekach CHZT jest ponad dwukrotnie większy niż w przypadku BZT5.

Zbiorowość jest mało zróżnicowana, ładunki BZT5 i CHZT, na przestrzeni roku, były bliskie średniej całorocznej. Świadczą o tym wartości odchyleń przeciętnych i wariancji, są one bardzo małe i dodatkowo są one na podobnym poziomie.

Potwierdzeniem nieznacznej tylko zmienności wielkości ładunków jest wartość odchylenia standardowego, które wynosi średnio dla BZT5 i CHZT tylko 0,5[mg/dm3] - jest to wartość bardzo mała w odniesieniu do wielkości poszczególnych ładunków tych wskaźników występujących w ściekach.

Obliczone współczynniki zmienności są bardzo małe, co świadczy zarówno o jednorodności badanej zbiorowości, jak i zebranych danych.

Z analizy sezonowości:

Przy dokonanym przeze mnie podziale na dwa sezony, dla każdego ze wskaźników, średnie wartości ładunków nie różnią się od siebie w istotny sposób. Brak więc jest sezonowości zjawisk ze względu na zmiany wartości oczekiwanych o obu sezonach.

Trochę inaczej wygląda to w przypadku sezonowości ze względu na wariancję w poszczególnych sezonach.

W przypadku BZT5, na poziomie =0.01, przyjmuję hipotezę o jednakowym stopniu rozproszenia wartości ładunku - brak więc znów sezonowości.

Dla CHZT jednak zaznacza się istotność w nierówności rozproszenia, ma więc miejsce zjawisko sezonowości.

Potwierdzeniem braku sezonowości dla BZT5, a sezonowości wielkości CHZT, jest analiza trendu testem Spearmana.

Obliczenia do tej analizy wykonałem bez podziału na sezony, co miało na celu sprawdzenie występowania zjawiska trendu w całym roku. Znalazłem w ten sposób potwierdzenie wyników analizy sezonowości: brak linii trendu dla BZT5 i trend wzrostowy w przypadku CHZT. Oznacza to zupełny brak sezonowości wielkości występowania BZT5, a sezonowość CHZT - dokładnie wzrost wielkości ładunku w II sezonie.



Wyszukiwarka