Skuteczność metod predykcji natężenia dopływu ścieków do oczyszczalni


MONIKA CHUCHRO*
Skuteczność metod predykcji natężenia dopływu ścieków do oczyszczalni
Słowa kluczowe
środowiskowe szeregi czasowe  ścieki  oczyszczalnie ścieków
Streszczenie
Predykcja zjawisk jest jednym z podstawowych zagadnień analizy środowiskowych szeregów czasowych.
Wybranie najlepszej metody przewidywania przyszłych wartości na podstawie posiadanych danych jest pro-
cesem skomplikowanym. Rozbieżność między przewidywanymi, a rzeczywistymi wartościami może być
wysoka. Jest to spowodowane zaszumieniem danych, które jest powszechnym zjawiskiem występującym
w środowiskowych szeregach czasowych. Dodatkowo na jakość predykcji wpływa fakt, że szeregi czasowe
mogą posiadać trend, cykliczność i sezonowość. Charakter środowiskowych szeregów czasowych, posiadają-
cych skomplikowaną strukturę i zaszumienie, wpływa znacznie na obniżenie jakości predykcji. Zastosowanie
licznych wariantów analiz oraz testów, połączone z obszerną wiedzą o danym szeregu czasowym umożliwia
uzyskanie dobrych wyników predykcji. W artykule zastosowano podstawowe metody predykcji szeregów
czasowych oraz sprawdzono ich skuteczność na przykładzie danych dotyczących natężenia dopływu ścieków
do oczyszczalni ścieków.
1. Wstęp
Prognoza pogody, temperatura ciała pacjentów notowana codziennie w szpitalu, waga odpadów
dowożonych w ciągu doby na wysypiska odpadów, to są przykłady szeregów czasowych. Dane
zbierane systematycznie w określonych przedziałach czasu mogą dostarczyć przydatnych informa-
cji o zmianach nasilenia zjawiska, a także okresowości występującej w danych. Szeregi czasowe
umożliwiają predykcje tych zjawisk. Prognozowanie przyszłych wartości interesującego nas zja-
wiska jest rzeczą skomplikowaną, gdyż wymaga poznania struktury danych opisujących zjawisko.
W zrozumieniu czynników kształtujących szereg czasowy pomaga wyodrębnienie składowych sze-
regu, do których należy trend, wahania sezonowe i okresowe oraz zjawiska losowe [3]. Większość
środowiskowych szeregów czasowych opisuje zjawiska skomplikowane, które są kształtowane
przez wiele czynników [6]. Przykładem takich szeregów czasowych jest średniodobowe natężenie
dopływu ścieków do oczyszczalni ścieków. Na kształtowanie natężenia dopływu mają wpływ: ilość
*
Katedra Geoinformatyki i Informatyki Stosowanej, Wydział Geologii, Geofizyki i Ochrony Środowiska, AGH, Kraków
e-mail: Chuchro@geol.agh.edu.pl
299
Chuchro M.: Skuteczność metod predykcji natężenia dopływu ścieków do oczyszczalni
ścieków wyprodukowanych przez gospodarstwa domowe, ilość ścieków wygenerowanych przez
zakłady przemysłowe, opady atmosferyczne i pora roku. Ilość ścieków wyprodukowanych przez
gospodarstwa domowe oraz przemysł jest natomiast uzależniona od dnia tygodnia oraz struktury
miesiąca.
Wiedza o strukturze szeregu czasowego umożliwia wybranie modeli predykcji. W zależności
od wymaganej dokładności modelu oraz posiadanych informacji o szeregu czasowym można wyko-
rzystać jeden z wielu metod predykcji, do których należy np.: estymacja nieliniowa, predykcja
na podstawie modeli autoregresyjnych, sieci neuronowe, prognozowanie na podstawie modeli re-
gresji lub modeli adaptacyjnych [3, 8]. Celem projektu było wykonanie dwóch typów analiz umoż-
liwiających predykcje szeregów czasowych, określenie ich skuteczności oraz możliwości zastoso-
wania. Do analiz wybrano modele estymacji nieliniowej oraz sieci neuronowe.
2. Charakterystyka danych
Objętość ścieków dopływających lub dowożonych do oczyszczalni ścieków, w określonej
jednostce czasu nazywamy natężeniem dopływu ścieków. Natężenie dopływu ścieków jest jednym
z podstawowych parametrów pracy oczyszczalni ścieków. Analizowane dane natężenia dopływu
ścieków pochodzą z trzech komunalnych oczyszczalni ścieków odbierających ścieki z Krakowa,
Sandomierza oraz Warszawy. Największa spośród analizowanych oczyszczalni ścieków  Czajka,
znajduje się w Warszawie. Została oddana do eksploatacji w 1991 roku, w celu odbierania ścieków
z prawobrzeżnej części stolicy. Do oczyszczalni dopływa 200 tyś. metrów sześciennych w ciągu
doby. Drugą, co do wielkości analizowaną oczyszczalnią ścieków jest obiekt należący do Miejskie-
go Przedsiębiorstwa Wodociągów i Kanalizacji w Krakowie   Kujawy . Obiekt ten został otwarty
w 1999 roku. W  Kujawach oczyszczane są ścieki pochodzące od 250 tyś. mieszkańców Nowej
Huty. Najmniejszą spośród analizowanych oczyszczalni ścieków jest obiekt zlokalizowany w San-
domierzu. W ciągu doby dopływa do niej 3 tys. metrów sześciennych ścieków pochodzących
z Sandomierza oraz okolic.
Cechą charakterystyczną wybranych szeregów czasowych jest ich dobowa rozdzielczość oraz
długość, każdy szereg składa się z 2922 wyrazów. Analizowane dane uwzględniają przedział czasu
od 01.01.2000 do 31.12.2007. Ze względu na rozmiar analizowanych wybrano pakiet Statistica 8
z najnowszą aktualizacją modułu analitycznego. Podstawowe analizy wykazały, że szeregi czasowe
natężenia dopływu ścieków są niestacjonarne i nieergodyczne [4]. Dane zawierają trend, zmiany
cykliczne, okresowe oraz szum [3]. Kolejną cechą charakterystyczną analizowanych szeregów cza-
sowych, jest ich wysoka skośność prawostronna (dla o.ś. Sandomierz =3), spowodowana przewagą
występowania intensywnych opadów nad incydentami braku wody i awariami w sieci wodno-kana-
lizacyjnej.
Szeregi czasowe z trzech analizowanych oczyszczalni ścieków wykazują dodatnią liniową kore-
lacje, Pearsona wynoszącą 0,6 z dobowymi wartościami opadów. Dodatnia korelacja występuje
między danymi z poszczególnych analizowanych oczyszczalni ścieków. Największa wartość kore-
lacji występuje między oczyszczalnią  Kujawy Kraków, a obiektem w Sandomierzu i wynosi 0,5.
Najmniejsza wartość korelacji występuje miedzy danymi pochodzącymi z oczyszczalni ścieków
w Warszawie i Krakowie, wynosi ona 0,3.
Wysoka wartość korelacji liniowej między dwoma oczyszczalniami ścieków może wystąpić,
gdy obiekty położone są w niewielkim oddaleniu od siebie oraz przyjmują ścieki o podobnej struk-
turze. W takim przypadku możliwe jest wykonanie jednego modelu dla obu obiektów lub też wyko-
rzystanie fragmentów modelu z jednej oczyszczalni do wykonania modelu dla drugiej oczyszczalni
ścieków.
Obliczanie korelacji liniowej Pearsona miało także na celu sprawdzenie czy występuje powią-
zanie między opadami a danymi z oczyszczalni. Wysoka wartość tego współczynnika świadczy
300
Krakowska Konferencja Młodych Uczonych 2009
o wysokiej zależności między objętością ścieków dopływających do oczyszczalni a opadami. Wyso-
ka dodatnia korelacja może też wystąpić między natężeniem dopływu do oczyszczalni z jednej
miejscowości a opadami z innej, blisko położonej miejscowości. Jeśli wartość współczynnika
korelacji byłaby wysoka, pozwoliłoby to na uproszczenie modeli a także zmniejszenie nakładów
finansowych potrzebnych na zakup danych pogodowych.
3. Estymacja nieliniowa
Określenie przyszłego przebiegu szeregu czasowego w sposób ogólny jest możliwe, dzięki za-
stosowaniu metod estymacji [1]. Wstępna analiza danych wykazała, że szereg czasowy natężenia
dopływu ścieków do oczyszczalni wykazuje fluktuacje występujące wewnątrz tygodnia. Charak-
terystyczne są wysokie wartości natężenia dopływu ścieków występujące w środy oraz w soboty.
Dodatkowo najniższe wartości natężenia dopływu ścieków można zaobserwować w niedziele.
Wahania wielkości natężenia dopływu występują także pomiędzy poszczególnymi tygodniami
wewnątrz miesiąca. Fluktuacje wielkości są cechą wspólną dla szeregów czasowych natężenia
dopływu ścieków z trzech analizowanych oczyszczalni ścieków. Na podstawie tych wiadomości
wybrano metodę estymacji nieliniowej z wykorzystaniem funkcji sinus. Modele estymacji nielinio-
wej zostały dopasowane metodą najmniejszych kwadratów, a także przy użyciu funkcji straty
określonej przez użytkownika. W przypadku zastosowania kryterium najmniejszych kwadratów
do estymacji parametrów modeli nieliniowych wykorzystano algorytmy Levenberga-Marquardta
i Gaussa-Newtona [1]. Modele estymacji z funkcją straty zawierały procedurę quasi-Newtona. Jako
funkcję straty wykorzystano kilka różnych funkcji opisanych poniżej, których skuteczność następ-
nie sprawdzano. Zadaniem funkcji straty było zniwelowanie wpływu wysokich odstających war-
tości w danych [2]. Modele estymacji zostały wykonane dla trzech kompletów danych: surowych,
zestandaryzowanych oraz znormalizowanych.
Celem estymacji nieliniowej było dopasowanie przebiegu modelu do zmian wewnątrz tygod-
niowych oraz miesięcznych.
3.1 Wyniki estymacji nieliniowej
Z powodu wysokiej liczby danych (2922) oraz ich zaszumienia, procent wytłumaczonej warian-
cji danych metodą estymacji nieliniowej jest stosunkowo niski. Najlepsze rezultaty uzyskano dla
modeli powstałych z danych zestandaryzowanych a także poddanych filtracji górnoprzepustowej,
odcinającej zmienności o okresowości większej niż 2 miesiące. Powstałe modele estymacji nielinio-
wej zostały porównane z danymi. Najlepsze dopasowanie do danych jest widoczne dla modelu
z danych zestandaryzowanych z funkcją straty w postaci:
L = |Obs - Pred| (1)
gdzie:
L  funkcja straty;
Obs  wartości rzeczywiste;
Pred  wartości przewidywane modelem estymacji.
Dobre dopasowanie do danych występuje też w modelach dla danych przefiltrowanych. W mo-
delach tych zastosowano kryterium najmniejszych kwadratów i algorytm Levenberga-Marquardta.
Wykonano model tygodnia oraz miesiąca dla każdego zestawu danych.
Pierwszymi wykonanymi modelami były modele tygodnia. Najlepsze rezultaty uzyskano dla
modeli wykorzystujących zestandaryzowane dane, funkcję straty podaną we wzorze (1), a także
zawierających procedurę quasi-Newtona. Tak przygotowany model dla danych pochodzących
301
Chuchro M.: Skuteczność metod predykcji natężenia dopływu ścieków do oczyszczalni
z oczyszczalni ścieków w Krakowie jest widoczny na rysunku 1. Nieznacznie gorsze wyniki uzys-
kano dla danych poddanych filtrowi górnoprzepustowemu, poddanych takiej samej procedurze jak
podana powyżej.
W wybranych modelach dla danych zestandaryzowanych i filtrowanych widoczne są minima
funkcji sinus przypadające w niedziele, środowe maksimum funkcji sinus. Dla modelu tygodnia
widoczny jest zbliżony przebieg modeli do przebiegu danych zestandaryzowanych. Okresy wyso-
kich wartości w danych pokrywają się z podobnym przebiegiem funkcji sinus. Minimum funkcji
sinus przypada między sobotą a niedzielą. Porównując model z danymi (rys. 1), można zauważyć
niższe wartości natężenia dopływu przypadające w niedziele.
Rysunek 1. Model tygodnia metodą estymacji nieliniowej
Figure 1. Week s model made by nonlinear estimation method
Modele miesiąca estymacji nieliniowej zostały przygotowane w sposób analogiczny jak modele
tygodnia. W tym przypadku modele powstałe z danych zestandaryzowanych osiągnęły najlepsze
rezultaty. Dopasowanie do danych modeli metodą najmniejszych kwadratów uzyskało takie same
rezultaty jak dopasowanie modeli z funkcją straty i z procedurą quasi-Newtona. W przypadku mo-
delu miesiąca (rys. 2) przebieg estymowanej funkcji sinus jest słabo zarysowany. Można zaobser-
wować, że ekstrema funkcji sinus pokrywają się z okresami w danych, o niższych lub wyższych
wartościach od średniego przebiegu.
Metoda ta pozwala na przybliżone określenie wartości parametru natężenia dopływu ścieków.
Lepsze rezultaty otrzymuje się dla okresów bezdeszczowych, niż okresów zmiennej pogody.
Rysunek 2. Model miesięcznego dopływu ścieków do o.ś. w Krakowie wykonany metodą estymacji nieliniowej
Figure 2. Monthly model of flow into WWTP in Cracow made by nonlinear estimation method
302
Krakowska Konferencja Młodych Uczonych 2009
3.2 Korelacja
Dla dokładnego określenia jakości modelu wykonano jego korelacje z danymi zestandaryzowa-
nymi (rys.3). Jako metodę wybrano korelację z ruchomym oknem gausowskim. Szerokość okien
korelacji (Gausowska sigma) wynosiła 5, 10, 30. Jak widać na wykresie korelacji (rys.3) występują
okresy z dobrą dodatnią korelacją, po których występują okresy bez korelacji lub z ujemną korela-
cją modelu z danymi. Prawdopodobnie zmiany w wielkości korelacji są spowodowane opadami.
Zwykle pogorszenie pogody wraz z opadami trwa od kilku do kilkunastu dni, po czym następuje
poprawa pogody. Najlepsze rezultaty estymacji nieliniowej osiągnięto przy pogodzie bezdeszczo-
wej; wartość korelacji gausowskiej była w tych okresach wyższa od 0,3 (dla Sigmy = 5)[9].
Rysunek 3. Korelacja z ruchomym oknem Gaussa
Figure 3. Correlation with moving Gaussian window
4. Sieci neuronowe
Drugą metodą analizy były sieci neuronowe. Sieciami neuronowymi nazywamy symulatory
modeli matematycznych realizujących pseudorównoległe przetwarzanie danych. Zasada działania
sieci odpowiada działaniu komórek neuronów. Zaletą tej metody jest ich tolerancja na nieciągłości,
przypadkowe zaburzenia, a także braki danych w zbiorach uczących. Dzięki temu sieci neuronowe
są dobrym narzędziem do analizy zaszumionych środowiskowych szeregów czasowych. Sieć skła-
da się przynajmniej z trzech warstw. Pierwsza warstwa wejściowa, przekazuje informacje do war-
stwy ukrytej. W warstwie ukrytej może znajdować się dowolna ilość neuronów ułożonych w war-
stwy. W warstwach pośrednich dane są przetwarzane, aby wypracować wyniki pośrednie, które
następnie są podstawą do wyznaczania ostatecznego wyniku na warstwę wyjściową-wynik [7].
4.1 Wyniki sieci neuronowych
Do analizy wybrano typy sieci uczonych z nauczycielem: MLP (percepton wielowarstwowy)
i RBF (radialna funkcja bazowa). Liczba warstw sieci i neuronów w poszczególnych warstwach
była ustalana automatycznie przez program. Obie wybrane sieci są jednokierunkowe oraz nie wy-
stępuje w nich sprzężenie zwrotne [7]. Sieci RBF prowadzą do wykrycia bardziej złożonych związ-
ków w danych, w tym celu wymagają jednak większej liczby warstw, przez co obliczenia są bar-
dziej czasochłonne [5].
W trakcie poszukiwania najlepszego modelu predykcji środowiskowych szeregów czasowych
wykonano kilkadziesiąt modeli sieci neuronowych dla każdej z analizowanych oczyszczalni ście-
303
Chuchro M.: Skuteczność metod predykcji natężenia dopływu ścieków do oczyszczalni
ków. Jakość pierwszych modeli udowodniła przewagę sieci MLP nad RBF dla analizowanych
danych. Sieci RBF, aby uzyskać jakość uczenia, testowania i walidacji, jakie osiągnęły sieci MLP,
potrzebowały dużo większej liczby neuronów pośrednich. Jakość testowania i walidacji wahała się
od 0,001 dla sieci RBF z kilkoma neuronami ukrytymi, do 0,6 dla sieci z kilkudziesięcioma neuro-
nami ukrytymi. Dla sieci MLP wyniki te wahały się w granicach od 0,2 do 0,6 jakości testowej
i walidacji. Liczba danych wejściowych  liczba wartości opóznionych była uzależniona od charak-
teru danych. Wykonano sieci dla 1, 7, 14, 21 i 28 liczby wartości opóznionych. Celem projektu
było wykonanie sieci przewidującej wartości natężenia dopływy na dobę i dwie doby w przód.
Większe wartości podane w horyzoncie czasowym obniżały jakość sieci oraz zwiększały czasochłon-
ność metody. W tabeli 1 widoczne są wybrane sieci neuronowe. Jak widać poniżej wybrane sieci
RBF osiągnęły podobne rezultaty jak sieci MLP, jednak odbyło się to kosztem większej ilości
neuronów ukrytych oraz czasochłonnością obliczeń. Dla porównania obliczenie jednej sieci MLP
podanej w tabeli zajęło kilkanaście sekund, natomiast sieci RBF około 10 minut. Wymienione po-
niżej sieci różnią się dodatkowo funkcją aktywacji neuronów ukrytych i wyjściowych, która jest
odpowiedzialna za transmisję neuronów z wcześniejszych neuronów. Jak widać w tabeli 1, w przy-
padku sieci RBF używana jest wyłącznie izotropowa gaussowska funkcja bazowa jako funkcja
aktywacji neuronów ukrytych. Większy wybór jest w przypadku stosowania sieci MLP, może być
tu użyta funkcja identycznościowa, logistyczna, tangens hiperboliczny (tanh), wykładnicza, sinus.
Zastosowano dwa różne algorytmy uczenia, algorytm BFGS (Broyden-Fletcher-Goldfarb-Shanno)
z liczbą epok równą 22 i 26 oraz algorytm RBFT. Dla wybranych sieci, zastosowano sumę kwadra-
tów (SOS) jako funkcję błędu.
Tabela 1. Wybrane sieci neuronowe
Table 1. Chosen neural networks
Jakość Aktywacja
Nazwa sieci algorytm uczenia
Uczenie Testowanie Walidacja Ukryte wyjściowe
MLP
0,591 0,664 0,585 Liniowa Logistyczna BFGS 22
14-2-1
RBF
0,597 0,615 0,594 Gaussa Liniowa RBFT
14-21-1
RBF
0,603 0,652 0,619 Gaussa Liniowa RBFT
21-21-1
MLP
0,638 0,670 0,629 Tanh Wykładnicza BFGS 26
7-4-1
Na rysunku 4 widoczne jest porównanie modelu predykcji wykonanego przy użyciu sieci neu-
ronowej z wielowarstwowym perceptonem, o siedmiu neuronach wejściowych, czterech neuronach
w warstwie pośredniej i jednym neuronie wyjściowym, z danymi natężenia dopływu ścieków dla
oczyszczalni ścieków w Warszawie. Jak widać na rysunku wybrana sieć neuronowa trafnie przewi-
duje kierunki zmian np. tendencje malejące lub rosnące. Dobre rezultaty predykcji osiągnięto dla
rzeczywistych danych o wartościach przeciętnych. Utworzona sieć słabo radzi sobie z predykcją
bardzo wysokich, a także niskich wartości występujących w krótkich okresach czasu (2 do 4 dni).
Utworzone sieci neuronowe nie radzą sobie z bardzo wysokimi odstającymi wartościami natężenia
dopływu i nie potrafią ich przewidywać.
304
Krakowska Konferencja Młodych Uczonych 2009
Rysunek 4. Wykres predykcji siecią neuronową MLP 7-4-1 natężenia dopływu dla oczyszczalni ścieków
w Warszawie
Figure 4. Graph of MLP 7-4-1 prediction of influent quantity for Wastewater Treatment Plant in Warsaw
5. Wnioski
Wybrane do analizy metody pozwalają na skuteczną predykcje zjawisk środowiskowych. Jeśli
potrzebne jest ogólne określenie kierunków zmian, a także przybliżone oznaczenie przyszłych
wartości, przydatna jest metoda estymacji nieliniowej. Metoda ta jest łatwa do zastosowania oraz
nie jest czasochłonna. Analiza wyników nie nastręcza problemów. Do stworzenia modelu wystar-
czy podstawowa wiedza o strukturze danych, która jest potrzebna do wybrania funkcji estymacji.
Niestety metoda ta jest mało skuteczna w przypadku silnego zaszumienia danych. Analizowane
w projekcie szeregi czasowe należały do danych silnie zaszumionych, dlatego też metoda estyma-
cji nieliniowej przyniosła mało dokładne rezultaty.
Sieci neuronowe jako narzędzia do predykcji zaszumionych szeregów czasowych, pozwoliły
uzyskać dokładne rezultaty. Pomimo długości szeregów, wykonanie modelu sieci neuronowej nie
sprawiało większych trudności. Najważniejszą kwestią przy budowie sieci neuronowej jest wybra-
nie odpowiedniej liczby wartości opóznionych, która jest uzależniona od charakteru danych. Dla
szeregów natężenia dopływu ścieków wybrano wartości 7, 14, 28 z powodu cykliczności występu-
jącej w danych. Jakość predykcji uzyskana dla prostych sieci neuronowych jest stosunkowo wysoka
i wynosi około 0,6. Dobrym rozwiązaniem dla środowiskowych szeregów czasowych o znacznej
długości jest zastosowanie sieci MLP, co skraca czas oczekiwania na rezultaty analiz, w stosunku
do zastosowania sieci RBF. Sieci RBF są tak samo skuteczne, jednak czas obliczeniowy jest kilka-
dziesiąt razy dłuższy niż w przypadku sieci MLP
Obie analizowane metody mają swoje plusy i minusy. Jeśli interesuje nas bardzo przybliżone
określenie przyszłych wartości szeregu czasowego, lepszym rozwiązaniem jest estymacja nielinio-
wa. Dodatkowo metoda ta będzie bardziej skuteczna dla danych mało zaszumionych, wtedy jakość
predykcji może być zadowalająca. Zaletą sieci neuronowych jest wysoka dokładność predykcji,
dzięki czemu są dobrym narzędziem analitycznym, wymagają jednak większej wiedzy o strukturze
danych i umiejętnościach analitycznych.
Praca była częściowo finansowana przez Akademię Górniczo-Hutniczą w ramach badań statutowych
Katedry Geoinformatyki i Informatyki Stosowanej nr 11.11.140.561
Praca była częściowo finansowana przez UE w ramach
Małopolskiego Funduszu Stypendialnego  DOCTUS
305
Chuchro M.: Skuteczność metod predykcji natężenia dopływu ścieków do oczyszczalni
Literatura
[1] Abraham B., Ledolter J., 2005, Statistical methods for forecasting, New Jersey, John Wiley and Sons,
Inc.
[2] Borovkova S., 1999, Estimation and prediction for nonlinear time series, Amsterdam, University of
Groningen.
[3] Box G. E. P., Jenkins G.M., 1983, Analiza szeregów czasowych: Prognozowanie i sterowanie, Warsza-
wa, Państwowe Wydawnictwo Naukowe.
[4] Koronacki J., Ćwik J., 2005, Statystyczne systemy uczące się, Warszawa, Wydawnictwa Naukowo-
-Techniczne.
[5] Kupczyk P., Stanek M., 2005, Predykcja danych w szeregach czasowych na przykładzie predykcji cen
akcji giełdowych spółki KGHM Polska Miedz S.A (prezentacja)
[6] Larose D.T., 2008, Metody i modele eksploatacji danych, Warszawa, Wydawnictwo Naukowe PWN.
[7] Tadeusiewicz R., 1993  Sieci neuronowe. Warszawa, Akademicka Oficyna Wydawnicza.
[8] Yaffee R.A., McGee M., 2000, Introduction to time series analysis and forecasting with applications
of SAS and SPSS, New York, Academic Press, Inc.
[9] Walanus A., 2000, Istotność statystyczna wniosków z analiz ilościowych na przykładzie badań górn-
ego czwartorzędu. Geologia, Kwartalnik AGH., vol. 26, No 4, pp. 1 59.
MONIKA CHUCHRO
Flow into Wastewater Treatment Plant Time Series Prediction Methods Effectiveness
Key word
environmental time series  sewage  wastewater treatment plant
Abstract
Prediction is one of the basics issues of environmental time series analysis. The best prediction method
selection is a complicated process and results depend on a collected data. Difference between predicted
and real values might be high. It is caused by the noise in data. Noise is a common phenomenon existing in
environmental time series data. Furthermore, time series could have trend, seasonality and periodicity, which
influenced on prediction quality. Complicated structure and noisy environmental time series data nature might
caused reduction of prediction quality. A high number of analysis versions and tests, connected with complete
knowledge about analyzed time series, helps in getting good prediction results. In this paper were used basic
time series prediction methods. What is more, quality of methods was tested. As exemplify was used influent
time series data into wastewater treatment plant.
306


Wyszukiwarka

Podobne podstrony:
Struktura szeregu czasowego natężenia dopływu ścieków do oczyszczalni
Ocena przydatności oczyszczonych ścieków do nawadniania
Zastosowanie metod plazmowych do oczyszczania gazu procesowego ze zgazowania biomasy
43 6 BWiS Urządzenia do oczyszczania wody i ścieków
96 ROZ warunki przy wprowadzaniu ścieków do wód lub do zi
mech gr05 doplyw wody do wykopu
odprowadzenie sciekow do odbiornika samooczyszczaniepoziomy hydrometryczne
J Kossecki, Ewolucja metod sterowania społecznego – od energetycznych do informacyjnych
18 urzadzenia do oczyszczania spalin
referat7 urzadzenia do oczyszczania powietrza
Ksiazka dla skutecznych szefow Znane i mniej znane drogi do sukcesu w kierowaniu ludzmi kielut
Komunikacja naprawde skuteczna Niezawodny sposob dotarcia do klientow pracownikow i znajomych dyresp
06 Podolski B i inni Awaria oraz sposob wzmocnienia zelbetowego, wielokomorowego zbiornika oczyszcza

więcej podobnych podstron