Dokumentacja techniczna
do projektu z NAI
Spis treści:
Opis problemu
Opis metody rozwiązywania
Wynik eksperymentu
Wnioski, podsumowanie
Bliższe wyjaśnienie:
Opis problemu:
Mamy dane opisujące środowisko leśne:
X - zmienna określająca położenie obszaru w poziome
Y - zmienna określająca położenie obszaru w pionie
Month - miesiąc dokonania pomiaru
Day - dzień dokonania pomiaru
FFMC - współczynnik biorący pod uwagę temperaturę, wilgotności względną, wiatr i ilość opadów
DMC - współczynnik biorący pod uwagę temperaturę, wilgotność względną oraz ilość opadów
DC - współczynnik biorący pod uwagę temperaturę oraz ilość opadów
ISI - współczynnik biorący pod uwagę wiatr
Temp - temperatura powietrza
RH - względna wilgotność
Wind - prędkość wiatru
Rain - opady
Area - odpowiedzialne za to czy pożar wybuchł czy nie.
Na podstawie danych mamy stworzyć system odpowiedzialny za przewidywanie prawdopodobieństwa wybuchu pożaru w lesie
Mamy 517 otczytów danych z czego 80% przeznaczamy ma uczenie sieci i 20% na testowanie
Opis metody rozwiązywania:
Dni tygodnia zostały zamienione na liczby przy sieci neuronowej.
Do analizy zastosowaliśmy system Weka
Do rozwiązania problemu użyliśmy dwóch klasyfikatorów: sieć neuronowa, oraz Klasyfikator Bayesa
Wynik eksperymentu:
Sieć neuronowa:
Architektura sieci
Typ neuronu: sigmoidalny
Metoda kodowania sygnałów wyjściowych (binarna)
Najkorzystniejszym współczynnikiem uczenia jest 0,3
Dla ustalonych początkowych wag oraz optymalnego współczynnika uczenia, sporządzić wykres opisujący zależność błędu sieci od liczby cykli uczenia (liczby epok).
Klasyfikować przykłady w zbiorze testowym. Zapisać jakość klasyfikacji.
Correlation coefficient 0.0534
Mean absolute error 0.4959
Root mean squared error 0.5167
Relative absolute error 99.1261 %
Root relative squared error 103.1033 %
Total Number of Instances 103;
Klasyfikator Bayesowski:
Wynik klasyfikacji z użyciem oryginalnego klasyfikatora Bayesa
Correctly Classified Instances 59 57.2816 %
Incorrectly Classified Instances 44 42.7184 %
Kappa statistic 0.1481
Mean absolute error 0.4598
Root mean squared error 0.535
Relative absolute error 91.915 %
Root relative squared error 106.7615 %
Total Number of Instances 103
Wynik klasyfikacji z użyciem modyfikowanego klasyfikatora Bayesa
Correctly Classified Instances 59 57.2816 %
Incorrectly Classified Instances 44 42.7184 %
Kappa statistic 0.1481
Mean absolute error 0.4598
Root mean squared error 0.535
Relative absolute error 91.915 %
Root relative squared error 106.7615 %
Total Number of Instances 103
W naszym przypadku obydwa klasyfikatory Bayesa zwracają taki sam wynik
Wnioski, podsumowanie:
Z danych otrzymanych z systemu weka widzimy że problem oszacowania prawdopodobieństwa wybuchu pożaru okazał się trudnym wyzwaniem dla dostępnych dla nas narzędzi sztucznej inteligencji. Zarówno sieć neuronowa jak i klasyfikator Bayesa dostarczają wyniki obarczone dość dużym błędem. Błąd jest na tyle duży że wyniki klasyfikacji można uznać bardziej za nieśmiałą sugestię niż pewnik.
Może być to spowodowane kilkoma czynnikami:
1.Dane są niepełne. Nie biorą pod uwagę wielu ważnych czynników jak np. ludzie. W końcu powodem wielu pożarów są właśnie ludzie. Niedogaszone ogniska, szklane butelki czy niedopałki papierosów stoją za dużą częścią, jeżeli nie większością pożarów leśnych. Pominięcie tego czynnika jest z całą pewnością dość sporym okaleczeniem dla naszego systemu.
2. Czynnik losowy. Pożary leśne pomimo mocnego związku z warunkami pogodowymi są jednak dość mocno losowe. Nie jest to zjawisko częste natomiast cechuje się dość sporą spontanicznością. Niekorzystne warunki pogodowe podnoszą prawdopodobieństwo wybuchu pożaru, natomiast jest ono dalej dość małe. Dlatego nie możemy wnioskować bezpośrednio z pogody czy pożar wybuchnie czy nie.
Oba wymienione czynniki sprawiają że problem pożarów leśnych jest dość trudnym zadaniem dla sztucznej inteligencji. Z całą pewnością komputery nie zastąpią w przyszłości systemów monitoringu stosowanych przez leśników.
2