Grupa cech |
Opis cechy |
Minimalna wartość współczynników RASTA PLP (1-13) |
4.3. Klasyfikacja hierarchiczna
Ostatni krok zadania rozpoznawania wzorców stanowi proces klasyfikacji. W procesie tym określa się przynależność nieznanego obiektu, opisanego za pomocą wektora atrybutów, do jednej ze zdefiniowanych wcześniej klas. Mimo, iż metody klasyfikacji to raczej standardowe narzędzia automatycznego rozpoznawania, obejmujące szereg podejść (systemy ekspertowe, drzewa decyzyjne, logika rozmyta, sieci neuronowe i inne) [11], to niejednokrotnie zdarza się, że narzędzia te nie dają oczekiwanych rezultatów. Klasyfikacja emocji na podstawie mowy, a w szczególności mowy spontanicznej, jest zadaniem trudnym, zależnym od wielu czynników, i mimo szeroko eksploatowanych badań, wciąż natrafia na poważne przeszkody. Dlatego też poszukuje się nowych rozwiązań, poprzez tworzenie innowacyjnych algorytmów bądź klasyfikatorów hybrydowych, bazujących na współdziałaniu istniejących rozwiązań.
Jednym z obiecujących podejść w uczeniu maszynowym wydaje się być stosowanie komitetów klasyfikujących (ang. Ensemble, Committee, Multiple Classifier Systems - MCS), bazujących na zasadzie dziel i zwyciężaj. W tym celu dokonuje się dekompozycji złożonego problemu na kilka mniej złożonych [12]. Tworzone w ten sposób rozwiązanie składa się z wielu prostych (łatwych do zbudowania) modeli (węzłów) o relatywnie niskiej skuteczności, a ich końcowe wyniki są łączone (np. metodą głosowania, przypisując obiekt do klasy, na którą głosuje najwięcej spośród klasyfikatorów bazowych).
Biorąc pod uwagę wysokie rezultaty rozpoznawania emocji na podstawie mowy w powyższych pracach oraz niejednoznaczność stanów oraz rozmycie granic między nimi w mowie spontanicznej, niniejsze badania stanowią próbę opracowania skutecznego klasyfikatora hierarchicznego. Proces jego tworzenia rozpoczyna się od Podstawowego Algorytmu Rozpoznawania Emocji PAKEmo, opartego na horyzontalnym podziale problemu na podproblemy względem wektora cech. Następnie algorytm rozbudowywany był poprzez dodawanie kolejnych węzłów, mających za zadanie zwiększyć wydajność systemu. Ostateczny algorytm stanowi wielopoziomowy, hierarchiczny klasyfikator, który na kolejnych poziomach zawiera takie elementy jak: rozpoznawanie płci, budowa profili emocjonalnych, zależność emocji od długości wypowiedzi oraz badanie natężenia emocji. Wszystkie wyżej wymienione podproblemy zostały kolejno przedstawione w poniższych podrozdziałach.
13