4. Poziom trzeci - stanowi głosowanie ważone na poziomie konkretnych grup cech (np. FO, LPC, PLP). Wyjściem modułu są klasy, których liczność jest równa liczbie grup cech wykorzystanych w badaniach.
5. Poziom czwarty - stanowi go głosowanie równoprawne na poziomie konkretnych fragmentów. Wyjściem modułu są klasy, których liczność jest równa liczbie fragmentów, na jakie została podzielona wypowiedź.
6. Poziom piąty - konkretna emocja jest badana pod kątem jej natężenia. Na podstawie autorskiego algorytmu porównującego badaną wypowiedź z modelem mowy neutralnej, określana jest jako emocja podstawowa, bądź dwie jej diady (najwyższa intensywność, najniższa intensywność). Krok ten kończy działanie algorytmu.
Profile emocjonalne
Aby lepiej zobrazować zagadnienie niejednoznaczności emocji autorka postanowiła skorzystać z definicji profili emocjonalnych w celu przedstawienia zawartości danych stanów w wypowiedzi. Według [10] profil emocjonalny jest to są wektor wyrażający stopień obecności lub nieobecności emocji podstawowych w danej wypowiedzi. Można w ten sposób uniknąć sztywnej klasyfikacji (ang. hard labeling), zastępując ją etykietowaniem wielokrotnym (ang. multiple labeling). Tego typu klasyfikacja może wskazywać na zawartość kilku stanów emocjonalnych w danej wypowiedzi, ich mieszaninę czy też ewolucję emocjonalną wypowiedzi. Możliwe jest również zastosowanie etykietowania rozmytego, w którym dodatkowo określa się funkcję przynależności do każdego ze stanów.
Algorytm podstawowy PAKEmo stanowi szereg klasyfikatorów tego samego poziomu, uwzględniających rozkład grup deskryptorów mowy. Poszerzenie tego modułu o kolejny, dokonujący segmentacji mowy, tworzy hierarchiczną strukturę klasyfikatorów k-NN, a na podstawie ich odpowiedzi dokonuje się głosowania. Zastąpienie głosowania analizą odpowiedzi pozawala na stworzenie profilu emocjonalnego poszczególnych próbek mowy. Poprzez zliczane kolejnych wyników dla danej emocji budowany jest histogram, przedstawiający zawartość danych stanów w konkretnej wypowiedzi. Podejście to nie zastępuje klasyfikacji, a jest jedynie jej rozszerzeniem, i w szczególności ma zadanie zobrazowanie wypowiedzi niejednoznacznie określonych.
Głównym założeniem prezentowanych badań było stworzenie systemu pozwalającego na automatyczne rozpoznawanie stanów emocjonalnych na podstawie mowy naturalnej. W tym celu stworzono polską bazę emocji spontanicznych, na którą składa się ponad siedemset próbek, podzielonych na siedem podzbiorów reprezentujących stany podstawowe. Ponadto w celach
18