1. Wstęp 13
Ponieważ do klasyfikacji trajektorii ruchu dłoni w językach migowych z powodzeniem używane są Ukryte Modele Markowa, nie ma konieczności dalszego badania tego zagadnienia. Do tej pory nie został jednak zaproponowany efektywny sposób klasyfikacji obrazów dłoni w celu rozpoznawania jej układu. Dlatego też autor skoncentrował działania badawcze na tym obszarze.
W celu osadzenia proponowanego tematu badań w kontekście rozwiązań znanych z literatury, autor przeanalizował systemy wizyjne wykorzystujące metody grafowe w podejściu syntaktyczno-strukturalnym. W grupie metod strukturalnych najczęściej spotykane jest rozpoznawanie układu dłoni na obrazie na podstawie elastycznego dopasowania grafów (ang. elastic graph-maching). Metoda ta polega na nakładaniu na obraz dłoni kolejno siatkowych (grafowych) modeli odpowiadających różnym jej układom. Jednocześnie obliczany jest „koszt” dopasowania węzłów siatki do punktów charakterystycznych znalezionych na obrazie. Dokładność rozpoznawania pozycji dłoni tą metodą jest wysoka, w porównaniu z innymi rozwiązaniami. Jej niepodważalną zaletę stanowi również niewrażliwość na złożone i ruchome tło. Niestety, opisany proces trwa bardzo długo, więc metoda ta nie może być zastosowania w efektywnych systemach rozpoznawania działających w czasie rzeczywistym. Wraz ze wzrostem liczby klas rozpoznawanych obiektów sytuacja się pogarsza - z punktu widzenia złożoności obliczeniowej etapu dopasowania wzorca (ang. pattem-matching) następuje eksplozja kombinatoryczna [Pap02]. Nie są znane natomiast publikacje dotyczące rozpoznawania układu dłoni metodami grafowymi w podejściu syn-taktycznym.
Celem pracy było skonstruowanie metody rozpoznawania układu dłoni (ang. hand posturę) na obrazie, opartej na modelu parsingu języków grafowych. Metodę przystosowano do obrazów układów dłoni Polskiego Języka Miganego (PJM), który jest podstawowym środkiem komunikacji osób głuchych i niedosłyszących z osobami spoza tego środowiska. Badana metoda klasyfikacji obrazów charakteryzuje się niższą złożonością obliczeniową i większą uniwersalnością od używanego dotychczas podejścia bazującego na reprezentacji grafowej dłoni w procesie rozpoznawaniu obrazów - dopasowania grafów (ang. graph-matching). Ta właściwość predestynuje ją do zastosowania w systemach wizyjnych w celu rozpoznawania układów dłoni w czasie rzeczywistym.
Rozpoznawanie układu dłoni w prezentowanej metodzie przebiega w następujących etapach.
1. Obraz wejściowy podlega wstępnemu przetwarzaniu, w wyniku którego wyznaczany jest zbiór punktów charakterystycznych obrazu.
2. Budowana jest grafowa reprezentacja obrazu dłoni, w postaci umożliwiającej zastosowanie efektywnego algorytmu analizy syntaktycznej.