Katedra Inżynierii Dźwięku
Laboratorium Przetwarzania Dźwięków I Obrazów
Ćwiczenie nr 8
Temat : Rozpoznawanie sygnałów przy pomocy sieci fuzzyneuronowych.
Wykonali: Data wykonania ćwiczenia:
Katarzyna Kubacka 18.XI.1998
Tomasz Kwidziński
Marek Chwojnicki
Podczas wykonywania ćwiczenia zapoznaliśmy się z programem SIROS służącym do obsługi karty Fuzzy Pattern Comparator. Karta ta jest szybkim komparatorem pozwalającym na porównanie ciągu wejściowego z zawartością ośmiu komórek pamięci. W naszym wypadku sygnałami wejściowymi były obrazy z monochromatycznej kamery przetworzone w 6-cio bitowym przetworniku A/C. Wynik był podawany szeregowo na wejście karty ( komparatora ). O rozpoznaniu obrazu decydowała zawartość akumulatora zawierającego ilość błędów porównania ciągu wejściowego z wzorcem zapisanym w pamięci.
W czasie wykonywania ćwiczenia zauważyliśmy, że pierwszy blok pamięci działał wadliwie - wskazanie prawdopodobieństwa wynosiło przez cały czas 100% i nie zmieniało się w procesie rozpoznawania, blokując jednocześnie prawidłowe działanie całego programu. W dalszej części ćwiczenia nie używaliśmy tej komórki, korzystając jedynie z komórek 2-5 ( zapamiętywaliśmy zawsze 4 obrazy ).
W laboratorium dokonaliśmy rozpoznawania obrazów w kilku konfiguracjach programu. Wyniki obserwacji przedstawione są w poniższych tabelach :
1.dla trybu rozpoznawania „maksymalne podobieństwo” oraz wartości startowych „0”. Wartość wyzwalania wynosiła : 344254. Dokonywaliśmy rozpoznania wszystkich 4 obrazów znajdujących się w pamięci.
Obraz |
Akumulator |
Prawdopodobieństwo [%] |
2 |
127809 |
67 |
3 |
25843 |
100 |
4 |
157962 |
58 |
5 |
37565 |
96 |
|
|
|
2 |
107922 |
73 |
3 |
46976 |
92 |
4 |
165651 |
55 |
5 |
22194 |
100 |
|
|
|
2 |
127037 |
67 |
3 |
156513 |
58 |
4 |
21756 |
100 |
5 |
165157 |
55 |
|
|
|
2 |
22605 |
100 |
3 |
137341 |
64 |
4 |
132744 |
65 |
5 |
116451 |
70 |
2. dla trybu „minimalne podobieństwo” oraz wartości startowych „0”. Wartość rozpoznawania wynosiła : 8712 .
Obraz |
Akumulator |
Prawdopodobieństwo [%] |
2 |
164590 |
100 |
3 |
124976 |
74 |
4 |
36631 |
17 |
5 |
13124 |
2 |
|
|
|
2 |
13818 |
3 |
3 |
127220 |
74 |
4 |
151761 |
90 |
5 |
166974 |
100 |
|
|
|
2 |
123123 |
94 |
3 |
15089 |
5 |
4 |
129704 |
100 |
5 |
125927 |
96 |
|
|
|
2 |
155022 |
100 |
3 |
132244 |
84 |
4 |
15151 |
4 |
5 |
29760 |
14 |
3. dla trybu „maksymalne podobieństwo” przy ustalonych niezerowych wartościach startowych, przy czym najpierw ustalana była wartość wyzwalania a potem wartości rejestrów startowych. Wartość wyzwalania : 175143.
Obraz |
Akumulator |
Start |
Prawdopodobieństwo [%] |
2 |
34106 |
10000 |
100 |
3 |
133218 |
3500 |
29 |
4 |
154428 |
7000 |
14 |
5 |
165534 |
5000 |
6 |
|
|
|
|
2 |
138632 |
10000 |
24 |
3 |
23464 |
3500 |
100 |
4 |
127842 |
7000 |
31 |
5 |
116464 |
5000 |
38 |
|
|
|
|
2 |
162056 |
10000 |
8 |
3 |
127200 |
3500 |
32 |
4 |
29194 |
7000 |
100 |
5 |
43462 |
5000 |
90 |
|
|
|
|
2 |
175142 |
10000 |
0 |
3 |
113512 |
3500 |
39 |
4 |
45552 |
7000 |
85 |
5 |
18340 |
5000 |
100 |
4. dla trybu „maksymalne podobieństwo” przy ustalonych wartościach startowych, przy czym najpierw ustalane były wartości rejestrów startowych, a potem wartość wyzwalania. Wartość wyzwalania : 183071
Obraz |
Akumulator |
Start |
Prawdopodobieństwo [%] |
2 |
22555 |
10000 |
100 |
3 |
138241 |
3500 |
27 |
4 |
157339 |
7000 |
16 |
5 |
168279 |
5000 |
9 |
|
|
|
|
2 |
136950 |
10000 |
28 |
3 |
22452 |
3500 |
100 |
4 |
131292 |
7000 |
32 |
5 |
121056 |
5000 |
38 |
|
|
|
|
2 |
159706 |
10000 |
14 |
3 |
124898 |
3500 |
35 |
4 |
19628 |
7000 |
100 |
5 |
34912 |
5000 |
90 |
|
|
|
|
2 |
169948 |
10000 |
7 |
3 |
111560 |
3500 |
42 |
4 |
35646 |
7000 |
88 |
5 |
16288 |
5000 |
100 |
Jak widać z tabel program nie miał większych problemów z rozpoznawaniem poszczególnych obrazów. Najbardziej podobne do siebie były obrazy 4 i 5. Właśnie w ich przypadku trzeba było dość dokładnie ustawiać obiekt przed obiektywem, gdyż już niewielka zmiana położenia ( np. obrót ) powodowała błędny wynik rozpoznawania. Nie wszystkie tryby rozpoznawania były w jednakowym stopniu wyczulone na ten błąd - przy ustalonych wartościach rejestrów startowych przekłamania nie występowały tak często, tzn. trzeba było większego odchylenia położenia aby wystąpiło złe rozpoznanie.
Tryb „minimalne podobieństwo” identyfikował obraz, który był najbardziej różny od prezentowanego, więc w tym przypadku także łatwo było poznać który z sygnałów zapisanych w pamięci jest aktualnie prezentowany - ten o najniższej stopie prawdopodobieństwa.
Po wykonaniu czynności przewidzianych w programie ćwiczenia wykonaliśmy eksperyment z rozpoznawaniem twarzy kilku biorących w ćwiczeniu udział osób. Generalnie wyniki były zadowalające, poza zastrzeżeniami dotyczącymi przede wszystkim dokładności powtarzania prezentowanych obrazów znacznie utrudnionej ze względu chociażby na mimikę danej osoby. Największe problemy wystąpiły przy rozróżnianiu osób o podobnym uczesaniu. Niewątpliwie jeszcze większym problemem byłaby kolorystyka odzieży, dlatego rozpoznawane osoby kadrowane były „od szyi w górę”. Krytycznym parametrem wpływającym na rozpoznawalność było umiejscowienie osoby w kadrze, co nie powinno zbytnio dziwić - program stosowany w ćwiczeniu nie był programem do rozpoznawania obiektów ( ich kształtów ) niezależnie od ich położenia lecz jedynie porównywał prezentowany obraz z wzorcem punkt po punkcie.
Katedra Inżynierii Dźwięku Wydział Elektroniki, Telekomunikacji i Informatyki PG
3