ENCJA - to każdy przedmiot, zjawiskom, stan iub pojęcie - każdy obiekt który potrafimy (chcemy) odróżnić od innych obiektów. Enęją jest zatem każdy stół, samochód itp.. Enęją jest niedźwiedź, jako element składowy życia na ziemi. Encja to każdy obiekt dający się zidentyfikować na podstawie swoich atrybutów.
ATRYBUT - cechy enęji które dają się wyrażać przez przydanie im pewnych wartości -są to cechy enęji wynikające z Ich natury, dające się wyrazić liczbami bądź prostymi określeniami słownymi. Stół ma np.: liczbę nóg, samochód - marka i pojemność silnika.
rekord - zbiór danych (w poszczególnych kolumnach) dotyczących jednego obiektu
1. skanowanie - proces konwersji danych od formatu stosowanego w tworzonej bazie danych . Może obejmować przeniesienie danych z nośnika papierowego do postaci elektronicznej. Należy wyróżnić 2 przypadki:
- seryjne skanowanie dokumentów o zunifikowanej strukturze (dane z biletów lotniczych)
- skanowanie dokumentów o niejednorodnym formacie
Proces OCR jest zawsze obciążony błędem w związku z tym trzeba się liczyć, z błędnie odczytanymi znakami ok. 3% OCR korzystają ze słowników dla podniesienia poprawności odczytu.
2. inrieksPwainło 1 i?cł‘ procesem opatrzenia dokumentu lub dodania do jego zawartości unifikalnego znaku, jest to klucz do relacji zawierających dane dokumenty
* - mapy bitowe np. TIFF
- - SQL indices - przez udostępnianie klucza do dokumentu
PREPARE
1. przygotowanie dokumentu - określanie typu dokumentów oraz pola indeksowania
2. przygotowanie dokumentów - przygotowanie fizyczne
3. określanie stref które będą poddawane analizie OCR
SCAN
1. wczytywanie danych
2. powtórne skanowanie
3. analiza zawartości odczytanych danych
| PRZETWARZANIE OBRAZÓW - image Processing
1. korekta kątowego usytuowania skanowanego obrazu
2. rozpoznawanie kodów paskowych - kody paskowe są standardowym sposobem oznaczania typów dokumentów przewidzianych do masowego (seryjnego) skanowania. Rozpoznanie kodu paskowego decyduje o
l sposobie przetwarzania skanowanego dokumentu. [ Dokumenty mogą