UMOWA LICENCYJNADLA UŻYTKOWNIKA KOŃCOWEGO (EULA)
WAŻNE-PRZECZYTAJ UWAŻNIE: Niniejsza umowa licencyjna dla użytkownika końcowego jest umową prawną (zwaną dalej Umową) zawartą
pomiędzy Tobą a firmą ABBYY Software House (zwaną dalej ABBYY), posiadaczem praw autorskich do oprogramowania (zwanego dalej
Oprogramowaniem) dostarczonym wraz z tą umową i obejmuje również nośniki, materiały drukowane oraz dokumentację elektroniczną lub w
wersji on-line. Instalując, kopiując lub w inny sposób używając Oprogramowanie zgadzasz się być objętym warunkami Umowy. Jeśli nie zgadzasz
się na warunki Umowy nie instaluj i nie używaj Oprogramowania.
LICENCJA NA OPROGRAMOWANIE
To Oprogramowanie jest chronione przez prawo autorskie i międzynarodowe traktaty dotyczące prawa autorskiego, jak również przez inne prawa
i traktaty chroniące własność intelektualną. To Oprogramowanie jest Ci licencjonowane, a nie sprzedane.
1. UDZIELENIE LICENCJI
Umowa daje Ci następujące prawa:
1.1. Aplikacja
Możesz zainstalować i używać łącznie jedną kopię Oprogramowania. Oprogramowanie może być zainstalowane tylko na jednym komputerze.
1.2. Komputer przenośny
Jeśli zakupiłeś Oprogramowanie i jesteś pierwszym użytkownikiem możesz skopiować to Oprogramowanie na komputer przenośny pod warunkiem,
że licencja nie jest powielana, współdzielona lub używana równolegle.
1.3. Pakiet wielolicencyjny
Możesz również przechowywać lub instalować kopię Oprogramowania na urządzeniu przechowującym dane takim jak serwer sieciowy,
używanym wyłącznie do zainstalowania lub uruchomienia Oprogramowania lub na innych komputerach w wewnętrznej sieci; w tym jednak przypadku
musisz otrzymać i przeznaczyć po jednej licencji na każdy oddzielny komputer, na którym Oprogramowanie jest zainstalowane lub
uruchamiane z urządzenia przechowującego dane. Licencja na Oprogramowanie nie może być współdzielona lub używana równolegle na
różnych komputerach.
1.4. Kopie archiwizacyjne
Masz prawo wykonać pojedynczą kopię Oprogramowania w celach archiwizacyjnych na wypadek zgubienia lub uszkodzenia oryginalnego
Oprogramowania. Kopia archiwizacyjna nie może być używana w jakimkolwiek innym celu.
2. Prawa autorskie
Wszystkie tytuły i prawa autorskie w stosunku do Oprogramowania (wliczając w to jakiekolwiek obrazy graficzne, fotografie, animacje, wideo,
ścieżki dźwiękowe, muzykę, tekst, aplety włączone do Oprogramowania), załączonych materiałów drukowanych i jakichkolwiek kopii
Oprogramowania są w posiadaniu ABBYY lub jej dostawców. Oprogramowanie jest chronione przez prawa autorskie i międzynarodowe traktaty.
Dlatego też musisz traktować Oprogramowanie jak jakikolwiek inny obiekt objęty ochroną praw autorskich z wyjątkiem faktu iż możesz zainstalować
Oprogramowanie na pojedynczym komputerze zakładając, że zachowujesz oryginał tylko i wyłącznie w celach archiwizacyjnych. Nie
możesz kopiować materiałów drukowanych towarzyszących Oprogramowaniu.
3. Opis innych praw i ograniczeń
3.1. "Reverse Engineering", dekompilacja, deasemblacja
Nie możesz dokonywać deasemblacji, dekompilacji (otrzymywanie kodów źródłowych z kodu wynikowego) Oprogramowania (aplikacji, baz
danych i innych komponentów Oprogramowania), za wyjątkiem i tylko w sytuacji kiedy taka działalność jest jawnie dozwolone przez prawo pomimo
tego ograniczenia.
3.2. Kod wynikowy
Nie możesz wykonywać zmian w kodzie wynikowym aplikacji i bazach danych innych niż udostępniane przez Oprogramowanie i opisane w
Umowie.
3.2. Separacja komponentów
Oprogramowanie jest licencjonowane jako pojedynczy produkt. Jego części składowe nie mogą być oddzielane i używane na więcej niż jednym
komputerze.
3.3. Redystrybucja Oprogramowania
Jakakolwiek redystrybucja Oprogramowania jest ściśle zakazana. Słowo "Redystrybucja" obejmuje między innymi udzielanie praw lub dostępu
osobom trzecim (wliczając dostęp przez sieć i inne metody dostępu), jak również sprzedaż, wynajmowanie, dzierżawę, leasing lub pożyczanie
Oprogramowania.
3.4. Przekazanie praw
Nie możesz nikomu przekazać praw autorskich do Oprogramowania i jakichkolwiek innych praw z nim związanych.
4. Usługi wsparcia
ABBYY może udostępnić Ci usługi wsparcia technicznego związanego z Oprogramowaniem (zwane dalej "Usługami wsparcia"). Wykorzystanie
Usług wsparcia jest uwarunkowane polityką i programami ABBYY opisanymi w podręczniku użytkownika, dokumentacji on-line i/lub innymi materia
łami dostarczonymi przez ABBYY. Jakikolwiek dodatkowy kod programu dostarczany Ci jako fragment Usług wsparcia musi być uważany za
część Oprogramowania ze wszelkimi tego implikacjami wynikającymi z Umowy. Jeśli chodzi o informacje techniczne, jakie dostarczysz ABBYY w
trakcie Usług wsparcia, ABBYY może użyć tych informacji dla własnych celów biznesowych, wliczając w to wsparcie techniczne i tworzenie systemów
komputerowych. ABBYY nie użyje takich informacji technicznych w formie, która pozwoliłaby Cię zidentyfikować.
5. Oprogramowanie Nie do sprzedaży.
Jeśli Oprogramowanie posiada etykietę "Not for Resale" lub "NFR," to obowiązują wszystkie inne regulacje Umowy i dodatkowo nie możesz
odsprzedawać lub w inny sposób przekazywać odpłatnie Oprogramowania.
6. Uaktualnienia
Jeśli Oprogramowanie jest oznaczone jako Upgrade (Uaktualnienie), musisz posiadać ważną licencję na produkt identyfikowany przez ABBYY
jako uprawniający do uaktualnienia i używania Oprogramowania (taki produkt jest dalej nazywany "Bazą uaktualnienia"). Oprogramowanie oznaczone
jako Upgrade zastępuje i/lub uzupełnia Bazę uaktualnienia. Możesz używać Oprogramowania tylko i wyłącznie zgodnie z warunkami
Umowy. Jeśli Bazą uaktualnienia jest komponent pakietu licencjonowanego Ci w całości Oprogramowanie może być używane i transferowane
tylko jako fragment tego pojedynczego produktu i nie może być rozdzielane w celu używania na więcej niż na jednym komputerze.
7. Oprogramowanie na wielu nośnikach
Możesz otrzymać Oprogramowanie na więcej niż na jednym nośniku. Bez względu na typ lub rozmiar nośnika jaki otrzymujesz możesz użyć tylko
jednego nośnika odpowiedniego dla pojedynczego komputera. Nie możesz używać lub instalować innego nośnika na innym komputerze. Nie
możesz wypożyczać, wynajmować, dzierżawić, leasingować lub w inny sposób transferować Oprogramowania na drugim nośniku jakiejkolwiek
osobie trzeciej.
8. Wypowiedzenie
Bez uszczerbku jakichkolwiek innych praw, ABBYY może wypowiedzieć tę Umowę jeśli nie spełnisz jej warunków. W takim przypadku musisz
zniszczyć wszystkie kopie Oprogramowania i jego komponentów.
9. Prawa lokalne
Ta Umowa podlega prawu państwa w którym zakupiono Oprogramowanie.
10. Ograniczona gwarancja
ABBYY gwarantuje, że (a) Oprogramowanie będzie funkcjonować zasadniczo zgodnie z towarzyszącymi mu materiałami drukowanymi przez
okres dziewięćdziesięciu (90) dni od daty otrzymania, i (b) jakiekolwiek Usługi wsparcia dostarczane przez ABBYY są zasadniczo opisane w
odpowiednich materiałach drukowanych dostarczonych Ci przez ABBYY, a inżynierowie wsparcia technicznego ABBYY podejmą ekonomicznie
uzasadnione wysiłki by rozwiązać jakiekolwiek problemy w Oprogramowaniu. Niektóre państwa i stany prawne w nich istniejące nie zezwalają na
ograniczenie czasu trwania domyślnej gwarancji, więc powyższe ograniczenia mogą Cię nie dotyczyć. W maksymalny sposób dopuszczony
przez odpowiednie prawa, domyślna gwarancja na Oprogramowanie jest ograniczona do nie więcej niż dziewięćdziesięciu (90) dni.
11. Naprawa szkód klienta
Całkowita odpowiedzialność ABBYY's i jej dostawców do naprawy szkód jest ograniczona do wg uznania ABBYY albo (a) zwrotu ceny zakupu
poniesionej rzeczywiście przez klienta, lub (b) zamiany Oprogramowania nie spełniającego Ograniczonej Gwarancji i które zwrócono do ABBYY z
kopią rachunku. Ograniczona gwarancja jest nieważna jeśli awaria Oprogramowania jest rezultatem zdarzeń losowych, wypadku, nadużycia, lub
złego stosowania. Jakiekolwiek zamienione Oprogramowanie będzie objęte gwarancja przez resztę dni oryginalnej gwarancji lub przez trzydzieści
(30) dni - którekolwiek będzie dłuższe. Poza USA ani te środki naprawcze ani jakiekolwiek usługi wsparcia produktu nie są dostępne bez
dowodu zakupu Oprogramowania od oficjalnego kanału dystrybucyjnego dla danego kraju.
12. Brak innych gwarancji
W maksymalny sposób dopuszczalny przez prawo ABBYY i jej dostawcy wyrzekają się wszelkich innych gwarancji i warunków, explicite lub
implicite, wliczając w to (ale nie ograniczając się do), domyślnej gwarancji, przydatności do określonych celów, itd. Ta ograniczona gwarancja
daje Ci tylko te prawa, które jawnie wymieniono w niniejszej umowie
13. Ograniczenie odpowiedzialności
W maksymalny sposób dopuszczalny przez prawo w żadnym wypadku ani ABBYY ani jej dostawcy i jej dystrybutorzy nie są odpowiedzialni za
jakiekolwiek specjalne, przypadkowe, pośrednie lub bezpośrednie uszkodzenia (wliczając w to, ale nie ograniczając się jedynie do: utraty
spodziewanego przychodu, przerw w pracy, utraty informacji, lub jakiejkolwiek straty finansowej) powstałej wskutek użycia lub niemożności
użycia Oprogramowania lub świadczenia bądź niemożności świadczenia Usług wsparcia, nawet jeśli ABBYY została ostrzeżona o możliwości
wystąpienia takich szkód. We wszystkich tych i innych przypadkach całkowita odpowiedzialność ABBYY lub jej dystrybutorów z uwzględnieniem
wszelkich regulacji Umowy jest ograniczona tylko i wyłącznie do większej z dwóch wartości: kosztów rzeczywiście poniesionych przez Ciebie na
zakup Oprogramowania lub 5.00 USD; zakładając jednakże, że jeśli podpisałeś umowę o świadczeniu dodatkowych usług serwisowych, całkowita
odpowiedzialność ABBYY's odnośnie Usług wsparcia jest określona w tamtej umowie. Jako, że niektóre państwa i stany prawne nie pozwalają
na wyłączenie lub ograniczenie odpowiedzialności, powyższe ograniczenia mogą nie odnosić się do Ciebie.
14. Brak gwarancji
Jeśli pobrałeś Oprogramowanie poprzez Internet dotyczy Cię następujące wyłączenie gwarancji:
ABBYY wyrzeka się wszelkiej gwarancji za Oprogramowanie. Oprogramowanie i związana z nim dokumentacja dostarczona jest w formie "jak
jest" bez jakiejkolwiek gwarancji czy to explicite czy to implicite, bez gwarancji domyślnej, gwarancji przydatności do określonych celów itd.
Całkowite ryzyko związane z użyciem lub zachowaniem się Oprogramowania leży tylko i wyłącznie po Twojej stronie.
System rozpoznawania pisma
ABBYY FineReader
Wersja 5.0
Podręcznik użytkownika
© 2001 ABBYY Software House
Informacje w tym dokumencie mogą się zmienić bez uprzedzenia i nie niosą żadnych zobowiązań po stronie
ABBYY Software House.
Oprogramowanie opisane w tym dokumencie jest dostarczane pod rygorem umowy licencyjnej.
Oprogramowanie może być używane lub kopiowane tylko i wyłączne w ścisłej zgodności z postanowieniami
umowy. Kopiowanie programu na jakikolwiek nośnik za wyjątkiem sytuacji bezpośrednio opisanych w
umowie licencyjnej jest złamaniem ustawy "O prawnej ochronie oprogramowania i baz danych" Federacji
Rosyjskiej oraz międzynarodowych praw.
Żaden fragment tego dokumentu nie może być reprodukowany, transmitowany w jakiejkolwiek formie,
jakimikolwiek środkami elektronicznymi lub innymi dla jakichkolwiek celów bez pisemnej zgody ABBYY
Software House.
© ABBYY Software House, 1993-2001. Wszystkie prawa zastrzeżone. ABBYY, BIT Software, "fontain image
transformation", Lingvo, Scan&Read, Scan&Translate, "one-button principle", "Your computer reads by itself"
są zastrzeżonymi znakami handlowymi ABBYY, Try&Buy, DOCFLOW są znakami towarowymi ABBYY
Software House.
Adobe®, Adobe Logo, Adobe PDF (Portable Document Format) i Adobe Acrobat® są zarejestrowanymi
znakami handlowymi Adobe Systems Incorporated.
Wszystkie znaki handlowe są znakami handlowymi lub zarejestrowanymi znakami handlowymi ich prawnych
właścicieli. 123015 Moscow, P.O. 72. ABBYY.
Spis treści
Witamy! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9
Instalowanie i uruchamianie ABBYY FineReader'a . . . . . . . . . .11
Wymagania programowe i sprzętowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Instalowanie FineReader'a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Instalacja na serwerze sieciowym lub stacji roboczej . . . . . . . . . . . . . . . . . . . . . 14
Uruchamianie FineReader'a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Szybki start: ogólnie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17
Jak wprowadzić dokument w minutę . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Główne okno ABBYY FineReader'a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Paski narzędziowe w ABBYY FineReader . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Podstawowe cechy FineReader'a . . . . . . . . . . . . . . . . . . . . . . .25
Co to jest system OCR? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Nowe możliwości ABBYY FineReader'a 5.0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Formaty plików tekstowych obsługiwanych przez FineReader'a . . . . . . . . . . . . . 28
Obsługiwane formaty plików graficznych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Pobieranie obrazu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31
Skanowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Ustawianie parametrów skanowania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Wskazówki na temat ustawiania jasności. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Skanowanie dokumentów wielostronnicowych . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Skanowanie podwójnych stron. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Otwieranie obrazów. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Praca z obrazem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Numeracja stron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Opcje obrazu w wiązce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Spis treści
5
Analiza układu strony . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43
Ogólne informacje o analizie układu strony . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Typy bloków . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Opcje automatycznej analizy układu strony . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Ręczne rysowanie i edycja bloków . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Ręczna analiza tabelki. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Używanie szablonów bloków . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Rozpoznawanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .53
Ogólne informacje o rozpoznawaniu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Rozpoznawany język. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Typ druku . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Inne opcje rozpoznawania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Rozpoznawanie w tle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Rozproszone, sieciowe przetwarzanie dokumentów. . . . . . . . . . . . . . . . . . . . . . 58
Rozpoznawanie z douczaniem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Jak douczyć wzorzec liter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Jak edytować wzorzec liter użytkownika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Języki użytkownika i grupy języków . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Jak stworzyć nowy język . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Jak stworzyć nową grupę języków . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Sprawdzanie i edycja tekstu . . . . . . . . . . . . . . . . . . . . . . . . . . .67
Sprawdzanie pisowni w ABBYY FineReader . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Opcje sprawdzania i edycji tekstu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Dodawanie i usuwanie słów ze słownika użytkownika . . . . . . . . . . . . . . . . . . . . 70
Edycja tekstu ABBYY FineReader . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Edycja tabelek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Eksport do zewnętrznych aplikacji i formatów . . . . . . . . . . . . .77
Ogólne informacje o eksporcie rozpoznanego tekstu . . . . . . . . . . . . . . . . . . . . . 78
Opcje eksportu tekstu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
ABBYY FineReader 5.0 Podręcznik użytkownika
6
Eksport rozpoznanego tekstu w formacie RTF i DOC. . . . . . . . . . . . . . . . . . . . . 80
Eksport rozpoznanego tekstu do formatu PDF. . . . . . . . . . . . . . . . . . . . . . . . . . 80
Eksport rozpoznanego tekstu w formacie HTML . . . . . . . . . . . . . . . . . . . . . . . . 82
Zapisywanie obrazu strony . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
Praca z wiązkami . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .85
Ogólne informacje o pracy z wiązkami. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Tworzenie nowej wiązki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Otwieranie wiązki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Dodawanie stron do wiązki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Numer strony wiązki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Zamykanie wiązki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Usuwanie wiązki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Spis treści
7
ABBYY FineReader 5.0 Podręcznik użytkownika
8
Witamy!
Dziękujemy Ci za wybór ABBYY FineReader'a!
Wszyscy potrzebujemy wprowadzić tekst do komputera. Mogą to być artykuły
z czasopism lub magazynów, umowy, listy formalne, faxy, cenniki, kwestionariusze
itp. 90% tych dokumentów jest w postaci wydruku na papierze.
Przez lata jedynym sposobem wprowadzenia drukowanego dokumentu do
komputera było przepisywanie go przy użyciu klawiatury. Pamiętasz długie
godziny spędzane przy przepisywaniu tekstu z dokumentu? Jak wspaniałą
rzeczą byłoby, gdyby komputer czytał tekst, prosto z kartki papieru!
Czasem marzenia się spełniają. FineReader OCR (System rozpoznawania
pisma) potrafi czytać wydrukowany tekst przy pomocy skanera i komputera.
Ale czy sam skaner wykonuje tą czynność?
Nie. Skaner wykonuje tylko obraz, zdjęcie tekstu. Zdjęcie to zbiór białych i
czarnych punktów, innymi słowy jest to plik graficzny , który nie może być
edytowany w edytorach tekstu np. MS Word, WordPerfect, Word Pro, itd.
Potrzebny jest Ci system OCR, który będzie szukał symboli w zbiorze białych
i czarnych kropek, "rozpoznawał" litery w każdym symbolu i zmieniał obraz
w tekst możliwy do edycji w komputerze. Taka aplikacja tworzy plik, z
którym edytory tekstu i inne systemy współpracują bez problemu.
Tak więc teraz mogę automatycznie wprowadzić mój dokument do komputera?
Tak, teraz możesz automatycznie wprowadzić Twój dokument do komputera
bez przepisywania przy użyciu klawiatury.
Baw się dobrze!
ABBYY FineReader 5.0 Podręcznik użytkownika
10
Podręcznik użytkownika
Ten podręcznik użytkownika wprowadza Cię w podstawy używania programu
ABBYY FineReader. Każdy rozdział zaczyna się od krótkiego opisu i spisu
zawartości.
System Pomocy on-line
System Pomocy zawiera podstawowe i zaawansowane informacje o możliwościach
programu, ustawieniach i okienkach dialogowych. System pomocy
dostępny jest w formacie HTML i został zaprojektowany, by umożliwić szybkie
wyszukiwanie informacji.
Plik Readme
Plik Readme zawiera ważne informacje z ostatniej chwili
Instalowanie i uruchamianie
ABBYY FineReader'a
Rozdział niniejszy opisuje procedurę instalacji oraz podaje związane z tym
informacje: wymagania systemowe, instalacja sieciowa itd.
Instalacji FineReader'a dokonuje specjalny program instalacyjny umieszczony
na zakupionych przez Ciebie nośnikach. Do instalacji używaj wyłącznie tych
nośników, jakie dostarczono Ci z programem. Program instalacyjny jest
bowiem tak skonstruowany, że nie będzie możliwe zainstalowanie programu
ze skopiowanej dyskietki lub CD-ROM'u.
Zawartość rozdziału:
Wymagania programowe i sprzętowe
Instalowanie ABBYY FineReader'a
Instalacja na serwerze sieciowym i na stacji roboczej
Uruchamianie ABBYY FineReader'a
ABBYY FineReader 5.0 Podręcznik użytkownika
12
Wymagania programowe i sprzętowe
Aby pracować z FineReaderem musisz mieć:
1. komputer PC z procesorem Intel® Pentium® 133 MHz lub szybszym
2. Microsoft® Windows® 2000, Windows® NT® Workstation 4.0 z Service
Pack 3 lub nowszym, Windows® 95 lub Windows® 98
3. 32 Mb RAM, plus 16 Mb RAM na każdy dodatkowy procesor (dotyczy
komputerów wieloprocesorowych)
4. Microsoft® Internet Explorer 3.02 lub nowszy (Microsoft® Internet
Explorer 5.01 jest dołączony do programu)
5. 40 Mb wolnej przestrzeni dyskowej do minimalnej wersji
6. 50 Mb wolnej przestrzeni dyskowej do pracy programu
7. skaner w 100% kompatybilny z TWAIN, kamera cyfrowa lub fax-modem
8. napęd CD-ROM
9. stacja dyskietek 3.5"
10. Myszka lub inne urządzenie wskazujące
11. VGA lub inny monitor o wysokiej rozdzielczości
Instalowanie FineReader'a
Opcje instalacji
Po tym jak program instalacyjny sprawdzi system, wpisz Twoje imię i
nazwisko oraz wskaż do której kartoteki chcesz zainstalować FineReader'a.
Następnie program instalacyjny wyświetli kilka opcji instalacji. Wybierz jedną
z nich klikając w odpowiednią ikonkę.
Pełna - zainstalowane zostaną wszystkie komponenty - łącznie z wszystkimi
rozpoznawanymi językami.
Minimalna (zalecana) - aplikacja zostanie zainstalowana w minimalnej konfiguracji:
jeden język interfejsu użytkownika wybrany podczas instalacji oraz
dwa rozpoznawane języki: angielski i jeden dodatkowy wskazany podczas
instalacji.
Instalacja użytkownika - możesz wskazać dowolną ilość komponentów do
zainstalowania.
Uwaga: Jeśli chcesz używać słowników i wzorców liter z poprzednich wersji
FineReader'a - nie usuwaj poprzedniej wersji przed instalacją nowej. Po zainstalowaniu
nowej wersji stare wzorce liter i słowniki staną się w niej
widoczne.
Zalecamy, by przed uruchomieniem programu instalacyjnego zamknąć wszystkie
inne aplikacje (tj. Microsoft Outlook, Microsoft Word itp.).
Instalowanie FineReader'a
Jeśli w pakiecie dystrybucyjnym znajduje się zarówno CD-ROM jak i
dyskietka:
1. Włóż dyskietkę do stacji dysków.
2. Włóż CD-ROM do napędu CD.
3. Kliknij w Start na pasku zadań i wybierz Ustawienia/Panel Sterowania
(Settings/Control Panel).
4. Uruchom opcję Dodaj/Usuń programy (Add/Remove Programs).
5. Wybierz zakładkę Instaluj/Odinstaluj i kliknij w przycisk Instaluj
(Install).
6. Postępuj dalej zgodnie z pojawiającymi się instrukcjami.
Uwaga: Kroki 3-5 mają taki sam skutek jak uruchomienie programu
install.exe z dostarczonej dyskietki startowej.
Jeśli w pakiecie dystrybucyjnym jest tylko CD-ROM:
1. Włóż CD-ROM do napędu CD.
2. Kliknij w Start na pasku zadań i wybierz Ustawienia/Panel Sterowania
(Settings/Control Panel).
3. Uruchom opcję Dodaj/Usuń programy (Add/Remove Programs).
4. Wybierz zakładkę Instaluj/Odinstaluj i kliknij w przycisk Instaluj
(Install).
5. Postępuj dalej zgodnie z pojawiającymi się instrukcjami.
Uwaga: Kroki 2-4 mają taki sam efekt jak uruchomienie programu install.exe
z dostarczonego dysku CD.
Instalowanie i uruchamianie ABBYY FineReader'a
13
Instalacja na serwerze sieciowym lub stacji
roboczej
Instalacja na serwerze sieciowym (tylko dla administratorów systemu)
Instalacja FineReader'a 5.0 Advanced Office na serwerze sieciowym może
zostać przeprowadzona jedynie przez administratora. Aby to zrobić:
Jeśli w pakiecie dystrybucyjnym znajduje się zarówno CD-ROM jak i
dyskietka, uruchom Install.exe z kartoteki \Server na dyskietce startowej.
Jeśli w pakiecie dystrybucyjnym znajduje się jedynie CD-ROM, uruchom
Install.exe z kartoteki \Server umieszczonej na dysku CD.
Dodatkowe licencje
Jeśli FineReader jest używany przez więcej niż jednego użytkownika, na
koniec instalacji na serwerze sieciowym konieczne jest dodanie numerów
seryjnych. Aby to zrobić:
1. Uruchom LicSetup.exe z kartoteki do której zainstalowano FineReader 5.0
Advanced Office. Pojawi się okienko dodawania licencji.
2. Wprowadź numer seryjny i kliknij w przycisk Dodaj (Add)
Uwaga:
1. Nie możesz używać dysków logicznych stworzonych poleceniem SUBST.
2. Jeśli instalujesz FineReader na serwerze ze stacji Windows 95 wprowadź
pełną ścieżkę do serwera i nie używaj zmapowanych dysków sieciowych.
3. Podczas instalacji na serwerze sieciowym nie są instalowane takie komponenty
jak MS Windows NT 4.0 Service Pack 3.0 lub MS Internet Explorer
5.01. Aby uniknąć problemów związanych z brakiem tych komponentów,
administrator systemu powinien odpowiednio uaktualnić oprogramowanie
na stacjach roboczych - zgodnie z wymaganiami FineReader'a.
4. Przed instalacją sprawdź czy wszyscy użytkownicy mają prawa do zapisu i
odczytu do/z kartoteki w której będzie zainstalowany FineReader 5.0
Advanced Office.
Instalacja na stacji roboczej
Jeśli FineReader 5.0 Advanced Office został zainstalowany na serwerze
sieciowym, możesz uruchomić program instalacyjny z tego serwera - nie
musisz używać dysku CD-ROM i/lub dyskietki. Ale jeśli chcesz zainstalować
FineReader'a na serwerze w trybie stacji roboczej, to dyskietka instalacyjna
jest niezbędna.
ABBYY FineReader 5.0 Podręcznik użytkownika
14
Aby zainstalować FineReader'a 5.0 Advanced Office na stacji roboczej
należy:
Uruchomić NetSetup.exe z kartoteki sieciowej (serwera) do której
FineReader został zainstalowany. Następnie postępuj zgodnie z
pojawiającymi się instrukcjami.
Uwaga:
1. Nie możesz używać dysków logicznych stworzonych poleceniem SUBST.
2. Jeśli instalujesz FineReader'a na stacji roboczej Windows 95, wprowadź
pełną ścieżkę do serwera i nie używaj mapowanych dysków sieciowych.
3. Powinieneś posiadać prawa administratora na stacji roboczej, na którą
chcesz zainstalować program.
4. Jeśli pojawi się komunikat "Nie można wczytać FineReader'a. Brak wolnych
licencji."; sprawdź liczbę dodatkowych licencji, które dodałeś w
okienku "Dodaj licencję" oraz liczbę użytkowników pracujących właśnie z
programem.
Uruchamianie FineReader'a
Aby uruchomić ABBYY FineReader'a:
Wybierz opcję ABBYY FineReader 5.0 Pro (Office) w menu
Start/Programs/ABBYY FineReader 5.0 .
Uwaga: Nim uruchomisz FineReader'a upewnij się, że Twój skaner jest prawid
łowo włączony i podłączony do komputera. Jeśli Twój skaner nie był do tej
pory podłączony - w jego instrukcji użytkownika znajdziesz opis jak to zrobić.
Jeśli nie masz skanera, FineReader może rozpoznawać pliki graficzne (popatrz
na przykładowy plik demo.tif w kartotece ABBYY FineReader5.0/Demo ).
Instalowanie i uruchamianie ABBYY FineReader'a
15
ABBYY FineReader 5.0 Podręcznik użytkownika
16
Szybki start: ogólnie
W tym rozdziale dowiesz się jak wprowadzić dokument bez posiadania żadnej
szczególnej wiedzy na temat działania FineReader'a!
Dowiesz się też jakie okienka i paski narzędziowe są dostępne w
FineReaderze. Jeśli jesteś już doświadczonym użytkownikiem poprzednich
wersji programu FineReader - możesz pominąć ten tekst, ale przeczytaj sekcję
Nowe możliwości ABBYY FineReader 5.0.
Zawartość rozdziału:
Jak wprowadzić dokument w minutę
Główne okno FineReader'a
Paski narzędziowe FineReader'a
Jak wprowadzić dokument w minutę
1. Włącz skaner (w przypadku jeśli ma inne źródło zasilania niż komputer).
Uwaga: Wiele modeli skanerów musi być włączonych przed włączeniem
komputera.
2. Włącz komputer i uruchom FineReader'a (Start/Programs/ABBYY
FineReader 5.0/ABBYY FineReader 5.0 Pro lub Office). Pojawi się
główne okienko FineReader'a.
3. Włóż stronę, którą chcesz rozpoznać do skanera.
4. Kliknij na strzałce po prawej stronie przycisku Skanuj&Czytaj. Z menu
wybierz opcję Kreator Skanuj&Czytaj.
Kreator Skanuj&Czytaj może pracować w trybie Skanuj&Czytaj lub
Otwórz&Czytaj. Przykładowe pliki graficzne, które możesz otworzyć, by
przetestować działanie programu znajdują się w kartotece Default wewnątrz
kartoteki do której zainstalowano FineReader'a
Postępuj zgodnie z instrukcjami kreatora Skanuj&Czytaj.
Proces wprowadzania dokumentu składa się z czterech kroków: skanowanie,
rozpoznawanie, sprawdzanie pisowni, oraz eksport rozpoznanego tekstu.
Po zakończeniu skanowania, w okienku Obraz pojawi się "fotografia" dokumentu.
Następnie aplikacja prosi Cię o ustawienia parametrów rozpoznawania.
Po ich ustawieniu FineReader rozpocznie rozpoznawanie tekstu z jednoczesną
analizą układu strony. Fragmenty obrazu, które już rozpoznano zaznaczone są
na niebiesko.
Rozpoznany tekst zostanie wyświetlony w okienku Tekst. W oknie tym
możesz sprawdzać pisownię i edytować dowolny fragment tekstu. Po
zakończeniu tych prac kreator Skanuj&Czytaj zapyta Cię co chcesz zrobić z
rozpoznanym tekstem: przesłać do danej aplikacji, zapisać do pliku czy też
przetwarzać kolejne dokumenty.
Główne okno ABBYY FineReader'a
FineReader przeprowadza wszystkie operacje na dokumentach w trybie
wiązki. Wiązka jest kartoteką zawierającą obrazy, rozpoznane pliki tekstowe i
inne pliki pomocnicze. Z każdego zeskanowanego obrazu tworzona jest oddzielna
strona w wiązce. Jeśli w jednym pliku znajduje się kilka obrazów
(przykładowo dzieje się tak kiedy pracujesz z wielostronnicowymi plikami
TIFF) z każdego obrazu w tym pliku zostanie stworzona osobna strona w
wiązce.
ABBYY FineReader 5.0 Podręcznik użytkownika
18
Kiedy po raz pierwszy uruchamiasz FineReader'a, otworzona zostaje domyślna
wiązka. W tej wiązce znajduje się tylko jedna strona stworzona z pliku
demo.tif. Możesz dalej pracować z domyślną wiązką lub stworzyć własną
nową wiązkę. W sekcji Ogólne informacje o pracy z wiązkami znajdziesz
więcej szczegółów.
Główne menu FineReader'a zobaczysz w górnej części głównego okna programu.
Pod głównym menu zobaczysz następujące cztery paski narzędziowe:
Standardowy, Formatowanie, Narzędzia obrazu, oraz Kreatory. Możesz
ukryć/wyświetlić dowolny pasek narzędziowy.
Ukryć/pokazać dowolny pasek narzędziowy możesz wybierając opcje w podmenu
Paski narzędziowe w menu Widok lub za pomocą menu kontekstowego.
Aby otworzyć menu kontekstowe kliknij prawym przyciskiem myszki
na jakimkolwiek pasku narzędziowym. Na liście pasków narzędziowych
aktualnie wyświetlane paski są zaznaczone "ptaszkiem". Kliknij w nazwę
paska narzędziowego, którego chcesz pokazać/ukryć.
W dolnej części głównego okna programu FineReader znajduje się pasek statusu
wyświetlający zarówno informacje o statusie aplikacji i aktualnie
wykonywanych operacjach, jak również krótkie opisy opcji w menu i zaznaczonych
przycisków.
Okno Wiązka jest zawsze wyświetlane w Głównym oknie. Dodatkowo mogą
być wyświetlane jeszcze trzy inne okna: Obraz, Powiększenie, Tekst.
Domyślnie okno Powiększenie wyświetla czarno-białe obrazy nawet jeśli
otworzysz obraz kolorowy lub w odcieniach szarości. Jeśli chcesz, by okno
Szybki start: ogólnie
19
Powiększenie wyświetlało kolorowe obrazy w kolorze wyłącz opcję W
okienku Powiększenie pokazuj obrazy w czerni/bieli na zakładce Widok
okna Opcje (menu Narzędzie>Opcje).
Możesz zmienić układ i tryb okien na ekranie:
Z menu Widok wybierz jedną z opcji w podmenu: Okienko Wiązka>...;
Okienko Obraz i Tekst >...; Okienko Powiększenie >.... .
Niektóre zalecane układy i tryby okien: Użyteczne kiedy/jeśli:
Okno Wiązka po lewej; Widok
wiązki: Miniaturki; Okna Obraz,
Tekst i Powiększenie
Okno Wiązka na górze; Widok
wiązki: Szczegółowy; Okna Obraz,
Tekst i Powiększenie
Okno Wiązka na górze; Widok
wiązki: Szczegółowy; Okna Obraz i
Powiększenie
Okno Wiązka na górze; Widok
wiązki: Szczegółowy; Okna Tekst i
Powiększenie
Aby przełączyć się pomiędzy oknami:
Wciśnij CTRL+TAB.
Wciśnij ALT+1 by aktywować okno Wiązka.
Wciśnij ALT+2 by aktywować okno Obraz.
Wciśnij ALT+3 by aktywować okno Tekst.
Paski narzędziowe w ABBYY FineReader
W programie FineReader znajdziesz cztery podstawowe paski: Standardowy,
Narzędzia obrazu, Formatowanie i Kreatory. Przyciski na pasku
narzędziowym są zdecydowanie najłatwiejszym sposobem dostępu do różnych
funkcji aplikacji; tym niemniej te same funkcje można wywołać przy pomocy
menu lub skrótów klawiszowych. Jeśli chcesz się dowiedzieć do czego służy
dany przycisk na pasku narzędziowym - najedź na niego myszką. Po chwili w
"dymku" obok przycisku pojawi się jego opis. Nieco dokładniejszy opis
pojawi się na pasku statusu.
ABBYY FineReader 5.0 Podręcznik użytkownika
20
wiązka nie zawiera zbyt wielu stron
wiązka zawiera wiele stron
przeprowadzasz analizę układu i rozpoznajesz
dokumenty
edytujesz rozpoznany tekst
Pasek narzędziowy: Kreatory
Pasek narzędziowy Kreatory pozwala na uruchomienie podstawowych funkcji
programu: Skanowania, Rozpoznawania, Sprawdzania pisowni, oraz
Zapisu wyników. Liczby na przyciskach oznaczają kolejność w której typowo
należy wywoływać te funkcje. Możesz wykonywać każdą operację osobno,
lub możesz je wykonać za jednym zamachem klikając w przycisk kreatora
Skanuj&Czytaj. Kreator Skanuj&Czytaj automatycznie przeprowadza cały
cykl obróbki dokumentu.
Każdy przycisk udostępnia daną funkcję w paru trybach. Kliknij w strzałkę po
prawej stronie przycisku i z pomocniczego menu wybierz żądany tryb. Ikona
na przycisku zawsze odpowiada ostatnio wybranemu trybowi. Aby powtórnie
wywołać daną akcję w tym samym trybie wystarczy powtórnie kliknąć przycisk
- nie trzeba już wywoływać pomocniczego menu.
Skanuj&Czytaj
Kreator Skanuj&Czytaj - uruchamia specjalny
kreator w którym FineReader
poprowadzi Cię przez cały proces
przetworzenia dokumentu i doradzi Ci jak
osiągnąć takie czy inne efekty.
Skanuj&Czytaj - uruchamia skanowanie i
rozpoznawanie dokumentu z użyciem aktualnie
ustawionych opcji.
Skanuj&Czytaj wiele stron - skanuje i
rozpoznaje wiele stron za jednym zamachem.
Otwórz&Czytaj - otwiera pliki i rozpoznaje
dokumenty w nich zawarte.
1-Skanuj
Otwórz obraz - dodaje obraz do wiązki ze
wskazanego pliku. Każdy dodany obraz jest
kopiowany do kartoteki z wiązką.
Skanuj obraz - skanuje obraz.
Skanuj wiele obrazów - skanuje obrazy dopóki
nie zatrzymasz skanowania. W tym celu
wybierz opcję Zatrzymaj skanowanie z menu
Plik.
Opcje - otwiera zakładkę Skanuj/Otwórz (w
oknie dialogowym Opcje) dzięki której możesz
ustawić różnorodne parametry skanowania.
Szybki start: ogólnie
21
2-Czytaj (Rozpoznaj)
Rozpoznaj - rozpoznaje otwartą stronę w
wiązce. Rozpoznaj wszystkie - rozpoznaje
wszystkie nierozpoznane strony w wiązce.
Opcje - otwiera zakładkę Rozpoznawania
(okno dialogowe Opcje) dzięki której
możesz ustawić różnorodne parametry
rozpoznawania.
3-Sprawdź
Sprawdź pisownię - wyszukuje w tekście
słowa nieprawidłowe lub niepewne (zawieraj
ące niepewne lub nierozpoznane znaki).
Opcje - otwiera zakładkę Sprawdzanie
pisowni (okno dialogowe Opcje) dzięki
której możesz ustawić różnorodne parametry
sprawdzania pisowni.
4-Zapisz (Eksportuj)
Kreator eksportu - otwiera Kreatora
eksportu dzięki któremu możesz wybrać
format pliku i ustawić różnorodne
dodatkowe opcje eksportu.
Zapisz tekst do pliku - zapisuje rozpoznany
tekst do pliku.
Wyślij zaznaczone strony do - możesz
wyeksportować tylko niektóre strony. W
takim przypadku zaznacz strony które
chcesz wyeksportować, potem włącz tę
opcję i wybierz aplikację do której chcesz
przesłać wyniki rozpoznawania. FineReader
wyeksportuje tekst do wybranej aplikacji
bez pośrednictwa pliku.
Wyślij wszystkie strony do - eksportuje
wszystkie rozpoznane strony do wybranej
aplikacji bez pośrednictwa pliku.
Opcje - otwiera zakładkę Formatowanie
(okno dialogowe Opcje) dzięki której
możesz ustawić opcje eksportu.
ABBYY FineReader 5.0 Podręcznik użytkownika
22
Pasek narzędziowy: Formatowanie
Przyciski tego paska narzędziowego udostępniają różnorodne narzędzia formatuj
ące tekst. Możesz edytować tekst i formatować tekst w okienku Tekst.
Pasek narzędziowy: Narzędzia obrazu
Ten pasek udostępnia narzędzia do analizy układu strony (tj. tworzenie i edycja
bloków), jak również narzędzia do powiększania/pomniejszania oraz edycji
obrazu.
Szybki start: ogólnie
23
Pasek narzędziowy: Standardowy
Ten pasek narzędziowy udostępnia narzędzia do pracy z plikami oraz obrazem
(cofnij/powtórz, pokaż poprzednią/następną stronę wiązki i obracanie obrazu)
a także listę Rozpoznawanych języków.
Uwaga: Wygląd głównego okna programu FineReader, a ściślej mówiąc ilość
przycisków wyświetlanych na paskach narzędziowych zależy od rozdzielczości
ekranu. Aby wyświetlić wszystkie dostępne przyciski na pasku
narzędziowym zwiększ rozdzielczość ekranu. Tym niemniej, nawet jeśli nie
widać wszystkich przycisków, funkcjonalność FineReader'a nie jest zubożona
- każda opcja jest zawsze dostępna z poziomu menu.
ABBYY FineReader 5.0 Podręcznik użytkownika
24
Podstawowe cechy FineReader'a
FineReader dostarcza Ci pełnego zakresu narzędzi do wprowadzania dokumentów
do komputera. Wszystko co musisz zrobić to kliknąć w przycisk
Skanuj&Czytaj - cała reszta jest wykonywana przez program dzięki czemu nie
musisz spędzać czasu studiując jego zawiłości. Rozpoznany tekst możesz
przesłać do edytora tekstów lub arkusza kalkulacyjnego. Możesz tez zapisać
go w formacie RTF/DOC, PDF i HTML w pełni zachowując układ dokumentu.
Możesz wreszcie zapisywać rozpoznany tekst bezpośrednio do bazy
danych.
Zawartość rozdziału
Co to jest system OCR?
Nowe możliwości ABBYY FineReader 5.0
Formaty plików tekstowych obsługiwanych przez FineReader'a
Obsługiwane formaty plików graficznych
Co to jest system OCR?
System OCR (Optical Character Recognition) pozwala wprowadzić
drukowane dokumenty do komputera - z użyciem skanera.
FineReader jest systemem typu omnifont. Oznacza to, że system rozpoznaje
tekst napisany praktycznie dowolną czcionką i to bez specjalnego przygotowania.
Charakterystyczną cechą FineReader'a jest wysoka jakość rozpoznawania
i niska wrażliwość na defekty wydruku. FineReader zawdzięcza to specjalnym
algorytmom opartym o technologię Integral Purposeful Adaptive (IPA).
Proces wprowadzania dokumentów może być podzielony na
następujące etapy:
1. Skanowanie. W pierwszym kroku skaner pełni rolę "oczu" Twojego komputera:
patrzy na obraz i transmituje go do komputera. Zeskanowany obraz
jest niczym innym jak obrazem, zbiorem czarnych i białych punktów -
niemożliwych do edycji przez edytor tekstu.
2. Rozpoznawanie. W drugim kroku FineReader przeprowadza OCRowanie
obrazu - czyli rozpoznaje zawarty w nim tekst.
Przyjrzyjmy się bliżej drugiemu etapowi.
Proces rozpoznawania obrazu przez FineReader'a obejmuje analizę pliku
przekazywanego przez skaner (analiza układu strony) oraz rozpoznawanie
każdego znaku. Proces analizy układu strony (zaznaczenie obszarów rozpoznawanych,
tabelek, grafiki, linii i pojedynczych znaków) oraz rozpoznawania
dokumentu są mocno z sobą powiązane: analiza układu strony używa informacji
o rozpoznanym tekście w celu zapewnienia najwyższego poziomu
poprawności analizy.
Jak wspomniano powyżej, rozpoznawanie obrazu oparte jest o technologię
IPA.
Integrity - rozpoznawany obiekt jest opisany jako całość przez zbiór elementów
i relacji między nimi.
Purposefulness - rozpoznawanie jest procesem generowania hipotez i
sprawdzania ich prawdopodobieństwa.
Adaptivity - to umiejętność systemu do uczenia się i bycia trenowanym.
Te trzy elementy stoją u podstaw działania systemu. System generuje hipotezę
na temat rozpoznawanego obiektu (znak, część znaku, kilka zlepionych
znaków (ligatura)) a następnie akceptuje je lub odrzuca, próbując krok po
kroku znaleźć wszystkie elementy struktury znaku i relacje między nimi. Te
elementy struktury są komputerowymi odpowiednikami fragmentów znaków
odpowiedzialnych za ich rozpoznawanie przez człowieka (łuki, okręgi, kropki
itp.). Następnie program dopasowuje się do tekstu - używając informacji
ABBYY FineReader 5.0 Podręcznik użytkownika
26
uzyskanych podczas rozpoznawania pierwszych poprawnie rozpoznanych
znaków. Wyszukiwanie informacji o kontekście znaku pozwala systemowi
rozpoznać nawet mocno uszkodzone znaki, dzięki czemu jest prawie
niewrażliwy na błędy druku.
Efektem końcowym jest rozpoznany tekst, który możesz zobaczyć w okienku
Tekst. Tekst ten możesz edytować i zapisać w jakiejkowiek potrzebnej Ci
formie.
Nowe możliwości ABBYY FineReader'a 5.0
Praca z obrazami
Nowy tryb wyświetlania wiązki: tryb miniaturek. W tym trybie strony
wiązki są wyświetlane jako miniaturki - bardzo małe obrazy.
Skanowanie
Przetwarzanie podwójnych stron. Dwie strony otwartej książki są
skanowane jednocześnie ale przetwarzane osobno. Pojedynczy obraz zawieraj
ący dwie strony obok siebie zostanie podzielony na dwie strony
wiązki.
Analiza układu strony
FineReader 5.0 został wyposażony w całkowicie nową procedurę analizy
układu strony. Analiza strony jest przeprowadzana w trakcie rozpoznawania
- dzięki temu algorytm analizy strony może używać informacji o już
rozpoznanym tekście. Ten nowy algorytm używany jest domyślnie. Jest
jednak możliwe użycie "starego" algorytmu pochodzącego z FineReader'a
4.0 (opcja Akcja>Analizuj układ).
Rozpoznawanie obrazów wewnątrz innych bloków- można zaznaczyć blok
graficzny wewnątrz bloku tekstowego lub bloku z tabelką.
Rozpoznawanie
wersja EU ze 121 rozpoznawanymi językami (ABBYY FineReader EU).
wersja Cyrillic Plus z dodatkowymi 55 językami stosującymi cyrylice jako
alfabet, łącznie 176 języków (ABBYY FineReader Cyrillic Plus).
wsparcie dla alfabetu armeńskiego (w wersji EU oraz Cyrillic Plus). Patrz
też do sekcji Zajrzyj do systemu pomocy on-line, w sekcji "Języki
obsługiwane przez FineReader'a" znajdziesz pełną listę wspieranych
języków.
Podstawowe cechy FineReader'a
27
rozpoznawanie języków formalnych (Basic, Cobol, Fortran, Java, C++,
Pascal).
Rozpoznawanie indeksów (np. H2O).
Rozpoznawanie tekstów w pionie.
Zachowywanie koloru tekstu.
Eksport i edycja
Bloki i rozpoznany tekst są zsynchronizowane: jeśli skasujesz blok,
odpowiadający mu rozpoznany tekst też jest kasowany. Zmiana numeracji
bloków spowoduje odpowiednią zmianę układu tekstu w okienku Tekst.
Eksport do formatu HTML z pełnym zachowywaniem układu strony.
Eksport do formatu RTF, PDF i HTML z pełnym zachowaniem kolorów
tekstu.
Eksport do formatu RTF, DOC, XLS, HTML, TXT i CSV z pełnym wsparciem
kodowania Unicode.
Formaty plików tekstowych obsługiwanych przez
FineReader'a
ABBYY FineReader zapisuje wyniki rozpoznawania w
następujących formatach:
Microsoft Word (*.DOC)
Rich Text Format (*.RTF)
Adobe Acrobat Format (*.PDF)
HTML
Comma Separated Values (*.CSV)
czysty tekst (*.TXT). FineReader obsługuje różne strony kodowe
(Windows, DOS, Mac, ISO) oraz kodowanie Unicode.
Microsoft Excel (*.XLS)
DBF
ABBYY FineReader 5.0 Podręcznik użytkownika
28
Obsługiwane formaty plików graficznych
ABBYY FineReader otwiera pliki graficzne w
następujących formatach:
BMP:
2-bitowy - czarno-biały
4- i 8-bitowy - Paleta
16-bitowy
24-bitowy - paleta i TrueColor
32-bitowy
PCX, DCX:
2-bitowy - czarno-biały
4- i 8-bitowy - w odcieniach szarości
JPEG:
odcienie szarości i TrueColor
TIFF:
czarno-biały - nieskompresowany, CCITT3, CCITT3FAX, CCITT4, Packbits
w odcieniach szarości - nieskompresowany, Packbits, JPEG
TrueColor - nieskompresowany, JPEG
Palette - nieskompresowany, Packbits
wielostronnicowy TIFF
PNG:
czarno-biały, w odcieniach szarości, kolorowy
ABBYY FineReader zapisuje pliki graficzne w
następujących formatach:
BMP:
czarno-biały, w odcieniach szarości, kolorowy
PCX:
czarno-biały, w odcieniach szarości
JPEG:
Podstawowe cechy FineReader'a
29
w odcieniach szarości, kolorowy
TIFF:
czarno-biały - nieskompresowany, CCITT3, CCITT3FAX, CCITT4, Packbits
w odcieniach szarości - nieskompresowany, Packbits, JPEG
kolorowe - nieskompresoway i JPEG
PNG:
czarno-biały, w odcieniach szarości, kolorowy
ABBYY FineReader 5.0 Podręcznik użytkownika
30
Pobieranie obrazu
Jakość rozpoznawania w dużej mierze zależy od jakości źródłowego obrazu.
W niniejszym rozdziale nauczysz się jak poprawnie skanować dokument, jak
otworzyć i rozpoznać zawartość pliku graficznego oraz jak przetwarzać obrazy
i ułatwiać ich rozpoznawanie.
Zawartość rozdziału:
Skanowanie
Ustawianie parametrów skanowania
Wskazówki na temat ustawiania jasności
Skanowanie dokumentów wielostronnicowych
Otwieranie obrazów
Skanowanie podwójnych stron
Praca z obrazem
Numerowanie stron
Opcje obrazu w wiązce
Skanowanie
FineReader "rozmawia" ze skanerami przy pomocy interfejsu TWAIN.
TWAIN to uniwersalny standard pozwalający zunifikować komunikację
pomiędzy aplikacjami a urządzeniami do wprowadzania obrazów do komputera
(przykładem takiego urządzenia jest skaner). Istnieją dwie podstawowe
metody komunikowania się FineReader'a ze skanerem z użyciem sterownika
TWAIN:
z użyciem własnego interfejsu: w tym przypadku do ustawienia
parametrów skanowania służy okienko Ustawienia skanera. Temu trybowi
odpowiada opcja Użyj FineReader'a;
z użyciem interfejsu TWAIN skanera: w tym przypadku do ustawienia
parametrów skanowania służy okienko sterownika TWAIN. Temu trybowi
odpowiada opcja Użyj tylko sterownika TWAIN.
Obie metody mają wady i zalety
Przy włączonej opcji Użyj tylko sterownika TWAIN, zwykle dostępna jest
opcja podglądu obrazu. Podgląd pozwala na precyzyjne ustawienie obszaru
skanowania i dopasowanie jasności. Wadą jest, że różne skanery mają różne
sterowniki TWAIN a co za tym idzie w różny sposób wyglądają odpowiednie
okienka dialogowe. Szczegóły znajdziesz w instrukcji użytkownika do
Twojego skanera.
Przy włączonej opcji Użyj FineReader'a: możesz łatwiej skanować wiele
stron za pomocą skanera bez podajnika ADF, możesz też zapisać parametry
skanowania w szablonie wiązki (*.fbt) i użyć ich w innych wiązkach.
W bardzo łatwy sposób możesz przełączać się z jednego trybu w drugi:
Wybierz zakładkę Skanuj/Otwórz w okienku Opcje (menu
Narzędzia>Opcje) i kliknij w odpowiedni przycisk wyboru: Użyj
FineReadera lub Użyj tylko sterownika TWAIN.
Uwaga:
1. W przypadku niektórych skanerów opcja Użyj FineReadera może być
niedostępna.
2. Jeśli chcesz zobaczyć okienko Ustawienia skanera w trybie Użyj
FineReadera, na zakładce Skanuj/Otwórz zaznacz opcję Wyświetl
okienko parametrów przed każdym skanowaniem.
Ważne: Uważnie przeczytaj dokumentację dostarczoną ze skanerem, by prawid
łowo go podłączyć. Po podłączeniu skanera nie zapomnij o konieczności
zainstalowania sterownika TWAIN i/lub aplikacji do skanowania.
ABBYY FineReader 5.0 Podręcznik użytkownika
32
Aby rozpocząć skanowanie:
Kliknij w przycisk 1-Skanuj lub wybierz opcję Zeskanuj obraz w menu Plik.
W głównym oknie FineReader'a pojawi się dodatkowe okienko Obraz z
"fotografią" skanowanego dokumentu. Jeśli chcesz zeskanować wiele stron,
kliknij w strzałkę po prawej stronie przycisku 1-Skanuj i z menu wybierz
opcję Skanuj wiele obrazów lub w menu Plik wybierz Zeskanuj wiele stron.
Jeśli skanowanie nie rozpocznie się od razu to wyświetli się jedno z dwóch
okienek dialogowych:
Okienko sterownika TWAIN. Sprawdź parametry skanowania i kliknij
odpowiedni przycisk by zacząć skanowanie.
Okienko Ustawienia skanera. Sprawdź parametry skanowania i kliknij
odpowiedni przycisk by zacząć skanowanie.
Wskazówka: Jeśli chcesz rozpocząć rozpoznawanie od razu po zeskanowaniu
obrazu, możesz użyć opcji Skanuj&Czytaj lub Skanuj&Czytaj wiele stron:
Kliknij w strzałkę po prawej stronie przycisku Skanuj&Czytaj i wybierz albo
Skanuj&Czytaj albo Skanuj&Czytaj wiele stron.
FineReader zeskanuje i rozpozna zawartość dokumentów. Okienko Obraz
zawierać będzie "fotografię" zeskanowanego dokumentu, zaś okienko Tekst -
rozpoznaną zawartość dokumentu. Rozpoznany tekst może być wysłany do
różnych aplikacji zewnętrznych lub zapisany w wielu różnych formatach.
Ustawianie parametrów skanowania
Jakość rozpoznawania w dużej mierze zależy od jakości zeskanowanego
obrazu. Jakością obrazu można sterować zmieniając parametry skanowania:
rozdzielczość, tryb skanowania i jasność.
Podstawowe parametry skanowania:
Rozdzielczość - przy zwykłych tekstach (o rozmiarze czcionki 10 lub
więcej) użyj rozdzielczości 300dpi, zaś 400-600 dpi dla tekstów
napisanych drobniejszą czcionką - 9 punktów lub mniej.
Tryb skanowania - odcienie szarości.
Ten tryb skanowania jest najlepszy do rozpoznawania tekstu. W tym trybie
program automatycznie dopasowuje jasność skanowania.
Tryb skanowania - czarno-biały.
Ten tryb pozwala co prawda na skanowanie z większą prędkością, ale gubione
są niektóre informacje o znakach (szczegóły znaków). Może się to niekorzyst-
Pobieranie obrazu
33
nie odbić na jakości rozpoznawania dokumentów o średniej i niskiej jakości
druku.
Tryb skanowania - kolorowy.
Jeśli skanujesz kolorowe dokumenty zawierające grafikę, kolorowe znaki na
kolorowym tle itd. - możesz zachować te kolory w dokumencie elektronicznym.
Jasność - w większości przypadków wystarczająca będzie wartość średnia
- 50%.
Niektóre dokumenty zeskanowane w trybie czarno-białym mogą wymagać
dodatkowego dopasowania jasności.
Uwaga: Skanowanie z rozdzielczością 400-600 dpi (zamiast domyślnych 300
dpi) lub skanowanie w odcieniach szarości lub kolorze (zamiast w trybie
czarno-białym) zabierze więcej czasu. W przypadku niektórych skanerów
skanowanie z rozdzielczością 600dpi może zająć 4 razy więcej czasu niż
skanowanie z rozdzielczością 300 dpi.
Aby ustawić parametry skanowania:
Jeśli skanujesz używając metod wbudowanych w FineReader'a, wybierz
opcję Ustawienia skanera w menu Narzędzia. Otworzy się okienko dialogowe
w którym możesz ustawić potrzebne Ci parametry.
Jeśli skanujesz używając wyłącznie metod sterownika TWAIN, okienko
dialogowe z ustawieniami tego sterownika otworzy się automatycznie po
kliknięciu przycisku 1-Skanuj. Ustaw w nim potrzebne parametry. Zwróć
uwagę, że nazwy tych parametrów mogą być bardzo różne - zależy to od
producenta sterownika TWAIN. Przykładowo: słowo "threshold" może być
użyte zamiast słowa "jasność" czy "brightness". Kontrola jasności może
być też oznaczona ikonką słoneczka lub czarnego i białego kółka.
Niezbędne informacje znajdziesz w instrukcji obsługi swojego skanera.
ABBYY FineReader 5.0 Podręcznik użytkownika
34
Wskazówki na temat ustawiania jasności
Zeskanowany obraz musi być czytelny. Aby to sprawdzić podejrzyj go w
okienku Powiększenie.
przykład dobrego obrazu (z punktu widzenia systemu OCR)
Jeśli widzisz, że zeskanowany obraz jest daleki od doskonałości (znaki są
"pozlepiane" lub "podarte"), powtórnie go zeskanuj stosując się do poniższych
wskazówek.
Wygląd Twojego obrazu: Środki zaradcze:
znaki są "podarte" lub bardzo
jasne
znaki są pozlepiane, zabrudzone
itd.
Skanowanie dokumentów wielostronnicowych
FineReader dysponuje specjalnym trybem skanowania użytecznym w przypadku
skanowania dokumentów wielostronnicowych: Skanowanie wielu stron.
W tym trybie możesz zeskanować dowolną ilość stron. Pamiętaj, że:
Jeśli skanujesz używając metod wbudowanych w FineReader'a, skaner nie
zatrzyma się po zeskanowaniu jednej strony i automatycznie zacznie
skanować następne.
Jeśli skanujesz używając sterownika TWAIN, okienko sterownika nie
zamknie się po zeskanowaniu strony. Możesz włożyć do skanera kolejną
stronę i dalej skanować - w tym samym okienku.
Jeśli musisz zeskanować większą ilość stron masz dwa wyjścia: użyć skanera
z automatycznym podajnikiem (ADF) lub skanera bez takiego podajnika!
Skanowanie przy użyciu ADF:
W przypadku skanowania przy użyciu metod wbudowanych w FineReader'a,
włącz opcję Użyj podajnika automatycznego (ADF) na okienku Ustawienia
Pobieranie obrazu
35
Spróbuj zmniejszyć jasność skanowania
(wynikowy obraz będzie ciemniejszy).
Spróbuj zeskanować obraz w odcieniach
szarości (w trybie automatycznego dopasowania
jasności).
Spróbuj zwiększyć jasność (wynikowy obraz
będzie jaśniejszy). Spróbuj zeskanować
obraz w odcieniach szarości (w trybie
automatycznego dopasowania jasności).
skanera (menu Narzędzia>Ustawienia skanera) a następnie wybierz opcję
menu Plik>Zeskanuj wiele stron.
W przypadku skanowania przy użyciu metod sterownika TWAIN, wybierz
opcję Use ADF (lub o podobnej nazwie) w samym sterowniku (zwróć uwagę,
że sterowniki TWAIN mogą się znacznie od siebie różnić) a następnie wybierz
opcję menu Plik>Zeskanuj wiele stron.
Skanowanie bez podajnika ADF:
W przypadku skanowania przy użyciu metod wbudowanych w FineReader'a
Wybierz opcję Zeskanuj wiele stron w menu Plik
Istnieje parę sposobów na ułatwienie sobie skanowania dużych ilości dokumentów
przy pomocy skanera bez podajnika ADF. Polecamy Ci dwie alternatywne:
Ustawienie pauzy - czasu jaki ma upłynąć pomiędzy zakończeniem
skanowania jednej strony a rozpoczęciem skanowania nowej strony. W
okienku Ustawienia skanera ustaw odpowiednią wartość w polu Pauza
pomiędzy stronami (menu Narzędzia>Ustawienia skanera).
W tym trybie skaner nie rozpocznie skanowania nowej strony dopóki nie
upłynie podana ilość sekund od zeskanowania poprzedniej strony. W tym
czasie możesz wymienić stronę włożoną do skanera. Po zakończeniu pauzy
FineReader automatycznie zeskanuje kolejną stronę.
Zaznacz opcję Zatrzymaj się pomiędzy stronami w okienku Ustawienia
skanera.
W tym trybie za każdym razem kiedy skaner kończy skanowanie, pojawia
się okienko dialogowe z pytaniem czy chcesz kontynuować skanowanie.
Kliknij Tak by kontynuować skanowanie lub Nie by zakończyć
skanowanie.
Kiedy zeskanujesz wszystkie strony wybierz opcję Zatrzymaj skanowanie z
menu Plik.
W przypadku skanowania przy użyciu metod sterownika TWAIN
Wybierz opcję Zeskanuj wiele stron w menu Plik. Otworzy się okienko
dialogowe sterownika TWAIN. Aby rozpocząć skanowanie kliknij przycisk
Scan (lub Final, lub inny o podobnej nazwie - w każdym sterowniku ten
przycisk może się inaczej nazywać).
Zeskanuj stronę, włóż do skanera kolejny dokument i kliknij w przycisk Scan
w okienku sterownika TWAIN, by go zeskanować. Postępuj dalej wg tego
schematu.
Kiedy zeskanujesz wszystkie strony kliknij przycisk Close (lub inny przycisk,
który spowoduje zamknięcie okienka dialogowego sterownika TWAIN).
ABBYY FineReader 5.0 Podręcznik użytkownika
36
Wskazówka: Jeśli chcesz bardziej bezpośrednio kontrolować jakość
zeskanowanych obrazów wybierz opcję Otwórz obraz po zeskanowaniu na
zakładce Skanuj/Otwórz (menu Narzędzia>Opcje). Każda strona po
zeskanowaniu pojawi się w okienku Obraz. Jeśli obraz zeskanowany jest
nieprawidłowo - zatrzymaj skanowanie i zeskanuj tę stronę raz jeszcze.
Skanowanie podwójnych stron
Kiedy skanujesz książkę, znacznie wygodniej jest skanować jednocześnie lewą
i prawą stronę (nazywamy to stroną podwójną). Jakość rozpoznawania będzie
znacznie większa jeśli taka podwójna strona będzie traktowana jako dwie
osobne kartki. W takim przypadku każda ze "stron" będzie na przykład
zupełnie osobno prostowana.
Jeśli chcesz dzielić strony podwójne:
Przed rozpoczęciem skanowania wybierz opcję Podział stron podwójnych
na zakładce Skanuj/Otwórz (menu Narzędzia>Opcje).
Jeśli ustawisz tę opcję, każda podwójna strona zostanie podzielona na dwa
obrazy w wiązce. Zobacz też informacje w sekcji Ogólne informacje o pracy z
wiązkami.
Otwieranie obrazów
Jeśli nie posiadasz skanera, możesz rozpoznawać tekst z plików graficznych
(patrz też Obsługiwane formaty plików graficznych).
Aby otworzyć obraz możesz skorzystać z jednej z
dwóch metod:
Kliknij w strzałkę po prawej stronie przycisku 1-Skanuj i wybierz Otwórz
obraz. Ikona przycisku 1-Skanuj zmieni się - napis Skanuj zostanie
zastąpiony przez napis Otwórz obraz.
Wybierz opcję Otwórz obraz z menu Plik.
W okienku Otwórz wybierz jeden lub wiele plików graficznych. Wybrane
obrazy będą wyświetlone w okienku Wiązka, a ostatni wybrany obraz
zostanie wyświetlony w okienku Obraz i Powiększenie. Wszystkie zaznaczone
obrazy zostaną skopiowane do kartoteki zawierającej wiązkę. W sekcji
Ogólne informacje o pracy z wiązkami znajdziesz więcej informacji na temat
struktury wiązki i sposobu wyświetlania jej zawartości.
Wskazówka: Jeśli chcesz, by otwierane obrazy od razu były rozpoznawane,
użyj trybu Otwórz&Czytaj:
Pobieranie obrazu
37
1. Wybierz opcję Otwórz&Czytaj z menu Akcja lub po prostu wciśnij
CTRL+SHIFT+D. Otworzy się okienko dialogowe Otwórz.
W okienku Otwórz wybierz obrazy, które chcesz rozpoznać.
Praca z obrazem
Czyść obraz
Inwersja obrazu
Obrót lub odbicie obrazu
Gumka
Pomniejszanie/powiększanie obrazu
Uzyskiwanie informacji na temat obrazu
Cofnij ostatnią akcję
Czyść obraz
Rozpoznawany obraz może być bardzo "zabrudzony", tzn. może zawierać
wiele dodatkowych, niepotrzebnych kropek. Kropki te pojawiają się podczas
skanowania dokumentów o średniej lub niskiej jakości wydruku. Kropki
zlokalizowane w pobliżu konturów liter mogą negatywnie wpłynąć na jakość
rozpoznawania pisma. Aby usunąć te zabrudzenia:
Wybierz opcję Czyść obraz z menu Obraz.
Jeśli chcesz oczyścić zawartość konkretnego bloku:
Wybierz opcję Czyść blok w menu Obraz.
Uwaga: Jeśli oryginalny dokument jest bardzo blady, lub jeśli użyto bardzo
delikatnej czcionki, oczyszczenie obrazu może spowodować usunięcie kropek,
przecinków a nawet fragmentów liter. Oczywiście dramatycznie obniży to
jakość rozpoznawania.
Jeśli często skanujesz lub otwierasz "zabrudzone" obrazy, wybierz opcję
Czyszczenie obrazu na zakładce Skanuj/Otwórz okienka Narzędzia>Opcje.
Wszystkie obrazy dodawane do wiązki zostaną automatycznie oczyszczone.
Inwersja obrazu
Niektóre skanery podczas skanowania dokonują inwersji obrazy (czarny kolor
jest zamieniany w biały i vice versa).
Dlatego też, czasami może być konieczne dokonanie inwersji obrazu - tak by
dokument pojawiał się w standardowej formie tj. czarne litery na białym tle.
Aby to zrobić:
ABBYY FineReader 5.0 Podręcznik użytkownika
38
Wybierz opcję Inwersja w menu Obraz.
Uwaga: Jeśli często skanujesz lub otwierasz obrazy w inwersji wybierz opcję
Inwersja obrazu na zakładce Skanuj/Otwórz. Dzięki temu wszystkie obrazy
dodawane do wiązki zostaną poddane automatycznej inwersji.
Obrót lub odbicie obrazu
Jakość rozpoznawania obrazu zależy od tego, czy dokument ma standardową
orientację (tekst powinien być czytany z góry w dół, a wszystkie linie powinny
być poziome). Domyślnie FineReader automatycznie wykrywa orientację
strony podczas rozpoznawania. Jeśli FineReader nieprawidłowo określa orientację
obrazu, wyczyść opcję Wykrywanie orientacji obrazu na zakładce
Skanuj/Otwórz i ręcznie obróć obraz tak by uzyskać standardową orientację:
Kliknij przycisk lub wybierz opcję Obróć w prawo z menu Obraz, by
obrócić obraz zgodnie z ruchem wskazówek zegara.
Kliknij przycisk lub wybierz opcję Obróć w lewo z menu Obraz, by
obrócić obraz przeciwnie do ruchu wskazówek zegara.
Wybierz opcję Odwróć z menu Obraz, by obrócić obraz o 180°.
Aby dokonać odbicia obrazu:
poziomo (względem osi pionowej) - wybierz opcję Odbicie w poziomie w
menu Obraz,
pionowo (względem osi poziomej) - wybierz opcję Odbicie w pionie w
menu Obraz.
Gumka
Jeśli nie chcesz rozpoznawać pewnego obszaru obrazu lub jeśli na obrazie
znajdują się duże zabrudzenia - możesz je po prostu usunąć. Aby to zrobić:
Wybierz narzędzie i wskaż lewy górny róg obszaru obrazu, który
chcesz skasować, następnie przytrzymując lewy przycisk myszki przejdź
do prawego dolnego rogu obszaru, który ma zostać skasowany. Zwolnienie
przycisku myszki spowoduje skasowanie zakreślonego obszaru.
Powiększenie/Pomniejszenie obrazu
Wybierz narzędzie / na pasku narzędziowym w okienku Obraz i
kliknij w obraz. Skala obrazu powiększy się/pomniejszy się dwukrotnie.
Kliknij prawym przyciskiem myszki na obrazie i z menu kontekstowego
wybierz opcję Powiększenie a następnie powiększenie, którego potrzebujesz.
Pobieranie obrazu
39
Uzyskiwanie informacji na temat obrazu
Na temat obrazu możesz uzyskać następujące informacje: szerokość i
wysokość w pikselach, rozdzielczość w pionie i poziomie, typ obrazu.
Kliknij prawym przyciskiem myszki na obrazie i z menu kontekstowego
wybierz opcję Właściwości. Otworzy się okienko. Wybierz w nim
zakładkę Obraz.
2. Cofnij ostatnią akcję
Aby cofnąć wyniki działania ostatniej komendy kliknij przycisk Cofnij na
standardowym pasku narzędziowym .
Wskazówka. Aby cofnąć wynik działania polecenia Cofnij kliknij w przycisk
Powtórz na standardowym pasku narzędziowym .
Numeracja stron
Każdej zeskanowanej stronie nadawany jest numer. Domyślnie jest to numer
ostatniej strony w wiązce plus 1.
Tym niemniej jeśli chcesz, możesz ręcznie podać numer dodawanej strony.
Aby to zrobić:
Wybierz opcję Pytaj o numer strony przed jej dodaniem do wiązki na
zakładce Skanuj/Otwórz (menu Narzędzia>Opcje) .
Jeśli skanujesz większą ilość dwustronnych dokumentów:
1. Wybierz opcję Pytaj o numer strony przed jej dodaniem do wiązki na
zakładce Skanuj/Otwórz (menu Narzędzia>Opcje).
2. Podczas skanowania pojawi się okienko. Podaj w nim numer pierwszej
zeskanowanej strony w polu Numer strony. Następnie ustaw opcję
Osobno parzyste i nieparzyste. Wybierz porządek sortowania: rosnący
lub malejący. Zależy to od sposobu w jaki wkładasz dwustronne dokumenty
do podajnika automatycznego, tj. czy na szczycie sterty dokumentów
jest najmniejszy czy największy numer strony.
Opcje obrazu w wiązce
Poniższe opcje ustaw na zakładce Skanuj/Otwórz (menu Narzędzia>Opcje).
Zrób to przed dodaniem obrazów do wiązki.
Zmniejsz rozdzielczość obrazów kolorowych do 100 dpi
Opcja ta jest używana, kiedy dodajesz do wiązki obrazy kolorowe o dużym
ABBYY FineReader 5.0 Podręcznik użytkownika
40
rozmiarze. Opcja ta ma dwie zalety: a) wiązka będzie zajmować mniej miejsca
na dysku, oraz b) przetwarzanie obrazu zajmie mniej czasu.
Uwaga: Ustawienie tej opcji nie wpływa na jakość rozpoznawania. Wpływa
natomiast na jakość zapisywanych obrazów (ich rozdzielczość będzie
mniejsza).
Konwertuj obrazy do formatu czerń/biel
Wybierz powyższą opcję jeśli skanujesz w odcieniach szarości używając
sterownika TWAIN a na skanowanych obrazach nie ma kolorowej grafiki,
kolorowych czcionek czy tła lub jeśli w rozpoznanym dokumencie nie chcesz
zachowywać tych kolorów. Zeskanowany obraz będzie zajmował znacznie
mniej miejsca na dysku twardym.
Pobieranie obrazu
41
ABBYY FineReader 5.0 Podręcznik użytkownika
42
Analiza układu strony
FineReader przed rozpoczęciem rozpoznawania musi "wiedzieć" co należy
rozpoznawać a co nie. Do tego celu służą algorytmy analizy układu strony.
Algorytmy te zaznaczają bloki tekstowe, bloki graficzne, bloki z tabelkami czy
kodami kreskowymi (to ostatnie dostępne jest jedynie w wersji Advanced
Office).
W rozdziale tym dowiesz się: kiedy niezbędna jest ręczna analiza układu
strony, jakiego typu mogą być bloki, jak można edytować bloki zaznaczone
automatycznie przez program, i jak można uprościć proces analizy układu
strony.
Zawartość rozdziału:
Ogólne informacje o analizie układu strony
Typy bloków
Opcje automatycznej analizy układu strony
Ręczne rysowanie i edycja bloków
Ręczna analiza układu tabelki
Używanie szablonów układu bloków
Ogólne informacje o analizie układu strony
Analiza układu strony może być przeprowadzona automatycznie lub ręcznie.
W większości przypadków FineReader sam przeprowadzi analizę układu
nawet skomplikowanych stron. Automatyczna analiza uruchamiana jest przyciskiem
2-Rozpoznaj. Rozpoznawanie zostanie przeprowadzone jednocześnie
z analizą układu strony.
Uwaga: Dostępna jest również samodzielna procedura analizy układu strony
(menu Akcja>Analizuj układ). Jeśli chcesz - możesz uruchomić tę procedurę,
pamiętaj jednak, że w trybie automatycznym podczas analizy układu strony
FineReader jednocześnie rozpoznaje tekst. Tak więc algorytm badający układ
strony może się opierać na wynikach rozpoznawania tekstu. Zapewnia to
wyższą wierność zachowania układu strony.
Możesz chcieć ręcznie zaznaczyć bloki, jeśli:
1. Chcesz rozpoznać tylko fragment obrazu;
2. Algorytm automatycznej analizy nieprawidłowo zaznaczył bloki.
Wskazówka:
W niektórych przypadkach jakość automatycznej analizy układu strony
może być podwyższona przez ustawienie odpowiednich opcji. Sprawdź
aktualne opcje analizy układu strony (zakładka Rozpoznawanie, menu
Narzędzia>Opcje).
W przypadku gdyby program zaznaczył niektóre bloki nieprawidłowo, czasami
lepiej (szybciej) jest skorzystać z narzędzi edycji bloków niż ręcznie
kasować wszystkie bloki i na nowo je definiować.
Typy bloków
Bloki to fragmenty obrazu obrysowane ramką. Bloki informują system jakie
obszary obrazu należy rozpoznać i w jakiej kolejności. Bloki mają również
wpływ na sposób w jaki zachowywany jest układ dokumentu.
Bloki różnych typów odróżniają się od siebie różnymi kolorami ramek. Kolory
te możesz zmienić w sekcji Wygląd na zakładce Widok w okienku
Narzędzia>Opcje. W polu Element wybierz odpowiedni typ bloku a polu
Kolor wskaż odpowiedni kolor.
Dostępne są następujące typy bloków:
Obszar rozpoznawania - ten typ bloku używany jest do automatycznego
ABBYY FineReader 5.0 Podręcznik użytkownika
44
rozpoznawania i analizy układu. Po kliknięciu w przycisk 2-Rozpoznaj wszystkie
bloki tego typu zostaną automatycznie przeanalizowane i rozpoznane.
Tekst - ten typ bloku jest używany w stosunku do fragmentów obrazu zawieraj
ących tekst. Blok taki powinien zawierać tekst sformatowany jedynie w
jedną kolumnę. Jeśli wewnątrz tekstu znajdują się jakieś elementy graficzne,
narysuj dla nich osobny blok.
Tabelka - ten typ bloku jest używany w stosunku do tabelek lub fragmentów
obrazu zawierających ustrukturalizowany w formie tabelki tekst. Kiedy program
rozpoznaje blok takiego typu, w celu określenia struktury tabelki rysuje
pionowe i poziome separatory. Taki blok w pliku wynikowym reprezentowany
jest w formie tabelki. Możesz też ręcznie edytować tabelki.
Grafika (obrazek) - ten typ bloku jest używany w stosunku do elementów
graficznych pojawiających się na dokumencie. Blok takiego typu może obejmować
element graficzny lub dowolny inny obiekt (jak np. fragment tekstu),
który w wynikowym pliku ma się pojawić w formie graficznej.
Kod kreskowy (dostępne wyłącznie w wersji Advanced Office) - ten typ
bloków jest używany w stosunku do kodów kreskowych. Jeśli Twój dokument
zawiera kody kreskowe i chcesz by został on rozpoznany narysuj osobny blok
dla kodu kreskowego i ustaw typ bloku na kod kreskowy.
Uwaga: Istnieje opcja pozwalająca na automatyczne wykrywanie i rozpoznawanie
kodów kreskowych, ale domyślnie jest ona wyłączona. Aby ją
włączyć - włącz opcję Szukaj kodów kresk. na zakładce Rozpoznawanie
okienka Narzędzia>Opcje.
Opcje automatycznej analizy układu strony
Automatyczna analiza układu strony rysuje bloki następujących typów: tekstowe,
tabelki, graficzne oraz kody kreskowe (to ostatnie dostępne jedynie w
wersji Advanced Office).
Automatyczna analiza układu strony (przeprowadzana jednocześnie z rozpoznawaniem)
rozpocznie się po kliknięciu przycisku 2-Rozpoznaj. Nim
klikniesz w ten przycisk powinieneś ustawić podstawowe opcje analizy układu
strony: typ dokumentu oraz opcje analizy tabelek.
Typ dokumentu
W większości przypadków układ strony jest wykrywany automatycznie.
Analiza automatyczna jest przeprowadzana o ile ustawiona jest (a tak jest
domyślnie) opcja Automatyczne wykrycie w grupie Typ dokumentu na
zakładce Rozpoznawanie (menu Narzędzia>Opcje).
Analiza układu strony
45
Jeśli chcesz ręcznie określić typ dokumentu:
Wybierz odpowiednią opcję w grupie Typ dokumentu zakładki
Rozpoznawanie okienka Narzędzia>Opcje.
Dostępne typy dokumentów:
Automatyczne wykrycie - wskazuje, że układ dokumentu będzie
określony automatycznie. Domyślnie ta wartość
jest ustawiona. W trybie automatycznym
rozpoznawane są dokumenty praktycznie
dowolnego typu wliczając w to dokumenty
wielokolumnowe, teksty z tabelkami i elementami
graficznymi.
Pojedyncza kolumna - wskazuje, że tekst jest sformatowany w jedną
kolumnę. Użyj tej opcji jeśli automatyczna analiza
układu strony nieprawidłowo określiła, że
tekst jest wielokolumnowy.
Czysty tekst formatowany
spacjami - wskazuje, że tekst jest sformatowany w jedną
kolumnę a napisany jest czcionką o tej samej
szerokości i wielkości. W rozpoznanym tekście
wcięcia z lewej strony będą reprezentowane
przez spacje; każda linia stanowić będzie osobny
paragraf a oryginalne paragrafy zostaną oddzielone
pustą linią. Ten typ dokumentu jest
użyteczny np. przy rozpoznawaniu kodów
źródłowych w języku C++ lub innych językach
programowania.
Opcje analizy tabelki
W większości przypadków program automatycznie dzieli tabelkę na wiersze i
kolumny. Jeśli chcesz dopasować opcje analizy tabelek - zmień je w zakładce
Rozpoznawanie w grupie Tabelki. Zmień te opcje jeśli:
automatyczna analiza układu strony błędnie zaznaczyła wiersze lub kolumny
tabelki;
dokument zawiera wiele prostych tabelek tego samego typu (tj. nie ma
komórek łączonych lub w każdej komórce jest tylko jedna linia tekstu).
ABBYY FineReader 5.0 Podręcznik użytkownika
46
Użyj opcji Jedna linia tekstu w jednej komórce jeśli pracujesz z tabelką, która
nie posiada czarnych separatorów, lub ma jedynie parę czarnych a jednocześnie
w każdej komórce występuje tylko jedna linia tekstu. Oto przykład:
w tej tabelce w każdej komórce jest tylko
jedna linia tekstu
ta tabelka zawiera komórki z więcej niż
jedną linią tekstu
Użyj opcji Brak komórek łączonych jeśli pracujesz z tabelką w której nie występuj
ą komórki łączone. Oto przykład:
komórka Temperature jest komórką
łączoną
Uwaga: Nie wybieraj opcji Brak komórek łączonych i Jedna linia tekstu w
komórce jeśli w Twoim dokumencie znajduje się wiele tabelek o różnej strukturze.
Wybranie tych opcji może wywołać wiele błędów analizy układu strony
oraz może pogorszyć jakość rozpoznawania.
Analiza układu strony
47
Kilometers Miles
1 0.62
5 3.2
Physical
Phenomenon
t, degrees
centigrade
Water boiling
point
100
Water freezing
point
0
Temperature
Degrees
centigrade
Degrees
Kelvin
-273 0
100 373
Ręczne rysownie i edycja bloków
Aby stworzyć nowy blok:
1. Wybierz jedno z poniższych narzędzi:
- aby narysować obszar rozpoznawania;
- aby narysować blok tekstowy;
- aby narysować blok graficzny;
- aby narysować blok tabelki.
2. Wskaż myszką punkt w którym ma się znajdować róg bloku. Przytrzymaj
lewy przycisk myszki i przeciągnij wskaźnik myszki to miejsca w którym
ma się znajdować przeciwległy róg bloku.
3. Zwolnij przycisk myszki.
Wokół zaznaczonego obszaru pojawi się ramka.
Możesz zmienić typ bloku. Dostępne typy to: Obszar rozpoznawania, Tekst,
Tabelka, Grafika, lub Kod kreskowy. Aby zmienić typ bloku:
ABBYY FineReader 5.0 Podręcznik użytkownika
48
Kliknij prawym przyciskiem myszki na bloku i z menu kontekstowego
wybierz opcję Typ bloku a następnie odpowiedni typ bloku.
Modyfikowanie bloków
Aby przesunąć ramkę bloku:
1. Kliknij w ramkę bloku i przytrzymaj lewy przycisk myszki. Wskaźnik
myszki zmieni się na dwukierunkową strzałkę.
2. Przeciągnij wskaźnik myszki w wybrane przez siebie miejsce.
3. Zwolnij przycisk myszki.
Uwaga: Jeśli klikniesz na rogu bloku, będziesz mógł jednocześnie przesuwać i
pionową i poziomą część ramki bloku.
Aby dodać do bloku prostokątny fragment obrazu:
1. Wybierz narzędzie .
2. Kliknij w blok do którego chcesz dodać jaki fragment. Kliknij lewy przycisk
myszki i trzymając go wciśnięty zaznacz obszar jaki chcesz dodać do
bloku. Po zwolnieniu przycisku myszki fragment ten zostanie dodany do
bloku.
3. Jeśli zajdzie taka potrzeba, przesuń ramki bloku.
Aby wyciąć prostokątny fragment z bloku:
1. Wybierz narzędzie .
2. Kliknij w blok z którego chcesz wyciąć fragment. Kliknij lewy przycisk
myszki i trzymając go wciśnięty zaznacz obszar, który chcesz wyciąć. Po
zwolnieniu przycisku myszki fragment ten zostanie usunięty.
3. Jeśli zajdzie taka potrzeba, przesuń ramki bloku.
Uwaga: Jeśli wytniesz dolną lub górną część bloku, FineReader może skasować
cały ten fragment oraz róg bloku. Jeśli spróbujesz wyciąć fragment
pomiędzy górnymi lub pomiędzy dolnymi rogami bloku, aplikacja wytnie
również prawy róg (odpowiednio górny lub dolny). Zachowanie to związane
jest z faktem, że aby rozpoznawanie przebiegało prawidłowo linia tekstu nie
może być przerwana. Zwracamy przy tym uwagę, że powyższe ograniczenie
nie stosuje się do wycinania bocznych krawędzi bloku.
Analiza układu strony
49
Aby zaznaczyć blok:
Wybierz narzędzie i kliknij w blok lub przeciągnij wskaźnik myszki
nad wszystkimi blokami jakie chcesz zaznaczyć.
Uwaga: Jeden lub więcej bloków możesz też zaznaczyć przy użyciu zwykłych
narzędzi edycyjnych. Aby zaznaczyć parę bloków przytrzymaj klawisz SHIFT
i przy wybranym jednym z narzędzi: , , lub przeciągnij
myszką nad blokami jakie chcesz zaznaczyć. Aby dokonać inwersji zaznaczenia
(tzn. zaznaczyć bloku odznaczone i odznaczyć bloki zaznaczone),
przytrzymaj klawisz CTRL i przy wybranym jednym z narzędzi: , ,
lub przeciągnij myszką nad niezbędnymi blokami.
Aby przesunąć bloki:
Przytrzymaj klawisz ALT i przy wybranym jednym z narzędzi: , ,
, lub przesuń blok.
Aby przenumerować bloki:
1. Wybierz narzędzie .
2. Klikaj na bloki w żądanej kolejności. W rozpoznanym tekście zawartość
bloków pojawi się w tej kolejności.
Uwaga: Jeśli przenumerujesz bloki na już rozpoznanej stronie, automatycznie
(i odpowiednio) zmieni się też kolejność tekstu w okienku Tekst.
Aby skasować blok:
Wybierz narzędzie i wskaż blok, który chcesz skasować.
Uwaga: Jeśli skasujesz już rozpoznany blok, jego zawartość automatycznie
zniknie z okna Tekst.
Aby skasować wszystkie bloki:
Zaznacz wszystkie bloki i wybierz opcję Usuń bloki i tekst z menu
Wiązka.
Uwaga: Jeśli już rozpoznano stronę z której skasowano bloki, rozpoznany
tekst pochodzący z tych bloków też zostanie skasowany.
ABBYY FineReader 5.0 Podręcznik użytkownika
50
Ręczna analiza tabelki
Wskazówka: Jeśli funkcja automatycznej analizy układu tabelki nie uczyniła
tego prawidłowo - zmodyfikuj stworzony przez nią układ tabelki zamiast
tworzyć go od zera. W większości przypadków zajmie to mniej czasu.
Aby ręcznie wyedytować tabelkę:
Aby edytować układ tabelki użyj następujących narzędzi:
Dodaj separator pionowy
Dodaj separator poziomy
Usuń separator
Jeśli komórka tabelki zawiera jedynie jakiś element graficzny, zaznacz opcję
Traktuj komórkę jak grafikę w okienku Właściwości bloku (menu
Widok>Właściwości). Jeśli komórka tabelki zawiera zarówno tekst jak i
grafikę, wewnątrz komórki narysuj osobne bloki graficzne.
Aby połączyć komórki lub wiersze tabelki:
Wybierz opcję Połącz komórki tabelki lub Połącz wiersze tabelki w menu
Edycja.
Uwaga 1: Aby rozdzielić uprzednio połączone komórki można użyć opcji
Podziel komórki tabelki w menu Edycja.
Uwaga 2: Opcja Połącz wiersze tabelki nie wpływa na podział tabelki na
kolumny.
Wskazówka: Aby uniknąć ręcznego zaznaczania pionowych i poziomych separatorów,
narysuj blok typu tabelka, a następnie kliknij na nim prawym przyciskiem
myszki i z menu kontekstowego wybierz opcję Analizuj strukturę
tabelki. System zaznaczy wszystkie separatory jakie uzna za konieczne. Po
ich zaznaczeniu, możesz wyedytować te, które są błędnie umiejscowione.
Używanie szablonów bloków
Jeśli przetwarzasz większą liczbę dokumentów o tym samym układzie - jak
chociażby kwestionariusze lub formularze - analizowanie układu każdej strony
zajmuje zdecydowanie zbyt wiele czasu. Aby go zaoszczędzić możesz przygo-
Analiza układu strony
51
tować szablon bloków - czyli standardowy układ bloków określonych typów.
Następnie taki układ bloków możesz nałożyć na strony, które chcesz rozpoznać.
Aby stworzyć szablon bloków:
1. Otwórz obraz i narysuj bloki albo automatycznie albo ręcznie.
2. Wybierz opcję Zapisz układ bloków w menu Obraz. W okienku dialogowym,
które się pojawi podaj nazwę pliku w którym chcesz zachować
szablon bloków.
Aby wczytać układ bloków:
1. Kliknij w okienko Wiązka i zaznacz strony na które chcesz nałożyć
szablon bloków.
2. Wybierz opcję Wczytaj układ bloków w menu Obraz.
3. W okienku dialogowym, które się pojawi wybierz plik z potrzebnym Ci
szablonem bloków.
4. W grupie Zastosuj do wybierz odpowiednią opcję: Wszystkich stron -
szablon zostanie zastosowany do wszystkich stron w wiązce, Tylko zaznaczonych
- szablon zostanie zastosowany tylko do stron zaznaczonych w
wiązce.
5. Kliknij przycisk Otwórz.
ABBYY FineReader 5.0 Podręcznik użytkownika
52
Rozpoznawanie
Celem systemów OCR jest czytanie tekstu ze źródłowego obrazu oraz
zachowywanie układu strony. Przed rozpoczęciem rozpoznawania powinieneś
ustawić podstawowe opcje: rozpoznawany język, typ druku oraz typ dokumentu.
Rozdział ten opisuje te oraz inne ważne parametry a także ilustruje znaczenie
różnych ustawień.
Zawartość rozdziału:
Ogólne informacje o rozpoznawaniu
Rozpoznawany język
Typ druku
Inne opcje rozpoznawania
Rozpoznawanie w tle
Rozproszone rozpoznawanie w trybie sieciowym
Rozpoznawanie z douczaniem
Jak douczyć wzorzec liter
Jak wyedytować wzorzec liter
Tworzenie nowego języka lub nowej grupy języków
Jak stworzyć nowy język użytkownika
Jak stworzyć nową grupę języków
Ogólne informacje o rozpoznawaniu
Uwaga: Przed rozpoczęciem rozpoznawania sprawdź następujące opcje:
rozpoznawany język, typ druku rozpoznawanego tekstu oraz typ dokumentu.
Możesz:
1. Rozpoznać jeden lub wiele bloków na obrazie.
2. Rozpoznać otwartą stronę lub wszystkie strony zaznaczone w okienku
Wiązka.
3. Rozpoznać wszystkie do tej pory nierozpoznane strony wiązki.
4. Rozpoznać wszystkie strony w trybie rozpoznawania w tle. Ten tryb
pozwala edytować i rozpoznawać strony w tym samym czasie.
5. Rozpoznać strony w trybie douczania. Ten tryb jest używany przede
wszystkim do rozpoznawania dokumentów wydrukowanych dekoracyjną
czcionką oraz dużych ilości dokumentów (więcej niż setki stron) o niskiej
jakości.
6. Rozpoznać tę samą wiązkę na kilku stacjach roboczych.
Aby rozpocząć rozpoznawanie:
Kliknij w przycisk 2-Rozpoznaj na pasku narzędziowym kreatorów, albo:
Wybierz właściwą opcję w menu Akcja:
Rozpoznaj - aby rozpoznać otwartą stronę lub wszystkie strony zaznaczone
w okienku Wiązka;
Rozpoznaj wszystkie strony - aby rozpoznać wszystkie strony, które do
tej pory nie były jeszcze rozpoznane;
Rozpoznaj blok - aby rozpoznać jeden lub wiele bloków na danej stronie;
Rozpocznij rozpoznawanie w tle - aby rozpocząć rozpoznawanie w tle (z
jednoczesną możliwością edycji już rozpoznanych stron).
Domyślnie przycisk 2-Rozpoznaj rozpoznaje otwartą stronę. Aby zmienić tryb
pracy przycisku, kliknij w strzałkę po prawej stronie i wybierz żądaną opcję z
menu, które się pojawi.
Uwaga: Po uruchomieniu rozpoznawania bloków już rozpoznanych, rozpoznawane
będą jedynie nowe lub zmodyfikowane bloki.
ABBYY FineReader 5.0 Podręcznik użytkownika
54
Rozpoznawany język
FineReader rozpoznaje dokumenty zarówno jedno- jak i wielojęzyczne (np.
angielsko-francuskie).
Aby ustawić język rozpoznawania, wybierz go z listy rozwijanej umieszczonej
na standardowym pasku narzędziowym.
Jeśli chcesz rozpoznać dokument wielojęzyczny:
1. Wybierz opcję Wybierz wiele języków.
2. W okienku, które się pojawi zaznacz odpowiednie języki.
Uwaga:
1. (tylko dla użytkowników wersji FineReader Advanced Office). Jeśli często
używasz pewnej kombinacji języków, możesz stworzyć grupę języków
i dodawać do niej odpowiednie języki.
2. Zwiększanie liczby jednocześnie używanych języków rozpoznawania,
może negatywnie wpłynąć na jakość rozpoznawania. Rozsądna liczba
używanych jednocześnie języków to 2-3.
3. Przed rozpoznaniem dokumentów sprawdź czcionki na zakładce
Formatowanie: czcionki te muszą zawierać wszystkie znaki używane w
językach rozpoznawania. W przeciwnym wypadku - tekst będzie wyświetlany
nieprawidłowo. Przeczytaj sekcję "Czcionki dla języków rozpoznawania,
które mogą być wyświetlane nieprawidłowo" (system Pomocy
on-line).
Może się zdarzyć, że na liście języków nie znajdziesz tego, który jest Ci
potrzebny. Przyczyny takiego stanu rzeczy mogą być różnorakie:
1. Język nie jest obsługiwany przez FineReader'a. Zajrzyj do systemu pomocy
on-line, w sekcji "Języki rozpoznawane" znajdziesz pełną listę wspieranych
języków. Posiadacze wersji Advanced Office mogą samodzielnie
"nauczyć" FineReader'a nowego języka (mogą bowiem stworzyć nowy
język).
2. Język jest obsługiwany przez FineReader'a, ale nie jest wyświetlany na liście
rozwijanej na standardowym pasku narzędziowym. Aby dodać tam
nowy język - wybierz opcję Wybierz więcej języków. W okienku
Rozpoznawane języki wskaż potrzebny Ci język..
3. Język jest obsługiwany przez FineReader'a, ale nie został zainstalowany
(wybrano minimalną instalację lub instalację użytkownika, podczas której
nie zaznaczono tego języka). Aby zainstalować dodatkowe języki uruchom
program instalacyjny w trybie użytkownika, odznacz wszystkie opcje za
wyjątkiem opcji Języki rozpoznawania i kliknij przycisk Szczegóły.
Rozpoznawanie
55
Pojawi się pełna lista języków obsługiwanych przez FineReader'a. Wybierz
z niej poszukiwany przez Ciebie język.
Uwaga: Upewnij się, że wskazałeś tę samą kartotekę do której uprzednio zainstalowa
łeś FineReader'a.
Aby pokazać/ukryć język w liście rozwijanej na pasku narzędziowym:
W okienku Edytor języków (menu Narzędzia>Edytor języków) wskaż
dany język i włącz lub wyłącz opcję Pokaż ten język w liście rozwijanej na
pasku narzędziowym.
Wskazówka: Język rozpoznawania możesz ustawić nawet dla pojedynczego
bloku! W tym celu kliknij prawym przyciskiem myszki na danym bloku i z
menu kontekstowego wybierz opcję Właściwości. W okienku, które się pojawi
na zakładce Blok wskaż język w polu Rozpoznawany język.
Typ druku
W większości przypadków typ druku wykrywany jest automatycznie. Aby
użyć automatycznego trybu wykrywania typu druku ustaw opcję
Automatyczne wykrycie w grupie Typ druku na zakładce Rozpoznawanie
w okienku Narzędzia>Opcje.
Jeśli chcesz rozpoznawać teksty wydrukowane w trybie draft na drukarce
igłowej, lub teksty wydrukowane na maszynie do pisania, możesz znacząco
zwiększyć jakość rozpoznawania odpowiednio ustawiając typ druku:
Maszyna do pisania - dla tekstu wydrukowanego na maszynie do pisania,
Drukarka igłowa - dla tekstu wydrukowanego na drukarce igłowej w trybie
draft.
Przykład wydruku z drukarki igłowej. Jak widać każdy znak złożony jest z
wielu samodzielnych punktów.
Przykład wydruku z maszyny do pisania. Wszystkie litery mają jednakową
szerokość (zwróć uwagę na literę "w" oraz "a").
Aby zmienić typ druku:
Wybierz odpowiednią opcję w grupie Typ druku na zakładce
Rozpoznawanie w okienku Narzędzia>Opcje.
Uwaga: Po rozpoznaniu dokumentów wydrukowanych na drukarce igłowej
lub maszynie do pisania, nie zapomnij by z powrotem ustawić typ druku na
Automatyczne wykrycie.
ABBYY FineReader 5.0 Podręcznik użytkownika
56
Inne opcje rozpoznawania
Pokazuj obraz podczas rozpoznawania
Rozpoznawanie dużej ilości dokumentów będzie szybsze, jeśli przetwarzany
obraz nie będzie wyświetlany. Aby rozpoznawać obrazy bez ich każdorazowego
wyświetlania:
Odznacz opcję Pokazuj obraz podczas rozpoznawania na zakładce
Ogólne okienka Narzędzia>Opcje.
Inwersja bloku
Aby rozpoznawać fragmenty obrazu poddane inwersji (białe litery na
czarnym tle):
Kliknij prawym przyciskiem myszki na danym bloku i z menu kontekstowego
wybierz opcję Właściwości. Otworzy się okienko Właściwości
bloku. Zaznacz w nim opcję W inwersji.
Rozpoznawanie w tle
Jeśli chcesz jednocześnie edytować już rozpoznane strony i rozpoznawać
nowe - użyj trybu rozpoznawania w tle. W tym celu:
Wybierz opcję Rozpocznij rozpoznawanie w tle w menu Akcja.
W linii statusu w dolnej części głównego okna FineReader'a pojawi się znak
. Jeśli przeglądasz wiązkę w trybie Szczegółowym (opcja Widok>Widok
wiązki>Szczegółowy) strona, która jest właśnie rozpoznawana, w kolumnie
Otworzone przez będzie miała znak .
Kiedy włączony jest tryb rozpoznawania w tle, po dodaniu do wiązki nowego
obrazu, rozpoznawanie zostanie automatycznie wznowione.
Aby zatrzymać rozpoznawanie w tle:
Wybierz opcję Zakończ rozpoznawanie w tle w menu Akcja.
Uwaga: Rozpoznawanie w tle używa aktualnego zestawu opcji rozpoznawania
obrazu.
Rozpoznawanie
57
Rozproszone, sieciowe przetwarzanie
dokumentów
(dostępne wyłącznie w wersji FineReader Advanced Office)
W procesie wprowadzania dużych ilości dokumentów ważnym czynnikiem
jest wydajność systemu. FineReader dzięki możliwości przetwarzania rozproszonego
pozwala na niemal nieograniczone zwiększanie wydajności (przepustowości)
systemu.
Proces wprowadzania dokumentów składa się z następujących kroków:
skanowanie, rozpoznawanie, edycja i eksport wyników. Każdy z tych kroków
lub dowolna liczba tych kroków może zostać przeprowadzona na dowolnej
ilości stacji roboczych. Przykładowo stacji roboczej ze skanerem
wyposażonym w automatyczny podajnik dokumentów można przypisać
zadanie skanowania. W tym samym czasie innej stacji roboczej może być
przypisane rozpoznawanie, edycja i/lub zapisywanie rozpoznanych stron.
Ta sama wiązka może być przetwarzana przez dwie lub więcej stacji
roboczych, dzięki czemu znacząco wzrasta szybkość całego systemu. Na
każdej stacji roboczej przetwarzającej wiązkę powinna być zainstalowana
kopia programu FineReader (w sekcji Instalacja sieciowa znajdziesz więcej
szczegółów na temat instalacji FineReader'a w środowisku sieciowym) i każda
taka stacja powinna mieć pełne prawa dostępu (do zapisu i odczytu) do kartoteki
zawierającej wiązkę.
W okienku Wiązka możesz podejrzeć pełny status strony (tj. czy została
zeskanowana, rozpoznana, wyedytowana i/lub wyeksportowana, który
użytkownik ją zeskanował, wyedytował itd.). Aby włączyć taki tryb podglądu
kliknij prawym przyciskiem myszki na wiązce i z menu kontekstowego
wybierz opcję Widok>Szczegóły.
Jeśli jednocześnie parę stacji roboczych przetwarza wiązkę, system będzie
automatycznie dystrybuował pracę do wykonania. Cały proces przebiega
następująco: stacja skanująca dodaje zeskanowane strony do wiązki. Następnie
jeśli w sieci działa jakaś niezajęta stacja robocza pracująca w trybie rozpoznawania
w tle, to natychmiast rozpocznie rozpoznawanie strony. Stacja ta
blokuje rozpoznawaną stronę tak, że żadna inna stacja nie może jej jednocześnie
rozpoznawać. Jeśli wszystkie stacje robocze są w danej chwili
zajęte, zeskanowana strona będzie czekać aż jakaś stacja robocza się zwolni.
W tym samym czasie inne stacje robocze mogą otwierać już rozpoznane
strony i sprawdzać pisownię, edytować lub eksportować dane.
ABBYY FineReader 5.0 Podręcznik użytkownika
58
Jak przetworzyć wiązkę w środowisku sieciowym:
1. Stwórz/otwórz wiązkę i ustaw następujące jej parametry: rozpoznawany
język, typ druku, układ strony, opcje analizy tabelek, oraz, o ile to
potrzebne, wzorzec liter użytkownika.
2. Uruchom FineReader'a na wszystkich stacjach które mają przetwarzać
wiązkę i na każdej z nich otwórz tę wiązkę. Włącz na wszystkich stacjach
rozpoznawanie w tle (menu Akcja>Rozpocznij rozpoznawanie w tle).
3. Uruchom skanowanie na stacji roboczej podłączonej do skanera z podajnikiem
ADF.
Wskazówka: Jeśli Twój skaner nie jest zgodny ze standardem TWAIN (co
często się zdarza przy bardzo szybkich skanerach przemysłowych) możesz
skanować dokumenty bezpośrednio do kartoteki zawierającej wiązkę. W
tym celu stacja robocza do której podłączony jest skaner, powinna
skanować dokumenty przy pomocy dowolnej aplikacji a następnie zapisywać
je do kartoteki zawierającej wiązkę. Nazwy plików powinny być
zgodne z wzorem: 0001.tif, 0002.tif, 0003.tif itd. Liczby powinny
odpowiadać kolejności w jakiej zeskanowano dokumenty.
FineReader automatycznie przechwyci wszystkie zeskanowane obrazy i
rozpozna je. Aby odświeżyć listę stron w okienku Wiązka wciśnij klawisz
F5 lub wybierz opcję Uaktualnij listę stron z menu Wiązka.
4. Na stacji roboczej pracującej w trybie rozpoznawania w tle lub na dowolnej
innej stacji możesz edytować rozpoznany tekst i zapisać go do pliku
lub przesłać do danej aplikacji.
Uwaga: Jeśli jako format zapisu rozpoznanego tekstu wybrałeś TXT, CSV lub
DBF, możesz ten tekst dołączyć do istniejącego pliku. W tym celu zaznacz
opcję Dołącz na koniec pliku (zakładki TXT, CSV oraz DBF w okienku dialogowym
Ustawienia formatów).
Rozpoznawanie z douczaniem
Jak już wspomniano, FineReader potrafi czytać teksty napisane praktycznie
dowolną czcionką i jest prawie niewrażliwy na jakość wydruku. Dlatego też
najczęściej możliwe jest rozpoznawanie tekstu bez wcześniejszego douczania.
Tym niemniej FineReader udostępnia narzędzia pozwalające na douczanie go
wyglądu konkretnych czcionek.
Z trybu douczania warto skorzystać, gdy:
1. rozpoznawany tekst napisany jest dekoracyjną, nietypową czcionką;
Rozpoznawanie
59
2. rozpoznawany tekst zawiera znaki specjalne (np. symbole matematyczne);
3. trzeba rozpoznać duże ilości dokumentów (więcej niż setki stron) o niskiej
jakości wydruku.
Wskazówka: Używaj trybu douczania tylko w powyższych przypadkach. W
pozostałych przypadkach jakość rozpoznawania wzrośnie bardzo nieznacznie,
będziesz natomiast musiał włożyć wiele pracy w douczanie programu.
Proces douczania i używania wzorca przebiega następująco: Najpierw rozpoznajesz
jedną lub więcej stron w trybie douczania. Wyniki tego douczania
tworzą tzw. wzorzec. następnie FineReader użyje tego wzorca podczas rozpoznawania
reszty dokumentów.
Czasami zdarza się, że dwie lub trzy litery zostają zlepione. W takim przypadku
nie jest często możliwe ich poprawne rozdzielenie. FineReader nie może
tak objąć tych liter w ramki, by każda litera była w swojej ramce. Wtedy to (tj.
kiedy nie można tak przesunąć ramki, by obejmowała cały jeden znak i ani
kawałka żadnego innego znaku) można nauczyć FineReader'a rozpoznawać
cały taki "zlepek" liter jako jedną całość. Typowe przykłady takich trudno separowalnych
grup liter to ff, fi, fl itp. Takie kombinacje nazywane są ligaturami.
Uwaga:
1. Stworzony wzorzec jest użyteczny tylko w przypadku rozpoznawania tekstów
napisanych przy użyciu takiej samej czcionki jak ta na której
douczano FineReader'a.
2. Każdy wzorzec jest tworzony dla konkretnej wiązki, dlatego jeśli skasujesz
wiązkę, skasujesz też wzorzec. Możesz jednak uczynić każdy wzorzec
widocznym dla wszystkich wiązek. W tym celu zapisz go w pliku szablonu
wiązki.
3. Jeśli zaczniesz rozpoznawać teksty napisane inną czcionką, nie zapomnij
zdeaktywować wzorca liter. W tym celu zaznacz opcję Nie używaj
dodatkowych wzorców na zakładce Rozpoznawanie okienka
Narzędzia>Opcje.
Jeśli chcesz douczyć wzorzec liter użytkownika:
1. Uruchom tryb douczania - wybierz opcję Douczanie wzorca na zakładce
Rozpoznawanie okienka Narzędzia>Opcje. W linii statusu pojawi się
domyślna nazwa wzorca ("Default").
2. Kliknij przycisk 2-Rozpoznaj.
3. Doucz wzorzec - rozpoznaj jedną lub dwie strony.
Douczone znaki zapisywane są we wzorcu. Po zakończeniu douczania
ABBYY FineReader 5.0 Podręcznik użytkownika
60
FineReader zapisze stworzony wzorzec (plik o nazwie Default.pat) do
kartoteki aktualnej wiązki.
4. Wyedytuj swój wzorzec.
5. Wyłącz tryb douczania (wybierz opcję Wykorzystanie wzorca na zakładce
Rozpoznawanie).
6. Rozpoznaj pozostałe dokumenty - kliknij w przycisk 2-Rozpoznaj.
Uwaga:
1. Aby stworzyć parę wzorców dla tej samej wiązki użyj Edytora wzorców
(kliknij w przycisk Edytor wzorców na zakładce Rozpoznawanie).
Stwórz nowy wzorzec (klikając w przycisk Nowy w okienku dialogowym)
a następnie uaktywnij go klikając w przycisk Uaktywnij. Dalsza praca z
takim wzorcem przebiega wg takiego samego schematu jak w przypadku
wzorca domyślnego - patrz kroki 1-5. Pamiętaj, że jednocześnie może być
aktywny tylko jeden wzorzec.
2. Jeśli stworzyłeś parę wzorców dla tej samej wiązki, aktywnym jest ten
ostatni. Nazwa aktywnego wzorca wyświetlana jest w pasku statusu. Aby
uaktywnić inny wzorzec, wskaż go w okienku Edytora wzorców (menu
Narzędzia>Edytor wzorców) i kliknij przycisk Uaktywnij. Następnie na
zakładce Rozpoznawanie, zaznacz opcję Wykorzystanie wzorca.
3. Jeśli ustawiona jest opcja Użyj wzorców wbudowanych, FineReader
próbuje rozpoznać tekst używając wbudowanych wzorców liter i zatrzymuje
się tylko na niepewnych znakach. Co więcej: jeśli uczysz system
rozpoznawać tekst napisany dekoracyjną lub niestandardową czcionką (np.
tybetańską) FineReader może nieprawidłowo rozpoznawać znaki. W takim
przypadku wyłącz opcję Użyj wzorców wbudowanych.
Jak douczyć wzorzec liter
1. Upewnij się, że na zakładce Rozpoznawanie okienka Narzędzia>Opcje
ustawiona jest opcja Douczanie wzorca.
2. Kliknij przycisk 2-Rozpoznaj. FineReader rozpocznie rozpoznawanie
dokumentu. Kiedy napotka na nieznany znak wyświetli go w okienku
Douczania wzorca.
Rozpoznawanie
61
Douczanie rozpoznawania znaku:
Ramka w górnej części okienka powinna obejmować jeden znak, co więcej
znak ten musi być całkowicie objęty ramką. Jeśli ramka obejmuje tylko fragment
znaku, lub jeśli obejmuje więcej niż jeden znak, kliknij na nią i spróbuj
ja tak przesunąć, by spełnione były powyższe wymagania. Do przesuwania
ramki służą też przyciski oraz . Po odpowiednim przesunięciu
ramki, wpisz nazwę znaku i kliknij na przycisk Trenuj.
Uwaga:
1. Możesz douczać system rozpoznawania jedynie tych znaków, które znajduj
ą się w alfabecie języka.
Jeśli douczasz FineReader'a rozpoznawania tych znaków, których nie
można wprowadzić przy użyciu klawiatury, możesz wprowadzić ich nazwę
w formie specjalnego dwuznakowego kodu. Możesz też użyć Tabeli
znaków - w tym celu kliknij w przycisk w okienku dialogowym
Douczanie wzorca.
2. Jeśli chcesz tak douczać system, by zachowywał formatowanie znaku, zaznacz
odpowiedni rodzaj efektu specjalnego: Pogrubiony, Kursywa,
Indeks dolny lub Indeks górny.
3. Upewnij się, że jako nazwę znaku wpisujesz dużą literę, gdy douczasz
rozpoznawania dużej litery i analogicznie dla małych liter.
Jeśli podczas douczania popełniłeś błąd, możesz kliknąć w przycisk Wstecz a
ramka wróci do ostatniego położenia i ostatnia para "obraz znaku" - "nazwa
znaku" zostanie usunięta ze wzorca. Funkcja ta ma jednak ograniczenie:
można cofnąć się tylko w ramach jednego słowa.
Douczanie rozpoznawania ligatur
Ligatura jest kombinacją dwóch lub trzech znaków, np. fi, fl, ffi itp. Znaki te
jest bardzo trudno rozdzielić, gdyż są "sklejane" w druku. Lepiej traktować
takie znaki jako pojedynczy - choć złożony - symbol.
Douczanie ligatur odbywa się w taki sam sposób jak douczanie zwykłych
znaków:
1. Wpisz odpowiednią kombinację znaków i kliknij przycisk Trenuj.
2. Ramka w górnej części okienka musi obejmować całą ligaturę. Ramkę
możesz przesuwać myszką lub przyciskami lub .
Każdy wzorzec może zawierać do 1000 znaków. Tym niemniej nie powinieneś
tworzyć zbyt wielu ligatur, gdyż może to negatywnie wpłynąć na jakość
rozpoznawania.
ABBYY FineReader 5.0 Podręcznik użytkownika
62
Powinieneś też wziąść pod uwagę następujące ograniczenia:
1. FineReader czasami nie dokonuje rozróżnienia znaków zwykle traktowanych
jako różne. Takie znaki są traktowane jak jeden. Przykładowo
apostrofy ('), (') oraz (') są zachowywane we wzorcu jako jeden znak -
zwykły apostrof. Dlatego też, w rozpoznanym tekście zobaczysz tylko
jeden apostrof, nawet jeśli będziesz douczał system rozpoznawania wszystkich
rodzajów apostrofa.
2. W niektórych przypadkach niektóre obrazy są rozpoznawane jako znaki w
zależności od kontekstu (otoczenia w jakim występują).
Jak edytować wzorzec liter użytkownika
Czasami może Ci być potrzebna możliwość edycji świeżo stworzonego wzorca
liter użytkownika nim zaczniesz z niego korzystać podczas rozpoznawania.
Nieprawidłowo douczony wzorzec może negatywnie wpłynąć na jakość
rozpoznawania tekstu!
Wzorzec powinien zawierać jedynie całe litery lub ligatury. Znaki z obciętymi
brzegami i nieprawidłowymi nazwami powinny być usunięte z wzorca.
Aby wyedytować wzorzec liter użytkownika:
1. Wybierz opcję Edytor wzorców w menu Narzędzia. Pojawi się okienko
Edytor wzorców.
2. Wskaż odpowiedni wzorzec i kliknij przycisk Edytuj. Otworzy sie
okienko Wzorzec liter.
3. Wskaż odpowiedni znak i kliknij w przycisk Właściwości. Możesz teraz
zmienić nazwę znaki, ustawić odpowiedni typ: kursywa, pogrubiony,
indeks górny lub dolny. Możesz też kliknąć w przycisk Usuń i usunąć
znak ze wzorca.
Języki użytkownika i grupy języków
(dostępne wyłącznie w wersji FineReader Advanced Office)
Oprócz wbudowanych języków i grup języków, możesz też korzystać ze
stworzonych przez Ciebie języków i grup języków.
Możesz chcieć stworzyć nowy język, jeśli chcesz:
1. Skorzystać ze słownika zdefiniowanego przez użytkownika.
Przykładowo, potrzebujesz rozpoznać tekst w języku angielskim zawieraj
ący wiele skrótów. W takim przypadku możesz stworzyć słownik
skrótów, stworzyć nowy język i przypisać mu ten nowy słownik.
Rozpoznawanie
63
Następnie możesz stworzyć nową grupę języków złożoną z języka angielskiego
(ze standardowym słownikiem) oraz nowego języka skrótów.
Język ten możesz użyć do rozpoznawania tekstu jak każdy "zwykły"
język.
2. Rozpoznać dokumenty pewnych specyficznych typów, przykładowo:
lista produktów w supermarkecie zawierająca wyłącznie kody produktów.
Takie kody składają się z cyfr oraz niektórych liter. Możesz
stworzyć język zawierający w swoim alfabecie tylko potrzebne litery i
cyfry i użyć go do rozpoznania takich dokumentów.
dokumenty korzystające wyłącznie z dużych liter. Aby zwiększyć
jakość rozpoznawanie, możesz stworzyć język, którego alfabet nie
będzie zawierać małych liter.
Grupę języków warto stworzyć jeśli często używasz jakiejś konkretnej kombinacji
języków.
Aby stworzyć nowy język, otwórz Edytor języków (menu Narzędzia>Edytor
języków).
Jak stworzyć nowy język
(dostępne wyłącznie w wersji FineReader Advanced Office)
Aby stworzyć nowy rozpoznawany język:
1. Wybierz opcję Edytor języków w menu Narzędzia.
2. Kliknij przycisk Nowy i w okienku, które się otworzy wybierz opcję
Stwórz kopię języka a następnie wybierz język bazowy dla języka, który
chcesz stworzyć.
3. Otworzy się okno Podstawowe właściwości języka.
ABBYY FineReader 5.0 Podręcznik użytkownika
64
Ustaw następujące parametry języka:
1. Nazwa nowego języka.
2. Bazowy alfabet dla nowego języka. Alfabet widać w polu Alfabet. Kliknij
przycisk po prawej stronie, by go zmienić.
3. Słownik języka (używany podczas rozpoznawania i sprawdzania pisowni).
Możesz wybrać jedną z następujących alternatyw:
Brak (nie będzie używany żaden słownik).
Słownik wbudowany (będzie używany słownik dostarczony z programem
FineReader)
Słownik użytkownika
Kliknij przycisk Edytuj, aby: dodać słowa do słownika, wimportować
słownik z innego słownika lub pliku tekstowego (kodowanie Windows lub
Unicode, plik musi zawierać słowa oddzielone spacjami lub innymi znakami
spoza alfabetu - np. znakiem końca linii).
Uwaga: System sprawdzania pisowni uznaje znalezione w tekście słowo
za poprawne jeśli układ dużych/małych liter jest taki sam jak w słowniku,
wszystkie litery są małe, wszystkie litery są duże, lub pierwsza litera jest
duża a reszta mała. Oto parę przykładów:
Słowo w słowniku: Wersje słowa, które zostaną
uznane za poprawne:
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
aBc aBc, abc, Abc, ABC
Wyrażenie regularne (określa "gramatykę" języka, szczegółów szukaj w
sekcji Wyrażenia regularne).
Uwaga: Aby ustawić zawansowane opcje nowego języka (np. ignorowane
itp.), kliknij w przycisk Zaawansowane.
Rozpoznawanie
65
Jak stworzyć nową grupę języków
(dostępne wyłącznie w wersji FineReader Advanced Office)
Jeśli często rozpoznajesz teksty napisane w pewnej kombinacji paru języków,
np. w języku angielskim i niemieckim, możesz stworzyć grupę języków.
Stworzona grupa języków będzie wyświetlona jako jeden "język" na liście na
standardowym pasku narzędziowym.
Uwaga: Rozpoznawane języki możesz też wskazać używając listy języków na
standardowym pasku narzędziowym. W tym celu z listy tej wybierz opcję
Wybierz wiele języków. W okienku dialogowym, które się pojawi, wskaż
języki jakie będą występować na Twoim dokumencie.
Aby stworzyć grupę języków:
1. Wybierz opcję Edytor języków w menu Narzędzia i kliknij przycisk
Nowy. W okienku, które się pojawi, wybierz opcję Stworzyć nową grupę
języków.
2. Otworzy się okienko Właściwości grupy języków.
Ustaw następujące parametry nowej grupy języków:
1. Nazwa grupy.
2. Nazwy języków wchodzących w skład grupy.
Uwaga: W niektórych przypadkach jesteś pewien, że pewne znaki nie
pojawią się nigdy w rozpoznawanych tekstach. Dlatego też FineReader
pozwala Ci zdefiniować listę takich znaków (zwanych znakami zabronionymi).
Jasne wymienienie takich znaków może zwiększyć zarówno szybkość jak
i dokładność rozpoznawania. W tym celu kliknij w przycisk Zaawansowane.
Otworzy się okno Zaawansowane właściwości grupy języków. Wypełnij w
nim pole Zabronione znaki.
ABBYY FineReader 5.0 Podręcznik użytkownika
66
Sprawdzanie i edycja tekstu
Po zakończeniu rozpoznawania, wynik rozpoznania pojawi się w okienku
Tekst. Okienko Tekst reprezentuje wbudowany w FineReader'a edytor tekstowy.
To w nim możesz sprawdzić wyniki rozpoznawania i wyedytować
rozpoznany tekst.
Edytor tekstowy FineReader'a ma charakterystyczne cechy:
1. Wbudowany system sprawdzania pisowni (lista języków dla których
możliwe jest sprawdzanie pisowni zajrzyj do systemu pomocy on-line, w
sekcji "Języki rozpoznawane" ).
2. Wygodny interfejs użytkownika: powiększony obraz edytowanej linii tekstu
wyświetlany jest w okienku Powiększenie.
Cechy wbudowanego systemu sprawdzania pisowni:
1. Narzędzia do wyszukiwania niepewnych słów (czyli słów zawierających
niepewne znaki).
2. Narzędzia do wyszukiwania słów błędnie napisanych.
3. Narzędzia do dodawania nieznanych słów do słownika. Dodawanie słów
podnosi jakość rozpoznawania.
Zawartość rozdziału:
Sprawdzanie tekstu w ABBYY FineReader
Opcje edycji i sprawdzania pisowni
Dodawanie i usuwanie słów ze słownika użytkownika
Edycja tekstu w ABBYY FineReader
Edycja tabelek
Sprawdzanie pisowni w ABBYY FineReader
Znaki niepewne oraz słowa nie występujące w słowniku są zaznaczone innymi
kolorami. Domyślnie kolor jasnoniebieski jest używany do znaków
niepewnych zaś różowy - do słów spoza słownika. Aby zmienić te kolory:
Wybierz opcję Niepewny znak (lub Słowo spoza słownika) oraz żądany
kolor w polu Kolor w zakładce Widok (menu Narzędzia>Opcje).
Aby sprawdzić pisownię:
1. Kliknij przycisk 3-Sprawdź na pasku narzędziowym Kreatory (lub z
menu Narzędzia wybierz opcję Sprawdź pisownię).
2. Otworzy się okienko dialogowe Sprawdzanie pisowni.
3. W okienku Sprawdzanie pisowni znajdują się trzy podstawowe okienka.
Górne jest takie samo jak okno Powiększenie - wyświetla oryginalny
obraz prawdopodobnie błędnego słowa. Środkowe okno wyświetla samo
błędne słowo, a ponad nim pojawia się informacja o rodzaju prawdopodobnego
błędu. Okno Sugestie w dolnej części podaje listę sugerowanych
zamienników błędnego słowa (jeśli takie istnieją). Sugestie oparte są o
słownik wybrany w polu Słownik języka.
Uwaga: Aby ułatwić sobie sprawdzanie pisowni i edycję błędnych znaków,
możesz powiększyć okno Sprawdzanie pisowni. W tym celu kliknij w ramkę
okienka, wskaźnik myszki zmieni się na dwustronną strzałkę. Następnie przeci
ągnij ramkę odpowiednio powiększając okno.
Co możesz zrobić z prawdopodobnie błędnym słowem? Oto możliwości:
Kliknij w przycisk Ignoruj, aby pozostawić aktualne wystąpienie słowa
bez zmian.
Kliknij Ignoruj wszystko, aby pozostawić wszystkie takie słowa bez zmiany.
ABBYY FineReader 5.0 Podręcznik użytkownika
68
Wybierz sugerowany zamiennik słowa a następnie kliknij w przycisk
Zamień lub Zamień wszystko, aby zastąpić aktualne wystąpienie słowa
lub wszystkie takie słowa w tekście. Jeśli w okienku Sugestie nie ma
prawidłowego zamiennika, wpisz prawidłowy w środkowym oknie i kliknij
przycisk Potwierdź, by zmienić aktualne słowo.
Kliknij przycisk Dodaj..., aby dodać słowo do słownika. Po dodaniu
słowa, aplikacja uzna wszystkie następne wystąpienia tego słowa w
jakiejkolwiek formie za poprawne.
Kliknij przycisk Opcje..., aby ustawić opcje sprawdzania pisowni.
Kliknij Zamknij, aby zamknąć to okienko dialogowe.
Opcje sprawdzania i edycji tekstu
Poniższe opcje są ustawiane na zakładce Sprawdzanie pisowni okienka
Narzędzia>Opcje.
Poziom wyświetlania błędów
Uwaga: Ta opcja musi być ustawiona przez rozpoczęciem rozpoznawania.
Zatrzymaj się na słowie z niepewnym znakiem
Zatrzymaj się na słowie spoza słownika
Zatrzymaj się na słowie złożonym
Ignoruj słowa z cyframi i innymi znakami nieliterowymi
Popraw spacje przed i po znakach interpunkcyjnych
Poziom wyświetlania błędów
W liście Poziom wyświetlania błędów możesz wybrać jedną z poniższych
opcji:
Brak - błędy rozpoznawania nie są podświetlane.
Standardowy - nierozpoznane i niepewne znaki są podświetlane.
Gruntowny - jak Standardowy, ale słowa spoza słownika są podświetlane
dodatkowo.
Uwaga: Liczba błędów podświetlonych w okienku Tekst, zmieni się po
powtórnym rozpoznaniu strony, jeśli zmieniłeś ustawienie powyższej opcji.
Zatrzymaj się na słowie z niepewnym znakiem
Sprawdzanie i edycja tekstu
69
Jeśli ustawisz tę opcję, system sprawdzania pisowni zatrzyma się na każdym
niepewnym słowie (czyli słowie zawierającym niepewny(-e) znak(-i)).
Zatrzymaj się na słowie spoza słownika
Jeśli ustawisz tę opcję, system sprawdzania pisowni zatrzyma się na każdym
słowie, którego nie znajdzie w słowniku wybranego języka. Jeśli słowo nie
znajduje się w słowniku - może zostać rozpoznane w sposób nieprawidłowy.
Zatrzymaj się na słowie złożonym
Jeśli ustawisz tę opcję, system sprawdzania pisowni zatrzyma się na słowach,
które co prawda nie występują w słowniku, ale które da się skonstruować z
innych słów w słowniku, używając modelu morfologicznego (reguł tworzenia
słów) języka.
Ignoruj słowa z cyframi i innymi znakami
nieliterowymi
Jeśli ustawisz tę opcję, system sprawdzania pisowni potraktuje słowa zawieraj
ące cyfry lub inne znaki nie należące do rozpoznawanego języka jako
poprawne - chyba, że takie słowa będą zawierać niepewne znaki.
Popraw spacje przed i po znakach interpunkcyjnych
Jeśli ustawisz tę opcję system sprawdzania pisowni nie będzie się zatrzymywał
na niepoprawnie umieszczonych spacjach przed lub po znakach interpunkcyjnych
- będzie natomiast je korygować.
Dodawanie i usuwanie słów ze słownika
użytkownika
Dodawanie słowa do słownika użytkownika
Zwiększanie ilości słów w słowniku, jest dobrą metodą na zwiększenie
dokładności rozpoznawania. Podczas rozpoznawania, FineReader sprawdza
rozpoznawane słowa w słowniku. Tak więc dobrze jest wstawić szczególnie
często występujące słowa do słownika użytkownika.
Charakterystyczną cechą systemu sprawdzania pisowni w programie
FineReader jest pełna integracja z systemem analizy morfologicznej języka.
Dzięki temu dodaniu słowa do słownika towarzyszyć może dodanie pełnej
odmiany słowa - a więc wszystkich jego form. Dzięki temu w tekście
znalezione będą i uznane za poprawne wszystkie formy słowa - bez względu
na to jaka forma pojawiła się jako pierwsza.
Aby dodać słowo do słownika podczas sprawdzania pisowni:
ABBYY FineReader 5.0 Podręcznik użytkownika
70
W okienku Sprawdzanie pisowni kliknij w przycisk Dodaj.
Ustaw następujące parametry w okienku dialogowym Forma podstawowa:
1. Część mowy (rzeczownik, przymiotnik, czasownik, bez fleksji).
2. Jeśli słowo jest zawsze pisane z dużej litery, zaznacz opcję Prawidłowa
nazwa.
Jeśli dodajesz skrót, zaznacz opcję Skrót.
3. Pierwotna forma słowa.
Kliknij OK. Otworzy się okno dialogowe Stwórz odmianę. FineReader zada
Ci różne pytania na temat form dodawanego słowa. Twoje odpowiedzi
pomogą FineReader'owi zbudować pełną odmianę tego słowa. Klikaj w Tak
lub Nie w odpowiedzi na pytania FineReader'a. Jeśli zrobiłeś błąd, kliknij
przycisk Znowu, by raz jeszcze (tym razem poprawnie) odpowiedzieć na
pytanie. Zbudowana odmiana zostanie wyświetlona w okienku dialogowym
Odmiana.
Uwaga: Jeśli nie chcesz budować odmiany słowa i zawsze chcesz dodawać
słowa jako słowa bez fleksji zaznacz opcję Pomiń pytanie o formy słowa
(tylko dla j. angielskiego) na zakładce Sprawdzanie pisowni w okienku
Opcje (menu Narzędzia>Opcje).
Uwaga: Możesz też dodawać słowa podczas przeglądania listy dodanych słów.
Aby to zrobić, wybierz opcję Obejrzyj słowniki w menu Narzędzia.
Wyświetli się okienko dialogowe Wybierz słownik. Wybierz w nim język,
którego potrzebujesz i kliknij przycisk Przeglądaj. Pojawi się lista wszystkich
dodanych słów. Możesz dodać nowe słowo używając przycisku Dodaj.
Jeśli dodawane słowo już istnieje w słowniku, system ostrzeże Cię o tym. W
tym przypadku będziesz mógł obejrzeć odmianę tego słowa. Jeśli uważasz, że
istniejąca odmiana jest błędna, możesz zbudować nową (kliknij przycisk
Dodaj w okienku Dodaj słowo).
Wskazówka:
1. FineReader pozwala na importowanie słowników stworzonych w starszych
wersjach programu (FineReader 3.0 i 4.0).
2. FineReader pozwala na importowanie słowników (*.dic) stworzonych
przez Microsoft Word 6.0, 7.0, 97 i 2000.
Aby wimportować słownik:
Sprawdzanie i edycja tekstu
71
1. Wybierz opcję Obejrzyj słowniki w menu Narzędzia, a następnie wybierz
słownik języka i kliknij przycisk Przeglądaj.
2. Kliknij przycisk Importuj i wybierz pliki z rozszerzeniami *.ext, *.txt lub
*.dic.
Aby skasować słowo ze słownika:
1. Wybierz opcję Obejrzyj słowniki w menu Narzędzia. Wybierz język,
którego potrzebujesz i kliknij w przycisk Przeglądaj. Otworzy się
okienko.
2. Wybierz słowo, które chcesz skasować i kliknij w przycisk Usuń.
Edycja tekstu ABBYY FineReader
Uwaga: Jeśli w okienku Tekst FineReader'a znaki nie są wyświetlane prawid
łowo (tj. pojawiają się znaki "?" lub inne "dziwne" znaki zamiast niektórych
liter), to oznacza, iż aktualna czcionka nie w pełni obsługuje alfabet rozpoznawanego
języka. Wybierz czcionkę, która obsługuje cały zbiór liter rozpoznawalnych
(przykładowo: Arial Unicode lub Bitstream Cyberbit) na zakładce
Formatowanie (menu Narzędzia>Opcje) w grupie Czcionki i powtórnie
rozpoznaj dokument. Przejrzyj też sekcję Czcionki do rozpoznawanych
języków, które mogą być wyświetlane nieprawidłowo (System Pomocy online).
Po rozpoznaniu strony, jej rozpoznana zawartość pojawi się w okienku Tekst.
Uwaga: FineReader zachowuje oryginalne formatowanie tekstu, ale nie
wyświetla go w pełni w okienku Tekst. Wbudowany w FineReader'a edytor
tekstowy wyświetla tekst w następujący sposób: zachowywana jest aranżacja
linii; rozpoznany tekst, grafika i tabelki są ułożone zgodnie z kolejnością
numeracji bloków na źródłowym obrazie; sekcje rozpoznane z oddzielnych
bloków są oddzielone kropkowanymi liniami. Kiedy prześlesz tekst do
zewnętrznej aplikacji, układ strony będzie zachowany zgodnie z ustawionymi
opcjami. Ustaw te opcje na zakładce Formatowanie (menu
Narzędzia>Opcje) i w okienkach dialogowych przypisanych do odpowiednich
formatów.
Niepewne znaki są podświetlone. Możesz wyłączyć podświetlanie takich
ABBYY FineReader 5.0 Podręcznik użytkownika
72
znaków - w tym celu wyłącz opcję Podświetl niepewne znaki na zakładce
Widok w okienku Narzędzia>Opcje.
Jeśli chcesz by przeglądanie dokumentu w okienku Tekst było wygodniejsze,
możesz przełączyć się w tryb draft. Następujące cechy tekstu nie są wyświetlane
w trybie draft: grafika (w miejscu grafiki zobaczysz napis "blok grafiki");
lewe wcięcia; wyrównanie paragrafu (wszystkie paragrafy są wyrównane w
lewo); kolor tekstu i tła. Użyta będzie tylko jedna czcionka i to w tej samej
wielkości: (domyślnie 12). Zachowywane są efekty specjalne (pogrubienie,
kursywa, podkreślenie, indeks górny i dolny). Przełączyć się pomiędzy trybami
draft i pełnym można przez kliknięcie przycisku na pasku
narzędziowym Formatowanie. Jeśli przycisk jest wciśnięty - aktywny jest
tryb pełny, jeśli przycisk jest wyciśnięty - aktywny jest tryb draft.
Możesz zmienić rozmiar czcionki używanej w trybie draft. Aby to zrobić:
1. Wejdź do okienka Opcje w menu Narzędzia.
2. Ustaw żądaną wielkość czcionki w polu Wielkość czcionki w trybie
draft.
Wbudowany w FineReader'a edytor tekstowy udostępnia następujące
możliwości:
Kopiuj, wytnij, wklej
Znajdź i zastąp
Efekty czcionek
Cofnij i Powtórz
Kopiuj, wytnij, wklej
1. Nim użyjesz poleceń kopiowania i wycinania, zaznacz wpierw żądany
tekst.
2. Postępuj zgodnie z poniższymi instrukcjami, w zależności od tego co
chcesz zrobić:
Aby skopiować zaznaczony tekst:
Przycisk Kopiuj
Kliknij w przycisk Kopiuj na pasku narzędziowym, lub:
Wybierz opcję Kopiuj w menu Edycja lub w menu kontekstowym, lub
Wciśnij CTRL+C
Aby wyciąć zaznaczony tekst:
Sprawdzanie i edycja tekstu
73
Przycisk Wytnij
Kliknij w przycisk Wytnij na pasku narzędziowym, lub:
Wybierz opcję Wytnij w menu Edycja lub w menu kontekstowym, lub:
Wciśnij CTRL+X
Aby wkleić zaznaczony tekst:
Przycisk Wklej
Kliknij w przycisk Wklej na pasku narzędziowym, lub:
Wybierz opcję Wklej w menu Edycja lub w menu kontekstowym, lub:
Wciśnij CTRL+V
Znajdź i zastąp
Aby znaleźć słowo lub całą frazę w edytowanym tekście:
Wykonaj jedną z następujących czynności:
Wybierz opcję Znajdź w menu Edycja, lub
Wciśnij CTRL+F
Otworzy się okienko dialogowe Szukaj. Wpisz szukane słowo lub frazę w
polu Szukaj i ustaw ewentualne dodatkowe opcje wyszukiwania.
Wskazówka: Aby wyszukać to słowo, z tymi samymi opcjami wyszukiwania
wystarczy wcisnąć F3.
Aby znaleźć i zastąpić słowo lub całą frazę w edytowanym tekście:
Wykonaj jedną z następujących czynności:
Wybierz opcję Zastąp w menu Edycja, lub
Wciśnij CTRL+H
Otworzy się okienko dialogowe Zastąp. Wpisz szukane słowo lub frazę w
polu Znajdź, słowo na które należy je zamienić w polu Zamień na i ustaw
ewentualne dodatkowe opcje wyszukiwania.
Efekty specjalne czcionek
1. Kliknij w słowo lub zaznacz tekst dla którego chcesz ustawić jakiś efekt
specjalny czcionki.
Wykonaj jedną z poniższych czynności:
ABBYY FineReader 5.0 Podręcznik użytkownika
74
Kliknij w odpowiedni przycisk (np. ) na pasku narzędziowym
Formatowanie, lub
Kliknij prawym przyciskiem myszki na okienku Tekst i z menu kontekstowego
wybierz opcję Właściwości znaku. Otworzy się okienko dialogowe.
Wskaż w nim potrzebną czcionkę ewentualnie żądane parametry
czcionki, lub
Wciśnij CTRL+B - by pogrubić czcionkę, CTRL+I - by zmienić ją na
kursywę, CTRL+U - by podkreślić tekst.
Uwaga: W okienku dialogowym Czcionka można ustawić następujące
parametry: odstępy pomiędzy znakami, powiększenie znaku, używanie kapitalików.
Pamiętaj wszakże, że edytor FineReader'a nie wyświetla takiego formatowania
- zmiany zobaczysz dopiero po wyeksportowaniu dokumentu do
zewnętrznej aplikacji obsługującej takie formatowanie (np. MS Word).
Cofnij i Powtórz
Wykonaj jedną z następujących czynności:
Aby cofnąć akcję:
Przycisk Cofnij
Kliknij w przycisk Cofnij na standardowym pasku narzędziowym, lub
Wybierz opcję Cofnij z menu Edycja lub Wciśnij CTRL+Z
Aby powtórzyć cofniętą akcję:
Przycisk Powtórz
Kliknij w przycisk Powtórz na standardowym pasku narzędziowym, lub
Wybierz opcję Powtórz z menu Edycja lub Wciśnij CTRL+Y
Edycja tabelek
Edytor tabelek udostępnia narzędzia do wykonania
następujących czynności:
Łączenie komórek lub wierszy
Dzielenie zawartości komórek
Dzielenie zawartości wiersza/kolumny
Usuwanie zawartości komórki
Sprawdzanie i edycja tekstu
75
Aby połączyć komórki lub zawartość wierszy:
Przytrzymując klawisz CTRL zaznacz komórki lub wiersze, które chcesz
połączyć i kliknij w opcję Połącz komórki tabelki lub Połącz wiersze
tabelki w menu Edycja.
Aby podzielić zawartość komórek:
Wybierz opcję Podziel komórki tabelki z menu Edycja.
Uwaga: Ta operacja może być przeprowadzona wyłącznie na komórkach
uprzednio połączonych.
Aby podzielić zawartość wiersza lub kolumny:
Wybierz narzędzie lub na pasku narzędziowym w okienku Tekst i
kliknij w wiersz/kolumnę którą chcesz podzielić, by dodać nowy separator
poziomy/pionowy.
Wskazówka: Zawartość wierszy można łączyć używając narzędzia lub
opcji Połącz wiersze tabelki (menu Edycja).
Aby usunąć zawartość komórki:
W okienku Tekst zaznacz jedną lub wiele komórek, które chcesz skasować
i wciśnij klawisz DEL.
ABBYY FineReader 5.0 Podręcznik użytkownika
76
Eksport do zewnętrznych
aplikacji i formatów
Rozpoznany tekst może zostać zapisany do pliku, wysłany e-mail'em,
przesłany do zewnętrznej aplikacji lub skopiowany do schowka. Możesz
wyeksportować wszystkie, lub tylko zaznaczone strony.
FineReader potrafi wyeksportować rozpoznany tekst
do następujących aplikacji:
Microsoft Word 6.0, 7.0, 97 i 2000; Microsoft Excel 6.0, 7.0, 97 i 2000; Corel
WordPerfect 7.0, 8.0 i 9.0; Lotus Word Pro 9.5 i 97; StarWriter 4.x i 5.x,
PROMT 98 i dowolne inne aplikacje obsługujące standard ODMA.
Zawartość rozdziału:
Ogólne informacje o eksporcie rozpoznanego tekstu
Opcje zapisu tekstu
Eksport rozpoznanego tekstu do formatu RTF i DOC
Eksport rozpoznanego tekstu do formatu PDF
Eksport rozpoznanego tekstu do formatu HTML
Eksport obrazu strony
Ogólne informacje o eksporcie rozpoznanego
tekstu
Możesz:
zapisać rozpoznany tekst używając Kreatora eksportu,
zapisać otwarte lub zaznaczone strony do pliku lub wysłać je do
zewnętrznej aplikacji,
zapisać wszystkie strony w wiązce do pliku lub wyeksportować je do
zewnętrznej aplikacji,
zapisać obraz strony.
Aby wyniki rozpoznawania zapisać do pliku, lub wyeksportować do danej
aplikacji, kliknij przycisk 4-Eksport. Wygląd ikony zależy od aktualnie
włączonego trybu pracy. Jego nazwą jest napis na przycisku. Tryb pracy
możesz zmienić przy pomocy menu, które się pojawi po kliknięciu w strzałkę
po prawej stronie przycisku.
Aby zapisać rozpoznany tekst:
1. Kliknij w strzałkę po prawej stronie przycisku 4-Eksport i wybierz żądaną
opcję.
Uwaga: Jeśli chcesz wyeksportować tylko niektóre strony, najpierw
zaznacz je.
Po wyeksportowaniu danych, ikona przycisku 4-Eksport zmieni się
odpowiednio w zależności od tego co zrobiłeś: przesłałeś rozpoznany tekst do
aplikacji, wysłałeś go przez e-mail, skopiowałeś do schowka czy też zapisałeś
go do pliku. Ikona przycisku 4-Eksport zawsze odpowiada ostatniemu trybowi
eksportu. Tak więc jeśli chcesz wyeksportować kolejne strony w tym
samym trybie - wystarczy raz kliknąć w ten przycisk.
Opcje eksportu tekstu
Opcje eksportu tekstu ustawia się na zakładce Formatowanie w menu
Narzędzia>Opcje. Niektóre opcje można ustawić w Kreatorze eksportu oraz
okienku dialogowym Zapisz tekst jako.
Formatowanie i tryby zachowania układu strony
Zachowaj grafikę
Czcionki
ABBYY FineReader 5.0 Podręcznik użytkownika
78
Eksport wszystkich stron wiązki lub tylko zaznaczonych
Tryby eksportu rozpoznanego tekstu
Formatowanie i tryby zachowania układu strony
(dotyczy eksportu w formacie RTF, DOC lub HTML)
Zachowaj pełny układ strony - układ dokumentu jest całkowicie
zachowywany: układ paragrafów, czcionki i ich wielkość, kolumny, orientacja
tekstu, kolory, struktura tabelek.
Zachowaj rodzaj czcionki i jej rozmiar - zachowywana jest struktura
tabelek, podział na paragrafy oraz rodzaj i wielkość czcionek.
Usuń formatowanie - zachowywany jest jedynie podział na paragrafy oraz
struktura tabelek.
Uwaga: Z zależności od wybranego przez Ciebie formatu eksportu możesz
ustawić pewne dodatkowe opcje. Przykładowo w przypadku formatów
RTF/DOC możesz ustawić domyślną wielkość strony oraz sposób podświetlania
niepewnych znaków. W przypadku HTML możesz ustawić rozdzielczość
grafiki i stronę kodową. Opcje te dostępne w okienku Ustawienia formatów
(menu Narzędzia>Opcje). Okienko dialogowe ma osobne zakładki dla
każdego formatu.
Zachowaj grafikę
Jeśli ustawisz tę opcję, elementy graficzne będą eksportowane wraz z rozpoznanym
tekstem. Opcja ta dostępna jest jeśli zapisujesz tekst w formacie RTF,
DOC lub HTML.
Czcionki (dotyczy eksportu do formatów RTF, DOC
lub HTML)
Kiedy eksportujesz tekst do formatu RTF, DOC lub HTML, domyślnie
używane są czcionki z zakładki Formatowanie. Możesz wskazać jakich
czcionek należy użyć. W tym celu możesz zmienić czcionki w okienku Tekst
lub wybrać inne czcionki na zakładce Formatowanie i powtórnie rozpoznać
dokument.
Eksport wszystkich stron wiązki lub tylko
zaznaczonych
Możesz wyeksportować wszystkie strony wiązki lub tylko te, które uprzednio
zaznaczyłeś.
Eksport do zewnętrznych aplikacji i formatów
79
Tryby eksportu rozpoznanego tekstu
Stwórz osobny plik dla każdej strony - każda strona wiązki zostanie
zapisana do osobnego pliku. Na koniec nazwy pliku zostanie dodany
numer strony.
Wyeksportuj wszystkie strony z jednego obrazu do jednego pliku -
wszystkie strony pochodzące z tego samego wielostronnicowego pliku
TIFF zostaną zapisane do jednego pliku wynikowego.
Stwórz nowy plik po każdej pustej stronie - każda grupa stron będzie
zapisana do osobnego pliku. Grupy te rozdzielone są pustą kartką papieru.
Stwórz jeden plik dla wszystkich stron - wszystkie (lub wszystkie
wybrane) strony zostaną zapisane do pojedynczego pliku.
Eksport rozpoznanego tekstu w formacie RTF i DOC
Opcje zachowania układu strony ustawia się na zakładce Formatowanie w
okienku Opcje (menu Narzędzia>Opcje).
Uwaga: Kiedy eksportujesz rozpoznany tekst do formatu RTF lub DOC, system
używa czcionek wymienionych na zakładce Formatowanie okienka
Opcje lub czcionek które określiłeś podczas edycji tekstu w okienku Tekst.
Wskazówka: Jeśli wolisz edytować tekst w Microsoft Word zamiast w
okienku Tekst wewnątrz FineReader'a - mimo wszystko niepewne znaki mogą
być dalej podświetlone. W tym celu, przed wykonaniem eksportu, zdefiniuj
odpowiednie kolory podświetlenia w grupie Podświetlenie niepewnych
znaków na zakładce RTF/DOC.
Eksport rozpoznanego tekstu do formatu PDF
Opcje zachowania układu strony:
1. Tylko tekst i grafika - wyeksportowany zostanie tylko rozpoznany tekst
oraz grafika obecna na stronie.
2. Tekst nad graficznym obrazem strony - cały obraz jest wyeksportowany
jako grafika. Obszary tekstowe są zapisane jako tekst leżący nad obrazem
graficznym.
3. Tekst pod graficznym obrazem strony - cały obraz jest wyeksportowany
jako grafika. Rozpoznany tekst leży pod nią. Opcja ta jest bardzo użyteczna
jeśli eksportujesz tekst do archiwów: z jednej strony zachowany jest
oryginalny wygląd strony a z drugiej możliwe jest pełnotekstowe
przeszukiwanie takiego archiwum.
ABBYY FineReader 5.0 Podręcznik użytkownika
80
Aby ustawić te opcje:
1. Wybierz opcję Ustawienia formatów w menu Narzędzia. Otworzy się
okienko dialogowe.
2. Ustaw żądane opcje na zakładce PDF.
Uwaga: Jeśli używasz opcji Tylko tekst i grafika oraz Tekst nad graficznym
obrazem strony dostępna jest specjalna opcja Zastąp niepewne znaki przez
ich obrazy. Jeśli ją włączysz, wszystkie niepewne znaki pojawią się w
wynikowym pliku w formie graficznej. Opcja ta dostępna jest na zakładce
PDF.
Tryby użycia czcionek
Przy zapisie wyników do pliku PDF konieczne jest wybranie odpowiedniego
trybu użycia czcionek. Jeśli pracujesz z tekstami używającymi innej strony
kodowej niż Latin (łacińska) (tj. cyrylica, grecka, czeska itd.), ustaw tryb
używania czcionek Type 1 oraz same czcionki Type 1. Czcionki te muszą być
dostępne w Adobe Type Manager.
1. Użyj standardowych czcionek Acrobat Reader'a - plik PDF używa standardowych
czcionek Times, Helvetica i CourierNew.
2. Referencja do czcionek Type 1 - w pliku PDF zapisywane są jedynie
odnośniki do czcionek Type 1. Same czcionki nie są zapamiętywane w
pliku. Czcionki te muszą być zainstalowane i dostępne w Adobe Type
Managerze.
3. Wbudowane czcionki Type 1 - czcionki Type 1 są zapisywane do pliku
PDF.
Uwaga: Jeśli nie masz czcionek Type 1 możesz użyć opcji Użyj standardowych
czcionek Acrobat Reader'a. Niemniej znaki pochodzące ze stron
kodowych inne niż Latin (a więc i polskie znaki) będą poprawnie wyświetlane
tylko w Acrobat Reader 3.x na platformie Windows.
Uwaga:
1. W trybie Referencja do czcionek Type 1 w pliku PDF zapisywane są
wyłącznie odnośniki to czcionek. Dlatego tak stworzone pliki PDF zajmują
mniej miejsca na dysku.
2. Jeśli plik PDF stworzono w trybie Wbudowane czcionki Type 1 to inni
użytkownicy mogą edytować i drukować taki plik w oryginalnych
czcionkach - nawet jeśli wcześniej nie mieli ich zainstalowanych.
Eksport do zewnętrznych aplikacji i formatów
81
Aby ustawić, których czcionek Type 1 używać:
Kliknij w przycisk Czcionki Type 1 na zakładce PDF w okienku
Ustawienia formatów (menu Narzędzia>Ustawienia formatów).
Uwaga: W okienku Czcionki Type 1 musisz ustawić wszystkie typy
czcionek: szeryfowe, bezszeryfowe i stałej szerokości.
Eksport rozpoznanego tekstu w formacie HTML
Tryby zachowania układu strony ustawiane są na zakładce Formatowanie w
okienku Opcje (menu Narzędzia>Opcje).
Uwaga:
Kiedy zapisujesz tekst w formacie HTML używane są czcionki zdefiniowane
na zakładce Formatowanie w okienku Opcje (menu
Narzędzia>Opcje) lub te, które wybrałeś podczas edytowania tekstu w
okienku Tekst.
Aby w pliku HTML zachować elementy graficzne obecne na stronie:
Ustaw opcję Zachowaj grafikę na zakładce Formatowanie okienka
Opcje
Uwaga: Obrazki (=elementy graficzne) zapisywane są w samodzielnych
plikach *.jpg.
Dostępne formaty HTML
1. Pełny (używa CSS; wymaga co najmniej MS IExplorer 4.0) - jeśli
ustawisz tę opcję użyty będzie nowy format HTML - HTML 4. Format ten
obsługuje wszystkie układy strony (zachowanie układu strony zależy od
opcji ustawionych na zakładce Formatowanie w grupie Układ strony);
używany jest wbudowany arkusz styli.
2. Prosty (kompatybilny ze wszystkimi przeglądarkami) - jeśli ustawisz tę
opcję użyty będzie format HTML 3. Układ dokumenty zachowywany jest
jedynie w przybliżeniu (np. format HTML 3 obsługuje ograniczoną liczbę
czcionek). Tym niemniej format ten jest obsługiwany przez praktycznie
wszystkie przeglądarki.
3. Automatyczny (zapisuje w trybie Pełnym i Prostym w jednym pliku
wraz z kodem wykrywającym rodzaj przeglądarki) - oba formaty
(Pełny i Prosty) zapisywane są do tego samego pliku. Przeglądarka sama
wybierze obsługiwany przez nią format.
ABBYY FineReader 5.0 Podręcznik użytkownika
82
Aby wybrać żądany format HTML:
Wybierz odpowiednią opcję w grupie Format na zakładce HTML w
okienku Ustawienia formatów (menu Narzędzia>Ustawienia formatów).
Uwaga: Aplikacja automatycznie wykrywa stronę kodową. Aby zmienić
stronę kodową - wybierz ją w polu Strona kodowa na zakładce HTML
okienka Ustawienia formatów.
Zapisywanie obrazu strony
1. Zaznacz stronę w wiązce.
2. Z menu Plik wybierz opcję Zapisz obraz jako.
3. W okienku dialogowym, które się pojawi wskaż kartotekę do której chcesz
zapisać plik oraz format tego pliku.
Uwaga: Jeśli chcesz możesz zapisać tylko niektóre fragmenty obrazu - te
które znajdują się wewnątrz bloków. W tym celu w powyższym okienku
dialogowym zaznacz opcję Zapisz tylko zaznaczone bloki.
4. Podaj nazwę pliku.
5. Kliknij Zapisz.
Uwaga: Możliwy jest zapis paru obrazów do jednego pliku (wielostronnicowy
TIFF). Aby to zrobić:
1. Zaznacz odpowiednie obrazy w okienku Wiązka.
2. Wybierz opcję Zapisz obraz jako z menu Plik. W okienku dialogowym,
które się pojawi wybierz format TIFF oraz opcję Zapisz jako wielostronnicowy
plik obrazu.
Eksport do zewnętrznych aplikacji i formatów
83
ABBYY FineReader 5.0 Podręcznik użytkownika
84
Praca z wiązkami
Wiązka jest główna składnicą danych programu FineReader: zeskanowane
obrazy, rozpoznany tekst i inne dane są przechowywane w wiązce. Większość
opcji FineReader'a ustawiasz właśnie dla całej wiązki: opcje skanowania,
rozpoznawania, eksportu itd. Wzorce liter użytkownika, języki zdefiniowane
przez użytkownika oraz grupy języków również przynależą do wiązki. Kiedy
tworzysz nową wiązkę, możesz użyć dla niej albo ustawień domyślnej wiązki,
albo ustawień z aktualnie otwartej wiązki, albo też ustawień zapisanych w
pliku *.fbt.
Zawartość rozdziału:
Ogólne informacje o pracy z wiązkami
Tworzenie nowej wiązki
Otwieranie wiązki
Dodawanie obrazów do wiązki
Numer strony w wiązce
Zamykanie wiązki
Usuwanie wiązki
Ogólne informacje o pracy z wiązkami
Kiedy FineReader jest uruchamiany po raz pierwszy, otwiera wiązkę ze swojej
własnej kartoteki. Możesz pracować dalej z tą wiązką lub możesz stworzyć
nową. Wiązka może zawierać do 9999 stron.
Wskazówka: Użyteczne jest kiedy w wiązce przechowywane są strony podobne
do siebie (lub w inny sposób powiązane z sobą), przykładowo: wszystkie
strony z tej samej książki, strony zawierające tekst napisany w tym samym
języku, strony z tym samym układem dokumentu itd.
Okno Wiązka wyświetla listę stron w otwartej wiązce. Aby podejrzeć stronę -
po prostu kliknij w jej ikonę lub w jej numer. Wszystkie pliki powiązane z tą
stroną otworzą się w odpowiednich okienkach, tj. tekst (jeśli strona była
rozpoznawana) w okienku Tekst, obraz strony w okienku Obraz - tam też
pojawią się bloki (jeśli dokument rozpoznawano lub kiedy ręcznie wykonano
analizę układu strony).
Okno Wiązka można wyświetlić w jednym z dwóch podstawowych
trybów:
Widok wiązki Opis
Miniaturki W tym widoku, strony wiązki wyświetlone są w formie
miniaturek. Miniaturka jest mocno pomniejszonym
obrazem oryginalnej strony. Na miniaturce pojawiać się
będą dodatkowe ikony - w miarę jej przetwarzania,
oznaczające, że przeprowadzono odpowiednie akcje, np.:
rozpoznawanie, eksport wyników itp. Ten tryb wyświetlany
jest szczególnie wygodny, gdy chcesz otworzyć
konkretną stronę - na miniaturce widać bowiem pomniejszony
obraz - łatwo jest więc zlokalizować potrzebna
stronę. Aby otworzyć strony - po prostu kliknij w jej
miniaturkę.
Szczegółowy W tym widoku okno Wiązka wyświetla szczegółowe
informacje o każdej stronie w wiązce; możesz przesortować
listę stron po dowolnej wybranej przez Ciebie cesze.
Widok Szczegółowy jest wygodny kiedy pracujesz z dużą
wiązką - w takim bowiem przypadku na ekranie wyświetlane
są informacje o większej liczbie stron niż w widoku
Miniaturki. Aby otworzyć stronę - dwukrotnie w nią
kliknij.
ABBYY FineReader 5.0 Podręcznik użytkownika
86
Aby wybrać widok dla okna Wiązka:
Kliknij prawym przyciskiem myszki na okienku Wiązka i wybierz opcję
Widok z menu kontekstowego.
Każdy widok okna Wiązki możesz dopasować do własnych potrzeb, tj.
wybrać jakie właściwości będą wyświetlane, w jaki sposób sortowane są
strony itd. Aby to zrobić:
Kliknij prawym przyciskiem myszki na oknie Wiązka i wybierz opcję
Widok>Dopasuj z menu kontekstowego. Otworzy się okienko dialogowe.
Na zakładkach Miniaturki i Szczegóły wybierz interesujące Cię opcje.
W oknie Wiązka możesz zaznaczyć wiele stron:
Aby zaznaczyć wiele kolejnych stron, przytrzymaj klawisz SHIFT i kliknij
w pierwszą a potem w ostatnią stronę z grupy kolejnych stron, które
chcesz zaznaczyć.
Aby zaznaczyć parę stron, przytrzymaj klawisz CTRL i kliknij po kolei w
strony, które chcesz zaznaczyć.
Aby zaznaczyć wszystkie strony w wiązce uaktywnij okienko Wiązka i
wybierz opcję Zaznacz wszystko z menu Edycja lub wciśnij CTRL+A.
Tworzenie nowej wiązki
Aby stworzyć nową wiązkę:
1. Wybierz opcję Nowa wiązka w menu Plik. Otworzy się okno Stwórz
nową wiązkę.
2. W okienku tym wybierz lub stwórz kartotekę dla nowej wiązki.
3. W polu Szablon wybierz jedną z następujących opcji w zależności od tego
jakie ustawienia początkowe chcesz przypisać do wiązki: Domyślne
ustawienia - aby przypisać ustawienia domyślne, Aktualna wiązka - aby
przypisać ustawienia z aktualnie otwartej wiązki, Szablon wiązki (.fbt) -
aby przypisać ustawienia zapisane uprzednio w pliku.
Zwróć uwagę: Aby zapisać ustawienia wiązki w pliku, kliknij w przycisk
Zapisz na zakładce Ogólne okna dialogowego Opcje (menu
Narzędzia>Opcje). Otworzy się okno dialogowe Zapisz szablon wiązki
jako. Podaj w nim nazwę pliku. Następujące opcje zapisywane są w tym
pliku: opcje ustawiane na zakładkach Rozpoznawanie, Skanuj/Czytaj,
Formatowanie i Sprawdzanie pisowni, opcje z zakładek okna Ustawienia
formatów. Języki zdefiniowane przez użytkownika, grupy języków oraz
wzorce liter użytkownika są również zapisywane w tym pliku. Jeśli chcesz z
powrotem powrócić do ustawień domyślnych po prostu kliknij w przycisk
Praca z wiązkami
87
Domyślne na zakładce Ogólne okna Opcje. Aby wczytać ustawienia kliknij w
przycisk Wczytaj na tej samej zakładce i w okienku, które się pojawi wybierz
plik szablonu wiązki (*.fbt) zawierający zapisane uprzednio opcje.
Otwieranie wiązki
1. Wybierz opcję Otwórz wiązkę w menu Plik. Wyświetli się okno Otwórz
wiązkę.
2. W okienku Otwórz wiązkę wybierz kartotekę zawierająca potrzebną Ci
wiązkę.
Kiedy otworzysz wiązkę, dotychczas otwarta wiązka będzie automatycznie
zamknięta i zapisana.
FineReader po uruchomieniu może automatycznie otworzyć ostatnio otwartą
wiązkę (opcja Po uruchomieniu otwórz ostatnio otwartą wiązkę na
zakładce Ogólne w okienku Opcje (Narzędzia>Opcje)).
Dodawanie stron do wiązki
Wybierz opcję Otwórz obraz w menu Plik lub wciśnij CTRL+O.
W okienku dialogowym Otwórz obraz wybierz obrazy, które chcesz
otworzyć.
FineReader doda obraz do otwartej wiązki i skopiuje plik do kartoteki zawieraj
ącej wiązki.
Numer strony wiązki
Wszystkie strony w wiązce są ponumerowane. Jedna wiązka może zawierać
do 9999 stron. Numer strony wyświetlony jest w okienku Wiązka.
Aby przenumerować strony:
1. Zaznacz jedną lub wiele stron.
2. Wybierz opcję Przenumeruj strony w menu Wiązka.
3. Wpisz nowy numer dla pierwszej zaznaczonej strony (strony z najmniejszym
numerem).
Uwaga
1. Jeśli chcesz przenumerować wszystkie strony w wiązce w okienku
Przenumerowanie stron wybierz opcję Wszystkie strony.
Jeśli chcesz przenumerować tylko część wiązki:
ABBYY FineReader 5.0 Podręcznik użytkownika
88
W okienku Wiązka zaznacz strony które chcesz przenumerować.
W okienku Przenumerowanie stron zaznacz opcję Wybrane strony.
Jeśli chcesz by zaznaczone strony były przenumerowane w sposób ciągły,
wybierz opcję Ciągła numeracja stron. Przykład: strony miały numery
2,5,6, jako pierwszy numer ustawiono 1; po przenumerowaniu strony będą
posiadały numery 1,2,3. W przypadku gdyby opcja Ciągła numeracja
stron nie była włączona strony posiadałyby numery 1,4,5.
Zamykanie wiązki
Wybierz opcję Zamknij wiązkę w menu Plik.
Wiązka zostanie zamknięta i automatycznie zapisana.
Usuwanie wiązki
Zwróć uwagę: Usuwanie wiązki oznacza skanowanie całej jej zawartości tj.
wszystkich stron (obrazów i tekstu) wraz z plikami dodatkowymi jakie
stworzyłeś podczas pracy z wiązką: wzorce liter, języki zdefiniowane przez
użytkownika itd. Tak więc kasowana jest cała zawartość kartoteki zawierającej
wiązkę.
Aby skasować wiązkę wybierz opcję Usuń wiązkę w menu Wiązka.
Aby skasować stronę w wiązce:
1. Zaznacz strony(-ę) które chcesz skasować w okienku Wiązka.
2. Wybierz opcję Usuń stronę w menu Wiązka lub po prostu wciśnij klawisz
DEL.
Eksport do zewnętrznych aplikacji i formatów
89
ABBYY FineReader 5.0 Podręcznik użytkownika
90