- 1 -
Lighten PDF Converter OCR
Wersja 3.5.0.
Portable
http://www.lightenpdf.com/pdf-converter-ocr.html
http://www.lightenpdf.com/product-tutorials/pdf-converter-ocr-win-tutorial.html
Konwerter PDF i czytnik OCR
Przekład
Robert Wiśniewski
http://chomikuj.pl/bobwis
Program Lighten PDF Converter OCR Pro jest profesjonalną wersją konwertera plików PDF.
Pomaga on użytkownikom w łatwym przekształcaniu plików PDF do formatów Microsoft Word, Excel,
PowerPoint, CSV, Text i do formatów obrazów zachowaniem oryginalnego formatowania z możliwie
największą dokładnością. Korzystając z zaawansowanej funkcji OCR można wykonywać
rozpoznawanie tekstu oraz wyciągać tekst ze skanowanych plików PDF. Istnieje wiele aplikacji firmy
Lighten Software do konwersji różnych formatów przeznaczonych dla profesjonalnych urzędów,
uczelni i małych firm.
- 2 -
Wersja bezpłatna Lighten PDF Converter OCR 3.5.0 Portable pozwala na przekształcanie plików
PDF do 6 różnych formatów dokumentów takich jak: Word (.docx lub .doc), Excel (.xlsx), PowerPoint
(.pptx), jak również do plików tekstowych (.txt), CSV (.csv), (.rtf) oraz obrazów (.jpeg).
Program ten również rozpoznaje i wyciąga teksty ze skanowanych plików PDF za pomocą
wbudowanego modułu OCR (Optical Character Recognition), korzystając z 10 języków takich jak:
angielski, francuski, hiszpański, holenderski, niemiecki, polski, portugalski, rosyjski, szwedzki i włoski.
Można przekształcać pliki PDF automatycznie lub korzystać z dostępnych opcji pozwalających na
dostosowywanie tworzonych plików wyjściowych. Przykładowo, można ustawiać jakość tworzonego
pliku obrazu grafiki, konwertować wszystkie lub tylko wybrane strony do Worda albo tylko wybrane
arkusze do Excela
Inne możliwości programu:
1. Samodzielny, nie wymaga instalowania programów MS Office ani Adobe
2. Obsługuje pliki PDF z ograniczeniami kopiowania i drukowania
3. Wbudowany czytnik pozwala na przeglądanie plików PDF przed konwersją
4. Możliwość jednoczesnej konwersji wielu plików PDF na raz
Wymagania systemowe
Systemy operacyjne:
Microsoft Windows® 8
Microsoft Windows® 7
Microsoft Windows® Vista
Microsoft Windows® XP (wszystkie wersje)
Zalecany sprzęt:
Procesor 2GHz
1 GB RAM
- 3 -
Przewodnik
do programu
Lighten PDF Converter OCR
Wprowadzenie
Konwerter PDF sześć w jednym oferuje zaawansowane funkcje OCR oraz pozwala na łatwe
przekształcanie plików PDF do formatów Word, PowerPoint, Excel i innych.
Operacje podstawowe:
1. Otwieranie i dodawanie plików
2. Wybieranie opcji wyjścia
3. Rozpoczynanie konwersji
Opcje wyjściowe:
1. PDF do Excel
2. PDF do Text
3. PDF do CSV
4. PDF do JPG
Konwersia OCR:
1. Uaktywnienie funkcji OCR
2. Wybór języka dokumentu
Praca z konwerterem plików PDF
Dodawanie plików PDF
Uruchomić aplikację i kliknąć przycisk Add Files w pasku narzędzi, po czym wybrać plik PDF
w otworzonym okienku dialogowym. Można na raz dodawać dowolną liczbę pików PDF. Na liście
ukażą się importowane pliki.
Kliknięcie przycisku Remove, usuwa zaznaczony plik z listy, a kliknięcie przycisku usuwa wszystkie
pliki z tej listy.
- 4 -
Wybieranie opcji wyjścia
1. Wybór formatu wyjścia – Na rozwijalnej liście Output Format wybrać wymagany format
wyjściowy:
Microsoft Office formats - Word(.docx), Powerpoint(.pptx), Excel(.xlsx); CSV(.csv),
plain text (.txt) oraz image format (.jpg).
2. Wybór konwertowanych stron – W sekcji Output Setting można wybrać opcję konwersji
wszystkich stron All Pages pliku PDF lub tylko określonych stron Select Particular Pages.
W tym drugim przypadku można podać dowolny numer strony lub ich zakres, oddzielając
poszczególne strony przecinkami, np. 1, 3-5. 12.
3. Wybór folderu wyjściowego – W sekcji Output Folder kliknąć przycisk Open aby otworzyć
folder wyjściowy albo kliknąć przycisk Browse aby wyszukać i zmienić folder wyjściowy.
Uruchamianie konwersji
Kliknąć przycisk Convert aby uruchomić konwersję zaznaczonego pliku PDF.
Po zakończeniu konwersji można kliknąć łacze pod nagłówkiem kolumny Output File aby otworzyć
przekonwertowany plik w odpowiednim programie.
- 5 -
Wprowadzenie do OCR
Gdy mamy skanowany plik PDF, musimy uaktywnić opcję optycznego rozpoznawania obrazów OCR.
Moduł ten może rozpoznawać i wyciągać informacje tekstowe ze skanowanych dokumentów takich
jak: PDF, TIFF, lub inne plik obrazów. Bliższe informacje o OCR-
kliknij tutaj
.
Jak korzystać z funkcji OCR
1. Uaktywnić funkcję OCR – Kliknąć przycisk OCR Option.
2. Ustawić opcje OCR – W otworzonym okienku dialogowym wybrać na rozwijalnej liście
Language język dokumentu źródłowego (dostępny język polski). Jest to bardzo ważne dla
zapewnienia dokładności pracy OCR.
Wskazówki Tips dotyczące zwiększania dokładności OCR –
Kliknij tutaj
.
Można dostosowywać opcje różnych formatów wyjściowych OCR przyciskiem Output Settings.
Gdy przycisk ten jest nieaktywny, format wyjściowy OCR dla aktualnego pliku jest niedostępny.
Opcje OCR są dostępne dla poniższych typów plików:
PDF do Excel – Konwertuje cały dokument do jednego arkusza lub każdą stronę do innego
arkusza.
Można również zachować oryginalne formatowanie pliku PDF.
PDF do CSV – j.w.
PDF do TXT – Po wybraniu opcji Show Page Number, po każdej stronie zostanie dodany
separator
PDF do obrazu – Wybranie opcji 100 % nie zmienia rozmiaru obrazu po konwersji.