I. CHARAKTERYSTYKA PLIKÓW TEKSTOWYCH.
Co to jest plik?
Plik jest to ciąg zer i jedynek, czyli ciąg bitów. Bity te słu\ą do zapisania określonej informacji -
na dysku, dyskietce, płycie CD-ROM lub DVD.
Innymi słowy ka\dy plik jest nieprzerwanym ciągiem zer i jedynek dlatego aby wiedzieć
jak go odczytać musimy nauczyć się rozró\niać formaty plików. Ka\dy format pliku powiązany
jest z odpowiednim oprogramowaniem.
Co to jest EDYTOR TEKSTOWY?
Edytor tekstowy lub inaczej procesor tekstowy jest to program komputerowy słu\ący
do przetwarzania tekstu. Przetwarzanie tekstu to jego wprowadzanie, modyfikowanie
oraz przeglądanie.
Zaawansowane edytory oferują funkcje składu komputerowego, czyli łączenia tekstu z grafiką,
formatowania układu tekstu (np. tworzenie kolumn tekstu). Mają równie\ funkcje sprawdzania
pisowni (ortografia i gramatyka), pisania równań matematycznych, tworzenia ozdobnych efektów
tekstowych. Często posiadają wbudowane proste edytory graficzne, pozwalające na tworzenie
lub szybką korektę umieszczanej w dokumencie grafiki.
DOC - Microsoft Word
+ Zaawansowana edycja tekstów.
" Zmiana właściwości czcionki (krój, kolor, styl).
" Aączenie grafiki i tekstu.
" Mo\liwość dodawania komentarzy.
" Mo\liwość wykorzystania wtyczek Microsoft - edytor równań, WordArt (teksty 3D),&
+ Jeden z najbardziej rozpowszechnionych formatów plików tekstowych.
+ Pliki DOC mogą zawierać w sobie programy (makra).
+ Pliki mogą być zabezpieczane hasłem.
- Wygląd dokumentu mo\e ulec zmianie (uszkodzeniu) jeśli plik zostanie otwarty w innej wersji
programu ni\ ta, w której został stworzony.
RTF - tekst formatowany (rich text format)
Pliki RTF zostały opracowane przez Microsoft w 1997r. Do międzyplatformowej wymiany informacji.
Są domyślnym formatem dla programu WordPad (Microsoft Windows) oraz TextEdit (Mac OS X).
+ Uniwersalny format plików tekstowych.
+ Mogą być otwierane przez większość edytorów tekstowych.
+ Pozwala na zaawansowane formatowanie tekstu.
+ Wygląd dokumentów nie zmienia się w zale\ności od wersji oprogramowania.
+ Mo\e zawierać elementy graficzne oraz tabele.
- Du\y rozmiar plików.
TXT - czysty tekst.
+ Pliki TXT mają bardzo małe rozmiary.
+ Mogą być odczytane na ka\dym komputerze.
- Nie pozwalają na formatowanie tekstu.
- Nie mo\na w nich umieszczać tabel ani elementów graficznych.
HTML - pliki stron www - hipertext markup language
+ Mo\na je odczytać w przeglądarkach stron www oraz w edytorach tekstu.
+ Pliki mają niewielkie rozmiary.
+ Dzięki mo\liwości tworzenia hiperłączy są łatwe w nawigacji.
+ Pliki HTML mo\na tworzyćprzy u\yciu edytora tekstu lub specjalnego edytora html.
Nie jest konieczna znajomość języka html.
+ Tekst mo\e być formatowany.
+ Mo\na tworzyć tabele i wstawiać elementy graficzne.
- Drukowanie plików html nie jest "przyjazne" dla u\ytkownika.
mgr in\. Alicja Pituła-Wilczyńska
PDF - portable document format
Jest to format słu\ący do prezentacji, przenoszenia i drukowania treści tekstowo-graficznych.
Został stworzony przez firmę Adobe Systems.
Pliki PDF mo\na przeglądać w specjalnej darmowej przeglądarce Adobe Acrobat Reader.
Instytucje rządowe, edukacyjne, biznesowe oraz inne zaadaptowały pliki PDF, aby zminimalizować
przepływ papierowych dokumentów. Równie\ dokumentacja dołączana do oprogramowania
lub sprzętu komputerowego (np. pliki pomocy, samouczki, tutoriale, instrukcje obsługi) przenoszona
jest poprzez pliki PDF.
+ Pliki PDF często klasyfikowane są jako pliki graficzne, ze względu na specyficzne
właściwości: na ka\dym komputerze dokument będzie wyglądał tak samo. Zachowane
są czcionki, obrazy oraz układ dokumentu.
+ Pliki mają stosunkowo niewielkie rozmiary.
+ Obsługują hiperłącza, dzięki którym nawigacja jest bardzo ułatwiona.
+ E-ksią\ki wykorzystują ten format, ze względu na mo\liwość tworzenia interaktywnego spisu
treści oraz bardzo utrudnioną modyfikację treści dokumentu.
+ Są bardzo "przyjazne" w drukowaniu.
+ Pozwalają na nanoszenie komentarzy.
+ Istnieje mo\liwość tworzenia interaktywnych formularzy.
+ Dzięki mo\liwości szyfrowania są to bezpieczne pliki. Jest to standardowy format
dla bezpiecznej i niezawodnej dystrybucji elektronicznych dokumentów oraz formularzy. Mo\na
ustalić specjalne prawa dostępu do plików PDF, ustalić hasło dla pliku albo podpisać plik
za pomocą podpisu cyfrowego.
+ Istnieje wiele darmowych aplikacji do konwersji plików tekstowych do formatu PDF.
+ Przeglądarka Aprobat Leader ma wbudowanych wiele funkcji ułatwiających wyszukiwanie
dokumentów (biblioteczka), a tak\e istnieje mo\liwość czytania treści dokumentu
przez przeglądarkę (niestety tylko w języku angielskim).
- Utworzony plik PDF nie mo\e być edytowany bez posiadania odpowiednich uprawnień
oraz odpowiedniego oprogramowania.
II. OCR OPTYCZNE ROZPOZNAWANIE TEKSTÓW.
Po co mi skaner?
(szafy pełne papierów mo\na zamienić na pudełko płyt CD lub DVD!).
1. Archiwizacja dokumentów
(album rodzinny zapisany na dysku komputera)
2. Archiwizacja fotografii .
3. Naprawa starych dokumentów. Retusz fotografii. Wczytywanie dokumentów tekstowych.
4. Kola\e, fotomonta\e. Kalendarze, zaproszenia, kartki z \yczeniami, biuletyny, gazetki
Szczegóły obróbki zdjęć na zajęciach z grafiki.
ścienne. Rodzinne strony WWW.
5. Tłumaczenie tekstów. Dzięki funkcji OCR mo\na wczytać tekst w jednym języku, a następnie
u\ywając odpowiednich programów tłumaczących przeczytać go w innym języku.
6. Wielofunkcyjne narzędzie biurowe:
o
Kopiarka, o ile do komputera jest równie\ podłączona drukarka.
o
Fax, o ile komputer łączy się z siecią Internet przy u\yciu modemu.
7. Mo\liwość skanowania kliszy fotograficznych.
Oprogramowanie dostępne do obsługo skanerów jest bardzo proste w obsłudze.
Dodatkowe programy graficzne pozwalają na szybką korekcję skanowanych obrazów:
Po zeskanowaniu czystego tekstu mo\na wydrukować go w bardziej atrakcyjnej formie, dodając
zdjęcia, obrazki, kolorując fragmenty tekstu, u\ywając dekoracyjnych czcionek.
Jak działa skaner?
Skaner zamienia obraz drukowany na postać cyfrową.
Oczy ludzkie: widzimy kolory dzięki falom światła o ró\nych częstotliwościach i ampitudach,
odbijanym od poszczególnych obiektów. Fala światła to DANE ANALOGOWE.
Skaner umo\liwia zmianę danych analogowych na postać CYFROW.
mgr in\. Alicja Pituła-Wilczyńska
Budowa skanera
CCD - charged-coupled device = układ ze sprzę\eniem ładunkowym - podstawowa część skanera
- układ czujników (światłoczułych komórek), które linie po linii są przesuwane wzdłu\ strony
i konwertują poziomy światła odbijane od skanowanej powierzchni na dane cyfrowe. Układ CCD
przesyła dane do przetwornika analogowo-cyfrowego - tu następuje konwersja ładunków
elektrycznych na dane cyfrowe.
CIS - contact image sensor - układ krzemowy, który spełnia funkcje CCD oraz przetwornika A-C,
jednak rezultaty są gorszej jakości. Skanery oparte o technologię CIS oferują ni\sza rozdzielczość.
Na jakość skanera wpływa liczba i jakość fotosensorów. Określana jest mianem: rozdzielczości
optycznej skanera. Mówi ona ile punktów zmieści się na jeden cal skanowanego obrazu.
Rozdzielczości skanerów podawana jest w jednostce: DPI - dot-per-inch = punktów-na-cal
Starsze skanery miały rozdzielczość do 300dpi. Obecnie standardem jest ju\ 1200-2400dpi.
Wartość 300dpi oznacza, \e na ka\dy cal zeskanowanego obrazu przypada 300 próbek koloru.
Często w materiałach reklamowych podawana jest równie\ rozdzielczość pionowa i pozioma. Rozdzielczość
pionowa ma 2 razy większą wartość, poniewa\ mo\na przesunąć o połowę odległość pomiędzy dwoma rzędami
skanowania. Rozdzielczość interpolowana informuje, \e pomiędzy ka\dy kolorowy punkt mo\na wstawić inny
z uśrednioną wartością koloru. Skaner mający rzeczywistą rozdzielczość 600dpi mo\e być tym sposobem
reklamowany jako 9600x9600dpi.
Skanujemy.
1. Układamy dokument skanowaną stroną na szklanej powierzchni.
2. Domykamy pokrywę skanera - ma ona dociskać dokument do szklanej powierzchni
skanującej.
3. Wciskany przycisk skanowania.
4. Wzdłu\ skanowanego dokumentu przesuwa się specjalna lampa. Światło odbija się
od powierzchni dokumentu i trafia do zestawu luster.
5. Lustra przekazują fale świetlne do soczewek.
6. Soczewka wysyła dane do CCD.
7. CCD rejestruje ładunki analogowe i kieruje je do przetwornika A-C.
8. Konwerter A-C zamienia napięcie na dane cyfrowe.
9. Dokument zapisywany jest w pamięci komputera.
Jaki du\y będzie plik?
Skanujemy zdjęcie o wymiarach 10x12,5cm (4x5 cali) z rozdzielczością 150dpi.
(4''x150dpi) x (5''x150dpi) = 450 000 pikseli
Skanując zdjęcie w kolorze musimy uwzględnić kanały kolorów RGB:
450 000 pikseli x 3 bajty przestrzeni dyskowej = 1 350 000 bajtów = 1,35mb
Dlaczego zeskanowany obraz wydaje się taki du\y na monitorze?
Związane jest to z mo\liwościami monitora. Na ekranie mo\na wyświetlić 72-75 punktów na cal,
dlatego obraz skanowany z rozdzielczością 150dpi będzie wydawał się 2 razy większy
ni\ na papierze.
Drukowanie
Po wydrukowaniu obrazek znowu będzie takiej samej wielkości jak przed skanowaniem,
poniewa\ drukarka atramentowa bez problemu poradzi sobie z rozdzielczością 150dpi.
Bity.
Ilość bitów przekłada się na jakość skanowanego obrazu. Im więcej bitów tym większa dokładność.
Co to jest bit?
Podstawowa jednostka miary binarnej, reprezentowana przez 0 lub 1.
O co chodzi?
24-bitowy skaner pobiera 8 bitów z ka\dego z 3 kanałów koloru (RGB).
Skanery 30-bitowe korzystają z głębi koloru rzędu 10 bitów, a 36-bitowe rzędu 12 bitów.
Dzięki temu prawdopodobieństwo utraty danych zmniejsza się, obraz będzie wiernej
przekazany.
mgr in\. Alicja Pituła-Wilczyńska
Co to jest piksel?
Ka\dy obraz rastrowy (zdjęcia) składa się z siatki kolorowych punkcików to właśnie są
piksele.
RGB red-green-blue.
Kolory tworzone są przy u\yciu 3 podstawowych barw: czerwonej, zielonej i niebieskiej.
Z ich połączenia powstają wszystkie pozostałe kolory. Są to "współrzędne" kolorów.
28=256 - ka\da współrzędna mo\e przyjmować wartość z zakresu 0-255.
Z tych trzech kolorów mo\e powstać ok. 16mln barw. Nale\y pamiętać, \e drukarka nie potrafi
ich wszystkich wydrukować. Tylko na monitorze mo\liwe jest wyświetlenie ich wszystkich.
Więcej na zajęciach z grafiki.
Do codziennych zastosowań, takich jak skanowanie i drukowanie zdjęć rozdzielczość 150-300dpi jest
wystarczająca.
Kiedy warto zwiększyć rozdzielczość skanowania?
Podczas skanowania obrazów czarno-białych.
Kiedy chcemy skanować z większą precyzją powiększając oryginalny dokument.
Planując zaawansowaną edycję skanowanej grafiki.
Jeśli naszym celem jest pozyskanie tekstu, najlepiej będzie u\yć rozdzielczości 300dpi oraz 2-
bitowej głębi kolorów (czarno-biały obraz).
OCR - optyczne rozpoznawanie tekstu.
Programy OCR umo\liwiają zamianę tekstu drukowanego na dokument tekstowy elektroniczny,
który mo\na edytować w dowolnym edytorze tekstowym.
Jak to się robi?
Proces rozpoznawania pisma jest podzielony na 4 etapy: wczytanie dokumentu do pamięci
komputera, podział dokumentu na obszary (zony) i rozpoznanie tekstu w obszarach (zonach),
korekcja tekstu oraz eksport odczytanych danych do zewnętrznych systemów.
1. Skanujemy obraz zawierający tekst. Skaner tworzy nam "zdjęcie" tekstu.
2. W programie do OCR otwieramy obrazek z zeskanowanym tekstem. Mo\e to być plik
graficzny, plik PDF lub obraz pobrany bezpośrednio ze skanera.
3. Wybieramy funkcję ROZPOZNAJ.
4. Eksportujemy rozpoznany tekst do wybranego programu (najczęściej edytora
tekstowego).
5. Zapisujemy nasz dokument na dysku komputera.
Współczesne programy OCR pozwalają na sprawdzanie poprawności pisowni w dokumencie,
szybką edycję tekstu, zmianę kroju czcionki, oznaczenie części rozpoznanej strony jako grafikę
i traktowanie jej jak obrazek umieszczony pomiędzy linijkami tekstu.
III. WYSZUKIWANIE INFORMACJI TEKSTOWEJ ORAZ OPROGRAMOWANIA.
Mój komputer.
Podstawową zasadą zarządzania informacją tekstową na własnym komputerze jest zapisywanie
plików w sposób logiczny i łatwy do odszukania. Systemy operacyjne umo\liwiają nam to dzięki
strukturze zapisywania pików w folderach, mo\liwości tworzenia opisów plików oraz
rozszerzonym nazwom plików, pozwalającym na dokładne nazwanie pliku.
Jeśli mimo wszystko zgubimy interesujące nas pliki nale\y skorzystać z funkcji WYSZUKAJ.
W Microsoft Windows znajduje się ona w menu Start oraz jest dostępna w oknie Eksploratora
(ikona lupki). Po uruchomieniu funkcji mamy mo\liwość podania kryteriów wyszukiwania, dzięki
którym system odszuka interesujący nas plik.
Internet.
W celu wyszukania interesującej nas informacji musimy skorzystać z wyszukiwarki.
Wyszukiwarka to specjalny program, który przegląda za nas strony dostępne w wirtualnym
świecie.
mgr in\. Alicja Pituła-Wilczyńska
Mo\emy skorzystać z prostego wyszukiwanie, wpisując po prostu słowa-klucze do okna
wyszukiwarki, lub wybrać funkcję zaawansowanego przeszukiwania sieci. W przypadku
wyszukiwania zaawansowanego musimy zdefiniować odpowiednie kryteria.
Najpopularniejszą wyszukiwarką jest http://www.google.pl. Google posiada równie\ moduł
przeszukiwania sieci pod kątem określonych typów plików lub określonej dziedziny
(np. przeszukuje wyłącznie portale edukacyjne). Mo\emy równie\ zdefiniować w jakim języku
mają być szukane informacje.
Oprogramowanie z sieci.
Szukając oprogramowania w Internecie nale\y pamiętać, \e nie wszystkie dostępne programy
mo\emy pobierać i u\ywać legalnie! Legalne programy posiadają licencje typu freeware lub open
source (oprogramowanie całkowicie darmowe) albo shareware lub trialware (oprogramowanie
do testów mo\emy go u\ywać przez pewien wyznaczony okres czasu, po którym musimy
program usunąć z dysku lub wykupić na niego licencję). Istnieją równie\ programy w wersji
demonstracyjnej (demo), mo\na ich u\ywać bezpłatnie, jednak mają one zablokowane niektóre
funkcje.
Wiele darmowych programów mo\na znalezć przeglądając strony internetowe firm produkujących
oprogramowanie komputerowe. Takie firmy udostępniają bezpłatnie wersie próbne nowych
programów, a czasem równie\ mo\na za darmo ściągnąć starsze wersje programów
komercyjnych. Zaletą korzystania ze stron producentów jest pewność, \e ściągane programy są
wolne od wirusów i innych szkodliwych dla nas programów.
Alternatywą dla stron producentów są internetowe archiwa z darmowym oprogramowaniem. Są to
du\e bazy programów. Mo\emy w nich znalezć opis funkcji danego programu. Archiwa posiadają
wbudowane wyszukiwarki programów, mamy jednak równie\ mo\liwość przeglądania
kontekstowego całej bazy.
Przykładami mogą być tutaj serwisy: www.thefreesite.com, www.zdnet.com,
www.download.com, www.tucows.com, www.dobreprogramy.pl, www.download.com, ...
IV. ARCHIWIZACJA PLIKÓW.
Kompresja danych.
Wadą dysków komputerowych jest to, \e nie rosną w miarę naszych potrzeb. Dlatego właśnie
wymyślono programy pakujące, które zmniejszają rozmiar pliku na dysku komputera.
Kompresja danych polega na zmianie sposobu zapisu informacji w taki sposób, aby zmniejszyć
objętość zbioru, nie zmieniając przenoszonych informacji. Innymi słowy chodzi o wyra\enie tego
samego zestawu informacji, lecz za pomocą mniejszej liczby bitów. Kompresja mo\e być
bezstratna (z postaci skompresowanej mo\na odzyskać identyczną postać pierwotną) oraz stratna
(w której pełne odzyskanie danych jest niemo\liwe, jednak główne właściwości które nas interesują zostają
zachowane dotyczy to głównie muzyki oraz grafiki).
Skompresowane pliki mają najczęściej rozszerzenie ZIP lub RAR, jednak mogą się zdarzyć
równie\ inne formaty, np. ACE. Format pliku zale\y od rodzaju u\ytej kompresji oraz programu
archiwizującego.
Pakery.
Pliki, nie tylko tekstowe, mo\na spakować u\ywając jednego z wielu dostępnych na rynku
programów. Aby spakować plik wystarczy uruchomić odpowiedni program i w nim wskazać plik,
który chcemy skompresować. Mo\emy wybrać stopień kompresji, czyli jak bardzo ma
się zmniejszyć nasz plik oraz czy chcemy archiwum (czyli spakowany plik) zabezpieczyć hasłem.
Mo\emy schować więcej ni\ jeden plik do archiwum.
Zaletą tworzenia archiwów jest mo\liwość podzielenia pliku lub grupy plików na mniejsze porcje,
tak aby mo\na było przenieść jeden du\y plik na kilku dyskietkach. Taki podział plików
jest równie\ przydatny, kiedy chcemy wysłać plik pocztą internetową, a jego rozmiar nie pozwala
nam na zrobienie tego bez spakowania i podziału pliku na mniejsze części.
Do najpopularniejszych nale\ą: 7-Zip, PowerArchiver, UltimateZip, ZipGenius, QuickZip, ArchiveXP,
WinZIP, WinRAR, ArchiveExpert, FilZip, PicoZip, PowerZip, ZippHO, ZipWave, EnZip, ZipCentral.
WinZIP WinRAR
WinZIP WinRAR
WinZIP WinRAR
mgr in\. Alicja Pituła-Wilczyńska
Dekompresja.
Aby skorzystać z pliku, który wcześniej umieściliśmy w archiwum musimy go najpierw
rozpakować. W tym celu uruchamiamy program archiwizujący i wybieramy funkcję ROZPAKUJ.
Wybieramy miejsce na dysku naszego komputera, w którym mają się pojawić rozpakowane ju\
dane i zatwierdzamy klikając OK.
Kopie zapasowe.
Archiwa tworzy się równie\ z myślą o zapasowych kopiach plików. Jeśli posiadamy na dysku
wa\ne dokumenty, warto posiadać ich kopię, na wypadek uszkodzenia oryginału. Nie warto
jednak zapychać dysku, lepiej wykorzystać do tego program kompresujący.
V. DODATKOWE yRÓDAA INFORMACJI.
1. Winston Steward, "Tajniki skanowania", ISBN 83-7279-219-4, Mikom, Warszawa 2002r.
2. Mirosława Kopertowska, Przetwarzanie tekstów , ISBN 83-7279-403-0, Warszawa 2004r.
3. Witold Sikorski, Podstawy technik informatycznych , ISBN 83-7279-401-4, Warszawa
2004r.
4. http://www.microsoft.com/downloads/details.aspx?FamilyID=ac57de32-17f0-4b46-9e4e-
467ef9bc5540&displaylang=en
5. http://www.wikipedia.org/
6. Pliki pomocy programów:
a. Microsoft Office - Word
b. Adobe Acrobat Reader
c. Abby Fine Reader
d. WinRar
mgr in\. Alicja Pituła-Wilczyńska
Wyszukiwarka
Podobne podstrony:
Ćwiczenie 3 Parsowanie plików tekstowych i binarnychCzytanie plików tekstowychCharakterystyka systemów plikówCharakterystyka systemów plikówEscherichia coli charakterystyka i wykrywanie w zywności Cz INauka Kompresowanie plików07 Charakteryzowanie budowy pojazdów samochodowychI grupa układu pierwiastkow i charakterystyka najważniejszych pierwiaskówSentymentalno romantyczny charakter miłości Wertera i LottyWypracowanie Ten Obcy Charakterystyka Pestki2 Charakterystyki geometryczne figur płaskich (2)Nowy dokument tekstowyNowy Dokument tekstowyCięcie pliku ac3, Ekspresowe cięcie pliku ac3, Łączenie plików audiowięcej podobnych podstron