Komputery i teksty
Dla wielu użytkowników komputer jest przede wszystkim inteligentną maszyną do pisania.
Wypełnianie skomplikowanego formularza może być szybsze na maszynie do pisania!
Jeśli wypełniamy jakiś formularz wielokrotnie warto zrobić formularz komputerowy.
Procesory do redakcji tekstu nie są prostsze w obsłudze od typowego programu do redakcji tekstu
Kategorie: edytory narzędziowe, edytory tekstu, procesory tekstu, DTP.
Edytory narzędziowe służą do pisania tekstów ASCII, np. oprogramowania, bez możliwości formatowania tekstu.
Przykłady: znakomite edytory pod Windows: TextPad i WinEdit, ze wspomaganiem pisania tekstów w TeXu i HTMLu.
Popularne w Unixie edytory narzędziowe: vi, emacs, również dostępne na PC (nie polecam).
Programy do pisania i redakcji tekstu przy pomocy komputera nazywa się zwykle edytorami tekstu.
Rozbudowane edytory = procesory tekstów.
Programy do redakcji gazet, składu dokumentów do druku określa się skrótem DTP, DeskTop Publilshing.
Pierwszy popularny program do redakcji tekstu to Wordstar, sekwencje kontrolne wprowadzone w Wordstarze używane są nadal w niektórych edytorach tekstów.
Łatwość wprowadzania poprawek i modyfikowania tekstu nie sprzyja niestety systematyczności i logice myślenia: liczba kolejnych wersji dokumentów tworzonych przy pomocy komputerów jest znacznie większa niż w czasach mozolnego pisania na maszynie.
Typowe cechy i funkcje edytorów tekstu
Tekst może być wyświetlany na stronie w:
trybie tekstowym - programy działały szybciej, ale nie mogły pokazać na ekranie nietypowych znaków, czcionek różnej wielkości czy grafiki.
trybie graficznym - pokazują tekst dokładnie w takiej formie, jak zostanie on wydrukowany, czyli w formie WYSIWYG: What You See Is What You Get (to co widzisz to dostajesz).
Szczególnie wolno działa tworzenie graficznego obrazu na ekranie przy wyborze drukarki postscriptowej.
Rozwiązaniem pośrednim jest tryb tekstowy z możliwością podglądu graficznego.
Funkcje edytora wywołuje się przez kody kontrolne, np. Ctrl, Alt lub Macro oraz klawiszy funkcyjnych F1-F12 (zależnie od systemu komputerowego) lub z rozwijalnych menu.
Edytory tekstu mają:
Poruszanie się szybko po tekście, skoki do końca i początku dokumentu, końca i początku wierszy lub akapitów, dowolnej strony, przeskakiwanie wyrazów oraz szukanie dowolnego ciągu znaków w tekście oferują wszystkie edytory.
Tryby pisania: wstawianie tekstu (insert mode), oraz zastępowanie tekstu (nadpisywanie, overwrite mode).
Poprawianie wprowadzonego tekstu; raz napisanego tekstu nigdy nie trzeba przepisywać po raz drugi, można go modyfikować dowolną liczbę razy.
Zaznaczanie bloków tekstu i wyboru elementów z menu myszą.
Szybkie kopiowanie i przenoszenia tekstu metodą "zaznacz i przenieś.
Poprawki w całym tekście dokonuje funkcja "szukaj i zamień".
Cofanie się o jeden lub więcej kroków edycji.
Wbudowane podpowiedzi i pomoc w korzystaniu z funkcji edytora, ikony reprezentujące różne funkcje.
Formatowanie tekstu, wyrównywanie do lewego, prawego lub obu marginesów, centrowanie.
Parametry strony: rozmiary, stopki, główki, numeracja stron, marginesy, odstępy między wierszami, łamy (np. dwie kolumny).
Wybór atrybutów czcionek: pochylanie, pogrubianie, podkreślanie, przekreślanie znaków, wybór wielkości (stopnia), kroju pisma, stosowanie indeksów dolnych i górnych.
Makropolecenia, czyli definiowanie często powtarzanych czynności, zapamiętanie fraz tekstu i wywołania ich w szybki sposób przy pomocy innych mechanizmów niż makropolecenia, np. przy pomocy glosariusza.
Formaty i importowanie/eksportowanie tekstu zarówno z innych edytorów tekstu jak i arkuszy kalkulacyjnych i baz danych.
Edycja wielu dokumentów jednocześnie.
Rzadziej spotykane możliwości edytorów.
Korespondencja seryjna.
Długie dokumenty - dzielenie na rozdziały, indeksy, spisy treści.
Styl dokumentu zdefiniowany w globalny sposób, szablony (templates) pozwalają ustalić styl dokumentu, łącznie z powtarzającymi się elementami tekstu - stałe elementy zabezpieczone są przed zmianami.
Automatyczna numeracja rozdziałów, rysunków, wzorów, tabel i odnośników do literatury.
Sortowanie wierszy lub wyrazów tekstu alfabetycznie, sortowanie według klucza numerycznego, sortowanie tylko w ograniczonym obszarze ekranu, np. kilku pierwszych kolumnach - w edytorach narzędziowych, ale nie procesorach tekstu.
Ramki zawierające tekst, grafikę czy tabele - przesuwanie i wyróżnianie elementów dokumentu.
Zagnieżdżanie obiektów pochodzących z innych aplikacji: wideo, grafika, dźwięk, obliczenia.
Narzędzia do rysowania i obróbki obrazu rastrowego, np. ze skanera.
Tabele i proste arkusze kalkulacyjne w tabelach.
Wstawianie notatek niewidocznych w druku, wstawianie, daty, czasu, różnych informacji o dokumencie.
Podgląd wielu stron, powiększanie i zmniejszanie ekranu, podgląd struktury dokumentu (hierarchiczny).
Zamiana liter małych na duże.
Szybkie formatowanie - przenoszenie formatowania pomiędzy akapitami.
Edytory i drukowanie
Drukować można korzystając z
czcionek sprzętowych (szybko);
traktując litery jak grafikę - wolniej ale dowolne kroje czcionek;
ładując wzorce binarne czcionek przed rozpoczęciem drukowania (downloading fonts) do pamięci drukarki.
Polskie znaki w drukarkach - trzeba uważać na wybór odpowiedniego sposobu kodowania.
Drukarki postscriptowe: teksty i rysunki w plikach postscriptowych (PS) zapisane są w sposób wektorowy, umożliwiający pełne wykorzystanie drukarek i naświetlarek o dowolnej zdolności rozdzielczej.
Interpreter języka postscript tworzy mapę rastrową, odpowiednią dla danego urządzenia drukującego.
Nie ma ,,edytorów postscriptu", tylko sterowniki postscriptowe dla drukarek, tworzacy pliki gotowe do druku.
Typografia komputerowa, rodzaje czcionek
awniej pojęcie czcionki odnosiło się do odlanych z metalu znaków używanych przy składzie drukarskim, obecnie utożsamia się pojęcie czcionki z jej wizerunkiem na papierze.
Font to zbiór znaków drukarskich. Odnosząc się do wyglądu znaków używamy najczęściej słowa czcionka, pisząc o znakach, którymi dysponuje drukarka, nazywamy je fontami.
Pięć klas pisma: szeryfowe, bezszeryfowe, pisanki, pisma gotyckie i ozdobne.
Krój pisma to komplet znaków o określonym rysunku oczka.
Kroje różnią się wydłużeniami, pogrubieniami i kształtem akcentów.
Odmiany krojów: znaki o jednakowej grubości elementów i kącie pochylenia.
Typowe odmiany to: prosta (roman font, czyli antykwa), kursywa (italik), półgruba prosta i półgruba kursywa, gruba, wąska, szeroka, jasna i ich różne kombinacje, kroje ozdobne.
Przykłady krojów pisma (Bitstream)
Kroje pisma z MS-Office, nie wszystkie w wersji PL
Stopień pisma mierzy się w punktach typograficznych (didot), w Europie 1pt=0.375 mm, w USA 1/72 cala = 0.351 mm (punkt pajki). Cycero =12 pt, garmont=10 pt.
Gęstość druku liczbę znaków na cal (cpi, character per inch), zwykle 12 cpi, druk ściśnięty 15-20 cpi, rozrzedzony (rozspacjowany) 10 lub mniej cpi.
Fonty proporcjonalne mają zmienne szerokości znaków.
Standardowe odstępy między znakami i wyrazami podawane są w % szerokości spacji a odstępy pomiędzy wierszami i akapitami w punktach lub % wysokości czcionki.
Metody regulacji odstępów (światła) między znakami: ligatury, np. ff, fi, fl, ffi, ffl.
Kerning, zaawansowana metoda regulacji światła, lub tracking, dopasowanie odstępów do stopnia pisma.
Czcionki sprzętowe (hardware fonts) i programowe (software fonts, softfonts).
Drukarki najczęściej mają kroje Courier, Times i LinePrinter, w kilku odmianach i stopniach.
Fonty rastrowe, bitmapowe, fonty mapy bitowej, dla fontów wysokich stopni duże pliki.
Fonty wektorowe, kształt znaków w postaci krzywych matematycznych.
Programy tworzące z czcionek wektorowych czcionki rastrowe nazywa się rasteryzerami.
Programy zarządzających czcionkami (Font Managers), zawierają wzorce czcionek, generatory czcionek pozwalające tworzyć nowe kroje lub modyfikować istniejące czcionki, konwertery formatów czcionek.
Technologia postscriptowa, opracowana przez firmę Adobe, uwzględnia „podpowiedzi” (hints), zawierające informacje o tym, jak mają wyglądać ładne czcionki. Kroje Adobe Postscript (Helvetica, Courier, Times, Garamond ... ) i program Adobe Type Manager (ATM), rasteryzer. Czcionek PS jest > 20 tysięcy
TrueType, standard opracowany przez firmy Apple i Microsoft, od 1990 roku, wiele krojów TrueType z polskimi znakami.
Prostszy opis matematycznym niż czcionki postscriptowe, większe plików z fontami.
Czcionki (fonty) Postscriptowe określane są jako Type 1 a TrueType jako Type 3.
OpenType - łączy zalety type1/3, stosowany w Windows 2000.
Inne formaty fontów wektorowych: Bitstream Fontware (około 300 krojów), Linotype Library (ponad 1000), Agfa Intellifont, Nimbus Q, Speedo i LXO (LaserMaster).
Ghostscript/Ghostview - darmowy program do oglądania i drukowania postscriptu na drukarkach bez interpretera PS.
TrueImage - język i rasteryzer, alternatywa firmy Microsoft dla PostScriptu? Sprawnie interpretuje fonty Type 1 i Type 3, chyba nie ma szans.
Istnieje grupa dyskusyjna Usenetu comp.fonts.
Edytory czcionek („odlewnie czcionek” czyli Type Foundry): znane przykłady programów tego typu to Publishers Type Foundry, Font Foundry, Font Monger i Fontographer.
The ITC Directory of New Typefaces prezentuje nowe kroje pisma wraz z próbkami składu.
Nie należy przesadzać z instalowaniem zbyt dużej liczby fontów - zżerają pamięć i spowalniają działanie procesorów tekstu!
Słowniki i analiza gramatyczna
Słowniki i tezaurusy - podpowiadają synonimy do danego wyrazu.
Problemy z fleksją w języku polskim.
Autokorekta - podmienianie typowych błędów.
COR, czyli „korektor polskich tekstów”, dodaje polskie znaki do tekstu, program samodzielny, obsługuje pliki ASCII i kilka starszych formatów.
Słowniki w różnych programach dostępnych na polskim rynku.
Brakuje dużych, porządnych słowników dwujęzycznych, które mógłby zastąpić słowniki w formie książkowej.
20-tomowy Oxford English Dictionary na CD-ROM, zawiera 20 milionów wyrazów.
Dobry słownik angielski Mirriam-Webster dostępny jest w Internecie.
Programy do analizy gramatycznej angielskich lub niemieckich tekstów - niezbyt inteligentne, częściej sygnalizują błędy pozorne niż rzeczywiste, czasami wyłapują literówki prowadzące do poprawnych form słów, np. „be” zamiast „by”.
Dla języka polskiego na razie takich programów nie ma.
Programy tłumaczące są marne.
Technologia NLP w systemach pomocy Office 2000.
Grafika w tekście
Większość procesorów tekstu ma wbudowane możliwości pracy z grafiką w ramkach, zestawy narzędzi graficznych do grafiki rastrowej (binarnej) i wektorowej.
Do rysunków grafika wektorowa + cliparty.
Przetwarzanie obrazu binarnego: korekta kontrastu, jasności, wygładzanie krawędzi itp.
Praca bezpośrednio ze skanerem, skalowanie grafiki.
Grafika prezentacyjna, uboższa niż w arkuszach kalkulacyjnych, rysunki jako grafika wektorowa.
Sześć podstawowych formatów grafiki prezentacyjnej.
Pliki tekstowe z grafiką, na której dokonujemy operacji, mogą być bardzo duże!
Edytory tekstu w Polsce
Problem polskich liter
Jak wywołać polskie litery?
Różne rodzaje klawiatur.
Problemy ze stacjami roboczymi.
Problemy z kopiowaniem pomiędzy aplikacjami Worda.
Polska strona ogonkowa (kopia w Sunsite) czyli jak używać polskie znaki w Internecie i nie tylko,
Tabela standardów IBM CP 852, Win1250 i innych
Wg norm RFC obowiazujacych w Internecie jedynym dopuszczalnym kodowaniem znaków narodowych w naszej części Europy jest standard ISO-8859-2 (znany też jako ISO-Latin-2).
Word - najpopularniejszy procesor tekstów; wersje Word 2.0 do WinWord'95 (Word 7)
WinWord'97 (Word 8), używa formatu Unicode;
Coraz większe pliki - w porównaniu z Wordem 2 nawet 10 x większe!
Pełno w nim błędów, zwłaszcza przy konwersji z innych formatów lub starszych wersji Worda.
Zła współpraca z formatem HTML.
Nie potrafi - jak wszystkie poprzednie wersje - zrobić dobrego postscriptu.
Liczne wirusy w makropoleceniach!
Zalety: liczne narzędzia i dodatki, najbardziej rozpowszechniony.
Tagger - narzędzia do automatycznej numeracji odnośników
Reference Manager - narzędzia do tworzenia bibliografii do procesorów Word i WordPerfect.
Word Pro i Ami Pro
Jeden z 3 najlepszych procesorów tekstu, Lotus jest obecnie własnością IBM.
Ami Pro jest w pełni spolszczony.
WordPro 97 dostępny za darmo na CD-ROMach dołączonych do PC World Komputer! Dobra współpraca z Wordem 97 (import/eksport).
QR-TEKST
Oficjalny procesor tekstu admnistracji pańsrtwowej, działa pod wszystkimi systemami operacyjnymi.
Część pakietu PerfectOffice, sprzedawana przez Corel Corporation. W niektórych krajach bardzo popularny.
ChiWriter
Ma znaczenie tylko historyczne - był to jeden z pierwszych edytorów z polskimi znakami.
TAG
Kiedyś jeden z najpopularniejszych edytorów w Polsce.
Jest konwerter Tag -> Word
Edytory shareware
Dostępne w wielu archiwach, np. Sunsite PL, wystarczą do większości zastosowań, np. PC Write.
Starsze wersje znanych procesorów bywają dostępne za darmo.
Matematyka w tekstach
MathType - edytor matematyczny do Worda, WordPerfecta i innych procesorów tekstu
Chemical Markup Language (CML) do zapisu wzorów chemicznych.
Scientific Word & WorkPlace - zgrabna integracja algebry symbolicznej i LaTeXa.
Matematyka w WWW - język MathML
TeX, LaTeX i SGML.
TeX - najlepszy system do składania zmatematyzowanych tekstów.
LaTeX - system makr dla TeXa, nieco łatwiejszy w użyciu.
LaMeX - polska wersja LaTeX
Scientific Word - prawie WYSWIG.
Metafont - pakiet do tworzenia fontów, możliwości korzystania z fontów PS.
Format dvi (device independent, czyli „niezależne od urządzenia”), pliki gotowe do druku lub oglądania na ekranie.
\begin{equation}
M=\left( \begin{array}{cc}
\sum_{i=1}^{N} \fraction{f(x_i)}{1-f^2(x_i)} & \prod_{i=1}sin^2(x_i)\\
\int_{-\infty}^{\infty}\Psi^{\ast}(x)\Psi(x)d^3 x &
\sqrt{\nabla\Phi}+\fraction{\partial\theta(\xi)}{\partial\xi\}
\end{array} \right)
\end{equation}
Doskonale rozwiązane zagadnienia kros-referencji, odnośników do literatury.
Czysty tekst ASCII, logiczna struktura dokumentu.
Darmowy! Wiele udanych darmowych implementacji.
Wady: konieczność kompilacji by zobaczyć, jak wygląda strona, trudno zmienić elementy gotowego stylu, setki szablonów stylów, nie nadaje się do robienia formularzy, cały system jest bardzo skomplikowany.
GUST, Grupa Użytkowników Systemu TeX, Wirtualna Akademia Texologii Stosowanej oraz TeXowe konferencje.
Archiwa programów i dokumentów CETAN (Comprehensive TeX Archive Network)
LyX, czyli LaTeX prawie WYSIWYG - niestety tylko pod Unixa (również Linuxa)
SGML, czyli Standardowym Uogólnionym Języku Korekty (Standard Generalized Markup Language), standard opisu informacji tekstowej.
Wordperfect 6.1 był pierwszym popularnym procesorem tekstu zawierającym narzędzia SGML.
Microsoft SGML Author dla Windows, pozwala na korzystanie z arkuszy stylu Worda do tworzenia szablonów SGML i umieszczania w plikach zarówno tabel jak i skomplikowanych wzorów matematycznych.
Edytory hipertekstu
Idea: wizjonerski artykułu Vannevara Busha z 1945 roku, książka Teda Nelsona „Computer Lib and Dream Machines” (1970).
Projekt Xanadu - Nelson wyobrażał sobie, że pewnego dnia możliwy będzie dostęp do dowolnej informacji kiedykolwiek opublikowanej. Każda nowa idea miałaby zostać zintegrowana z dostępną już wiedzą a odwoływanie się do niej automatycznie związane być miało z cytowaniem jej autora. Dzięki HTML tak się stało!
Uproszczony hipertekst pozwala na hierarchiczną organizację dokumentu, pokazując tytuły rozdziałów czy podrozdziałów i pozwalając na rozwinięcie pełnego tekstu dowolnie wybranych fragmentów - edytory „outliners”, czyli podgląd hierarchiczny.
HyperCard, prosty program dla Macintoshy, pozwalający tworzyć sobie bazy danych składających się z kart połączonych przez hiperlinki.
Językiem pozwalającym sterować „hiperkartą” jest HyperTalk.
SuperCard i SuperTalk, pozwalają na większą swobodę w używaniu dźwięku i grafiki.
Guide - edytor hipertekstu, do organizacji informacji i opracowywania dokumentacji przez poważne wydawnictwa (np. Elsevier).
Systemy autorskie i HTML
Toolbook (Asymetrix) hipertekstowy edytor + multimedialne wstawki, system do tworzenia, zarządzania i udostępniania materiałów do nauki w rozproszonym środowisku (Distributed Learning).
Wersja Toolbook II zawiera HTML oraz Java, ponad 200 appletów pomaga w tworzeniu materiałów edukacyjnych, zdalnym prowadzeniu egzaminów i ocenie wyników.
Przeglądarki WWW mogą używać darmowego rozszerzenia (plug-in) o nazwie Neuron, pozwalającego na bezpośrednie oglądanie dokumentów stworzonych w Toolbooku.
Mediaview - bardzo zaawansowany edytor multimedialny, integrujący tekst, grafikę, wideo, animację, dźwięk, matematykę. „Żywy” tj. interaktywny dokument, w którym naciśnięcie elementu ekranu wywoła sekwencję wideo czy zamieni zaszyfrowany napis na rysunku.
Mosaic, NCSA (National Center for Supercomputing Applications) - pierwsza realizacja HTML.
HTML ( Hyper text Mark-up Language); standard HTML 3.2 (początek 1997 roku)
Liczne kursy HTML i edytory HTML po polsku!
XML - Extensible Markup Language - następca HTML?
Microsoft obiecuje używanie XML ale mu się nie udało!
Publikacje i książki elektroniczne (ebook)
Adobe Acrobat , „przenośne pliki dokumentów" PDF (Portable Document File)
Pliki PDF można drukować tak, jak pliki postscriptowe, lub "destylować" z plików postscriptowych.
W plikach PDF można szukać tak, jak w plikach tekstowych.
Powieść S. Kinga w 2000 roku tylko w sieci; dostępne wydania "Newsweeka" i innych gazet.
Powieść Krystyny Kofty w 2000 roku w Internecie - nie dla elektronicznych książek.
Księgarnia Merlin przedstawia pierwsze publikacje przedpremierowe w PDF.
Inne formaty elektroniczne - bałagan: OEB (Open E-Book), PDB, LIT (Microsoft)
Odtwarzane na urządzeniach czytających, np. Softbook, RocketBook, Softbook, EBookman, Cybook.
Programy do czytania: Microsoft Reader, Glassbook Reader, eBook Reader.
No Hands, technologia „Cyfrowego Papieru" ( Digital Paper, DP), oprogramowanie Common Ground dla Windows (Common Ground Software)
Edytory wielojęzyczne
Rozszerzony alfabet łaciński, grecki lub cyrilica - łatwo.
Arabski, hebrajskim od prawej do lewej.
W Indiach jest kilkadziesiąt rozpowszechnionych rodzajów pisma, bardzo różnorodnych.
Pisma ideograficzne: chiński, koreański i japoński.
Multilingual Scholar (MLS), UniVerse - ponad 60 języków.
DTP - skład komputerowy
DeskTop Publishing (DTP), czyli przygotowywanie profesjonalnych publikacji książek i gazet na biurku.
Automatyzacja czynności wykonywanych przez drukarzy i redaktorów technicznych.
Typowe możliwości programów DTP (niektóre z nich maja również dobre procesory tekstów) to:
złożona kompozycja układu strony, używanie wielu szpalt z grafiką oblewaną przez tekst, możliwości automatycznej zmiany układu strony przez rezerwowanie miejsca na grafikę wprowadzaną ze skanera, z programów tworzących lub przetwarzających grafikę rastrową i wektorową
możliwości precyzyjnego określania gęstości znaków oraz innych odstępów między słowami, wierszami, wyrównywania marginesów itd, edycja światła fontów
automatyczne numerowanie obiektów, tworzenie odnośników, spisów treści, indeksów
manipulowanie grafiką (skalowanie, obracanie), rasteryzacja i retuszowanie
bogaty zestaw fontów, automatyczne dzielenie wyrazów
wydruk na dowolnych urządzeniach drukujących, separacja kolorów przy druku na kolorowych naświetlarkach.
Najważniejsze programy: Ventura (Corel Inc.), PageMaker (Aldus Corp.), FrameMaker (Adobe), QuarkXPress, PagePlus 2.0, Calamus SL
Jak uniknąć przepisywania tekstu: programy OCR
Programy OCR nie rozpoznają pisma ręcznego, a jeśli rozpoznają (np. w komputerach klasy Penbook) to tylko drukowane, oddzielone od siebie litery, a i to nie najlepiej.
Im lepsza jest jakość druku skanowanego dokumentu tym mniej błędów w OCR.
Wyniki zależą od wielkości czcionki (stopnia pisma) - przy zbyt małych literach możemy dostać same błędy.
Skaner należy ustawić na dużą zdolność rozdzielczą (300 dpi).
Recognita, jeden z najbardziej zananych programów OCR, drogi.
TypeReader Profesional (ExperVision Corp.) zachowuje układ dokumentu, włącznie z tablicami i elementami graficznymi.
Oparty na algorytmie uczenia się na błędach, rozpoznaje ponad 2000 krojów pisma.
Pióra skanujące z OCR: np. IRIS, piórowy skaner ręczny z OCR, PRIMAX International B.V