Komputery i teksty


Komputery i teksty 0x01 graphic

0x08 graphic
Dla wielu użytkowników komputer jest przede wszystkim inteligentną maszyną do pisania.
Wypełnianie skomplikowanego formularza może być szybsze na maszynie do pisania!
Jeśli wypełniamy jakiś formularz wielokrotnie warto zrobić formularz komputerowy.

Procesory do redakcji tekstu nie są prostsze w obsłudze od typowego programu do redakcji tekstu

Kategorie: edytory narzędziowe, edytory tekstu, procesory tekstu, DTP.

Edytory narzędziowe służą do pisania tekstów ASCII, np. oprogramowania, bez możliwości formatowania tekstu.

Przykłady: znakomite edytory pod Windows: TextPad i WinEdit, ze wspomaganiem pisania tekstów w TeXu i HTMLu.

0x01 graphic

Popularne w Unixie edytory narzędziowe: vi, emacs, również dostępne na PC (nie polecam).

Programy do pisania i redakcji tekstu przy pomocy komputera nazywa się zwykle edytorami tekstu.

Rozbudowane edytory =  procesory tekstów.
Programy do redakcji gazet, składu dokumentów do druku określa się skrótem DTP, DeskTop Publilshing.

Pierwszy popularny program do redakcji tekstu to Wordstar, sekwencje kontrolne wprowadzone w Wordstarze używane są nadal w niektórych edytorach tekstów.

Łatwość wprowadzania poprawek i modyfikowania tekstu nie sprzyja niestety systematyczności i logice myślenia: liczba kolejnych wersji dokumentów tworzonych przy pomocy komputerów jest znacznie większa niż w czasach mozolnego pisania na maszynie.

Typowe cechy i funkcje edytorów tekstu

Tekst może być wyświetlany na stronie w:
trybie tekstowym - programy działały szybciej, ale nie mogły pokazać na ekranie nietypowych znaków, czcionek różnej wielkości czy grafiki.
trybie graficznym - pokazują tekst dokładnie w takiej formie, jak zostanie on wydrukowany, czyli w formie WYSIWYG: What You See Is What You Get (to co widzisz to dostajesz).

Szczególnie wolno działa tworzenie graficznego obrazu na ekranie przy wyborze drukarki postscriptowej.
Rozwiązaniem pośrednim jest tryb tekstowy z możliwością podglądu graficznego.

Funkcje edytora wywołuje się przez kody kontrolne, np. Ctrl, Alt lub Macro oraz klawiszy funkcyjnych F1-F12 (zależnie od systemu komputerowego) lub z rozwijalnych menu.

Edytory tekstu mają:

Rzadziej spotykane możliwości edytorów.

Edytory i drukowanie

Drukować można korzystając z

Polskie znaki w drukarkach - trzeba uważać na wybór odpowiedniego sposobu kodowania.

Drukarki postscriptowe: teksty i rysunki w plikach postscriptowych (PS) zapisane są w sposób wektorowy, umożliwiający pełne wykorzystanie drukarek i naświetlarek o dowolnej zdolności rozdzielczej.
Interpreter języka postscript tworzy mapę rastrową, odpowiednią dla danego urządzenia drukującego.
Nie ma ,,edytorów postscriptu", tylko sterowniki postscriptowe dla drukarek, tworzacy pliki gotowe do druku.

Typografia komputerowa, rodzaje czcionek

0x01 graphic
awniej pojęcie czcionki odnosiło się do odlanych z metalu znaków używanych przy składzie drukarskim, obecnie utożsamia się pojęcie czcionki z jej wizerunkiem na papierze.

Font to zbiór znaków drukarskich. Odnosząc się do wyglądu znaków używamy najczęściej słowa czcionka, pisząc o znakach, którymi dysponuje drukarka, nazywamy je fontami.

Pięć klas pisma: szeryfowe, bezszeryfowe, pisanki, pisma gotyckie i ozdobne.
Krój pisma to komplet znaków o określonym rysunku oczka.
Kroje różnią się wydłużeniami, pogrubieniami i kształtem akcentów.
Odmiany krojów: znaki o jednakowej grubości elementów i kącie pochylenia.
Typowe odmiany to: prosta (roman font, czyli antykwa), kursywa (italik), półgruba prosta i półgruba kursywa, gruba, wąska, szeroka, jasna i ich różne kombinacje, kroje ozdobne.
Przykłady krojów pisma (Bitstream)
Kroje pisma z MS-Office, nie wszystkie w wersji PL

Stopień pisma mierzy się w punktach typograficznych (didot), w Europie 1pt=0.375 mm, w USA 1/72 cala = 0.351 mm (punkt pajki). Cycero =12 pt, garmont=10 pt.
Gęstość druku liczbę znaków na cal (cpi, character per inch), zwykle 12 cpi, druk ściśnięty 15-20 cpi, rozrzedzony (rozspacjowany) 10 lub mniej cpi.
Fonty proporcjonalne mają zmienne szerokości znaków.
Standardowe odstępy między znakami i wyrazami podawane są w % szerokości spacji a odstępy pomiędzy wierszami i akapitami w punktach lub % wysokości czcionki.

Metody regulacji odstępów (światła) między znakami: ligatury, np. ff, fi, fl, ffi, ffl.
Kerning, zaawansowana metoda regulacji światła, lub tracking, dopasowanie odstępów do stopnia pisma.

Czcionki sprzętowe (hardware fonts) i programowe (software fonts, softfonts).
Drukarki najczęściej mają kroje Courier, Times i LinePrinter, w kilku odmianach i stopniach.
0x08 graphic

Fonty rastrowe, bitmapowe, fonty mapy bitowej, dla fontów wysokich stopni duże pliki.
Fonty wektorowe, kształt znaków w postaci krzywych matematycznych.

Programy tworzące z czcionek wektorowych czcionki rastrowe nazywa się rasteryzerami.
Programy zarządzających czcionkami (Font Managers), zawierają wzorce czcionek, generatory czcionek pozwalające tworzyć nowe kroje lub modyfikować istniejące czcionki, konwertery formatów czcionek.

Technologia postscriptowa, opracowana przez firmę Adobe, uwzględnia „podpowiedzi” (hints), zawierające informacje o tym, jak mają wyglądać ładne czcionki. Kroje Adobe Postscript (Helvetica, Courier, Times, Garamond ... ) i program Adobe Type Manager (ATM), rasteryzer. Czcionek PS jest > 20 tysięcy

TrueType, standard opracowany przez firmy Apple i Microsoft, od 1990 roku, wiele krojów TrueType z polskimi znakami.
Prostszy opis matematycznym niż czcionki postscriptowe, większe plików z fontami.
Czcionki (fonty) Postscriptowe określane są jako Type 1 a TrueType jako Type 3.

OpenType - łączy zalety type1/3, stosowany w Windows 2000.
Inne formaty fontów wektorowych: Bitstream Fontware (około 300 krojów), Linotype Library (ponad 1000), Agfa Intellifont, Nimbus Q, Speedo i LXO (LaserMaster).

Ghostscript/Ghostview - darmowy program do oglądania i drukowania postscriptu na drukarkach bez interpretera PS.

TrueImage - język i rasteryzer, alternatywa firmy Microsoft dla PostScriptu? Sprawnie interpretuje fonty Type 1 i Type 3, chyba nie ma szans.

Istnieje grupa dyskusyjna Usenetu comp.fonts.

Edytory czcionek („odlewnie czcionek” czyli Type Foundry): znane przykłady programów tego typu to Publishers Type Foundry, Font Foundry, Font Monger i Fontographer.
The ITC Directory of New Typefaces prezentuje nowe kroje pisma wraz z próbkami składu.

Nie należy przesadzać z instalowaniem zbyt dużej liczby fontów - zżerają pamięć i spowalniają działanie procesorów tekstu!

Słowniki i analiza gramatyczna

Słowniki i tezaurusy - podpowiadają synonimy do danego wyrazu.
Problemy z fleksją w języku polskim. 
Autokorekta - podmienianie typowych błędów.

COR, czyli „korektor polskich tekstów”, dodaje polskie znaki do tekstu, program samodzielny, obsługuje pliki ASCII i kilka starszych formatów.
Słowniki w różnych programach dostępnych na polskim rynku.

Brakuje dużych, porządnych słowników dwujęzycznych, które mógłby zastąpić słowniki w formie książkowej.
20-tomowy Oxford English Dictionary na CD-ROM, zawiera 20 milionów wyrazów.
Dobry słownik angielski Mirriam-Webster dostępny jest w Internecie.

Programy do analizy gramatycznej angielskich lub niemieckich tekstów - niezbyt inteligentne, częściej sygnalizują błędy pozorne niż rzeczywiste, czasami wyłapują literówki prowadzące do poprawnych form słów, np. „be” zamiast „by”.
Dla języka polskiego na razie takich programów nie ma.
Programy tłumaczące są marne.

Technologia NLP w systemach pomocy Office 2000.

Grafika w tekście

Większość procesorów tekstu ma wbudowane możliwości pracy z grafiką w ramkach, zestawy narzędzi graficznych do grafiki rastrowej (binarnej) i wektorowej.
Do rysunków grafika wektorowa + cliparty.

Przetwarzanie obrazu binarnego: korekta kontrastu, jasności, wygładzanie krawędzi itp.
Praca bezpośrednio ze skanerem, skalowanie grafiki.

Grafika prezentacyjna, uboższa niż w arkuszach kalkulacyjnych, rysunki jako grafika wektorowa.
Sześć podstawowych formatów grafiki prezentacyjnej.

Pliki tekstowe z grafiką, na której dokonujemy operacji, mogą być bardzo duże!

Edytory tekstu w Polsce

Problem polskich liter

Jak wywołać polskie litery? 0x01 graphic

Różne rodzaje klawiatur.
Problemy ze stacjami roboczymi.
Problemy z kopiowaniem pomiędzy aplikacjami Worda.

Polska strona ogonkowa (kopia w Sunsite) czyli jak używać polskie znaki w Internecie i nie tylko,
Tabela standardów IBM CP 852, Win1250 i innych
Wg norm RFC obowiazujacych w Internecie jedynym dopuszczalnym kodowaniem znaków narodowych w naszej części Europy jest standard ISO-8859-2 (znany też jako ISO-Latin-2).

MS-Word, Microsoft PL

Word - najpopularniejszy procesor tekstów; wersje Word 2.0 do WinWord'95 (Word 7)
WinWord'97 (Word 8), używa formatu Unicode;
Coraz większe pliki - w porównaniu z Wordem 2 nawet 10 x większe!
Pełno w nim błędów, zwłaszcza przy konwersji z innych formatów lub starszych wersji Worda.
Zła współpraca z formatem HTML.
Nie potrafi - jak wszystkie poprzednie wersje - zrobić dobrego postscriptu.
Liczne wirusy w makropoleceniach!

Zalety: liczne narzędzia i dodatki, najbardziej rozpowszechniony.
Tagger - narzędzia do automatycznej numeracji odnośników
Reference Manager - narzędzia do tworzenia bibliografii do procesorów Word i WordPerfect.

Word Pro i Ami Pro

0x08 graphic
Jeden z 3 najlepszych procesorów tekstu, Lotus jest obecnie własnością IBM.
Ami Pro jest w pełni spolszczony.
WordPro 97 dostępny za darmo na CD-ROMach dołączonych do PC World Komputer! Dobra współpraca z Wordem 97 (import/eksport).

QR-TEKST

Oficjalny procesor tekstu admnistracji pańsrtwowej, działa pod wszystkimi systemami operacyjnymi.

Wordperfect PL Wordperfect Corporation

Część pakietu PerfectOffice, sprzedawana przez Corel Corporation. W niektórych krajach bardzo popularny.

ChiWriter

Ma znaczenie tylko historyczne - był to jeden z pierwszych edytorów z polskimi znakami.

TAG

Kiedyś jeden z najpopularniejszych edytorów w Polsce.
Jest konwerter Tag -> Word

Edytory shareware

Dostępne w wielu archiwach, np. Sunsite PL, wystarczą do większości zastosowań, np. PC Write.

Starsze wersje znanych procesorów bywają dostępne za darmo.

Matematyka w tekstach

MathType - edytor matematyczny do Worda, WordPerfecta i innych procesorów tekstu
Chemical Markup Language (CML) do zapisu wzorów chemicznych.
Scientific Word & WorkPlace - zgrabna integracja algebry symbolicznej i LaTeXa.
Matematyka w WWW - język MathML

TeX, LaTeX i SGML.

0x08 graphic
TeX - najlepszy system do składania zmatematyzowanych tekstów.
LaTeX - system makr dla TeXa, nieco łatwiejszy w użyciu.
LaMeX - polska wersja LaTeX

Scientific Word - prawie WYSWIG.
Metafont - pakiet do tworzenia fontów, możliwości korzystania z fontów PS.
Format dvi (device independent, czyli „niezależne od urządzenia”), pliki gotowe do druku lub oglądania na ekranie.

0x08 graphic
\begin{equation}
M=\left( \begin{array}{cc}
\sum_{i=1}^{N} \fraction{f(x_i)}{1-f^2(x_i)} & \prod_{i=1}sin^2(x_i)\\
\int_{-\infty}^{\infty}\Psi^{\ast}(x)\Psi(x)d^3 x &
\sqrt{\nabla\Phi}+\fraction{\partial\theta(\xi)}{\partial\xi\}
\end{array} \right)
\end{equation}

Doskonale rozwiązane zagadnienia kros-referencji, odnośników do literatury.
Czysty tekst ASCII, logiczna struktura dokumentu.
Darmowy! Wiele udanych darmowych implementacji.

Wady: konieczność kompilacji by zobaczyć, jak wygląda strona, trudno zmienić elementy gotowego stylu, setki szablonów stylów, nie nadaje się do robienia formularzy, cały system jest bardzo skomplikowany.

GUST, Grupa Użytkowników Systemu TeX, Wirtualna Akademia Texologii Stosowanej oraz TeXowe konferencje.
Archiwa programów i dokumentów CETAN (Comprehensive TeX Archive Network)
LyX, czyli LaTeX prawie WYSIWYG - niestety tylko pod Unixa (również Linuxa)

SGML, czyli Standardowym Uogólnionym Języku Korekty (Standard Generalized Markup Language), standard opisu informacji tekstowej.
Wordperfect 6.1 był pierwszym popularnym procesorem tekstu zawierającym narzędzia SGML.

Microsoft SGML Author dla Windows, pozwala na korzystanie z arkuszy stylu Worda do tworzenia szablonów SGML i umieszczania w plikach zarówno tabel jak i skomplikowanych wzorów matematycznych.

Edytory hipertekstu

Idea: wizjonerski artykułu Vannevara Busha z 1945 roku, książka Teda Nelsona „Computer Lib and Dream Machines” (1970).
Projekt Xanadu - Nelson wyobrażał sobie, że pewnego dnia możliwy będzie dostęp do dowolnej informacji kiedykolwiek opublikowanej. Każda nowa idea miałaby zostać zintegrowana z dostępną już wiedzą a odwoływanie się do niej automatycznie związane być miało z cytowaniem jej autora. Dzięki HTML tak się stało!

Uproszczony hipertekst pozwala na hierarchiczną organizację dokumentu, pokazując tytuły rozdziałów czy podrozdziałów i pozwalając na rozwinięcie pełnego tekstu dowolnie wybranych fragmentów - edytory „outliners”, czyli podgląd hierarchiczny.

HyperCard, prosty program dla Macintoshy, pozwalający tworzyć sobie bazy danych składających się z kart połączonych przez hiperlinki.
Językiem pozwalającym sterować „hiperkartą” jest HyperTalk.
SuperCard i SuperTalk, pozwalają na większą swobodę w używaniu dźwięku i grafiki.

Guide - edytor hipertekstu, do organizacji informacji i opracowywania dokumentacji przez poważne wydawnictwa (np. Elsevier).

Systemy autorskie i HTML

Toolbook (Asymetrix) hipertekstowy edytor + multimedialne wstawki, system do tworzenia, zarządzania i udostępniania materiałów do nauki w rozproszonym środowisku (Distributed Learning).
Wersja Toolbook II zawiera HTML oraz Java, ponad 200 appletów pomaga w tworzeniu materiałów edukacyjnych, zdalnym prowadzeniu egzaminów i ocenie wyników.
Przeglądarki WWW mogą używać darmowego rozszerzenia (plug-in) o nazwie Neuron, pozwalającego na bezpośrednie oglądanie dokumentów stworzonych w Toolbooku.

Mediaview - bardzo zaawansowany edytor multimedialny, integrujący tekst, grafikę, wideo, animację, dźwięk, matematykę. „Żywy” tj. interaktywny dokument, w którym naciśnięcie elementu ekranu wywoła sekwencję wideo czy zamieni zaszyfrowany napis na rysunku.

Mosaic, NCSA (National Center for Supercomputing Applications) - pierwsza realizacja HTML.

HTML ( Hyper text Mark-up Language); standard HTML 3.2 (początek 1997 roku)
Liczne kursy HTML i edytory HTML po polsku!

XML - Extensible Markup Language - następca HTML?
Microsoft obiecuje używanie XML ale mu się nie udało!

0x01 graphic

Publikacje i książki elektroniczne (ebook)

0x08 graphic
Adobe Acrobat , „przenośne pliki dokumentów" PDF (Portable Document File)
Pliki PDF można drukować tak, jak pliki postscriptowe, lub "destylować" z plików postscriptowych.
W plikach PDF można szukać tak, jak w plikach tekstowych.

Powieść S. Kinga w 2000 roku tylko w sieci; dostępne wydania "Newsweeka" i innych gazet.
Powieść Krystyny Kofty w 2000 roku w Internecie - nie dla elektronicznych książek.
Księgarnia Merlin przedstawia pierwsze publikacje przedpremierowe w PDF.

Inne formaty elektroniczne - bałagan: OEB (Open E-Book), PDB, LIT (Microsoft)

Odtwarzane na urządzeniach czytających, np. Softbook, RocketBook, Softbook, EBookman, Cybook.
Programy do czytania: Microsoft Reader, Glassbook Reader, eBook Reader.

No Hands, technologia „Cyfrowego Papieru" ( Digital Paper, DP), oprogramowanie Common Ground dla Windows (Common Ground Software)

Edytory wielojęzyczne

Rozszerzony alfabet łaciński, grecki lub cyrilica - łatwo.
Arabski, hebrajskim od prawej do lewej.
W Indiach jest kilkadziesiąt rozpowszechnionych rodzajów pisma, bardzo różnorodnych.
Pisma ideograficzne: chiński, koreański i japoński.

Multilingual Scholar (MLS), UniVerse - ponad 60 języków. 

DTP - skład komputerowy

DeskTop Publishing (DTP), czyli przygotowywanie profesjonalnych publikacji książek i gazet na biurku.
Automatyzacja czynności wykonywanych przez drukarzy i redaktorów technicznych.

Typowe możliwości programów DTP (niektóre z nich maja również dobre procesory tekstów) to:

Najważniejsze programy: Ventura (Corel Inc.), PageMaker (Aldus Corp.), FrameMaker (Adobe), QuarkXPress, PagePlus 2.0, Calamus SL

Jak uniknąć przepisywania tekstu: programy OCR

Programy OCR nie rozpoznają pisma ręcznego, a jeśli rozpoznają (np. w komputerach klasy Penbook) to tylko drukowane, oddzielone od siebie litery, a i to nie najlepiej.
Im lepsza jest jakość druku skanowanego dokumentu tym mniej błędów w OCR.
Wyniki zależą od wielkości czcionki (stopnia pisma) - przy zbyt małych literach możemy dostać same błędy.
Skaner należy ustawić na dużą zdolność rozdzielczą (300 dpi).

Recognita, jeden z najbardziej zananych programów OCR, drogi.
TypeReader Profesional (ExperVision Corp.) zachowuje układ dokumentu, włącznie z tablicami i elementami graficznymi.
Oparty na algorytmie uczenia się na błędach, rozpoznaje ponad 2000 krojów pisma.

Pióra skanujące z OCR: np. IRIS, piórowy skaner ręczny z OCR, PRIMAX International B.V



Wyszukiwarka

Podobne podstrony:
Komputery i teksty, edukacja i nauka, Informatyka
TEKSTY Z SERWISÓW KOMPUTEROWYCH
9 Sieci komputerowe II
ARCHITEKTURA KOMPUTEROW1A
SILNIKI GRAFICZNE W GRACH KOMPUTEROWYCH
Budowa i dzialanie komputera
Metodologia SPSS Zastosowanie komputerów Golański Standaryzacja
Sieci komputerowe 7
Metodologia SPSS Zastosowanie komputerów Golański Anowa założenia
10 Reprezentacja liczb w systemie komputerowymid 11082 ppt
Metodologia SPSS Zastosowanie komputerów Brzezicka Rotkiewicz Podstawy statystyki
Metodologia SPSS Zastosowanie komputerów Brzezicka Rotkiewicz Testy zależne
sieci komputerowe 2
Komputerowe systemy zarządzania produkcją
Metodologia SPSS Zastosowanie komputerów Golański Statystyki

więcej podobnych podstron