system biurowy璵inistracji rz膮dowej (89 str) XUYSP7H74ZQEVFYOPKMCIPLKGRZH42XX2HDVLEA


Uniwersytet Gda艅ski

Wydzia艂 Zarz膮dzania

Katedra Informatyki Ekonomicznej

Adam Drewnowski

Nr albumu 75931

„System biurowy administracji rz膮dowej” jako przyk艂ad zastosowa艅 systemu zarz膮dzania dokumentami elektronicznymi

Praca magisterska
napis
ana pod kierunkiem
dra Marka Markowskiego

Sopot 1998

Spis tre艣ci

Wst臋p

Wst臋p

W ostatnich kilkunastu latach organizacje na ca艂ym 艣wiecie chc膮c skutecznie realizowa膰 zamierzone cele zmuszone s膮 do wykorzystywania w swojej dzia艂alno艣ci nowych technologii informatycznych. Wraz z post臋puj膮c膮 komputeryzacj膮 organizacji, ro艣nie zainteresowanie dokumentami elektronicznymi oraz systemami do zarz膮dzania nimi. Bardzo du偶e zapotrzebowanie na tego rodzaju systemy istnieje zw艂aszcza ze strony takich podmiot贸w jak banki, firmy ubezpieczeniowe, administracja pa艅stwowa oraz innych, w kt贸rych zarz膮dzanie dokumentami ma kluczowe znaczenie. Jednocze艣nie organizacje te bardzo cz臋sto, ze wzgl臋du na brak dostatecznej wiedzy, nie potrafi膮 precyzyjnie wyrazi膰 swoich potrzeb w tym zakresie.

G艂贸wnymi 藕r贸d艂ami informacji w Polsce w dziedzinie zarz膮dzania dokumentami elektronicznymi s膮 opracowania obcoj臋zyczne, g艂贸wnie w j臋zyku angielskim oraz strony WWW w sieci komputerowej Internet. Jednocze艣nie istnieje niewiele polskich publikacji na ten temat, a te kt贸re s膮, pojawi艂y si臋 g艂贸wnie w聽specjalistycznych pismach informatycznych, zazwyczaj przy okazji opisu komercyjnych produkt贸w (programistycznych i sprz臋towych), co czyni te opracowania ma艂o obiektywnymi. Bior膮c pod uwag臋 du偶e potrzeby oraz ma艂膮 wiedz臋 organizacji w tej dziedzinie, dziwi膰 mo偶e brak obszernych polskich opracowa艅.

Technologie zarz膮dzania dokumentami elektronicznymi s膮 stosunkowo nowe zar贸wno w Polsce jak i na 艣wiecie. St膮d te偶 cz臋sto brak jest polskich odpowiednik贸w wielu angielskich termin贸w u偶ywanych do ich opisu, nie zawsze r贸wnie偶 istnieje ich jednoznaczne nazewnictwo w literaturze angielskiej.

Celem niniejszego opracowania jest uporz膮dkowanie i prezentacja zagadnie艅 zwi膮zanych z wykorzystaniem dokument贸w elektronicznych oraz technologii zarz膮dzania tymi dokumentami. Aby om贸wi膰 istot臋 problemu niezb臋dna jest znajomo艣膰 takich poj臋膰 jak: dokument, dokument elektroniczny oraz system zarz膮dzania dokumentami elektronicznymi.

Opracowanie sk艂ada si臋 z czterech rozdzia艂贸w. W rozdziale pierwszym wprowadzone zostaj膮 oraz om贸wione podstawowe poj臋cia i definicje dotycz膮ce dokument贸w. Za pomoc膮 definicji komentowany jest termin „dokument" oraz opisywanych jest wiele w艂a艣ciwo艣ci i atrybut贸w dokument贸w zar贸wno papierowych jak i elektronicznych. Rozdzia艂 ten jest wst臋pem do kolejnych rozdzia艂贸w, kt贸re szczeg贸艂owiej opisuj膮 technologie dokument贸w elektronicznych.

Rozdzia艂 drugi stanowi przegl膮d istniej膮cych oraz powstaj膮cych standard贸w w聽technologii dokument贸w elektronicznych. W rozdziale tym pokazane zosta艂o w聽jaki spos贸b r贸偶ne typy danych (tekst, grafika) mog膮 zosta膰 umieszczone wewn膮trz dokumentu przy zastosowaniu r贸偶nych metod kodowania. Om贸wione zosta艂y zar贸wno tradycyjne, zorientowane na aplikacje standardy, jak r贸wnie偶 standardy niezale偶ne od platformy i aplikacji. Wa偶ne w tym rozdziale jest to, aby u艣wiadomi膰 sobie, 偶e opisywane tam typy dokument贸w elektronicznych, w bardzo wielu przypadkach s膮 w ci膮g艂ym rozwoju. Rozw贸j ten jest 艣ci艣le zwi膮zany ze zmianami zachodz膮cymi w 艣rodowisku komputerowym, w kt贸rym dokumenty te istniej膮.

Rozdzia艂 trzeci po艣wi臋cony jest zarz膮dzaniu dokumentami elektronicznymi. W rozdziale tym przedstawiona zosta艂a idea oraz zadania realizowane przez systemy zarz膮dzania dokumentami elektronicznymi (SZDE). Scharakteryzowane zosta艂y tam r贸wnie偶 najpopularniejsze standardy tych system贸w. Rozdzia艂 ten jest jednocze艣nie opisem zbioru najwa偶niejszych technologii informatycznych stosowanych obecnie w dziedzinie zarz膮dzania dokumentami elektronicznymi.

Ostatni, czwarty rozdzia艂 stanowi studium przedsi臋wzi臋cia „Systemu biurowego administracji rz膮dowej” opracowanego na potrzeby Ministerstwa Spraw Wewn臋trznych i Administracji. Jest on doskona艂ym przyk艂adem pokazuj膮cym to, w聽jaki spos贸b firmy, organizacje oraz instytucje wyra偶aj膮 swoje potrzeby oraz wymagania w dziedzinie zarz膮dzania dokumentami.

Ocenia si臋, 偶e 艣rednio sze艣膰dziesi膮t procent czasu przeznaczonego na prac臋 ludzie sp臋dzaj膮 przy obs艂udze dokument贸w. Rocznie w skali ca艂ego 艣wiata r贸wna si臋 to produkcji ponad 92 miliard贸w dokument贸w 藕r贸d艂owych oraz ich 400聽miliard贸w fotokopii聽[3]. W trakcie u偶ytkowania tych dokument贸w rzadko my艣li si臋 o tym jak ka偶dy z nich zosta艂 zredagowany, napisany, wyprodukowany lub nawet dystrybuowany. Najwa偶niejszym faktem dla wielu ludzi jest istnienie dokumentu jako rzeczywistego (namacalnego) mechanizmu wymiany informacji.

Dokumenty nie tylko przenosz膮 wiele r贸偶nego rodzaju wiadomo艣ci, lecz r贸wnie偶 stosuj膮 r贸偶ne metody ich kodowania (przekazywania). Na przyk艂ad, uwzgl臋dniaj膮c zakres i z艂o偶ono艣膰 dokument贸w stosowanych w procesie projektowania, mo偶emy wyr贸偶ni膰: plany, specyfikacje, katalogi produkt贸w, broszury informacyjne, podr臋czniki i instrukcje. Ka偶dy z tych typ贸w dokument贸w mo偶e by膰 z 艂atwo艣ci膮 rozpoznany przez u偶ytkownika, pomimo tego i偶 s膮 one zwykle tworzone przy u偶yciu r贸偶nych metod kodowania, sk艂adni i prezentacji.

Dokumenty s膮 bardzo wa偶ne dla projektant贸w. S膮 szeroko u偶ywane w聽艂膮czeniu informacji pomi臋dzy rozmaitymi grupami zaanga偶owanymi w proces projektowania i konstrukcji. Ich istnienie w wielu przypadkach, jest nie tylko wymogiem formalnym, lecz r贸wnie偶 niezb臋dnym 艣rodkiem w procesie obs艂ugi wielkich ilo艣ci r贸偶norodnych informacji. W rzeczywisto艣ci jednym z聽najwa偶niejszych powod贸w istnienia dokument贸w jest ograniczenie ludzkiego m贸zgu do operowania na olbrzymich ilo艣ciach informacji. Wsp贸艂czesna psychologia przyznaje, 偶e pojemno艣膰 ludzkiego procesu my艣lowego jest ograniczona do mo偶liwo艣ci manipulowania tylko siedmioma (plus minus dwie) jednostkami informacji jednocze艣nie聽[1,聽str.28]. Z tego te偶 powodu dokumenty staj膮 si臋 dla projektant贸w koniecznym 艣rodkiem efektywnego i wiernego zapisu intencji projektu oraz przenoszenia go do klient贸w, konsultant贸w, kontrahent贸w oraz innych uczestnik贸w procesu tworzenia.

    1. Definicja dokumentu

Jak do tej pory znaczenie terminu „dokument” zosta艂o zaledwie zasugerowane. Stosuje si臋 mn贸stwo definicji i interpretacji tego terminu. Definicje te zwykle zale偶ne s膮 od interpretacji formu艂owanych poprzez w艂asne do艣wiadczenia r贸偶nych ludzi. Dla przyk艂adu prawnicy b臋d膮 u偶ywa膰 zwykle tego poj臋cia w聽odniesieniu do legalnej ewidencji, architekci w stosunku do specyfikacji i聽rysunk贸w, za艣 muzycy w odniesieniu do zapis贸w nutowych. Ka偶de z tych okre艣le艅 jest ca艂kowicie poprawne, lecz s膮 one tylko mo偶liwymi przyk艂adami wykorzystania tego terminu.

Informatycy, drukarze, j臋zykoznawcy i psychologowie - ka偶da z tych grup ma sw贸j w艂asny pogl膮d na to, czym jest dokument, i co powinien zawiera膰. Trudno艣膰 w sformu艂owaniu uniwersalnej definicji, polega na tym, 偶e nie istnieje 偶adna 艣cis艂a teoria dotycz膮ca dokument贸w, dostarczaj膮ca ich sp贸jnego obrazu. Kolejn膮 trudno艣ci膮 jest to, 偶e nowo powstaj膮ce metody tworzenia i dystrybucji dokument贸w zwi臋kszaj膮 ci膮gle liczb臋 istniej膮cych ich typ贸w.

Pomimo istnienia ogromnej liczby rodzaj贸w dokument贸w, wszystkie one posiadaj膮 jedn膮 wa偶n膮, wsp贸ln膮 cech臋 - przenosz膮 informacj臋. Dlatego te偶 najprostszy opis dokumentu mo偶e wygl膮da膰 w nast臋puj膮cy spos贸b:

„Dokumentem jest powszechnie akceptowane medium dystrybucji i聽przyswajania informacji”聽[4].

Bardziej obszerna definicja mo偶e zosta膰 sformu艂owana nast臋puj膮co:

„Dokument jest seri膮 znak贸w (ang. marks) na pod艂o偶u (ang. substrate), spe艂niaj膮cym funkcje no艣nika, przy pomocy kt贸rego wiadomo艣ci mog膮 by膰 przenoszone od autora do 艣rodowiska czytelnik贸w, kt贸rzy s膮 oddzieleni od autora w聽czasie i przestrzeni”聽[2].

Regu艂a ta zosta艂a przedstawiona na rysunku聽1. W uproszczonej postaci powy偶sza definicja mo偶e r贸wnie偶 zosta膰 sformu艂owana jak poni偶ej:

„Dokument jest „pojemnikiem” z informacj膮 s艂u偶膮cym do przenoszenia wiadomo艣ci pomi臋dzy autorem i czytelnikiem”聽[1,聽str.28].

0x01 graphic

Rysunek 1. Relacja zachodz膮ca poprzez dokument pomi臋dzy autorem i聽czytelnikiem.

殴r贸d艂o:聽[2]

Na u偶ytek tej pracy, b臋dzie to ostateczna definicja. W najlepszy spos贸b syntetyzuje ona rozmaite elementy innych definicji, r贸wnie偶 wcze艣niej przedstawionych.

Poni偶ej przytoczonych zosta艂o kilka przyk艂adowych interpretacji terminu „dokument”. S膮 one w znacznym stopniu zale偶ne od profesji formu艂uj膮cego je聽autora.

Tak wi臋c osoba zajmuj膮ca si臋 archiwizacj膮 mianem dokumentu mog艂aby okre艣li膰:

„Ka偶dy przedmiot materialny wyra偶aj膮cy my艣l ludzk膮, s艂u偶膮cy do udowodnienia jakiego艣 twierdzenia; dokumenty graficzne (druki, r臋kopisy itp.), ogl膮dowe (m.in. fotografie, filmy) i s艂uchowe (ta艣my d藕wi臋kowe, p艂yty)”聽[11,聽str.182].

W uj臋ciu historyka dokumentem by艂oby:

„Ka偶de pisemne o艣wiadczenie, samodzielne prawnie i kancelaryjnie, kt贸re s艂u偶y艂o powstaniu, udowodnieniu i wykonaniu okre艣lonych uprawnie艅 oraz posiadaj膮ce pewne wyznaczone prawem i kultur膮 cechy, zmieniaj膮ce si臋 zale偶nie od czasu i miejsca jego powstania”聽[11,聽str.182].

Prawnik natomiast okre艣li艂by dokument jako:

„Ka偶dy przedmiot stanowi膮cy dow贸d prawa, stosunku prawnego lub okoliczno艣ci mog膮cych mie膰 znaczenie prawne”聽[11,聽str.182].

Dla informatyka dokumentem b臋dzie zwykle:

„Dowolny format zawieraj膮cy informacj臋. Dokumentem mo偶e by膰 tutaj plik tekstowy, wiadomo艣膰 e-mail, arkusz kalkulacyjny, tablica bazy danych, poczta g艂osowa lub inne nagranie audio, faks, formularz biznesowy, obraz, informacje uzyskane z Internetu, itd.”聽[6].

Zgodnie z ANSI/AIIM TR40-1995, dokumentem b臋dzie „kolekcja sk艂adaj膮ca si臋 z zera lub wi臋kszej ilo艣ci stron, kt贸re zosta艂y nawzajem po艂膮czone w聽dowolny, stosowny dla okre艣lonej aplikacji spos贸b”聽[6].

Dokument elektroniczny - jest to dowolny dokument przechowywany w聽komputerze. Dokument taki m贸g艂 zosta膰 utworzony przy pomocy komputera, jak np. plik tekstowy i arkusz kalkulacyjny, lub te偶 m贸g艂 by膰 przekszta艂cony w聽dokument elektroniczny za pomoc膮 techniki zwanej obrazowaniem dokumentu (ang. document imaging)”聽[6].

Z poj臋ciem „dokument”, niezale偶nie od stosowanej interpretacji nierozerwalnie zwi膮zany jest kolejny termin - cyklu 偶ycia dokumentu.

Cyklem 偶ycia dokumentu jest okres, kt贸ry zawiera stworzenie, utrzymanie, u偶ytkowanie oraz ostateczn膮 dyspozycj臋 (zniszczenie) dokumentu. Osoba (lub te偶 program) zarz膮dzaj膮ca dokumentami (baz膮 danych) powinna zna膰 cykl 偶ycia ka偶dego dokumentu wewn膮trz organizacji”聽[6].

    1. Elementy sk艂adowe dokumentu

Kluczowe komponenty dokumentu mog膮 zosta膰 podzielone na trzy cz臋艣ci: znaki (ang. marks), pod艂o偶e (ang. substrate) oraz pojemnik (ang. container)聽[2]. Definicje i przyk艂ady tych element贸w zosta艂y przedstawione poni偶ej oraz zilustrowane na rysunku聽2.

Znaki mog膮 zosta膰 zdefiniowane jako tusze, barwniki, punkty ekranowe, kt贸re formuj膮 graficzne i tekstowe obiekty na no艣niku. Przyk艂ady: atrament, grafit, w臋giel, kredka, d艂ugopis, akwarela, farba, punkty ekranowe (ang. pixels).

Pod艂o偶e mo偶na przedstawi膰 jako utrwalon膮 lub przeno艣n膮 powierzchni臋, na聽kt贸rej tworzone s膮 znaki dokumentu.

Przeno艣nym pod艂o偶em (ang. portable substrate) jest takie pod艂o偶e, kt贸re mo偶e zosta膰 zabrane z urz膮dzenia lub miejsca w kt贸rym zosta艂o utworzone. Na聽przyk艂ad: papier, kalka, fotokopia, rolka filmowa, p艂贸tno, tablica, film.

Utrwalonym pod艂o偶em (ang. fixed substrate) jest takie pod艂o偶e, kt贸re wymaga od czytaj膮cego przyj艣cia do dokumentu, w celu przeczytania go. Na聽przyk艂ad: monitor komputera, czytnik.

Pojemnik mo偶e by膰 rozwa偶any jako „zbiornik”, kt贸ry formatuje pod艂o偶e oraz znaki. Przyk艂ady pojemnik贸w: plany, kontrakty, specyfikacje, broszury, pliki komputerowe.

0x01 graphic

Rysunek 2. Komponenty dokumentu.

殴r贸d艂o:聽[2]

Poza przytoczonymi ju偶 wcze艣niej definicjami, istniej膮 kolejne poj臋cia, kt贸re nale偶y om贸wi膰, w celu lepszego zrozumienia idei dokument贸w. W kolejnych podrozdzia艂ach rozwa偶one zostan膮 mechanizmy oraz struktury, dzi臋ki kt贸rym dokumenty s膮 w stanie przenosi膰 zawarte w nich wiadomo艣ci.

    1. Typy dokument贸w

Dokumenty mog膮 zosta膰 podzielone na dwa g艂贸wne typy: dokumenty rzeczywiste oraz dokumenty wirtualne聽[2]. Rozr贸偶nienie to jest niezb臋dne w celu wprowadzenia w dalszej cz臋艣ci koncepcji nawi膮zuj膮cej do technologii dokument贸w elektronicznych oraz sposobu w jaki s膮 one tworzone, wymieniane i wy艣wietlane w聽艣rodowisku elektronicznym.

„Dokument rzeczywisty (ang. actual document) - termin oznaczaj膮cy fizyczny obiekt, kt贸ry czytelnik widzi i u偶ywa. Innymi s艂owy, dokument rzeczywisty jest zbiorem znak贸w, kt贸re pojawiaj膮 si臋 na no艣niku”聽[2]. Znaki te mog膮 by膰 zar贸wno proste jak i z艂o偶one, lecz ka偶dy dostrzegalny element odgrywa tak膮 sam膮 rol臋 w kszta艂towaniu si臋 zrozumienia przez czytelnika poszczeg贸lnych dokument贸w. Jest to pow贸d, dla kt贸rego dokumenty prawne s膮 tak precyzyjnie formu艂owane, za艣 architektoniczne szkice tak wiernie narysowane.

Podczas gdy autor dokumentu jest nieobecny, oczywistym jest, 偶e czytelnik musi polega膰 wy艂膮cznie na informacji, kt贸ra mo偶e by膰 fizycznie przedstawiona na dokumencie rzeczywistym. Na przyk艂ad, budowniczy, kt贸ry jest odosobniony na miejscu budowy, zwykle polega艂 b臋dzie na informacji, kt贸r膮 mo偶e odczyta膰 z聽plan贸w oraz specyfikacji, utworzonych przez architekta. W tym przypadku plany pozwalaj膮 architektowi na oddalenie si臋 w czasie i przestrzeni od miejsca budowy.

„Dokument rzeczywisty - jest fizyczn膮 prezentacj膮 zbioru znak贸w na no艣niku”聽[2].

„Dokument wirtualny (ang. virtual document) - termin u偶ywany do opisu specyfikacji dla dokumentu rzeczywistego, kt贸ry ma zosta膰 utworzony przez system”聽[2]. Termin ten jest kojarzony przede wszystkim z komputerami, dzi臋ki kt贸rym dokument wirtualny istnieje jako struktura danych.

„Dokument wirtualny - jest opisem struktury danych zawarto艣ci dokumentu”聽[2].

Przyk艂ad demonstruj膮cy r贸偶nice pomi臋dzy dokumentem rzeczywistym a聽wirtualnym zosta艂 pokazany na rysunku聽3.

0x01 graphic

Rysunek 3. R贸偶nica pomi臋dzy dokumentem rzeczywistym i wirtualnym.

殴r贸d艂o:聽[2]

    1. Struktura dokumentu

W poprzednich podrozdzia艂ach dokument zdefiniowany zosta艂 jako „pojemnik” z informacj膮, co jest r贸wnoznaczne z tym, 偶e posiada on pewn膮 zawarto艣膰. Je艣li dokument istnieje w formie elektronicznej, zawarto艣ci膮 tak膮 mo偶na manipulowa膰 na wiele r贸偶nych sposob贸w, co nie jest niestety mo偶liwe w przypadku gdy jako pod艂o偶a dokumentu u偶ywamy wy艂膮cznie papieru.

Zanim rozpocz臋艂o si臋 powszechne stosowanie komputer贸w, niewiele mo偶na by艂o zrobi膰 je艣li chodzi o rozszerzenie u偶yteczno艣ci dokument贸w bazuj膮cych na papierze, poza mo偶liwo艣ci膮 ich odczytu, kategoryzowania i przechowywania. Dla聽przyk艂adu w systemach bibliotecznych podczas ustalania kolejno艣ci segregowania czy te偶 kategoryzacji u偶ywa si臋 zwykle: kodu dziesi臋tnego, nazwiska autora, tytu艂u, roku, miejsca publikacji, opisu fizycznego, adnotacji, s艂贸w kluczowych, mi臋dzynarodowego standardowego numeru ksi膮偶ki (ISBN) lub mi臋dzynarodowego standardowego numeru seryjnego (ISSN) [1,聽str.31]. Przeszukuj膮c katalogi biblioteczne przy u偶yciu tego systemu, zwykle mo偶liwe jest znalezienie wy艂膮cznie tytu艂u dokumentu, bez jakiejkolwiek dodatkowej informacji o聽zawarto艣ci danej pozycji.

Podobnie sytuacja wygl膮da w codziennej dzia艂alno艣ci biur projektanckich, gdzie szkice i specyfikacje s膮 zwykle kategoryzowane i przechowywane wed艂ug numeru pracy i/lub nazwy klienta. Przy braku prostej metody katalogowania zawarto艣ci dokument贸w papierowych, nie ma na og贸艂 sposobu na szybkie wyszukiwanie specyficznych detali lub specyfikacji z poprzednich (a nawet bie偶膮cych) projekt贸w. Zamiast tego, alternatyw膮 jest robienie starannych podr臋cznik贸w wyszukiwania, kt贸re zwykle i tak wymagaj膮 wiedzy ludzi, kt贸rzy pracowali nad takimi projektami.

Obecnie, dzi臋ki zastosowaniu komputer贸w, wzrasta zainteresowanie sposobami opisu struktury dokument贸w, w celu rozwi膮zania przedstawionych problem贸w. Dokumenty w postaci elektronicznej staj膮 si臋 znacznie 艂atwiejsze do zlokalizowania, poniewa偶 wyszukiwanie mo偶e zosta膰 przeprowadzone bazuj膮c na ich tytule, zawartej w nich informacji lub dowolnej liczbie innych towarzysz膮cych im atrybut贸w. Dla przyk艂adu, obecnie mo偶liwe jest przeszukiwanie dokument贸w elektronicznych przy u偶yciu takich technik jak: po艂膮czenia hipertekstowe, wyszukiwanie pe艂no-tekstowe, przegl膮danie graficzne, szukanie s艂贸w kluczowych, rozpoznawanie obiekt贸w oraz aktywne spisy tre艣ci聽[1,聽str.32].

W swojej wirtualnej formie, dokumenty elektroniczne mog膮 r贸wnie偶 zawiera膰 wiele informacji o samych sobie. Mo偶e to obejmowa膰 informacje o聽pochodzeniu i to偶samo艣ci dokumentu, dat臋 i czas przegl膮dania, adnotacje, poziom bezpiecze艅stwa, ale r贸wnie偶 kod wykonywalny, kt贸ry okre艣la w jaki spos贸b dokument mo偶e by膰 prezentowany u偶ytkownikowi oraz przez u偶ytkownika przetwarzany聽[1, str.32].

Cyfrowa posta膰 dokumentu jest r贸wnie偶 znacznie bogatsza ni偶 jej papierowy odpowiednik. Obecnie jest ju偶 ca艂kiem powszechne umieszczanie wewn膮trz struktury dokumentu elektronicznego obiekt贸w multimedialnych takich jak grafika, animacja i d藕wi臋k.

Ponadto istnieje jeszcze szereg innych mo偶liwych do okre艣lenia cech struktury dokumentu. Wyr贸偶nia si臋 szereg z艂o偶onych kryteri贸w, kt贸re mog膮 zosta膰 u偶yte przy opisie graficznego schematu kodowania zawarto艣ci dokumentu聽[2]. Dla聽przyk艂adu mo偶liwe jest kodowanie dokumentu na czterech oddzielnych poziomach: werbalne kodowanie zawarto艣ci, semantyczne kodowanie atrybut贸w, syntaktyczne kodowanie struktury i kodowanie struktury zawarto艣ci. W istocie, mechanizmy te pozwalaj膮 autorowi na kodowanie wiadomo艣ci wewn膮trz dokumentu na wiele rozmaitych sposob贸w. Proste tego przyk艂ady to u偶ycie punktowania, pozycjonowania i r贸偶nicowania.

    1. Prezentacja i przedstawianie dokumentu

Ostatni膮 w艂a艣ciwo艣ci膮 dokumentu, kt贸ra b臋dzie rozwa偶ana, jest spos贸b w聽jaki obiekt graficzny (taki jak tekst czy obraz) mo偶e zosta膰 opisany do przedstawienia na monitorze komputera lub urz膮dzeniu wyj艣ciowym. Termin聽„przedstawianie” (ang.聽rendering), w tym kontek艣cie, jest u偶ywany do opisu sposobu w jaki dokument jest wy艣wietlany lub prezentowany u偶ytkownikowi na danym pod艂o偶u.

W swojej wirtualnej formie, dokument elektroniczny mo偶e by膰 kodowany przy u偶yciu wielu r贸偶nych etykiet (ang. markup tags) okre艣laj膮cych jego organizacj臋 oraz zamierzony spos贸b prezentacji czytelnikowi. Zwykle odbywa si臋 to przy u偶yciu dw贸ch rodzaj贸w etykiet: strukturalnych i proceduralnych. Etykiety聽strukturalne okre艣laj膮 w jaki spos贸b dokument mo偶e zosta膰 podzielony na r贸偶ne elementy organizacyjne, takie jak: nag艂贸wki, paragrafy, sekcje, listy, punkty itp. Etykiety聽proceduralne s艂u偶膮 do opisu charakterystyk takich jak rodzaj czcionki, rozmiar, metryczne w艂a艣ciwo艣ci tekstu, oraz wiele innych aspekt贸w uk艂adu. Rysunek 4 ilustruje prosty przyk艂ad tych regu艂.

0x01 graphic

Rysunek 4. Przyk艂ad strukturalnych i proceduralnych etykiet.

殴r贸d艂o:聽[2]

Wsp贸lnie etykiety strukturalne i proceduralne s膮 generalnie zwi膮zane z聽formatowaniem dokumentu. Formatowanie jest bardzo wa偶nym aspektem, z聽punktu widzenia sposobu w jaki dokument mo偶e przenosi膰 zawart膮 w nim wiadomo艣膰. Dla przyk艂adu, na architektonicznych szkicach istniej膮 ustalone konwencje graficzne, kt贸re mog膮 zosta膰 u偶yte dla prezentacji informacji takiej jak po艂o偶enie bloku tytu艂u czy podpisy pod rysunkami. Istniej膮 r贸wnie偶 ustalone konwencje u偶ywane w uk艂adzie, strukturze i wygl膮dzie specyfikacji budynku.

Aby wy艣wietli膰 dokument na monitorze komputera, kody formatuj膮ce s膮 najcz臋艣ciej obs艂ugiwane przez aplikacje programowe. W przypadku jednak drukowania, wymagany jest zwykle niezale偶ny od urz膮dze艅 j臋zyk opisu stron (ang.聽PDL - Page Description Language). Kiedy dokument ma zosta膰 wydrukowany, kody oraz etykiety wewn膮trz dokumentu musz膮 zosta膰 przet艂umaczone na PDL, kt贸ry jest znany dla urz膮dze艅 wyj艣ciowych. Przyk艂adem powszechnego PDL, u偶ywanego przez wiele drukarek, jest j臋zyk PostScript. J臋zyk聽ten sk艂ada si臋 ze zbioru graficznych operator贸w, takich jak „fill” do maskowania obszar贸w, „stroke” do generowania linii, „image” do malowania rastrowych obraz贸w oraz „show” do tworzenia tekstu. Jego charakterystyka zawiera r贸wnie偶 du偶膮 liczb臋 operator贸w opisuj膮cych po艂o偶enie r贸偶nych obiekt贸w na stronie oraz zbi贸r atrybut贸w, takich jak fonty, kolor wype艂nienia, wz贸r wype艂nienia itp.

    1. Wykorzystanie papieru jako no艣nika dokumentu

Jedn膮 z najbardziej spornych kwestii dotycz膮cych u偶ytkowania dokument贸w jest wyb贸r pomi臋dzy papierowym a elektronicznym no艣nikiem. Jak dot膮d bardziej uznanym z tej pary jest no艣nik papierowy聽[2].

Na przestrzeni wiek贸w papier sta艂 si臋 najszerzej u偶ywanym medium publikacji, drukowania, dystrybucji i archiwizowania dokument贸w. Dzieje si臋 tak g艂贸wnie dlatego, poniewa偶 dokument papierowy jest: 艂atwy w przenoszeniu, prosty w聽u偶yciu, relatywnie niedrogi w produkcji, charakteryzuje si臋 wysokim stopniem przejrzysto艣ci i kontrastu, jest relatywnie 艂atwy w utrzymaniu, nie wymaga skomplikowanych urz膮dze艅 do interpretacji, ma przewag臋 przy wprowadzaniu konwencji odno艣nie struktur danych i formatowania oraz 艂atwo mo偶na dodawa膰 na nim odr臋czne adnotacje聽[1,聽str.34].

Pomimo wszystkich tych zalet, jego u偶ycie bardzo cz臋sto bywa nieefektywne. Do g艂贸wnych jego wad mo偶na zaliczy膰 problemy z reprodukcj膮, metodami sk艂adowania, konsumpcj膮 zasob贸w naturalnych oraz kwestie zwi膮zane z聽zarz膮dzaniem dokumentem papierowymi.

Od 1800 roku stale rozwijanych jest szereg wydajnych narz臋dzi produkcji i聽reprodukcji papierowych dokument贸w. Do narz臋dzi tych zaliczy膰 mo偶emy zar贸wno linotyp i monotyp jak i dzisiejsze komputery i fotokopiarki. W rezultacie bardzo cz臋sto dowodzi si臋, 偶e wykorzystanie komputer贸w w celu osi膮gni臋cia „biura bez papieru”, jest celem nie do zrealizowania聽[1,聽str.34]. Nawet obecnie, pomimo istnienia zaawansowanej technologii komputerowej, nie pojawi艂y si臋 jeszcze „biura bez papieru”. W rzeczywisto艣ci w typowym, wsp贸艂czesnym biurze obs艂uga dokument贸w w dalszym ci膮gu przebiega w spos贸b zbli偶ony do tego jak robiono to w ko艅cu ubieg艂ego wieku. Dla przyk艂adu, szacuje si臋, 偶e obecnie nadal 80 procent ca艂ej technicznej informacji znajduje si臋 na papierze lub na mikrofilmach聽[1,聽str.34].

W 艣wiecie biznesu ocenia si臋, 偶e dziennie tworzonych jest 252 miliony dokument贸w 藕r贸d艂owych聽[3]. Dokumenty te przechodz膮 poprzez rozmaite procesy reprodukcji, w聽efekcie kt贸rych przeci臋tny dokument biurowy kopiowany jest oko艂o 19聽razy聽[3]. W聽trakcie procesu reprodukcji dokumenty cz臋sto trac膮 swoj膮 jako艣膰, za艣 藕r贸d艂owe dokumenty gubi膮 si臋 po艣r贸d papierowych duplikat贸w. Dla przyk艂adu szacuje si臋, 偶e w samych tylko USA dziennie tworzonych jest 1,1 miliarda fotokopii. Jest to tak wielka liczba, 偶e przy pomocy tych papierowych kopii mo偶na by utworzy膰 stos wysoko艣ci 110 km聽[3].

Kolejnym problemem, do kt贸rego przyczynia si臋 reprodukcja dokument贸w, jest zachowanie bezpiecze艅stwa. Bardzo cz臋sto dokumenty zawieraj膮 „wra偶liwe” informacje, takie jak znacz膮ce liczby, bud偶ety klient贸w lub plany rozwoju. Gdy聽tego typu dokumenty s膮 powielane i dystrybuowane, w przypadku ujawnienia, mo偶e to doprowadzi膰 do k艂opotliwych sytuacji a nawet konflikt贸w politycznych. W聽by艂ym ZSRR, jeszcze do po艂owy lat osiemdziesi膮tych, problem reprodukcji „wra偶liwych” dokument贸w rozwi膮zywano w ten spos贸b, 偶e maszyny kopiuj膮ce trzymano w zamkni臋ciu pod kluczem聽[1,聽str.36]. Do dzisiaj tak膮 sytuacj臋 (w r贸偶nej formie) mo偶na zaobserwowa膰 w firmach na ca艂ym 艣wiecie.

Istnieje szereg problem贸w zwi膮zanych z przechowywaniem papieru. Dwa聽g艂贸wne problemy to jego fizyczna obj臋to艣膰 oraz metody wymagane do jego utrzymania.

Jednym z najwi臋kszych problem贸w podczas u偶ywania papieru jest zajmowana przez niego przestrze艅 sk艂adowania. Pomimo faktu, 偶e zaledwie jeden dokument z pi臋ciu wyprodukowanych zostaje zmagazynowany, to jednak wci膮偶 pozostaje dziennie oko艂o 200 milion贸w stron papieru , kt贸re musz膮 by膰 przechowywane聽[3]. Jak dot膮d ocenia si臋, 偶e na ca艂ym 艣wiecie istnieje 4聽biliony dokument贸w oraz 8聽miliard贸w szkic贸w, kt贸re s膮 przechowywane w standardowych kartotekach. Firma „Xerox” szacuje, 偶e wielko艣ci te ulegaj膮 podwojeniu co ka偶de 3,5聽roku聽[1,聽str.36]. Bior膮c pod uwag臋, 偶e przeci臋tna cztero-szufladowa szafa jest w聽stanie pomie艣ci膰 zaledwie oko艂o 10,000 dokument贸w, przestrze艅 wymagana do przechowywania tych ilo艣ci papieru musi by膰 olbrzymia.

Por贸wnuj膮c pojemno艣膰 elektronicznych sk艂adnic, te same 10,000 dokument贸w mo偶e by膰 przechowywane na zaledwie jednym dysku CD-ROM o聽pojemno艣ci 600MB, tak jak przedstawiono to na rysunku聽5. Ta sama pojemno艣膰 CD-ROM mo偶e r贸wnie偶 zosta膰 u偶yta do przechowania dwuletniego nak艂adu „Wall聽Street Journal” lub 100 klasycznych nowel聽[1,聽str.36]. Takie mo偶liwo艣ci zapisu nie mog艂y pozosta膰 niezauwa偶one; Obecnie wielu wydawc贸w jak i聽producent贸w oprogramowania stosuje CD-ROM jako medium publikacji oraz metod臋 zast臋powania obszernych podr臋cznik贸w聽[4].

0x01 graphic

Rysunek 5. Por贸wnanie pojemno艣ci sk艂adnic papieru oraz no艣nik贸w elektronicznych.

殴r贸d艂o:聽[1,聽str.36]

Wykorzystanie dokument贸w papierowych nierozerwalnie zwi膮zane jest ze zu偶ywaniem zasob贸w naturalnych. Ka偶dego roku olbrzymia ilo艣膰 nieodnawialnych zasob贸w jest zu偶ywana przy produkcji, transporcie, drukowaniu, dystrybucji, sk艂adowaniu i niszczeniu drukowanych materia艂贸w. W skali 艣wiata ocenia si臋, 偶e w聽ka偶dej sekundzie zu偶ywa si臋 2,3 tony papieru, oraz 偶e na ka偶d膮 ton臋 papieru przypada 17 drzew. Do roku 2000 oczekuje si臋 zapotrzebowania na papier rz臋du 310,000,000 ton聽[3].

Problem sk艂adowania papierowych dokument贸w to r贸wnie偶 koszty utrzymania oraz zajmowana przestrze艅 przez dodatkowe artyku艂y potrzebne do sprawnego pos艂ugiwania si臋 nimi. W prawie ka偶dym biurze znajduje du偶a liczba r贸偶nego rodzaju zszywaczy, spinaczy, dziurkaczy, etykiet, skoroszyt贸w, kopert, no偶yczek, klej贸w, gumek, marker贸w, pi贸r itp. Wszystkie te przedmioty wymagaj膮 miejsca na przechowywanie w magazynach, szafach i szufladach. Ponadto nale偶y do tego doda膰 jeszcze drogie wyposa偶enie archiw贸w, takie jak dodatkowe drukarki, kopiarki, faksy oraz szafy na kartoteki. Z ka偶dym z tych przedmiot贸w zwi膮zane s膮 pewne wydatki, kt贸re powinny by膰 uwzgl臋dniane w ca艂kowitym koszcie utrzymania dokument贸w drukowanych.

Kolejnym wielkim problemem zwi膮zanym z u偶ywaniem dokument贸w bazuj膮cych na papierze jest proces ich rejestracji. W wi臋kszo艣ci biur zwykle pozwala si臋 pracownikom na chowanie do akt dokument贸w, z kt贸rych korzystali. Bardzo cz臋sto zdarzaj膮 si臋 sytuacje, gdy ten sam dokument zostaje zakwalifikowany do r贸偶nych kategorii przez r贸偶nych ludzi. Dzieje si臋 tak niezale偶nie od tego jak dobrze zaprojektowany i opisany jest system rejestracji w聽biurze. System taki mo偶e by膰 alfabetyczny, numeryczny, tematyczny lub te偶 tworzony na bie偶膮ce potrzeby. Sugeruje si臋, 偶e niezale偶nie od istniej膮cego systemu powinna istnie膰 jaka艣 forma 艣cis艂ej regulacji okre艣laj膮cej jego u偶ycie. „Statystycznie聽ocenia si臋, 偶e zaledwie 10 procent wszystkich pobranych z kartotek dokument贸w wraca na swoje prawid艂owe miejsce”聽[1,聽str.39].

Nawet w przypadku, gdy dokumenty kataloguje si臋 bardzo starannie i聽systematycznie, to nie istnieje przewa偶nie 偶aden indeks lub baza danych zawieraj膮ca informacje o po艂o偶eniu ka偶dego dokumentu. Cz臋sto nawet oczekuje si臋, 偶e u偶ytkownicy sami b臋d膮 pami臋ta膰 o miejscach ich przechowywania. Sytuacja聽taka, w przypadku poszukiwania konkretnego dokumentu, wymusza zwykle konsultacje z osob膮, kt贸ra go rejestrowa艂a.

Metody sk艂adowania papieru s膮 r贸wnie偶 bardzo nieefektywne i聽czasoch艂onne. Ocenia si臋, 偶e 60 procent czasu pracy pracownicy sp臋dzaj膮 przy obs艂udze dokument贸w oraz 偶e znaczn膮 cz臋艣膰 tego czasu zajmuje im ich zlokalizowanie聽[3]. Nieefektywno艣膰 tych metod kosztuje przedsi臋biorstwa du偶膮 sum臋 pieni臋dzy. Je艣li nawet wyprodukowanie jednej strony kosztuje 艣rednio od 30 do 70 cent贸w, za艣 reprodukcja 0,5 centa, to ju偶 odzyskanie utraconego dokumentu 150-200 dolar贸w聽[3]. W konsekwencji zarz膮dzanie dokumentami staje si臋 jednym z聽bardziej licz膮cych si臋 koszt贸w przedsi臋biorstwa.

Ka偶dy dokument musi ostatecznie zosta膰 gdzie艣 przekazany. Obecnie wi臋kszo艣膰 metod dostarczania papierowych dokument贸w jest nieefektywna. Zwykle im wi臋ksza jest liczba odbiorc贸w, tym bardziej skomplikowana jest 艣cie偶ka dostarczania oraz d艂u偶szy czas przemieszczania si臋 dokumentu. Dzisiaj nadal papierowe dokumenty dostarcza si臋 r臋cznie w tradycyjny, czasoch艂onny i drogi spos贸b. U偶ywa si臋 w tym celu szeregu metod takich jak wewn臋trzna i zewn臋trzna poczta, us艂ugi kurierskie lub faks.

Rysunek 6 por贸wnuje kilka metod dostarczania dokument贸w. Na rysunku tym mo偶na zaobserwowa膰 jak sie膰 komputerowa mo偶e zosta膰 wykorzystana do聽prawie natychmiastowego dostarczania dokument贸w w por贸wnaniu z聽wielofazowymi metodami r臋cznymi. Ocenia si臋, 偶e przekazywanie dokument贸w w postaci papierowej jest 艣rednio 50-60 procent wolniejsze od pozosta艂ych metod聽[1,聽str.39].

0x01 graphic

Rysunek 6. Por贸wnanie metod dostarczania dokument贸w.

殴r贸d艂o:聽[1,聽str.40]

    1. Wykorzystanie dokumentu elektronicznego

W kolejnych rozdzia艂ach pojawi si臋 wiele odno艣nik贸w do zagadnie艅 zwi膮zanych z u偶yciem dokumentu elektronicznego. Jako wst臋p do tych rozwa偶a艅 warto wspomnie膰 o tym jak technologie cyfrowe mog膮 pom贸c w rozwi膮zywaniu niekt贸rych z wcze艣niej przedstawionych problem贸w.

Pomimo tego, i偶 mo偶liwo艣ci „cyfrowej alternatywy” b臋d膮 szerzej przedstawione w dalszej cz臋艣ci tego opracowania, to istnieje ca艂y szereg, wartych odnotowania ju偶 teraz, korzy艣ci zwi膮zanych z wykorzystaniem cyfrowych rozwi膮za艅. Do korzy艣ci tych zaliczy膰 mo偶na:

Wszystkie wy偶ej wymienione mo偶liwo艣ci zostan膮 om贸wione bardziej szczeg贸艂owo w kolejnych rozdzia艂ach.

Z wykorzystaniem dokumentu wi膮偶膮 si臋 nie tylko same korzy艣ci ale r贸wnie偶 pewne niedogodno艣ci a nawet zagro偶enia, kt贸rych nale偶y by膰 艣wiadomym. Najwi臋ksz膮 wad膮 dokumentu elektronicznego jest ma艂e bezpiecze艅stwo danych w聽nim zawartych. Dane takie mog膮 by膰 bez problemu odczytane oraz zmodyfikowane przez osoby nieuprawnione. Podobnie nigdy nie mo偶na by膰 pewnym, kto tak naprawd臋 jest autorem dokumentu. Dokument elektroniczny mo偶na bez trudu kopiowa膰 praktycznie w niesko艅czono艣膰 bez utraty jego jako艣ci. Zwykle jest to jego du偶膮 zalet膮, ale jednocze艣nie wielk膮 wad膮 w przypadku gdy zawiera on dane poufne. Wp艂ywa to w znacznym stopniu na brak zaufania ludzi do dokument贸w elektronicznych. Bezpo艣rednim skutkiem tego stanu jest prawny obowi膮zek stosowania wy艂膮cznie papierowej formy dla wielu rodzaj贸w dokument贸w, np.: rachunk贸w, faktur, um贸w, czek贸w, weksli itd. Dzieje si臋 tak gdy偶 w ich przypadku bezpiecze艅stwo jest wa偶niejsze od korzy艣ci gospodarczych, kt贸re mo偶na uzyska膰 poprzez zast膮pienie ich dokumentem elektronicznym.

Powy偶sze problemy ju偶 obecnie mo偶na skutecznie rozwi膮za膰 stosuj膮c narz臋dzia kryptograficzne do szyfrowania danych oraz elektronicznego podpisywania dokument贸w. Wymaga to jednak od ludzi dodatkowej wiedzy oraz dyscypliny w pos艂ugiwaniu si臋 tymi narz臋dziami. Mo偶e to stanowi膰 powa偶ny problem bior膮c pod uwag臋 niski poziom edukacji informatycznej w Polsce.

Wydaje si臋, 偶e wraz z up艂ywem czasu oraz wzrostem 艣wiadomo艣ci i edukacji informatycznej ludzi, dokument elektroniczny b臋dzie stawa艂 si臋 coraz bardziej popularnym. Id膮c za przyk艂adem kraj贸w wysoko uprzemys艂owionych, tak偶e w聽Polsce dokument elektroniczny b臋dzie odgrywa艂 coraz wi臋ksze znaczenie w聽偶yciu gospodarczym i spo艂ecznym. Zmiany te b臋d膮 musia艂y r贸wnie偶 znale藕膰 swoje odzwierciedlenie w polskim prawie.

Dotychczasowe okre艣lanie dokument贸w elektronicznych jako „dokument贸w bez papieru” staje si臋 niewystarczaj膮ce i wymaga ponownego zdefiniowania. Pod聽wzgl臋dem semantycznym termin „bez papieru” nic pozytywnego o nowym typie dokument贸w nie m贸wi, a jedynie odr贸偶nia je od tradycyjnych. Jak d艂ugo jednak dokument drukowany b臋dzie stanowi艂 punkt odniesienia? Ju偶 dzi艣 coraz trudniej wydawa膰 czasopismo, nie korzystaj膮c z Internetu czy z dokumentacji zawartej na CD-ROM. Musimy si臋 powoli oswoi膰 z my艣l膮, 偶e dokumenty papierowe b臋d膮 coraz cz臋艣ciej tylko utrwalon膮 drukiem wersj膮 materia艂贸w, kt贸re: powsta艂y w formie elektronicznej, zosta艂y w medium elektronicznym zredagowane, opracowane i s膮 w tym 艣rodowisku tak偶e rozpowszechniane.

Silny nacisk na stosowanie nowych form dokument贸w stanowi wyzwanie zar贸wno dla producent贸w, jak i u偶ytkownik贸w oprogramowania. Producenci musz膮 skupi膰 si臋 przede wszystkim na problemach kompatybilno艣ci z r贸偶norodno艣ci膮 rozwi膮za艅 zar贸wno sprz臋towych jak i programowych. Wiele istniej膮cych aplikacji, mimo pozor贸w uniwersalno艣ci, okazuje si臋 w rzeczywisto艣ci dedykowanymi. Innym problemem jest uzgodnienie format贸w samych dokument贸w. Ich regularna struktura umo偶liwi艂aby automatyzacj臋 wielu funkcji (takich jak sortowanie, 艣ledzenie, wsp贸艂u偶ytkowanie i wymian臋 danych).

    1. Relacja pomi臋dzy oprogramowaniem, danymi i dokumentami

W poprzednim rozdziale dokument zosta艂 okre艣lony jako „pojemnik” z聽informacj膮, u偶ywany do przenoszenia tej informacji od autora do czytelnika.

Kontynuuj膮c rozwa偶ania nad tym modelem, obecnie przedstawione zostan膮 narz臋dzia tworzenia dokument贸w (oprogramowanie) oraz elementy, z kt贸rych dokumenty si臋 sk艂adaj膮 (dane).

Mo偶na zauwa偶y膰 istniej膮c膮 relacj臋 pomi臋dzy oprogramowaniem i danymi. Zwykle jedno z nich tworzone jest za pomoc膮 drugiego i na odwr贸t. Pomi臋dzy聽nimi聽za艣 znajduj膮 si臋 dokumenty, utworzone przez oprogramowanie i聽spe艂niaj膮ce funkcje pojemnik贸w z danymi. W celu lepszego zilustrowania tych zale偶no艣ci, ka偶dy z tych termin贸w przedstawi膰 mo偶na jako warstw臋, tak jak pokazane to zosta艂o na rysunku聽7.

0x01 graphic

Rysunek 7. Dokument w kontek艣cie og贸lnego 艣rodowiska komputerowego.

殴r贸d艂o:聽[1,聽str.150]

Pomimo tego, i偶 to abstrakcyjne spojrzenie na relacj臋 pomi臋dzy danymi, dokumentami i oprogramowaniem mo偶e w wielu przypadkach by膰 nazbyt uproszczone, to pomaga ono jednak odzwierciedli膰 spos贸b w jaki dokumenty postrzegane s膮 w og贸lnym obrazie technologii informatycznej.

Spojrzenie to odnosi si臋 r贸wnie偶 do koncepcji dzia艂a艅 zorientowanych na dokument (ang. document-centric approach to computing). W podej艣ciu tym k艂adzie si臋 wi臋kszy nacisk na znaczenie struktury dokumentu, ni偶 na specyficzne w艂a艣ciwo艣ci aplikacji (narz臋dzia), dzi臋ki kt贸remu zosta艂 on utworzony. Stosuj膮c聽odpowiedni膮 struktur臋 dokument贸w, informacja w nich zawarta staje si臋 bardziej u偶yteczna i dost臋pna.

Potrzeba 艂atwego dost臋pu oraz ponownego wykorzystania informacji jest niezwykle wa偶na. Bardzo cz臋sto zachodzi konieczno艣膰 pos艂ugiwania si臋 du偶膮 ilo艣ci膮 informacji pochodz膮cych z wielu heterogenicznych 藕r贸de艂, za艣 dokumenty r贸偶nego typu cz臋sto musz膮 by膰 dost臋pne dla szerokiego spektrum odmiennych odbiorc贸w.

Pomimo znacznego post臋pu, kt贸ry dokona艂 si臋 w technologii informatycznej, wymiana dokument贸w w heterogenicznym 艣rodowisku obliczeniowym nadal pozostaje trudna do zrealizowania. Zasadnicz膮 przyczyn膮 tych trudno艣ci jest du偶a liczba stosowanych struktur dokument贸w. Historycznie, za ka偶dym razem, gdy nowy typ aplikacji pojawia艂 si臋 na rynku, producenci u偶ywali w艂asnych metod kodowania tekstu, grafiki oraz innych form danych wewn膮trz dokumentu. W聽efekcie otrzymano du偶膮 niekompatybilno艣膰 pomi臋dzy wi臋kszo艣ci膮 typ贸w dokument贸w, pochodz膮cych z r贸偶nych aplikacji.

Znaczna cz臋艣膰 spotykanych trudno艣ci przy wymianie dokument贸w, powstaje jako wynik generalnego braku wiedzy o danych oraz standardach dokument贸w. Trudno艣ci te objawiaj膮 si臋 w braku kompatybilno艣ci pomi臋dzy r贸偶nymi typami oprogramowania oraz systemami komputerowymi b臋d膮cymi w u偶yciu.

Podczas, gdy oprogramowanie by艂o tworzone po raz pierwszy, cz臋sto istnia艂y ca艂kiem uzasadnione powody, dla kt贸rych producenci musieli lub chcieli stosowa膰 w艂asne struktury dokument贸w, odmienne od tych, kt贸re stosowa艂a konkurencja聽[1,聽str.151]. Te powody to:

G艂贸wny pow贸d odnosi si臋 do natury danych zawartych w strukturze dokumentu. W zale偶no艣ci od aplikacji dokument m贸g艂 zawiera膰 dowoln膮 „mieszank臋” grafiki, danych wektorowych i tekstowych. W wyniku tego zwi膮zany z聽aplikacj膮 dokument posiada艂 odpowiedni膮 do danych struktur臋.

W przypadku aplikacji graficznych, struktura dokumentu mog艂a by膰 okre艣lona w taki spos贸b, aby mo偶liwe by艂o 艂atwe wykonywanie operacji na poziomie bit贸w oraz tak aby plik wynikowy zajmowa艂 jak najmniej miejsca na聽dysku. Podobnie aplikacje przetwarzaj膮ce tekst mog艂y stosowa膰 struktur臋 dokument贸w dostosowan膮 do potrzeb przechowywania informacji np. o czcionce oraz do艂膮czonych obiektach graficznych. W obu tych przypadkach format dokumentu m贸g艂 zosta膰 opracowany tak, aby jak najlepiej odpowiada艂 cechom i聽u偶yteczno艣ci aplikacji.

Kolejnym powodem, dla kt贸rego producenci tworz膮 w艂asne rozwi膮zania, jest elastyczno艣膰 na kt贸r膮 mog膮 sobie oni pozwoli膰 w przypadku, gdy s膮 jedynymi w艂a艣cicielami formatu dokumentu. W czasie gdy tworzy si臋 aplikacje, pierwsza generacja struktury dokumentu jest zwykle niedojrza艂a. W trakcie rozwoju aplikacji oraz dodawania do niej nowych cech funkcjonalnych, struktura zwi膮zanego z ni膮 dokumentu r贸wnie偶 ulega zmianie. Przejawia si臋 to tym, 偶e wiele format贸w dokument贸w jest 艣ci艣le zwi膮zanych ze szczeg贸ln膮 wersj膮 oprogramowania, u偶ywanego do ich utworzenia (np.: format MS Word 6.0 .DOC lub AutoCAD R.13 .DWG).

Zwykle w interesie producenta jest utrzymywanie w艂asnych format贸w dokument贸w. Pozwala to na ich 艂atw膮 modyfikacj臋 bez obawy o uzyskanie zgody od innych producent贸w. Wad膮 tego podej艣cia jest to, 偶e istnieje znacznie mniej aplikacji, z kt贸rymi taki dokument mo偶e by膰 wymieniany聽[8].

Efektem ubocznym stosowania w艂asnych format贸w dokument贸w przez producent贸w jest mo偶liwo艣膰 utrzymania „lojalno艣ci” klient贸w. Anegdotycznie mo偶na stwierdzi膰, 偶e jednym z powod贸w, dla kt贸rych u偶ytkownicy sk艂aniaj膮 si臋 do oprogramowania konkretnej marki lub wersji, jest oferowana im „kompatybilno艣膰” w聽przypadku, gdy dokument ma by膰 wymieniany z innymi u偶ytkownikami. W聽wyniku tego wiele biur sk艂ania si臋 do korzystania z aplikacji tylko jednego producenta.

W biurach, w kt贸rych stosuje si臋 procesor tekstu jednej marki, wymiana dokument贸w, ponowne ich wykorzystanie oraz wyszukiwanie staje si臋 ca艂kiem proste. W przypadku korzystania z kilku r贸偶nych procesor贸w tekstu mo偶e dochodzi膰 do wielu problem贸w zwi膮zanych z niekompatybilno艣ci膮 dokument贸w.

    1. Klasyfikacja dokument贸w elektronicznych

Z powodu ogromnej r贸偶norodno艣ci danych, aplikacji i protoko艂贸w komunikacyjnych, jest prawie niemo偶liwa, przy zastosowaniu tylko jednego zbioru kryteri贸w, jasna klasyfikacja typ贸w dokument贸w elektronicznych. Technologia dokument贸w elektronicznych rozwija si臋 gwa艂townie, nieustannie dodawane s膮 do niej nowe elementy i mo偶liwo艣ci.

Wprowadzanie r贸偶nych klasyfikacji czasami mo偶e prowadzi膰 do b艂臋d贸w. Dzieje si臋 tak dlatego, poniewa偶 nowe cechy niekt贸rych typ贸w dokument贸w cz臋sto mog膮 „zamazywa膰” elementy odr贸偶niaj膮ce dla wcze艣niej zdefiniowanych klas. Pomimo tego istnieje szereg klas dokument贸w, kt贸re mo偶na zidentyfikowa膰 na podstawie zbioru wsp贸lnych charakterystyk i podobnej funkcjonalno艣ci. Klasyfikacja ta rozci膮ga si臋 od tradycyjnych struktur opartych o aplikacje i聽specyficznych dla urz膮dze艅 wyj艣ciowych, a偶 po bardziej otwarte, standaryzowane i聽og贸lne struktury. Poni偶ej znajduje si臋 opis kilku klas dokument贸w, wyja艣niaj膮cy r贸偶ne wsp贸lne metody, za pomoc膮 kt贸rych dane mog膮 zosta膰 odwzorowane w聽dokumencie elektronicznym.

Standardy bazuj膮ce na aplikacjach (ang. Application-based Standards) - s膮 to takie struktury dokument贸w, kt贸re zwi膮zane s膮 z w艂asnymi, zorientowanymi na aplikacje metodami produkcji dokument贸w. Mo偶na je podzieli膰 na dokumenty w艂asne aplikacji oraz dokumenty wyj艣ciowe.

Dokumenty w艂asne aplikacji (ang. Proprietary Application-based Documents) - s膮 to dokumenty zwi膮zane ze specyficzn膮 aplikacj膮.

Dokumenty wyj艣ciowe (ang. Output Documents) - s膮 to dokumenty u偶ywane w procesie przedstawiania dokumentu 藕r贸d艂owego na urz膮dzeniu wyj艣ciowym, takim jak drukarka lub ploter.

Jako wynik nadmiaru w艂asnych format贸w dokument贸w oraz wzrostu zapotrzebowania u偶ytkownik贸w na wieloplatformowe 艣rodowisko obliczeniowe, powsta艂o wiele otwartych standard贸w (ang. Open Standards) wymiany z艂o偶onych typ贸w dokument贸w. Najcz臋艣ciej te klasy dokument贸w powstawa艂y z zamiarem zapewnienia szerokiej przemys艂owej kompatybilno艣ci. W konsekwencji wiele z聽tych standard贸w jest kontrolowanych i wspieranych przez niezale偶ne organizacje takie jak ISO czy ANSI, lub te偶 s膮 one publicznie dost臋pne poprzez indywidualnych lub wsp贸艂pracuj膮cych producent贸w oprogramowania. Klasy otwartych standard贸w dokument贸w mog膮 by膰 pogrupowane nast臋puj膮co:

Dokumenty wymiany (ang. Interchange Documents) - s膮 to dokumenty wykorzystywane jako 艣rodki translacji pomi臋dzy r贸偶nymi typami dokument贸w.

Dokumenty komunikacyjne (ang. Messaging Documents) - s膮 to dokumenty u偶ywane do wymiany wiadomo艣ci pomi臋dzy u偶ytkownikami lub u偶ytkownikiem i baz膮 danych poprzez sie膰 komputerow膮.

Dokumenty tworzone dynamicznie (ang. Dynamic Compound Documents) - s膮 to dokumenty przeznaczone do spe艂niania funkcji pojemnika dla obiekt贸w danych, kt贸re s膮 dynamicznie po艂膮czone z w艂asnymi 藕r贸d艂ami.

Dokumenty tworzone w procesie (ang. Processable Compound Documents) - s膮 to dokumenty maj膮ce dostarcza膰 uniwersalny, neutralny model kodowania dokument贸w.

Dokumenty widoki (ang. Viewer Documents) - s膮 to dokumenty dostarczaj膮ce platform臋 oraz niezale偶n膮 od aplikacji, tylko do odczytu, struktur臋 dla dystrybucji w pe艂ni sformatowanej kopii oryginalnego dokumentu.

Dokumenty elektronicznych odno艣nik贸w oraz 艂膮czonych form informacji (ang. Electronic Reference and Hypermedia Documents) - s膮 to dokumenty przeznaczone do szybkiego dostarczania informacji umieszczonej wewn膮trz olbrzymich kolekcji dokument贸w elektronicznych, poprzez zastosowanie w聽nich elektronicznych odno艣nik贸w do tych dokument贸w.

Dokumenty multimedialne (ang. Multimedia Documents) - s膮 to dokumenty, kt贸re zawieraj膮 wiele wymieszanych 藕r贸de艂 danych, oraz zorganizowane s膮 w taki spos贸b aby pomaga膰 w nauce lub dostarcza膰 rozrywki.

W oparciu o przedstawion膮 klasyfikacj臋, w dalszej cz臋艣ci rozdzia艂u przedstawiona zosta艂a szersza charakterystyka klas dokument贸w wraz z opisem najpopularniejszych na rynku format贸w dokument贸w z ka偶dego z wy偶ej wymienionych typ贸w.

    1. Dokumenty w艂asne aplikacji

Tradycyjne, zorientowane na aplikacje spojrzenie, dotyczy wi臋kszo艣ci dokument贸w, b臋d膮cych specyficznym wyj艣ciem aplikacji, tak jak zosta艂o to pokazane na rysunku聽8. Pomimo tego, i偶 dotychczas opracowano ju偶 wiele niezale偶nych od platformy i aplikacji struktur dokument贸w, w艂asne formaty aplikacji nadal pozostaj膮 bardzo popularne. Struktury dokument贸w, kt贸re przynale偶膮 do okre艣lonego producenta i/lub aplikacji bywaj膮 okre艣lane mianem „rodzimych” (ang. native) lub „prywatnych” (ang. private)聽[8]. Dla przyk艂adu format pliku .DWG aplikacji AutoCAD, pozostaje w艂asno艣ci膮 firmy „Autodesk”, kt贸ra go opracowa艂a.

0x01 graphic

Rysunek 8. Koncepcja format贸w dokument贸w opartych o aplikacje.

殴r贸d艂o:聽[1,聽str.154]

Bardzo charakterystyczne dla w艂asnych format贸w dokument贸w jest to, 偶e u偶ywaj膮 one specyficznej dla danej aplikacji semantyki oraz 偶e wyst臋puj膮 one cz臋sto w postaci binarnej. Oznacza to, 偶e producenci u偶ywaj膮 w艂asnych system贸w strukturalnych i proceduralnych etykiet do organizacji danych wewn膮trz ich w艂asnych specyficznych typ贸w dokument贸w. Ponadto, charakterystyczne jest r贸wnie偶 to, 偶e wi臋kszo艣膰 w艂asnych typ贸w dokument贸w jest trudnych do przenoszenia pomi臋dzy innymi aplikacjami lub systemami operacyjnymi, w kt贸rych dane formy etykiet nie s膮 uznawane.

Jak wcze艣niej zosta艂o wspomniane, istnieje wiele przyczyn, z powodu kt贸rych w艂asne formaty dokument贸w pozostaj膮 tak popularne. Jednak偶e, oczywistym jest, 偶e pewna forma przemys艂owej standaryzacji b臋dzie wymagana, aby mog艂a zaistnie膰 w wielkiej skali nieograniczona i wierna wymiana informacji w聽艣rodowisku cyfrowym.

Powszechna standaryzacja aplikacji, maj膮ca na celu przezwyci臋偶enie niekompatybilno艣ci dokument贸w jest ma艂o prawdopodobna. Bior膮c pod uwag臋 pr臋dko艣膰 z jak膮 rozwijanych jest wiele technologii obliczeniowych, oraz w聽rezultacie wychodzenie z u偶ycia technologii, kt贸re je poprzedza艂y, jest ma艂o prawdopodobne, aby pojawi艂a si臋 jakakolwiek uniwersalna standaryzacja aplikacji, pochodz膮ca od jednego tylko dostawcy oprogramowania. R贸wnie偶 istniej膮ce w聽wielu krajach prawo przeciwdzia艂a tego typu zachowaniom monopolistycznym. R贸wnie偶 w膮tpliwym jest, aby zaistnia艂a na wi臋ksz膮 skal臋 jakakolwiek standaryzacja aplikacji stosowanych w sektorze AEC, ze wzgl臋du na du偶膮 liczb臋 uczestnik贸w oraz r贸偶norodno艣膰 dyscyplin. W konsekwencji, je艣li maj膮 zosta膰 osi膮gni臋te na du偶膮 skal臋 korzy艣ci z u偶ywania dokument贸w elektronicznych, musi zosta膰 przyswojony przemys艂owy standard neutralnego formatu dokumentu.

Kolejn膮 mo偶liwo艣ci膮 rozwi膮zania tego problemu, stosowan膮 przez wielu tw贸rc贸w urz膮dze艅 i oprogramowania, jest opracowanie rozmaitych metod wymiany i translacji dokument贸w. Niekt贸re z tych metod om贸wione zostan膮 w聽dalszej cz臋艣ci rozdzia艂u.

Istnieje zbyt wiele r贸偶nych aplikacji i w艂asnych format贸w dokument贸w, aby m贸c je wszystkie wymieni膰. Opr贸cz szerokiej skali specyficznych dla aplikacji format贸w, istniej膮 r贸wnie偶 warianty indywidualnych standard贸w, zale偶nie od wersji oprogramowania, przy u偶yciu kt贸rego zosta艂y utworzone. Dla przyk艂adu, kolejne wersje wi臋kszo艣ci program贸w, stosuj膮 formaty dokument贸w kompatybilne w d贸艂. Oznacza to, 偶e nowsza wersja programu potrafi odczyta膰 dokument utworzony w聽wersji poprzedniej, lecz nie na odwr贸t.

Niekt贸re typowe przyk艂ady w艂asnych format贸w dokument贸w przedstawione zosta艂y w tabeli聽1.

Tabela 1

Przyk艂ad kilku popularnych, w艂asnych format贸w dokument贸w.

Aplikacja

Spe艂niana funkcja

Rozszerzenie

Tw贸rca

Word for Windows 6.0

Procesor tekstu

DOC

Microsoft

AutoCAD Release 13

Wykresy CAD

DWG

Autodesk

Lotus 1-2-3 v2.0

Arkusz kalkulacyjny

WKS

Lotus

Filemaker Pro v2.0

Baza danych

FM

Claris

PageMaker v5.0

Sk艂ad tekstu

PM5

Adobe Systems

殴r贸d艂o:聽[1,聽str.155]

    1. Dokumenty wyj艣ciowe

W celu odwzorowania zawarto艣ci dokumentu na urz膮dzeniu drukuj膮cym (takim jak ploter lub drukarka) stosuje si臋 formaty wyj艣ciowe. Pomimo i偶 format贸w tych zwykle nie stosuje si臋 w oprogramowaniu jako dokument贸w „edytowalnych”, to jednak odpowiadaj膮 one wcze艣niejszej definicji okre艣laj膮cej dokumenty jako pojemniki informacji.

Podczas gdy dokument elektroniczny jest wysy艂any do urz膮dzenia drukuj膮cego, musi on zosta膰 przej臋ty przez element tego urz膮dzenia okre艣lany mianem kontrolera. Kontroler stosuje program do interpretacji wys艂anego do niego zakodowanego dokumentu, kt贸ry nast臋pnie opisuje go dla modu艂u drukuj膮cego w聽j臋zyku stosowanym przez ten modu艂 do odtworzenia dokumentu na papierze聽[1,聽str.155]. J臋zyk ten zawiera informacje o sposobie w jaki sformatowany dokument powinien by膰 przet艂umaczony na instrukcje rozk艂adaj膮ce mikroskopijne kropki czarnego lub kolorowego tuszu na stronie. T艂umaczenie takie jest zwykle bardzo z艂o偶one, gdy偶 musi bra膰 pod uwag臋 szereg typograficznych kwestii. Zasadniczo istniej膮 dwa g艂贸wne typy dokument贸w wyj艣ciowych okre艣lane mianem j臋zyka opisu wyj艣cia (ang. ODL - Output Description Languages) oraz j臋zyka opisu stron (ang. PDL - Page Description Languages).

J臋zyki opisu wyj艣cia (ODL) s膮 to zbiory komend opracowane przez producent贸w do komunikacji ze szczeg贸lnym typem urz膮dze艅 wyj艣ciowych. J臋zyki聽te mog膮, ale nie musz膮 by膰 w postaci 艂atwej do odczytu i zrozumienia dla cz艂owieka. Powszechnie znanym przyk艂adem jest j臋zyk kontroli stron opracowany przez firm臋 Hewlett-Packard, a stosowany do komunikacji z drukarkami tej firmy.

J臋zyki opisu stron (PDL) tworzone s膮 przez producent贸w w celu komunikacji z szerokim zakresem r贸偶nych urz膮dze艅 wyj艣ciowych. J臋zyki te zawsze s膮 proste do odczytu i zrozumienia dla cz艂owieka. S膮 one generalnie bardziej wyrafinowane ni偶 j臋zyki opisu wyj艣cia, a przede wszystkim nie s膮 „skrojone” do 偶adnego szczeg贸lnego urz膮dzenia wyj艣ciowego (rysunek聽9). Najbardziej popularnym obecnie j臋zykiem opisu stron jest opracowany przez firm臋 Adobe Systems j臋zyk PostScript.

0x01 graphic

Rysunek 9. Urz膮dzenia wyj艣ciowe wspieraj膮ce PDL.

殴r贸d艂o:聽[1,聽str.156]

Najwa偶niejszym aspektem PDL jest to, 偶e s膮 one j臋zykami. Oznacza to, 偶e kiedy informacja zostaje wys艂ana do druku, przesy艂any jest tylko kr贸tki program zamiast olbrzymiej ilo艣ci punkt贸w. W spos贸b znacz膮cy podnosi to szybko艣膰 drukowania. Na dodatek oznacza to, 偶e j臋zyk ten mo偶e zosta膰 prze艂o偶ony lub聽zinterpretowany przez r贸偶ne aplikacje. Dla przyk艂adu PostScript jest powszechnie stosowany jako metoda dystrybucji formatowanych dokument贸w. Dzi臋ki dystrybucji dokumentu przy zastosowaniu PostScript'u u偶ytkownik mo偶e wys艂a膰 go bezpo艣rednio na drukark臋, przegl膮da膰 go przy u偶yciu specjalnych program贸w (np.聽GhostView) lub zaimportowa膰 go do aplikacji wspieraj膮cej PostScript.

Pomimo tych wszystkich zalet, jedn膮 z wad PostScript'u jest relatywnie du偶y rozmiar tworzonych plik贸w, w por贸wnaniu z oryginalnymi formatami dokument贸w z聽kt贸rych zosta艂y utworzone.

Kilka typowych przyk艂ad贸w zar贸wno PDL jak i ODL przedstawionych zosta艂o w tabeli聽2.

Tabela 2

Przyk艂ad kilku j臋zyk贸w opisu wyj艣cia i opisu stron.

J臋zyk

Rodzaj

Tw贸rca

PostScript

PDL

Adobe Systems

Interpress

PDL

Xerox

Reprint

PDL

Interleaf

DDL

ODL

Imagen

HPGL

ODL

Hewlett-Packard

PCL

ODL

Hewlett-Packard

殴r贸d艂o:聽[1, str.157]

    1. Dokumenty wymiany

Dokumenty elektroniczne mog膮 by膰 wymieniane prawie na ka偶dym poziomie wewn膮trz 艣rodowiska cyfrowego. W najprostszym przypadku pliki mog膮 by膰 wymieniane przy u偶yciu dyskietek i przenoszone z jednego komputera na inne. Dzi臋ki zastosowaniu sieci komputerowych przenoszenie plik贸w uleg艂o znacznemu uproszczeniu oraz wzros艂a mo偶liwo艣膰 dost臋pu do du偶ej liczby komputer贸w i聽informacji. Wynikiem tego sta艂o si臋 r贸wnie偶 stosowanie przez wielu u偶ytkownik贸w znacznych ilo艣ci r贸偶norodnych rodzaj贸w plik贸w i typ贸w dokument贸w.

Pomimo szerokiego stosowania w艂asnych format贸w dokument贸w, istnieje wiele sposob贸w, kt贸re mog膮 by膰 u偶yte w prze艂amywaniu niekompatybilno艣ci dokument贸w. Wiele z tych metod jest wynikiem wymaga艅 stawianych przez przemys艂 odno艣nie pracy na wielu platformach sprz臋towych. Podstawowymi wymogami pomy艣lnej wymiany dokument贸w s膮:聽[1,聽str.158]

Powodzenie rozwi膮zania spe艂niaj膮cego te kryteria cz臋sto w znacznym stopniu jest zale偶ne od z艂o偶ono艣ci wymienianej informacji.

Tak jak to zosta艂o pokazane na rysunku聽10, zasadniczo istniej膮 dwa odr臋bne sposoby wymiany r贸偶nych w艂asnych format贸w dokument贸w:聽[1,聽str.158]

0x01 graphic

Rysunek 10. Metody wymiany w艂asnych format贸w dokument贸w.

殴r贸d艂o:聽[1,聽str.158]

Metoda bezpo艣redniego przek艂adu cz臋sto zaszyta jest wewn膮trz aplikacji, dzi臋ki czemu „obce” dane lub pliki z dokumentami mog膮 by膰 w bardzo prosty spos贸b zar贸wno importowane jak i eksportowane. Pomimo i偶 jest to bardzo wygodne dla u偶ytkownika, to jednak skuteczno艣膰 tego podej艣cia zale偶y w du偶ej mierze od tego na ile dok艂adnie producent oprogramowania interpretuje format dokumentu opracowany przez innego producenta.

Innym podej艣ciem do bezpo艣redniego przek艂adu jest stosowanie aplikacji przeznaczonych specjalnie do t艂umaczenia pomi臋dzy r贸偶nymi formatami dokument贸w. Metod臋 t膮 powszechnie stosuje si臋 przy konwersji pomi臋dzy r贸偶nymi formatami plik贸w graficznych.

Najpowa偶niejszym problemem napotykanym przy bezpo艣rednim przek艂adzie jest olbrzymia ilo艣膰 wymaganych translator贸w. Dla n r贸偶nych format贸w dokument贸w konieczne jest u偶ycie a偶 n*(n-1) r贸偶nych program贸w t艂umacz膮cych.

W celu przezwyci臋偶enia tego problemu coraz powszechniej stosuje si臋 neutralne formaty dokument贸w. Formaty te dostarczaj膮 producentom po艣redni膮 struktur臋 dokument贸w, zwykle dobrze wspart膮 przez przemys艂, dzi臋ki swojej publicznej dost臋pno艣ci.

Dzi臋ki zastosowaniu powszechnych format贸w wymiany dokument贸w, zar贸wno u偶ytkownik jak i producent otrzymuj膮 pewniejsz膮 i wierniejsz膮 metod臋 wymiany dokument贸w. Formaty wymiany bazuj膮 zwykle na ASCII, dzi臋ki czemu s膮 one dobrze przenoszone pomi臋dzy wieloma r贸偶nymi platformami i przy zastosowaniu wielu r贸偶nych protoko艂贸w sieciowych. Przy zastosowaniu neutralnych format贸w wymiany liczba niezb臋dnych translator贸w pomi臋dzy n聽聽r贸偶nymi formatami maleje z n*(n-1) do 2n.

Jedn膮 z najprostszych metod wymiany dokument贸w jest wykorzystanie tekstu ASCII. ASCII jest szczeg贸lnie zalecany przy wymianie zachodz膮cej pomi臋dzy r贸偶nymi platformami lub w przypadku, gdy nie istnieje 偶adna inna forma bezpo艣redniego przek艂adu. Aczkolwiek problem z ASCII jest tego typu, 偶e oryginalny dokument nie mo偶e zawiera膰 偶adnej komendy formatuj膮cej takiej jak informacja o czcionce lub uk艂adzie tekstu. To co zwykle pozostaje jest wy艂膮cznie tre艣ci膮.

W przypadku, gdy musimy wymieni膰 dokumenty pochodz膮ce z bazy danych lub arkusza kalkulacyjnego, mo偶e zosta膰 zastosowana inna forma transferu ASCII. Podej艣cie to stosuje wymian臋 plik贸w ASCII, u偶ywaj膮c znacznik贸w do formatowania informacji zawartej w kom贸rkach lub polach bazy danych czy arkusza kalkulacyjnego. Najpopularniejszymi znacznikami s膮 przecinki oraz znaki聽tabulacji.

Poprzednie przyk艂ady ukazywa艂y jak w prosty spos贸b mo偶na wymienia膰 zawarto艣膰 dokumentu trac膮c jednak przy tym informacj臋 formatuj膮c膮. Czasami聽jednak informacja formatuj膮ca mo偶e okaza膰 si臋 niezwykle istotn膮 z punktu widzenia interpretacji dokumentu. W celu umo偶liwienia zachowania informacji formatuj膮cej w bardziej z艂o偶onych dokumentach, wymagany jest neutralny format etykiet. Metody takie nadal mog膮 bazowa膰 na ASCII.

U偶ycie etykiet w formacie wymiany umo偶liwia zachowanie informacji o聽strukturze dokumentu i po艂o偶eniu tekstu w trakcie procesu wymiany. Wielu聽producent贸w oprogramowania opracowa艂o tego typu formaty wymiany dla swoich w艂asnych format贸w dokument贸w. Niekt贸re powszechnie stosowane standardy dokument贸w stosuj膮cych te metody przedstawione zosta艂y w tabeli聽3.

Tabela 3

Przyk艂ad kilku popularnych standard贸w wymiany dokument贸w.

Standard

Typ aplikacji

Tw贸rca / W艂a艣ciciel

DXF

Wykresy CAD

Autodesk

SIF

Wykresy CAD

Intergraph

IGES

Wykresy CAD

ISO, NIST, SAA

STEP

Wykresy CAD

ISO

SYLK

Arkusz kalkulacyjny

Microsoft

RTF

Procesor tekstu

Microsoft

殴r贸d艂o:聽[1,聽str.161]

Uznanym i cz臋sto stosowanym standardem wymiany dla procesor贸w tekstu i聽program贸w sk艂adu tekstu jest format RTF (Rich Text Formatting) opracowany przez firm臋 Microsoft. Standard ten korzysta z szeregu strukturalnych i聽proceduralnych etykiet do opisu zar贸wno zawarto艣ci jak i informacji formatuj膮cej.

Poniewa偶 formaty wymiany (takie jak RTF) stosuj膮 uznane i dobrze udokumentowane metody strukturyzacji dokumentu, producenci mog膮 tworzy膰 dla nich bardziej niezawodne translatory, ni偶 w przypadku metod bezpo艣redniego przek艂adu dokumentu.

    1. Dokumenty komunikacyjne

Wraz z rozwojem sieci komputerowych, w kt贸rych dzieli si臋 i wymienia dane, wzros艂o zastosowanie system贸w komunikacyjnych. Formaty komunikat贸w zwi膮zane z tymi systemami zaprojektowane s膮 w ten spos贸b aby umo偶liwi膰 bezproblemow膮 wymian臋 informacji pomi臋dzy odleg艂ymi grupami. Formaty komunikacyjne bazuj膮 zwykle na tek艣cie (ASCII), dzieje si臋 tak ze wzgl臋du na jego niezawodno艣膰 w przesy艂aniu poprzez r贸偶ne typy sieci.

Standardy komunikacyjne dziel膮 si臋 na trzy g艂贸wne kategorie: poczt臋 elektroniczn膮, elektroniczn膮 wymian臋 danych EDI oraz us艂ugi faksowe. Ponadto聽nale偶y wymieni膰 typ dokumentu, 艣ci艣le zwi膮zany z tymi standardami i聽okre艣lany mianem elektronicznego formularza.

Poczta elektroniczna (e-mail) jest us艂ug膮, kt贸ra umo偶liwia u偶ytkownikowi sieci wysy艂anie komunikat贸w do innego u偶ytkownika komputera pod艂膮czonego do sieci. Komunikaty te mog膮 by膰 uwa偶ane za dokumenty (zgodnie z definicj膮, w聽kt贸rej dokument okre艣lony zosta艂 jako pojemnik z informacj膮). Podkre艣li膰 nale偶y, 偶e e-mail jest protoko艂em komunikacyjnym 艣ci艣le zwi膮zanym z protoko艂ami stosowanymi w komunikacji sieciowej.

E-mail mo偶e by膰 stosowany do przesy艂ania notatek, zawiadomie艅, list贸w i聽wielu innych typ贸w dokument贸w. Tak jak ju偶 by艂o wcze艣niej wspomniane, dokumenty te wysy艂ane s膮 w postaci ASCII, w zwi膮zku z czym wszelkie dane binarne, kt贸re zostaj膮 wys艂ane jako za艂膮czniki do komunikatu, musz膮 zosta膰 przekonwertowane na ASCII przy pomocy specjalnego programu.

Elektroniczna wymiana danych (EDI) zdefiniowana jest jako „mechanizm przesy艂ania danych biznesowych pomi臋dzy lub wewn膮trz firm (艂膮cznie z ich agentami i po艣rednikami), w postaci ustrukturyzowanych, gotowych do obr贸bki przez komputer danych. Transakcje EDI mog膮 zawiera膰 notowania gie艂dowe, zlecenia zakupu, faktury oraz dowolne inne typy danych biznesowych, kt贸re mog膮 by膰 przedstawione w postaci formularza”聽[1,聽str.169].

EDI zaprojektowane zosta艂o po to aby wyeliminowa膰 drogie i czasoch艂onne pos艂ugiwanie si臋 dokumentami oraz zadania zwi膮zane z wprowadzaniem danych. Stosowanie EDI mo偶e uczyni膰 dzia艂alno艣膰 gospodarcz膮 bardziej efektywn膮.

Znaczna cz臋艣膰 kluczowych cech dokument贸w EDI jest analogiczna do cech odpowiadaj膮cych im papierowych dokument贸w handlowych. Istniej膮 jednak w EDI pewne unikatowe elementy. Mo偶na do nich zaliczy膰 cyfrowe podpisy, elektroniczne pieni膮dze oraz elektroniczne oznaczanie czasu.

Komunikaty EDI s膮 bardzo zbli偶one do e-mail. G艂贸wna r贸偶nica polega na tym, 偶e komunikaty EDI przychodz膮 w z g贸ry okre艣lonym formacie, kt贸ry umo偶liwia oprogramowaniu inwentaryzacyjnemu i obliczeniowemu 艂atwe przetwarzanie zawartych tam danych. Aby by艂o to mo偶liwe, komunikat musi zosta膰 wys艂any przy u偶yciu odpowiedniego standardu takiego jak ANSI X.12 lub United聽Nations EDIFACT (EDI For Administration, Commerce and Transport).

Dzi臋ki powszechnej akceptacji EDI, oraz mi臋dzynarodowej wsp贸艂pracy przy rozwoju standard贸w, EDI mo偶e sta膰 si臋 znacz膮c膮 metod膮 komunikacji w wielu krajach. Powszechnie uwa偶a si臋, 偶e jest ju偶 tylko kwesti膮 czasu to, 偶e EDI stanie si臋 najcz臋stszym sposobem wymiany informacji pomi臋dzy przedsi臋biorstwami [1,聽str.172].

Kolejnym typem dokumentu elektronicznego powi膮zanego z systemami komunikacyjnymi jest formularz elektroniczny. Formularz taki mo偶na okre艣li膰 jako elektroniczny odpowiednik formularza drukowanego na papierze. Formularze powszechnie wykorzystywane s膮 w: aplikacjach, kwestionariuszach, deklaracjach podatkowych, raportach itp.

Formularze elektroniczne mog膮 zosta膰 zaimplementowane na dwa podstawowe sposoby:

Aplikacje bazuj膮ce na formularzach dziel膮 si臋 na dwie cz臋艣ci: oprogramowanie przeznaczone do projektowania formularzy oraz oprogramowanie przeznaczone do ich wype艂niania. Aby utworzy膰 formularz niezb臋dne b臋dzie wykorzystanie przez projektanta obu rodzaj贸w oprogramowania. U偶ytkownik formularza potrzebuje jedynie oprogramowania do wype艂niania go.

Po wype艂nieniu, formularz lub jego zawarto艣膰 mo偶e zosta膰 wys艂ana do innego u偶ytkownika. Gdy formularz zostanie ju偶 wys艂any, mo偶e on by膰 nast臋pnie automatycznie przemieszczany jako element systemu workflow lub systemu zarz膮dzania dokumentami. Oznacza to, 偶e wype艂niony formularz mo偶e by膰 automatycznie transmitowany przez sie膰 komputerow膮 do ustalonej liczby u偶ytkownik贸w w celu podj臋cia przez nich dalszych dzia艂a艅 na dokumencie.

Do aplikacji bazuj膮cych na formularzach mo偶na zaliczy膰 mi臋dzy innymi: „InForms” firmy Novell, „Lotus Forms” firmy Lotus Development, oraz „FormFlow” firmy Derlina.

Generalnie formularze utworzone przy zastosowaniu takich aplikacji nie mog膮 by膰 wymieniane pomi臋dzy r贸偶nymi systemami. Aczkolwiek wiele system贸w wspiera powszechne protoko艂y wymiany komunikat贸w takie jak MAPI lub VIM, dzi臋ki czemu informacja zawarta w formularzach mo偶e by膰 swobodnie przenoszona w sieci komputerowej.

Mo偶liwe jest r贸wnie偶 wykorzystanie formularzy wy艂膮cznie jako interfejs贸w, i聽przekazywanie informacji zawartej wewn膮trz ich p贸l jako oddzielnych plik贸w聽ASCII. Dzi臋ki tej w艂a艣ciwo艣ci formularze mog膮 by膰 wykorzystywane jako interfejsy do transakcji EDI.

Opr贸cz aplikacji formularzowych, szereg innych system贸w informatycznych korzysta z formularzy. Do najpopularniejszych przyk艂ad贸w nale偶膮 systemy zarz膮dzania bazami danych oraz dokumenty hipertekstowe.

Systemy zarz膮dzania bazami danych takie jak Microsoft Access, Claris FileMaker Pro oraz Borland dBase, wykorzystuj膮 formularze jako interfejsy do swoich baz danych. Wiele z element贸w tworz膮cych formularze, takich jak pola wprowadzania danych, przyciski, pola wyboru itp. dost臋pnych jest przy tworzeniu interfejs贸w do danych w wy偶ej wymienionych pakietach. Podstawow膮 r贸偶nic膮 pomi臋dzy tymi formularzami jest to, 偶e s膮 one 艣ci艣le zintegrowane z konkretnym systemem. Najwi臋ksz膮 wad膮 takiego podej艣cia jest to, 偶e formularz taki nie jest w聽pe艂ni odr臋bnym dokumentem, gdy偶 musi on by膰 przez ca艂y czas dost臋pny razem z聽baz膮 danych.

Jedno z narz臋dzi „nawigacji” w Internecie, okre艣lane jako WWW, korzysta ze struktury dokument贸w hipertekstowych HTML. Jedn膮 z cech tego systemu jest to, 偶e umo偶liwia on niezale偶n膮 od platformy oraz oprogramowania metod臋 tworzenia interfejs贸w w oparciu o formularze. J臋zyk HTML wspiera u偶ycie rozwijanych list, p贸l tekstowych oraz p贸l wyboru, aby umo偶liwi膰 u偶ytkownikowi interakcj臋 z systemem informacyjnym lub baz膮 danych. Poniewa偶 HTML jest niezale偶ny od platformy, oznacza to, 偶e klient (korzystaj膮cy z formularza) oraz serwer (zarz膮dzaj膮cy baz膮 danych) mog膮 by膰 na ca艂kowicie odmiennych platformach sprz臋towych.

    1. Dokumenty sk艂adane dynamicznie

Znaczna cz臋艣膰 dokument贸w zawiera wiele r贸偶nych typ贸w danych i z tego powodu okre艣lane s膮 one mianem z艂o偶onych lub sk艂adanych聽[8]. W przesz艂o艣ci aplikacje takie jak procesory tekstu czy pakiety graficzne dzia艂a艂y niezale偶nie od siebie nawzajem. W najlepszym razie by艂y one w stanie zaimportowa膰 okre艣lone typy plik贸w w celu ich dalszej obr贸bki. Jednak偶e dzi臋ki rozwojowi nowych opartych o graficzn膮 komunikacj臋 z u偶ytkownikiem system贸w operacyjnych takich jak Microsoft Windows, OS/2 czy MacOS, powsta艂o szereg r贸偶nych metod komunikacji pomi臋dzy aplikacjami. Metody te pozwalaj膮 programom na 艂atwe kopiowanie, wstawianie i w艂膮czanie informacji zawartych w jednym dokumencie do innego dokumentu. Celem aplikacji zawieraj膮cych obiektowo zorientowane dokumenty jest nie tylko wymiana obiekt贸w z danymi, ale r贸wnie偶 ich ponowne wykorzystanie.

Zwykle, gdy dane 藕r贸d艂owe s膮 wstawiane do dokumentu, po艂膮czenie pomi臋dzy 藕r贸d艂em i dokumentem przestaje istnie膰. Oznacza to, 偶e w przypadku gdy dane zostaj膮 zmienione, dokument nie jest automatycznie aktualizowany. Przyczynia si臋 to do potrzeby cz臋stych rewizji dokument贸w, oraz mo偶e to powodowa膰 powstawanie licznych b艂臋d贸w.

Dzi臋ki 艂膮czeniu dokument贸w z ich 藕r贸d艂em danych, powoduje si臋, 偶e dokument zawsze zawiera dane aktualne. Wewn膮trz dokument贸w opis danych mo偶e zawiera膰 informacj臋 o tym jak zawarte w dokumencie dane s膮 dzielone lub aktualizowane w innych dokumentach. Podej艣cie takie daje grupom roboczym mo偶liwo艣膰 reorganizacji prac zwi膮zanych z generowaniem i aktualizacj膮 dokument贸w聽[4].

Rozw贸j struktur dokument贸w sk艂adanych dynamicznie dokonuje si臋 dopiero od niedawna, i dlatego nie zosta艂y one jeszcze szeroko zaakceptowane. Tabela聽4 przedstawia szereg standardowych metod komunikacji pomi臋dzy aplikacjami oraz standard贸w dynamicznie sk艂adanych dokument贸w.

Tabela 4

Przyk艂ad kilku standard贸w komunikacji pomi臋dzy aplikacjami oraz standard贸w dynamicznie sk艂adanych dokument贸w.

Standard

Opis

Tw贸rca

Cut & Paste

Kopiuje lub przemieszcza dane wewn膮trz lub pomi臋dzy dokumentami

Wielu

Print merge

Wstawia dane (zwykle z bazy danych) w聽puste pola we wzorcu dokumentu

Wielu

Publish & Subscribe

W艂asna metoda dynamicznego dzielenia danych pomi臋dzy dokumentami

Apple Computer

DDE

„Dynamic Data Exchange” - dynamicznie 艂膮czy dane pomi臋dzy dokumentami

Microsoft

OLE

„Object Linking and Embedding” - standard interaktywnej wymiany obiekt贸w z r贸偶nych aplikacji w sk艂adanych dokumentach

Microsoft

OpenDoc

Specyfikacja sk艂adanych dokument贸w,
podobna do OLE, lecz posiadaj膮ca wi臋cej zaawansowanych cech

Component Integration Laboratories

DSOM

„Distributed System Object Model” - specyfikacja sk艂adanych dokument贸w

IBM

CORBA

„Common Object Request Broker Architecture” - specyfikacja rozproszonego 艣rodowiska z聽przeno艣nymi obiektami

H-P, DEC, Sun Microsystem

PDO

„Portable Distribution Object” - specyfikacja sk艂adanych dokument贸w

NeXt

Frameworks

Specyfikacja sk艂adanych dokument贸w

Taligent

殴r贸d艂o:聽[1,聽str.177]

Spo艣r贸d wszystkich dost臋pnych standard贸w, jedynie dwa b臋d膮 mia艂y wi臋ksze znaczenie dla u偶ytkownik贸w komputer贸w. S膮 to standardy OLE i聽OpenDoc. Celem聽obu tych standard贸w jest umo偶liwienie tworzenia na wielu platformach dokument贸w sk艂adanych dynamicznie, kt贸re mog膮 by膰 opracowywane i u偶ywane wsp贸lnie przez wiele os贸b聽[1,聽str.177]. R贸wnie偶 oba te standardy s膮 przedstawicielami nowych, zorientowanych na dokument technologii.

    1. Dokumenty sk艂adane w procesie

Zbi贸r znak贸w ASCII zawsze by艂 postrzegany jako uniwersalna metoda neutralnej wymiany danych. Istnieje jednak pewien niedostatek element贸w w聽ASCII potrzebnych do kodowania z艂o偶onych dokument贸w聽[8]. Wynika on z tego, 偶e ASCII przeznaczony jest g艂贸wnie do wyra偶ania tre艣ci dokumentu, ma za艣 ograniczone mo偶liwo艣ci jego formatowania.

Dokumenty sk艂adane zwykle zawieraj膮 informacj臋, kt贸ra zosta艂a starannie sformatowana, w zwi膮zku z czym zachodzi konieczno艣膰 wyra偶enia ich w trzech wymiarach: tre艣ci, struktury i stylu prezentacji聽[8]. Dlatego te偶 celem neutralnego modelu kodowania dokument贸w jest konwersja zawarto艣ci dokumentu, jego uk艂adu oraz prezentacji, tak aby m贸g艂 by膰 on p贸藕niej u偶ywany przez r贸偶nego typu aplikacje, poddawany dalszej edycji, przechowywany, drukowany oraz przekazywany聽[8].

Mi臋dzynarodowa Organizacja Standaryzacyjna (ISO) jak do tej pory opublikowa艂a dwa standardy otwartej wymiany dokument贸w odpowiadaj膮ce powy偶szym za艂o偶eniom. Pierwszym standardem w tej kategorii by艂 SGML (Standard Generalised Markup Language), opublikowany w 1986r. Drugim standardem by艂a ODA (Open Document Architecture) opublikowana w 1987r. Kolejny model nazywany CDA ukaza艂 si臋 w 1989r.i w znacznym stopniu bazuje na聽ODA聽[1,聽str.180].

Tabela 5

Przyk艂ad kilku popularnych modeli sk艂adu dokumentu w procesie.

Standard

Opis

W艂a艣ciciel / Tw贸rca

SGML (ISO 8879:1986)

Opis struktury dokument贸w

ISO

ODA (ISO 8613:1989)

Kodowanie sk艂adanych dokument贸w

ISO

CDA

Kodowanie sk艂adanych dokument贸w

DEC

殴r贸d艂o:聽[1,聽str.180]

Ka偶dy ze standard贸w przedstawionych w tabeli聽5 cechuje odmienne podej艣cie do sk艂adu dokument贸w. SGML znany jest jako j臋zyk etykiet i stosowany do oznaczania struktury dokument贸w bazuj膮cych na ASCII. ODA oraz CDA zaprojektowane zosta艂y tak, aby dostarcza艂y standardowych metod wymiany sformatowanych strukturalnie i proceduralnie dokument贸w pomi臋dzy r贸偶nymi platformami komputerowymi i aplikacjami. Najbardziej rozpowszechnionym z tych standard贸w jest SGML聽[4].

SGML oferuje neutraln膮 metod臋 organizacji dokumentu przy u偶yciu strukturalnych etykiet. Oznacza to, 偶e dokument mo偶e zosta膰 zorganizowany zgodnie z takimi elementami jak nag艂贸wki, paragrafy, tabele, listy itp. SGML nie u偶ywa jednak 偶adnych etykiet proceduralnych do opisu formatowania dokumentu takich jak uk艂ad strony, czcionka czy marginesy. Innymi s艂owy zawarto艣膰 dokumentu jest rozpatrywana ca艂kowicie oddzielnie od jego formatowania.

Najwi臋ksz膮 zalet膮 stosowania strukturalnych etykiet takich jak w SGML jest to, 偶e zawarto艣膰 dokument贸w mo偶e by膰 przechowywana w spos贸b niezale偶ny od technologii formatowania dokument贸w聽[4]. Poniewa偶 technologie informatyczne ulegaj膮 ci膮g艂ym zmianom, zastosowanie SGML podnosi w znacznym stopniu u偶yteczno艣膰 informacji zawartych w dokumentach.

    1. Dokumenty - widoki

Ocenia si臋, 偶e pomi臋dzy 50 a 80 procent potrzeb u偶ytkownik贸w komputer贸w dotyczy wy艂膮cznie wy艣wietlania dokument贸w na ekranie聽[1,聽str.186]. Fakt ten przyczyni艂 si臋 do opracowania szeregu typ贸w dokument贸w elektronicznych, kt贸rych g艂贸wnym przeznaczeniem jest dostarczanie widoku (wersji nieedytowalnej) dokumentu. Dokumenty te okre艣lane s膮 mianem dokument贸w - widok贸w.

Podczas, gdy istnieje ca艂y szereg r贸偶nych dokument贸w聽-聽widok贸w przeznaczonych do odczytu przez tylko jedn膮 aplikacj臋 lub platform臋, to najbardziej u偶yteczne s膮 te formaty dokument贸w, kt贸re zaprojektowane zosta艂y do zastosowa艅 na wielu r贸偶nych platformach sprz臋towych i programowych. W tabeli聽6 przedstawionych zosta艂o szereg najpopularniejszych format贸w dokument贸w聽- widok贸w.

Tabela 6

Przyk艂ad kilku popularnych format贸w dokument贸w - widok贸w.

Format

System operacyjny

Tw贸rca

Acrobat (PDF)

MacOS, DOS, Windows, SunOS

Adobe Systems

Common Ground

Solaris, MacOS, Windows

No Hands Software

Worldview

MacOS, Windows, Unix, VMS

Interleaf

Portable Digital Document (PDD)

MacOS

Apple Computer

Replica

MacOS, Windows

Fallon

FrameViewer

MacOS, Windows, X/motif, Unix

Frame Technologies

DocViewer

MacOS

Apple Computer

Envoy

MacOS, Windows

WordPerfect

GhostView

MacOS, OS/2, Windows, Unix, VMS

Alladin

殴r贸d艂o:聽[1,聽str.187]

Zadaniem dokument贸w聽-聽widok贸w jest dostarczanie w pe艂ni sformatowanej struktury dokumentu, kt贸ra mo偶e by膰 dystrybuowana pomi臋dzy r贸偶nymi komputerami, niezale偶nie od ich platformy sprz臋towej, systemu operacyjnego lub aplikacji, kt贸ra pos艂u偶y艂a do utworzenia dokumentu. Kiedy u偶ytkownik otrzymuje dokument聽-聽widok, mo偶e wykonywa膰 na nim takie operacje jak przegl膮danie, przeszukiwanie, tworzenie przypis贸w, drukowanie oraz sk艂adowanie w swoim w艂asnym systemie聽[3].

Dokument, kt贸ry zosta艂 przekonwertowany do formatu dokumentu聽-聽widoku, mo偶e by膰 dystrybuowany do u偶ytkownik贸w na wielu r贸偶nych platformach oraz wy艣wietlany niezale偶nie od aplikacji, kt贸ra pierwotnie pos艂u偶y艂a do jego powstania. Ka偶dy odbiorca b臋dzie dysponowa艂 dokumentem o takim samym wygl膮dzie jak dokument 藕r贸d艂owy. Dla przyk艂adu z艂o偶ony raport zawieraj膮cy tekst, grafik臋, arkusz kalkulacyjny i wykresy CAD mo偶e zosta膰 utworzony przy u偶yciu sytemu do sk艂adu tekstu na komputerze Macintosh. Po konwersji na przyk艂ad do formatu PDF, mo偶e by膰 on przekazywany do innych u偶ytkownik贸w niezale偶nie od tego, czy korzystaj膮 oni z systemu operacyjnego MacOS, Windows czy Unix. Jedynym聽wymogiem jest posiadanie przez nich odpowiedniego programu do przegl膮dania tego typu dokument贸w.

    1. Dokumenty elektronicznych odno艣nik贸w oraz 艂膮czonych form informacji

Dokumenty elektronicznych odno艣nik贸w ERD (ang.聽Electronic reference documents) spe艂niaj膮 takie samo zadanie jak kopiowanie powi膮zanych dokument贸w. S膮 one znane r贸wnie偶 pod innymi angielskimi nazwami, takimi jak: „softcopy”, „enhanced documents”, „hypertext” oraz „hypermedia”聽[1,聽str.194]. Dzi臋ki strukturyzacji dokument贸w elektronicznych przy u偶yciu metody elektronicznych odno艣nik贸w, informacja mo偶e by膰 b艂yskawicznie zlokalizowana wewn膮trz olbrzymiej kolekcji dokument贸w.

Koncepcja 艂膮czenia dokument贸w przy pomocy elektronicznych odno艣nik贸w przedstawiona zosta艂a na rysunku聽11.

0x01 graphic

Rysunek 11. Szereg dokument贸w po艂膮czonych elektronicznymi odno艣nikami.

殴r贸d艂o: Opracowanie w艂asne

Kluczowym elementem system贸w opartych o dokumenty elektronicznych odno艣nik贸w jest zastosowanie struktury dost臋pu do informacji, kt贸ra mo偶e zosta膰 przystosowana do proces贸w skojarzeniowych w ludzkiej pami臋ci聽[4].

W dokumentach bazuj膮cych na papierze (np. ksi膮偶ki) - rozdzia艂y, paragrafy i聽strony nast臋puj膮 kolejno po sobie w porz膮dku zale偶nym nie tylko od intencji autora, ale r贸wnie偶 od fizycznej konstrukcji samego dokumentu. W dokumentach elektronicznych odno艣nik贸w istnieje system po艂膮cze艅, kt贸re pozwalaj膮 czytelnikowi na przyswajanie informacji w dowolnej kolejno艣ci.

Wsp贸lnym dla wszystkich system贸w dokument贸w elektronicznych odno艣nik贸w s膮 koncepcje 艂膮czenia (ang. linking), wertowania (ang. browsing) oraz nawigacji (ang. navigating)聽[4]:

Dzi臋ki zastosowaniu tych technik informacja zawarta w dokumencie mo偶e by膰 dost臋pna w spos贸b nieliniowy.

W tabeli聽7 przedstawionych zosta艂o kilka standard贸w dokument贸w elektronicznych odno艣nik贸w.

Tabela 7

Przyk艂ad kilku system贸w oraz standard贸w dokument贸w elektronicznych odno艣nik贸w.

Standard / Produkt

Opis

W艂a艣ciciel / Tw贸rca

HTML

Hypertext Markup Language - bazuj膮cy na SGML j臋zyk elektronicznych odno艣nik贸w

IETF (Internet Engineering Task Force) & W3C (World Wide Web Consorcium)

DynaText

Bazuj膮cy na SGML system odwo艂a艅 do dokument贸w elektronicznych

Electronic Book Technologies

Explorer

Bazuj膮cy na SGML system odwo艂a艅 do dokument贸w elektronicznych

SoftQuad

FolioViews

System odwo艂a艅 do dokument贸w elektronicznych

Folio Corporation

BookManager

System odwo艂a艅 do dokument贸w elektronicznych

IBM

HyperWriter

System odwo艂a艅 do dokument贸w elektronicznych

Ntergaid

Standard / Produkt

Opis

W艂a艣ciciel / Tw贸rca

KnowledgePro

System odwo艂a艅 do dokument贸w elektronicznych bazuj膮cy na systemie ekspertowym

Knowledge Garden

MS-Help

Pliki pomocy elektronicznej

Microsoft

Hytime
(ISO/IEC 10744)

J臋zyk strukturalny bazuj膮cy na SGML

ISO

殴r贸d艂o:聽[1,聽str.197]

Obecnie najbardziej rozpowszechnionym systemem dokument贸w elektronicznych odno艣nik贸w jest World Wide Web (znane r贸wnie偶 jako WWW lub po prostu Web). Jest to jeden z najnowszych no艣nik贸w dost臋pnych w Internecie. WWW jest olbrzymim zbiorem po艂膮cze艅 dokument贸w hipertekstowych. Dokumenty te zawieraj膮 odwo艂ania do innych dokument贸w lub miejsc ftp, gopher, telnet itd. Za pomoc膮 przegl膮darki WWW mo偶na przechodzi膰 od jednego po艂膮czenia do innego, poruszaj膮c si臋 wzd艂u偶 po艂膮cze艅 w dowoln膮 ich stron臋.

Hipertekst jest to tekst z odwo艂aniami. Odwo艂ania te s膮 elementami dokumentu hipertekstowego i s膮 tworzone przez jego autora. Wybranie odwo艂ania powoduje przeniesienie do dokumentu, z kt贸rym bie偶膮cy dokument by艂 powi膮zany lub te偶 do innej cz臋艣ci bie偶膮cego dokumentu.

Dokumenty hipertekstowe w WWW s膮 strukturyzowane przy u偶yciu j臋zyka Hypertext Markup Language (HTML). Jest to j臋zyk, kt贸ry powsta艂 w oparciu o聽j臋zyk opisu struktury dokumentu SGML. Specyfikacja HTML definiuje zbi贸r predefiniowanych element贸w, kt贸re mog膮 pos艂u偶y膰 do oznaczania dokument贸w dla dystrybucji ich w Internecie聽[1,聽str.198]. Przegl膮darki WWW s膮 w stanie interpretowa膰 i聽wy艣wietla膰 dokumenty HTML oraz inne bazuj膮ce na kodach ASCII.

Specyfikacja HTML definiuje szereg element贸w, kt贸re umo偶liwiaj膮 autorowi definiowanie sposobu strukturyzacji dokumentu. Stosuj膮c te elementy, autor mo偶e osi膮ga膰 takie efekty jak: