Uniwersytet Gda艅ski
Wydzia艂 Zarz膮dzania
Katedra Informatyki Ekonomicznej
Adam Drewnowski
Nr albumu 75931
„System biurowy administracji rz膮dowej” jako przyk艂ad zastosowa艅 systemu zarz膮dzania dokumentami elektronicznymi
Praca magisterska
napisana pod kierunkiem
dra Marka Markowskiego
Sopot 1998
Spis tre艣ci
Wst臋p
Wst臋p
W ostatnich kilkunastu latach organizacje na ca艂ym 艣wiecie chc膮c skutecznie realizowa膰 zamierzone cele zmuszone s膮 do wykorzystywania w swojej dzia艂alno艣ci nowych technologii informatycznych. Wraz z post臋puj膮c膮 komputeryzacj膮 organizacji, ro艣nie zainteresowanie dokumentami elektronicznymi oraz systemami do zarz膮dzania nimi. Bardzo du偶e zapotrzebowanie na tego rodzaju systemy istnieje zw艂aszcza ze strony takich podmiot贸w jak banki, firmy ubezpieczeniowe, administracja pa艅stwowa oraz innych, w kt贸rych zarz膮dzanie dokumentami ma kluczowe znaczenie. Jednocze艣nie organizacje te bardzo cz臋sto, ze wzgl臋du na brak dostatecznej wiedzy, nie potrafi膮 precyzyjnie wyrazi膰 swoich potrzeb w tym zakresie.
G艂贸wnymi 藕r贸d艂ami informacji w Polsce w dziedzinie zarz膮dzania dokumentami elektronicznymi s膮 opracowania obcoj臋zyczne, g艂贸wnie w j臋zyku angielskim oraz strony WWW w sieci komputerowej Internet. Jednocze艣nie istnieje niewiele polskich publikacji na ten temat, a te kt贸re s膮, pojawi艂y si臋 g艂贸wnie w聽specjalistycznych pismach informatycznych, zazwyczaj przy okazji opisu komercyjnych produkt贸w (programistycznych i sprz臋towych), co czyni te opracowania ma艂o obiektywnymi. Bior膮c pod uwag臋 du偶e potrzeby oraz ma艂膮 wiedz臋 organizacji w tej dziedzinie, dziwi膰 mo偶e brak obszernych polskich opracowa艅.
Technologie zarz膮dzania dokumentami elektronicznymi s膮 stosunkowo nowe zar贸wno w Polsce jak i na 艣wiecie. St膮d te偶 cz臋sto brak jest polskich odpowiednik贸w wielu angielskich termin贸w u偶ywanych do ich opisu, nie zawsze r贸wnie偶 istnieje ich jednoznaczne nazewnictwo w literaturze angielskiej.
Celem niniejszego opracowania jest uporz膮dkowanie i prezentacja zagadnie艅 zwi膮zanych z wykorzystaniem dokument贸w elektronicznych oraz technologii zarz膮dzania tymi dokumentami. Aby om贸wi膰 istot臋 problemu niezb臋dna jest znajomo艣膰 takich poj臋膰 jak: dokument, dokument elektroniczny oraz system zarz膮dzania dokumentami elektronicznymi.
Opracowanie sk艂ada si臋 z czterech rozdzia艂贸w. W rozdziale pierwszym wprowadzone zostaj膮 oraz om贸wione podstawowe poj臋cia i definicje dotycz膮ce dokument贸w. Za pomoc膮 definicji komentowany jest termin „dokument" oraz opisywanych jest wiele w艂a艣ciwo艣ci i atrybut贸w dokument贸w zar贸wno papierowych jak i elektronicznych. Rozdzia艂 ten jest wst臋pem do kolejnych rozdzia艂贸w, kt贸re szczeg贸艂owiej opisuj膮 technologie dokument贸w elektronicznych.
Rozdzia艂 drugi stanowi przegl膮d istniej膮cych oraz powstaj膮cych standard贸w w聽technologii dokument贸w elektronicznych. W rozdziale tym pokazane zosta艂o w聽jaki spos贸b r贸偶ne typy danych (tekst, grafika) mog膮 zosta膰 umieszczone wewn膮trz dokumentu przy zastosowaniu r贸偶nych metod kodowania. Om贸wione zosta艂y zar贸wno tradycyjne, zorientowane na aplikacje standardy, jak r贸wnie偶 standardy niezale偶ne od platformy i aplikacji. Wa偶ne w tym rozdziale jest to, aby u艣wiadomi膰 sobie, 偶e opisywane tam typy dokument贸w elektronicznych, w bardzo wielu przypadkach s膮 w ci膮g艂ym rozwoju. Rozw贸j ten jest 艣ci艣le zwi膮zany ze zmianami zachodz膮cymi w 艣rodowisku komputerowym, w kt贸rym dokumenty te istniej膮.
Rozdzia艂 trzeci po艣wi臋cony jest zarz膮dzaniu dokumentami elektronicznymi. W rozdziale tym przedstawiona zosta艂a idea oraz zadania realizowane przez systemy zarz膮dzania dokumentami elektronicznymi (SZDE). Scharakteryzowane zosta艂y tam r贸wnie偶 najpopularniejsze standardy tych system贸w. Rozdzia艂 ten jest jednocze艣nie opisem zbioru najwa偶niejszych technologii informatycznych stosowanych obecnie w dziedzinie zarz膮dzania dokumentami elektronicznymi.
Ostatni, czwarty rozdzia艂 stanowi studium przedsi臋wzi臋cia „Systemu biurowego administracji rz膮dowej” opracowanego na potrzeby Ministerstwa Spraw Wewn臋trznych i Administracji. Jest on doskona艂ym przyk艂adem pokazuj膮cym to, w聽jaki spos贸b firmy, organizacje oraz instytucje wyra偶aj膮 swoje potrzeby oraz wymagania w dziedzinie zarz膮dzania dokumentami.
Charakterystyka dokumentu - podstawowe poj臋cia i聽definicje
Ocenia si臋, 偶e 艣rednio sze艣膰dziesi膮t procent czasu przeznaczonego na prac臋 ludzie sp臋dzaj膮 przy obs艂udze dokument贸w. Rocznie w skali ca艂ego 艣wiata r贸wna si臋 to produkcji ponad 92 miliard贸w dokument贸w 藕r贸d艂owych oraz ich 400聽miliard贸w fotokopii聽[3]. W trakcie u偶ytkowania tych dokument贸w rzadko my艣li si臋 o tym jak ka偶dy z nich zosta艂 zredagowany, napisany, wyprodukowany lub nawet dystrybuowany. Najwa偶niejszym faktem dla wielu ludzi jest istnienie dokumentu jako rzeczywistego (namacalnego) mechanizmu wymiany informacji.
Dokumenty nie tylko przenosz膮 wiele r贸偶nego rodzaju wiadomo艣ci, lecz r贸wnie偶 stosuj膮 r贸偶ne metody ich kodowania (przekazywania). Na przyk艂ad, uwzgl臋dniaj膮c zakres i z艂o偶ono艣膰 dokument贸w stosowanych w procesie projektowania, mo偶emy wyr贸偶ni膰: plany, specyfikacje, katalogi produkt贸w, broszury informacyjne, podr臋czniki i instrukcje. Ka偶dy z tych typ贸w dokument贸w mo偶e by膰 z 艂atwo艣ci膮 rozpoznany przez u偶ytkownika, pomimo tego i偶 s膮 one zwykle tworzone przy u偶yciu r贸偶nych metod kodowania, sk艂adni i prezentacji.
Dokumenty s膮 bardzo wa偶ne dla projektant贸w. S膮 szeroko u偶ywane w聽艂膮czeniu informacji pomi臋dzy rozmaitymi grupami zaanga偶owanymi w proces projektowania i konstrukcji. Ich istnienie w wielu przypadkach, jest nie tylko wymogiem formalnym, lecz r贸wnie偶 niezb臋dnym 艣rodkiem w procesie obs艂ugi wielkich ilo艣ci r贸偶norodnych informacji. W rzeczywisto艣ci jednym z聽najwa偶niejszych powod贸w istnienia dokument贸w jest ograniczenie ludzkiego m贸zgu do operowania na olbrzymich ilo艣ciach informacji. Wsp贸艂czesna psychologia przyznaje, 偶e pojemno艣膰 ludzkiego procesu my艣lowego jest ograniczona do mo偶liwo艣ci manipulowania tylko siedmioma (plus minus dwie) jednostkami informacji jednocze艣nie聽[1,聽str.28]. Z tego te偶 powodu dokumenty staj膮 si臋 dla projektant贸w koniecznym 艣rodkiem efektywnego i wiernego zapisu intencji projektu oraz przenoszenia go do klient贸w, konsultant贸w, kontrahent贸w oraz innych uczestnik贸w procesu tworzenia.
Definicja dokumentu
Jak do tej pory znaczenie terminu „dokument” zosta艂o zaledwie zasugerowane. Stosuje si臋 mn贸stwo definicji i interpretacji tego terminu. Definicje te zwykle zale偶ne s膮 od interpretacji formu艂owanych poprzez w艂asne do艣wiadczenia r贸偶nych ludzi. Dla przyk艂adu prawnicy b臋d膮 u偶ywa膰 zwykle tego poj臋cia w聽odniesieniu do legalnej ewidencji, architekci w stosunku do specyfikacji i聽rysunk贸w, za艣 muzycy w odniesieniu do zapis贸w nutowych. Ka偶de z tych okre艣le艅 jest ca艂kowicie poprawne, lecz s膮 one tylko mo偶liwymi przyk艂adami wykorzystania tego terminu.
Informatycy, drukarze, j臋zykoznawcy i psychologowie - ka偶da z tych grup ma sw贸j w艂asny pogl膮d na to, czym jest dokument, i co powinien zawiera膰. Trudno艣膰 w sformu艂owaniu uniwersalnej definicji, polega na tym, 偶e nie istnieje 偶adna 艣cis艂a teoria dotycz膮ca dokument贸w, dostarczaj膮ca ich sp贸jnego obrazu. Kolejn膮 trudno艣ci膮 jest to, 偶e nowo powstaj膮ce metody tworzenia i dystrybucji dokument贸w zwi臋kszaj膮 ci膮gle liczb臋 istniej膮cych ich typ贸w.
Pomimo istnienia ogromnej liczby rodzaj贸w dokument贸w, wszystkie one posiadaj膮 jedn膮 wa偶n膮, wsp贸ln膮 cech臋 - przenosz膮 informacj臋. Dlatego te偶 najprostszy opis dokumentu mo偶e wygl膮da膰 w nast臋puj膮cy spos贸b:
„Dokumentem jest powszechnie akceptowane medium dystrybucji i聽przyswajania informacji”聽[4].
Bardziej obszerna definicja mo偶e zosta膰 sformu艂owana nast臋puj膮co:
„Dokument jest seri膮 znak贸w (ang. marks) na pod艂o偶u (ang. substrate), spe艂niaj膮cym funkcje no艣nika, przy pomocy kt贸rego wiadomo艣ci mog膮 by膰 przenoszone od autora do 艣rodowiska czytelnik贸w, kt贸rzy s膮 oddzieleni od autora w聽czasie i przestrzeni”聽[2].
Regu艂a ta zosta艂a przedstawiona na rysunku聽1. W uproszczonej postaci powy偶sza definicja mo偶e r贸wnie偶 zosta膰 sformu艂owana jak poni偶ej:
„Dokument jest „pojemnikiem” z informacj膮 s艂u偶膮cym do przenoszenia wiadomo艣ci pomi臋dzy autorem i czytelnikiem”聽[1,聽str.28].
Rysunek 1. Relacja zachodz膮ca poprzez dokument pomi臋dzy autorem i聽czytelnikiem.
殴r贸d艂o:聽[2]
Na u偶ytek tej pracy, b臋dzie to ostateczna definicja. W najlepszy spos贸b syntetyzuje ona rozmaite elementy innych definicji, r贸wnie偶 wcze艣niej przedstawionych.
Poni偶ej przytoczonych zosta艂o kilka przyk艂adowych interpretacji terminu „dokument”. S膮 one w znacznym stopniu zale偶ne od profesji formu艂uj膮cego je聽autora.
Tak wi臋c osoba zajmuj膮ca si臋 archiwizacj膮 mianem dokumentu mog艂aby okre艣li膰:
„Ka偶dy przedmiot materialny wyra偶aj膮cy my艣l ludzk膮, s艂u偶膮cy do udowodnienia jakiego艣 twierdzenia; dokumenty graficzne (druki, r臋kopisy itp.), ogl膮dowe (m.in. fotografie, filmy) i s艂uchowe (ta艣my d藕wi臋kowe, p艂yty)”聽[11,聽str.182].
W uj臋ciu historyka dokumentem by艂oby:
„Ka偶de pisemne o艣wiadczenie, samodzielne prawnie i kancelaryjnie, kt贸re s艂u偶y艂o powstaniu, udowodnieniu i wykonaniu okre艣lonych uprawnie艅 oraz posiadaj膮ce pewne wyznaczone prawem i kultur膮 cechy, zmieniaj膮ce si臋 zale偶nie od czasu i miejsca jego powstania”聽[11,聽str.182].
Prawnik natomiast okre艣li艂by dokument jako:
„Ka偶dy przedmiot stanowi膮cy dow贸d prawa, stosunku prawnego lub okoliczno艣ci mog膮cych mie膰 znaczenie prawne”聽[11,聽str.182].
Dla informatyka dokumentem b臋dzie zwykle:
„Dowolny format zawieraj膮cy informacj臋. Dokumentem mo偶e by膰 tutaj plik tekstowy, wiadomo艣膰 e-mail, arkusz kalkulacyjny, tablica bazy danych, poczta g艂osowa lub inne nagranie audio, faks, formularz biznesowy, obraz, informacje uzyskane z Internetu, itd.”聽[6].
Zgodnie z ANSI/AIIM TR40-1995, dokumentem b臋dzie „kolekcja sk艂adaj膮ca si臋 z zera lub wi臋kszej ilo艣ci stron, kt贸re zosta艂y nawzajem po艂膮czone w聽dowolny, stosowny dla okre艣lonej aplikacji spos贸b”聽[6].
„Dokument elektroniczny - jest to dowolny dokument przechowywany w聽komputerze. Dokument taki m贸g艂 zosta膰 utworzony przy pomocy komputera, jak np. plik tekstowy i arkusz kalkulacyjny, lub te偶 m贸g艂 by膰 przekszta艂cony w聽dokument elektroniczny za pomoc膮 techniki zwanej obrazowaniem dokumentu (ang. document imaging)”聽[6].
Z poj臋ciem „dokument”, niezale偶nie od stosowanej interpretacji nierozerwalnie zwi膮zany jest kolejny termin - cyklu 偶ycia dokumentu.
„Cyklem 偶ycia dokumentu jest okres, kt贸ry zawiera stworzenie, utrzymanie, u偶ytkowanie oraz ostateczn膮 dyspozycj臋 (zniszczenie) dokumentu. Osoba (lub te偶 program) zarz膮dzaj膮ca dokumentami (baz膮 danych) powinna zna膰 cykl 偶ycia ka偶dego dokumentu wewn膮trz organizacji”聽[6].
Elementy sk艂adowe dokumentu
Kluczowe komponenty dokumentu mog膮 zosta膰 podzielone na trzy cz臋艣ci: znaki (ang. marks), pod艂o偶e (ang. substrate) oraz pojemnik (ang. container)聽[2]. Definicje i przyk艂ady tych element贸w zosta艂y przedstawione poni偶ej oraz zilustrowane na rysunku聽2.
Znaki mog膮 zosta膰 zdefiniowane jako tusze, barwniki, punkty ekranowe, kt贸re formuj膮 graficzne i tekstowe obiekty na no艣niku. Przyk艂ady: atrament, grafit, w臋giel, kredka, d艂ugopis, akwarela, farba, punkty ekranowe (ang. pixels).
Pod艂o偶e mo偶na przedstawi膰 jako utrwalon膮 lub przeno艣n膮 powierzchni臋, na聽kt贸rej tworzone s膮 znaki dokumentu.
Przeno艣nym pod艂o偶em (ang. portable substrate) jest takie pod艂o偶e, kt贸re mo偶e zosta膰 zabrane z urz膮dzenia lub miejsca w kt贸rym zosta艂o utworzone. Na聽przyk艂ad: papier, kalka, fotokopia, rolka filmowa, p艂贸tno, tablica, film.
Utrwalonym pod艂o偶em (ang. fixed substrate) jest takie pod艂o偶e, kt贸re wymaga od czytaj膮cego przyj艣cia do dokumentu, w celu przeczytania go. Na聽przyk艂ad: monitor komputera, czytnik.
Pojemnik mo偶e by膰 rozwa偶any jako „zbiornik”, kt贸ry formatuje pod艂o偶e oraz znaki. Przyk艂ady pojemnik贸w: plany, kontrakty, specyfikacje, broszury, pliki komputerowe.
Rysunek 2. Komponenty dokumentu.
殴r贸d艂o:聽[2]
Poza przytoczonymi ju偶 wcze艣niej definicjami, istniej膮 kolejne poj臋cia, kt贸re nale偶y om贸wi膰, w celu lepszego zrozumienia idei dokument贸w. W kolejnych podrozdzia艂ach rozwa偶one zostan膮 mechanizmy oraz struktury, dzi臋ki kt贸rym dokumenty s膮 w stanie przenosi膰 zawarte w nich wiadomo艣ci.
Typy dokument贸w
Dokumenty mog膮 zosta膰 podzielone na dwa g艂贸wne typy: dokumenty rzeczywiste oraz dokumenty wirtualne聽[2]. Rozr贸偶nienie to jest niezb臋dne w celu wprowadzenia w dalszej cz臋艣ci koncepcji nawi膮zuj膮cej do technologii dokument贸w elektronicznych oraz sposobu w jaki s膮 one tworzone, wymieniane i wy艣wietlane w聽艣rodowisku elektronicznym.
„Dokument rzeczywisty (ang. actual document) - termin oznaczaj膮cy fizyczny obiekt, kt贸ry czytelnik widzi i u偶ywa. Innymi s艂owy, dokument rzeczywisty jest zbiorem znak贸w, kt贸re pojawiaj膮 si臋 na no艣niku”聽[2]. Znaki te mog膮 by膰 zar贸wno proste jak i z艂o偶one, lecz ka偶dy dostrzegalny element odgrywa tak膮 sam膮 rol臋 w kszta艂towaniu si臋 zrozumienia przez czytelnika poszczeg贸lnych dokument贸w. Jest to pow贸d, dla kt贸rego dokumenty prawne s膮 tak precyzyjnie formu艂owane, za艣 architektoniczne szkice tak wiernie narysowane.
Podczas gdy autor dokumentu jest nieobecny, oczywistym jest, 偶e czytelnik musi polega膰 wy艂膮cznie na informacji, kt贸ra mo偶e by膰 fizycznie przedstawiona na dokumencie rzeczywistym. Na przyk艂ad, budowniczy, kt贸ry jest odosobniony na miejscu budowy, zwykle polega艂 b臋dzie na informacji, kt贸r膮 mo偶e odczyta膰 z聽plan贸w oraz specyfikacji, utworzonych przez architekta. W tym przypadku plany pozwalaj膮 architektowi na oddalenie si臋 w czasie i przestrzeni od miejsca budowy.
„Dokument rzeczywisty - jest fizyczn膮 prezentacj膮 zbioru znak贸w na no艣niku”聽[2].
„Dokument wirtualny (ang. virtual document) - termin u偶ywany do opisu specyfikacji dla dokumentu rzeczywistego, kt贸ry ma zosta膰 utworzony przez system”聽[2]. Termin ten jest kojarzony przede wszystkim z komputerami, dzi臋ki kt贸rym dokument wirtualny istnieje jako struktura danych.
„Dokument wirtualny - jest opisem struktury danych zawarto艣ci dokumentu”聽[2].
Przyk艂ad demonstruj膮cy r贸偶nice pomi臋dzy dokumentem rzeczywistym a聽wirtualnym zosta艂 pokazany na rysunku聽3.
Rysunek 3. R贸偶nica pomi臋dzy dokumentem rzeczywistym i wirtualnym.
殴r贸d艂o:聽[2]
Struktura dokumentu
W poprzednich podrozdzia艂ach dokument zdefiniowany zosta艂 jako „pojemnik” z informacj膮, co jest r贸wnoznaczne z tym, 偶e posiada on pewn膮 zawarto艣膰. Je艣li dokument istnieje w formie elektronicznej, zawarto艣ci膮 tak膮 mo偶na manipulowa膰 na wiele r贸偶nych sposob贸w, co nie jest niestety mo偶liwe w przypadku gdy jako pod艂o偶a dokumentu u偶ywamy wy艂膮cznie papieru.
Zanim rozpocz臋艂o si臋 powszechne stosowanie komputer贸w, niewiele mo偶na by艂o zrobi膰 je艣li chodzi o rozszerzenie u偶yteczno艣ci dokument贸w bazuj膮cych na papierze, poza mo偶liwo艣ci膮 ich odczytu, kategoryzowania i przechowywania. Dla聽przyk艂adu w systemach bibliotecznych podczas ustalania kolejno艣ci segregowania czy te偶 kategoryzacji u偶ywa si臋 zwykle: kodu dziesi臋tnego, nazwiska autora, tytu艂u, roku, miejsca publikacji, opisu fizycznego, adnotacji, s艂贸w kluczowych, mi臋dzynarodowego standardowego numeru ksi膮偶ki (ISBN) lub mi臋dzynarodowego standardowego numeru seryjnego (ISSN) [1,聽str.31]. Przeszukuj膮c katalogi biblioteczne przy u偶yciu tego systemu, zwykle mo偶liwe jest znalezienie wy艂膮cznie tytu艂u dokumentu, bez jakiejkolwiek dodatkowej informacji o聽zawarto艣ci danej pozycji.
Podobnie sytuacja wygl膮da w codziennej dzia艂alno艣ci biur projektanckich, gdzie szkice i specyfikacje s膮 zwykle kategoryzowane i przechowywane wed艂ug numeru pracy i/lub nazwy klienta. Przy braku prostej metody katalogowania zawarto艣ci dokument贸w papierowych, nie ma na og贸艂 sposobu na szybkie wyszukiwanie specyficznych detali lub specyfikacji z poprzednich (a nawet bie偶膮cych) projekt贸w. Zamiast tego, alternatyw膮 jest robienie starannych podr臋cznik贸w wyszukiwania, kt贸re zwykle i tak wymagaj膮 wiedzy ludzi, kt贸rzy pracowali nad takimi projektami.
Obecnie, dzi臋ki zastosowaniu komputer贸w, wzrasta zainteresowanie sposobami opisu struktury dokument贸w, w celu rozwi膮zania przedstawionych problem贸w. Dokumenty w postaci elektronicznej staj膮 si臋 znacznie 艂atwiejsze do zlokalizowania, poniewa偶 wyszukiwanie mo偶e zosta膰 przeprowadzone bazuj膮c na ich tytule, zawartej w nich informacji lub dowolnej liczbie innych towarzysz膮cych im atrybut贸w. Dla przyk艂adu, obecnie mo偶liwe jest przeszukiwanie dokument贸w elektronicznych przy u偶yciu takich technik jak: po艂膮czenia hipertekstowe, wyszukiwanie pe艂no-tekstowe, przegl膮danie graficzne, szukanie s艂贸w kluczowych, rozpoznawanie obiekt贸w oraz aktywne spisy tre艣ci聽[1,聽str.32].
W swojej wirtualnej formie, dokumenty elektroniczne mog膮 r贸wnie偶 zawiera膰 wiele informacji o samych sobie. Mo偶e to obejmowa膰 informacje o聽pochodzeniu i to偶samo艣ci dokumentu, dat臋 i czas przegl膮dania, adnotacje, poziom bezpiecze艅stwa, ale r贸wnie偶 kod wykonywalny, kt贸ry okre艣la w jaki spos贸b dokument mo偶e by膰 prezentowany u偶ytkownikowi oraz przez u偶ytkownika przetwarzany聽[1, str.32].
Cyfrowa posta膰 dokumentu jest r贸wnie偶 znacznie bogatsza ni偶 jej papierowy odpowiednik. Obecnie jest ju偶 ca艂kiem powszechne umieszczanie wewn膮trz struktury dokumentu elektronicznego obiekt贸w multimedialnych takich jak grafika, animacja i d藕wi臋k.
Ponadto istnieje jeszcze szereg innych mo偶liwych do okre艣lenia cech struktury dokumentu. Wyr贸偶nia si臋 szereg z艂o偶onych kryteri贸w, kt贸re mog膮 zosta膰 u偶yte przy opisie graficznego schematu kodowania zawarto艣ci dokumentu聽[2]. Dla聽przyk艂adu mo偶liwe jest kodowanie dokumentu na czterech oddzielnych poziomach: werbalne kodowanie zawarto艣ci, semantyczne kodowanie atrybut贸w, syntaktyczne kodowanie struktury i kodowanie struktury zawarto艣ci. W istocie, mechanizmy te pozwalaj膮 autorowi na kodowanie wiadomo艣ci wewn膮trz dokumentu na wiele rozmaitych sposob贸w. Proste tego przyk艂ady to u偶ycie punktowania, pozycjonowania i r贸偶nicowania.
Prezentacja i przedstawianie dokumentu
Ostatni膮 w艂a艣ciwo艣ci膮 dokumentu, kt贸ra b臋dzie rozwa偶ana, jest spos贸b w聽jaki obiekt graficzny (taki jak tekst czy obraz) mo偶e zosta膰 opisany do przedstawienia na monitorze komputera lub urz膮dzeniu wyj艣ciowym. Termin聽„przedstawianie” (ang.聽rendering), w tym kontek艣cie, jest u偶ywany do opisu sposobu w jaki dokument jest wy艣wietlany lub prezentowany u偶ytkownikowi na danym pod艂o偶u.
W swojej wirtualnej formie, dokument elektroniczny mo偶e by膰 kodowany przy u偶yciu wielu r贸偶nych etykiet (ang. markup tags) okre艣laj膮cych jego organizacj臋 oraz zamierzony spos贸b prezentacji czytelnikowi. Zwykle odbywa si臋 to przy u偶yciu dw贸ch rodzaj贸w etykiet: strukturalnych i proceduralnych. Etykiety聽strukturalne okre艣laj膮 w jaki spos贸b dokument mo偶e zosta膰 podzielony na r贸偶ne elementy organizacyjne, takie jak: nag艂贸wki, paragrafy, sekcje, listy, punkty itp. Etykiety聽proceduralne s艂u偶膮 do opisu charakterystyk takich jak rodzaj czcionki, rozmiar, metryczne w艂a艣ciwo艣ci tekstu, oraz wiele innych aspekt贸w uk艂adu. Rysunek 4 ilustruje prosty przyk艂ad tych regu艂.
Rysunek 4. Przyk艂ad strukturalnych i proceduralnych etykiet.
殴r贸d艂o:聽[2]
Wsp贸lnie etykiety strukturalne i proceduralne s膮 generalnie zwi膮zane z聽formatowaniem dokumentu. Formatowanie jest bardzo wa偶nym aspektem, z聽punktu widzenia sposobu w jaki dokument mo偶e przenosi膰 zawart膮 w nim wiadomo艣膰. Dla przyk艂adu, na architektonicznych szkicach istniej膮 ustalone konwencje graficzne, kt贸re mog膮 zosta膰 u偶yte dla prezentacji informacji takiej jak po艂o偶enie bloku tytu艂u czy podpisy pod rysunkami. Istniej膮 r贸wnie偶 ustalone konwencje u偶ywane w uk艂adzie, strukturze i wygl膮dzie specyfikacji budynku.
Aby wy艣wietli膰 dokument na monitorze komputera, kody formatuj膮ce s膮 najcz臋艣ciej obs艂ugiwane przez aplikacje programowe. W przypadku jednak drukowania, wymagany jest zwykle niezale偶ny od urz膮dze艅 j臋zyk opisu stron (ang.聽PDL - Page Description Language). Kiedy dokument ma zosta膰 wydrukowany, kody oraz etykiety wewn膮trz dokumentu musz膮 zosta膰 przet艂umaczone na PDL, kt贸ry jest znany dla urz膮dze艅 wyj艣ciowych. Przyk艂adem powszechnego PDL, u偶ywanego przez wiele drukarek, jest j臋zyk PostScript. J臋zyk聽ten sk艂ada si臋 ze zbioru graficznych operator贸w, takich jak „fill” do maskowania obszar贸w, „stroke” do generowania linii, „image” do malowania rastrowych obraz贸w oraz „show” do tworzenia tekstu. Jego charakterystyka zawiera r贸wnie偶 du偶膮 liczb臋 operator贸w opisuj膮cych po艂o偶enie r贸偶nych obiekt贸w na stronie oraz zbi贸r atrybut贸w, takich jak fonty, kolor wype艂nienia, wz贸r wype艂nienia itp.
Wykorzystanie papieru jako no艣nika dokumentu
Jedn膮 z najbardziej spornych kwestii dotycz膮cych u偶ytkowania dokument贸w jest wyb贸r pomi臋dzy papierowym a elektronicznym no艣nikiem. Jak dot膮d bardziej uznanym z tej pary jest no艣nik papierowy聽[2].
Na przestrzeni wiek贸w papier sta艂 si臋 najszerzej u偶ywanym medium publikacji, drukowania, dystrybucji i archiwizowania dokument贸w. Dzieje si臋 tak g艂贸wnie dlatego, poniewa偶 dokument papierowy jest: 艂atwy w przenoszeniu, prosty w聽u偶yciu, relatywnie niedrogi w produkcji, charakteryzuje si臋 wysokim stopniem przejrzysto艣ci i kontrastu, jest relatywnie 艂atwy w utrzymaniu, nie wymaga skomplikowanych urz膮dze艅 do interpretacji, ma przewag臋 przy wprowadzaniu konwencji odno艣nie struktur danych i formatowania oraz 艂atwo mo偶na dodawa膰 na nim odr臋czne adnotacje聽[1,聽str.34].
Pomimo wszystkich tych zalet, jego u偶ycie bardzo cz臋sto bywa nieefektywne. Do g艂贸wnych jego wad mo偶na zaliczy膰 problemy z reprodukcj膮, metodami sk艂adowania, konsumpcj膮 zasob贸w naturalnych oraz kwestie zwi膮zane z聽zarz膮dzaniem dokumentem papierowymi.
Od 1800 roku stale rozwijanych jest szereg wydajnych narz臋dzi produkcji i聽reprodukcji papierowych dokument贸w. Do narz臋dzi tych zaliczy膰 mo偶emy zar贸wno linotyp i monotyp jak i dzisiejsze komputery i fotokopiarki. W rezultacie bardzo cz臋sto dowodzi si臋, 偶e wykorzystanie komputer贸w w celu osi膮gni臋cia „biura bez papieru”, jest celem nie do zrealizowania聽[1,聽str.34]. Nawet obecnie, pomimo istnienia zaawansowanej technologii komputerowej, nie pojawi艂y si臋 jeszcze „biura bez papieru”. W rzeczywisto艣ci w typowym, wsp贸艂czesnym biurze obs艂uga dokument贸w w dalszym ci膮gu przebiega w spos贸b zbli偶ony do tego jak robiono to w ko艅cu ubieg艂ego wieku. Dla przyk艂adu, szacuje si臋, 偶e obecnie nadal 80 procent ca艂ej technicznej informacji znajduje si臋 na papierze lub na mikrofilmach聽[1,聽str.34].
W 艣wiecie biznesu ocenia si臋, 偶e dziennie tworzonych jest 252 miliony dokument贸w 藕r贸d艂owych聽[3]. Dokumenty te przechodz膮 poprzez rozmaite procesy reprodukcji, w聽efekcie kt贸rych przeci臋tny dokument biurowy kopiowany jest oko艂o 19聽razy聽[3]. W聽trakcie procesu reprodukcji dokumenty cz臋sto trac膮 swoj膮 jako艣膰, za艣 藕r贸d艂owe dokumenty gubi膮 si臋 po艣r贸d papierowych duplikat贸w. Dla przyk艂adu szacuje si臋, 偶e w samych tylko USA dziennie tworzonych jest 1,1 miliarda fotokopii. Jest to tak wielka liczba, 偶e przy pomocy tych papierowych kopii mo偶na by utworzy膰 stos wysoko艣ci 110 km聽[3].
Kolejnym problemem, do kt贸rego przyczynia si臋 reprodukcja dokument贸w, jest zachowanie bezpiecze艅stwa. Bardzo cz臋sto dokumenty zawieraj膮 „wra偶liwe” informacje, takie jak znacz膮ce liczby, bud偶ety klient贸w lub plany rozwoju. Gdy聽tego typu dokumenty s膮 powielane i dystrybuowane, w przypadku ujawnienia, mo偶e to doprowadzi膰 do k艂opotliwych sytuacji a nawet konflikt贸w politycznych. W聽by艂ym ZSRR, jeszcze do po艂owy lat osiemdziesi膮tych, problem reprodukcji „wra偶liwych” dokument贸w rozwi膮zywano w ten spos贸b, 偶e maszyny kopiuj膮ce trzymano w zamkni臋ciu pod kluczem聽[1,聽str.36]. Do dzisiaj tak膮 sytuacj臋 (w r贸偶nej formie) mo偶na zaobserwowa膰 w firmach na ca艂ym 艣wiecie.
Istnieje szereg problem贸w zwi膮zanych z przechowywaniem papieru. Dwa聽g艂贸wne problemy to jego fizyczna obj臋to艣膰 oraz metody wymagane do jego utrzymania.
Jednym z najwi臋kszych problem贸w podczas u偶ywania papieru jest zajmowana przez niego przestrze艅 sk艂adowania. Pomimo faktu, 偶e zaledwie jeden dokument z pi臋ciu wyprodukowanych zostaje zmagazynowany, to jednak wci膮偶 pozostaje dziennie oko艂o 200 milion贸w stron papieru , kt贸re musz膮 by膰 przechowywane聽[3]. Jak dot膮d ocenia si臋, 偶e na ca艂ym 艣wiecie istnieje 4聽biliony dokument贸w oraz 8聽miliard贸w szkic贸w, kt贸re s膮 przechowywane w standardowych kartotekach. Firma „Xerox” szacuje, 偶e wielko艣ci te ulegaj膮 podwojeniu co ka偶de 3,5聽roku聽[1,聽str.36]. Bior膮c pod uwag臋, 偶e przeci臋tna cztero-szufladowa szafa jest w聽stanie pomie艣ci膰 zaledwie oko艂o 10,000 dokument贸w, przestrze艅 wymagana do przechowywania tych ilo艣ci papieru musi by膰 olbrzymia.
Por贸wnuj膮c pojemno艣膰 elektronicznych sk艂adnic, te same 10,000 dokument贸w mo偶e by膰 przechowywane na zaledwie jednym dysku CD-ROM o聽pojemno艣ci 600MB, tak jak przedstawiono to na rysunku聽5. Ta sama pojemno艣膰 CD-ROM mo偶e r贸wnie偶 zosta膰 u偶yta do przechowania dwuletniego nak艂adu „Wall聽Street Journal” lub 100 klasycznych nowel聽[1,聽str.36]. Takie mo偶liwo艣ci zapisu nie mog艂y pozosta膰 niezauwa偶one; Obecnie wielu wydawc贸w jak i聽producent贸w oprogramowania stosuje CD-ROM jako medium publikacji oraz metod臋 zast臋powania obszernych podr臋cznik贸w聽[4].
Rysunek 5. Por贸wnanie pojemno艣ci sk艂adnic papieru oraz no艣nik贸w elektronicznych.
殴r贸d艂o:聽[1,聽str.36]
Wykorzystanie dokument贸w papierowych nierozerwalnie zwi膮zane jest ze zu偶ywaniem zasob贸w naturalnych. Ka偶dego roku olbrzymia ilo艣膰 nieodnawialnych zasob贸w jest zu偶ywana przy produkcji, transporcie, drukowaniu, dystrybucji, sk艂adowaniu i niszczeniu drukowanych materia艂贸w. W skali 艣wiata ocenia si臋, 偶e w聽ka偶dej sekundzie zu偶ywa si臋 2,3 tony papieru, oraz 偶e na ka偶d膮 ton臋 papieru przypada 17 drzew. Do roku 2000 oczekuje si臋 zapotrzebowania na papier rz臋du 310,000,000 ton聽[3].
Problem sk艂adowania papierowych dokument贸w to r贸wnie偶 koszty utrzymania oraz zajmowana przestrze艅 przez dodatkowe artyku艂y potrzebne do sprawnego pos艂ugiwania si臋 nimi. W prawie ka偶dym biurze znajduje du偶a liczba r贸偶nego rodzaju zszywaczy, spinaczy, dziurkaczy, etykiet, skoroszyt贸w, kopert, no偶yczek, klej贸w, gumek, marker贸w, pi贸r itp. Wszystkie te przedmioty wymagaj膮 miejsca na przechowywanie w magazynach, szafach i szufladach. Ponadto nale偶y do tego doda膰 jeszcze drogie wyposa偶enie archiw贸w, takie jak dodatkowe drukarki, kopiarki, faksy oraz szafy na kartoteki. Z ka偶dym z tych przedmiot贸w zwi膮zane s膮 pewne wydatki, kt贸re powinny by膰 uwzgl臋dniane w ca艂kowitym koszcie utrzymania dokument贸w drukowanych.
Kolejnym wielkim problemem zwi膮zanym z u偶ywaniem dokument贸w bazuj膮cych na papierze jest proces ich rejestracji. W wi臋kszo艣ci biur zwykle pozwala si臋 pracownikom na chowanie do akt dokument贸w, z kt贸rych korzystali. Bardzo cz臋sto zdarzaj膮 si臋 sytuacje, gdy ten sam dokument zostaje zakwalifikowany do r贸偶nych kategorii przez r贸偶nych ludzi. Dzieje si臋 tak niezale偶nie od tego jak dobrze zaprojektowany i opisany jest system rejestracji w聽biurze. System taki mo偶e by膰 alfabetyczny, numeryczny, tematyczny lub te偶 tworzony na bie偶膮ce potrzeby. Sugeruje si臋, 偶e niezale偶nie od istniej膮cego systemu powinna istnie膰 jaka艣 forma 艣cis艂ej regulacji okre艣laj膮cej jego u偶ycie. „Statystycznie聽ocenia si臋, 偶e zaledwie 10 procent wszystkich pobranych z kartotek dokument贸w wraca na swoje prawid艂owe miejsce”聽[1,聽str.39].
Nawet w przypadku, gdy dokumenty kataloguje si臋 bardzo starannie i聽systematycznie, to nie istnieje przewa偶nie 偶aden indeks lub baza danych zawieraj膮ca informacje o po艂o偶eniu ka偶dego dokumentu. Cz臋sto nawet oczekuje si臋, 偶e u偶ytkownicy sami b臋d膮 pami臋ta膰 o miejscach ich przechowywania. Sytuacja聽taka, w przypadku poszukiwania konkretnego dokumentu, wymusza zwykle konsultacje z osob膮, kt贸ra go rejestrowa艂a.
Metody sk艂adowania papieru s膮 r贸wnie偶 bardzo nieefektywne i聽czasoch艂onne. Ocenia si臋, 偶e 60 procent czasu pracy pracownicy sp臋dzaj膮 przy obs艂udze dokument贸w oraz 偶e znaczn膮 cz臋艣膰 tego czasu zajmuje im ich zlokalizowanie聽[3]. Nieefektywno艣膰 tych metod kosztuje przedsi臋biorstwa du偶膮 sum臋 pieni臋dzy. Je艣li nawet wyprodukowanie jednej strony kosztuje 艣rednio od 30 do 70 cent贸w, za艣 reprodukcja 0,5 centa, to ju偶 odzyskanie utraconego dokumentu 150-200 dolar贸w聽[3]. W konsekwencji zarz膮dzanie dokumentami staje si臋 jednym z聽bardziej licz膮cych si臋 koszt贸w przedsi臋biorstwa.
Ka偶dy dokument musi ostatecznie zosta膰 gdzie艣 przekazany. Obecnie wi臋kszo艣膰 metod dostarczania papierowych dokument贸w jest nieefektywna. Zwykle im wi臋ksza jest liczba odbiorc贸w, tym bardziej skomplikowana jest 艣cie偶ka dostarczania oraz d艂u偶szy czas przemieszczania si臋 dokumentu. Dzisiaj nadal papierowe dokumenty dostarcza si臋 r臋cznie w tradycyjny, czasoch艂onny i drogi spos贸b. U偶ywa si臋 w tym celu szeregu metod takich jak wewn臋trzna i zewn臋trzna poczta, us艂ugi kurierskie lub faks.
Rysunek 6 por贸wnuje kilka metod dostarczania dokument贸w. Na rysunku tym mo偶na zaobserwowa膰 jak sie膰 komputerowa mo偶e zosta膰 wykorzystana do聽prawie natychmiastowego dostarczania dokument贸w w por贸wnaniu z聽wielofazowymi metodami r臋cznymi. Ocenia si臋, 偶e przekazywanie dokument贸w w postaci papierowej jest 艣rednio 50-60 procent wolniejsze od pozosta艂ych metod聽[1,聽str.39].
Rysunek 6. Por贸wnanie metod dostarczania dokument贸w.
殴r贸d艂o:聽[1,聽str.40]
Wykorzystanie dokumentu elektronicznego
W kolejnych rozdzia艂ach pojawi si臋 wiele odno艣nik贸w do zagadnie艅 zwi膮zanych z u偶yciem dokumentu elektronicznego. Jako wst臋p do tych rozwa偶a艅 warto wspomnie膰 o tym jak technologie cyfrowe mog膮 pom贸c w rozwi膮zywaniu niekt贸rych z wcze艣niej przedstawionych problem贸w.
Pomimo tego, i偶 mo偶liwo艣ci „cyfrowej alternatywy” b臋d膮 szerzej przedstawione w dalszej cz臋艣ci tego opracowania, to istnieje ca艂y szereg, wartych odnotowania ju偶 teraz, korzy艣ci zwi膮zanych z wykorzystaniem cyfrowych rozwi膮za艅. Do korzy艣ci tych zaliczy膰 mo偶na:
prosty spos贸b powt贸rnego wykorzystania informacji zawartych wewn膮trz dokumentu elektronicznego, dzi臋ki czemu unika si臋 czasoch艂onnego oraz podatnego na b艂臋dy, r臋cznego kopiowania informacji;
艂atwy spos贸b zarz膮dzania oraz koordynowania dokument贸w przy u偶yciu komputerowego systemu zarz膮dzania dokumentami;
艂atwy spos贸b przeszukiwania szeregu tytu艂贸w lub zawarto艣ci dokument贸w mog膮cych mie膰 znaczenie dla danego zadania;
przyst臋pny spos贸b integrowania i wymiany informacji zawartej wewn膮trz dokument贸w elektronicznych;
szybki i prosty spos贸b dostarczania dokument贸w w odleg艂e geograficznie miejsca przy u偶yciu sieci komputerowych;
efektywne i zwi臋z艂e zachowywanie dokument贸w dla cel贸w prawnych lub dla p贸藕niejszego ich wykorzystania;
podnoszenie efektywno艣ci r贸偶nych procedur pracy, co mo偶e przyczynia膰 si臋 do zmniejszania koszt贸w produkcji oraz wzrostu dost臋pno艣ci czasu pracy dla innych dzia艂alno艣ci;
mo偶liwo艣膰 tworzenia cennej sk艂adnicy informacji w oparciu o dokumenty pozostaj膮ce pod kontrol膮 Systemu Zarz膮dzania Dokumentami.
Wszystkie wy偶ej wymienione mo偶liwo艣ci zostan膮 om贸wione bardziej szczeg贸艂owo w kolejnych rozdzia艂ach.
Z wykorzystaniem dokumentu wi膮偶膮 si臋 nie tylko same korzy艣ci ale r贸wnie偶 pewne niedogodno艣ci a nawet zagro偶enia, kt贸rych nale偶y by膰 艣wiadomym. Najwi臋ksz膮 wad膮 dokumentu elektronicznego jest ma艂e bezpiecze艅stwo danych w聽nim zawartych. Dane takie mog膮 by膰 bez problemu odczytane oraz zmodyfikowane przez osoby nieuprawnione. Podobnie nigdy nie mo偶na by膰 pewnym, kto tak naprawd臋 jest autorem dokumentu. Dokument elektroniczny mo偶na bez trudu kopiowa膰 praktycznie w niesko艅czono艣膰 bez utraty jego jako艣ci. Zwykle jest to jego du偶膮 zalet膮, ale jednocze艣nie wielk膮 wad膮 w przypadku gdy zawiera on dane poufne. Wp艂ywa to w znacznym stopniu na brak zaufania ludzi do dokument贸w elektronicznych. Bezpo艣rednim skutkiem tego stanu jest prawny obowi膮zek stosowania wy艂膮cznie papierowej formy dla wielu rodzaj贸w dokument贸w, np.: rachunk贸w, faktur, um贸w, czek贸w, weksli itd. Dzieje si臋 tak gdy偶 w ich przypadku bezpiecze艅stwo jest wa偶niejsze od korzy艣ci gospodarczych, kt贸re mo偶na uzyska膰 poprzez zast膮pienie ich dokumentem elektronicznym.
Powy偶sze problemy ju偶 obecnie mo偶na skutecznie rozwi膮za膰 stosuj膮c narz臋dzia kryptograficzne do szyfrowania danych oraz elektronicznego podpisywania dokument贸w. Wymaga to jednak od ludzi dodatkowej wiedzy oraz dyscypliny w pos艂ugiwaniu si臋 tymi narz臋dziami. Mo偶e to stanowi膰 powa偶ny problem bior膮c pod uwag臋 niski poziom edukacji informatycznej w Polsce.
Wydaje si臋, 偶e wraz z up艂ywem czasu oraz wzrostem 艣wiadomo艣ci i edukacji informatycznej ludzi, dokument elektroniczny b臋dzie stawa艂 si臋 coraz bardziej popularnym. Id膮c za przyk艂adem kraj贸w wysoko uprzemys艂owionych, tak偶e w聽Polsce dokument elektroniczny b臋dzie odgrywa艂 coraz wi臋ksze znaczenie w聽偶yciu gospodarczym i spo艂ecznym. Zmiany te b臋d膮 musia艂y r贸wnie偶 znale藕膰 swoje odzwierciedlenie w polskim prawie.
Charakterystyka podstawowych typ贸w dokument贸w elektronicznych oraz obszary ich zastosowa艅
Dotychczasowe okre艣lanie dokument贸w elektronicznych jako „dokument贸w bez papieru” staje si臋 niewystarczaj膮ce i wymaga ponownego zdefiniowania. Pod聽wzgl臋dem semantycznym termin „bez papieru” nic pozytywnego o nowym typie dokument贸w nie m贸wi, a jedynie odr贸偶nia je od tradycyjnych. Jak d艂ugo jednak dokument drukowany b臋dzie stanowi艂 punkt odniesienia? Ju偶 dzi艣 coraz trudniej wydawa膰 czasopismo, nie korzystaj膮c z Internetu czy z dokumentacji zawartej na CD-ROM. Musimy si臋 powoli oswoi膰 z my艣l膮, 偶e dokumenty papierowe b臋d膮 coraz cz臋艣ciej tylko utrwalon膮 drukiem wersj膮 materia艂贸w, kt贸re: powsta艂y w formie elektronicznej, zosta艂y w medium elektronicznym zredagowane, opracowane i s膮 w tym 艣rodowisku tak偶e rozpowszechniane.
Silny nacisk na stosowanie nowych form dokument贸w stanowi wyzwanie zar贸wno dla producent贸w, jak i u偶ytkownik贸w oprogramowania. Producenci musz膮 skupi膰 si臋 przede wszystkim na problemach kompatybilno艣ci z r贸偶norodno艣ci膮 rozwi膮za艅 zar贸wno sprz臋towych jak i programowych. Wiele istniej膮cych aplikacji, mimo pozor贸w uniwersalno艣ci, okazuje si臋 w rzeczywisto艣ci dedykowanymi. Innym problemem jest uzgodnienie format贸w samych dokument贸w. Ich regularna struktura umo偶liwi艂aby automatyzacj臋 wielu funkcji (takich jak sortowanie, 艣ledzenie, wsp贸艂u偶ytkowanie i wymian臋 danych).
Relacja pomi臋dzy oprogramowaniem, danymi i dokumentami
W poprzednim rozdziale dokument zosta艂 okre艣lony jako „pojemnik” z聽informacj膮, u偶ywany do przenoszenia tej informacji od autora do czytelnika.
Kontynuuj膮c rozwa偶ania nad tym modelem, obecnie przedstawione zostan膮 narz臋dzia tworzenia dokument贸w (oprogramowanie) oraz elementy, z kt贸rych dokumenty si臋 sk艂adaj膮 (dane).
Mo偶na zauwa偶y膰 istniej膮c膮 relacj臋 pomi臋dzy oprogramowaniem i danymi. Zwykle jedno z nich tworzone jest za pomoc膮 drugiego i na odwr贸t. Pomi臋dzy聽nimi聽za艣 znajduj膮 si臋 dokumenty, utworzone przez oprogramowanie i聽spe艂niaj膮ce funkcje pojemnik贸w z danymi. W celu lepszego zilustrowania tych zale偶no艣ci, ka偶dy z tych termin贸w przedstawi膰 mo偶na jako warstw臋, tak jak pokazane to zosta艂o na rysunku聽7.
Rysunek 7. Dokument w kontek艣cie og贸lnego 艣rodowiska komputerowego.
殴r贸d艂o:聽[1,聽str.150]
Pomimo tego, i偶 to abstrakcyjne spojrzenie na relacj臋 pomi臋dzy danymi, dokumentami i oprogramowaniem mo偶e w wielu przypadkach by膰 nazbyt uproszczone, to pomaga ono jednak odzwierciedli膰 spos贸b w jaki dokumenty postrzegane s膮 w og贸lnym obrazie technologii informatycznej.
Spojrzenie to odnosi si臋 r贸wnie偶 do koncepcji dzia艂a艅 zorientowanych na dokument (ang. document-centric approach to computing). W podej艣ciu tym k艂adzie si臋 wi臋kszy nacisk na znaczenie struktury dokumentu, ni偶 na specyficzne w艂a艣ciwo艣ci aplikacji (narz臋dzia), dzi臋ki kt贸remu zosta艂 on utworzony. Stosuj膮c聽odpowiedni膮 struktur臋 dokument贸w, informacja w nich zawarta staje si臋 bardziej u偶yteczna i dost臋pna.
Potrzeba 艂atwego dost臋pu oraz ponownego wykorzystania informacji jest niezwykle wa偶na. Bardzo cz臋sto zachodzi konieczno艣膰 pos艂ugiwania si臋 du偶膮 ilo艣ci膮 informacji pochodz膮cych z wielu heterogenicznych 藕r贸de艂, za艣 dokumenty r贸偶nego typu cz臋sto musz膮 by膰 dost臋pne dla szerokiego spektrum odmiennych odbiorc贸w.
Pomimo znacznego post臋pu, kt贸ry dokona艂 si臋 w technologii informatycznej, wymiana dokument贸w w heterogenicznym 艣rodowisku obliczeniowym nadal pozostaje trudna do zrealizowania. Zasadnicz膮 przyczyn膮 tych trudno艣ci jest du偶a liczba stosowanych struktur dokument贸w. Historycznie, za ka偶dym razem, gdy nowy typ aplikacji pojawia艂 si臋 na rynku, producenci u偶ywali w艂asnych metod kodowania tekstu, grafiki oraz innych form danych wewn膮trz dokumentu. W聽efekcie otrzymano du偶膮 niekompatybilno艣膰 pomi臋dzy wi臋kszo艣ci膮 typ贸w dokument贸w, pochodz膮cych z r贸偶nych aplikacji.
Znaczna cz臋艣膰 spotykanych trudno艣ci przy wymianie dokument贸w, powstaje jako wynik generalnego braku wiedzy o danych oraz standardach dokument贸w. Trudno艣ci te objawiaj膮 si臋 w braku kompatybilno艣ci pomi臋dzy r贸偶nymi typami oprogramowania oraz systemami komputerowymi b臋d膮cymi w u偶yciu.
Podczas, gdy oprogramowanie by艂o tworzone po raz pierwszy, cz臋sto istnia艂y ca艂kiem uzasadnione powody, dla kt贸rych producenci musieli lub chcieli stosowa膰 w艂asne struktury dokument贸w, odmienne od tych, kt贸re stosowa艂a konkurencja聽[1,聽str.151]. Te powody to:
natura danych zawartych wewn膮trz dokumentu;
kontrola producenta nad formatem dokumentu;
ch臋膰 przywi膮zywanie klienta do firmy.
G艂贸wny pow贸d odnosi si臋 do natury danych zawartych w strukturze dokumentu. W zale偶no艣ci od aplikacji dokument m贸g艂 zawiera膰 dowoln膮 „mieszank臋” grafiki, danych wektorowych i tekstowych. W wyniku tego zwi膮zany z聽aplikacj膮 dokument posiada艂 odpowiedni膮 do danych struktur臋.
W przypadku aplikacji graficznych, struktura dokumentu mog艂a by膰 okre艣lona w taki spos贸b, aby mo偶liwe by艂o 艂atwe wykonywanie operacji na poziomie bit贸w oraz tak aby plik wynikowy zajmowa艂 jak najmniej miejsca na聽dysku. Podobnie aplikacje przetwarzaj膮ce tekst mog艂y stosowa膰 struktur臋 dokument贸w dostosowan膮 do potrzeb przechowywania informacji np. o czcionce oraz do艂膮czonych obiektach graficznych. W obu tych przypadkach format dokumentu m贸g艂 zosta膰 opracowany tak, aby jak najlepiej odpowiada艂 cechom i聽u偶yteczno艣ci aplikacji.
Kolejnym powodem, dla kt贸rego producenci tworz膮 w艂asne rozwi膮zania, jest elastyczno艣膰 na kt贸r膮 mog膮 sobie oni pozwoli膰 w przypadku, gdy s膮 jedynymi w艂a艣cicielami formatu dokumentu. W czasie gdy tworzy si臋 aplikacje, pierwsza generacja struktury dokumentu jest zwykle niedojrza艂a. W trakcie rozwoju aplikacji oraz dodawania do niej nowych cech funkcjonalnych, struktura zwi膮zanego z ni膮 dokumentu r贸wnie偶 ulega zmianie. Przejawia si臋 to tym, 偶e wiele format贸w dokument贸w jest 艣ci艣le zwi膮zanych ze szczeg贸ln膮 wersj膮 oprogramowania, u偶ywanego do ich utworzenia (np.: format MS Word 6.0 .DOC lub AutoCAD R.13 .DWG).
Zwykle w interesie producenta jest utrzymywanie w艂asnych format贸w dokument贸w. Pozwala to na ich 艂atw膮 modyfikacj臋 bez obawy o uzyskanie zgody od innych producent贸w. Wad膮 tego podej艣cia jest to, 偶e istnieje znacznie mniej aplikacji, z kt贸rymi taki dokument mo偶e by膰 wymieniany聽[8].
Efektem ubocznym stosowania w艂asnych format贸w dokument贸w przez producent贸w jest mo偶liwo艣膰 utrzymania „lojalno艣ci” klient贸w. Anegdotycznie mo偶na stwierdzi膰, 偶e jednym z powod贸w, dla kt贸rych u偶ytkownicy sk艂aniaj膮 si臋 do oprogramowania konkretnej marki lub wersji, jest oferowana im „kompatybilno艣膰” w聽przypadku, gdy dokument ma by膰 wymieniany z innymi u偶ytkownikami. W聽wyniku tego wiele biur sk艂ania si臋 do korzystania z aplikacji tylko jednego producenta.
W biurach, w kt贸rych stosuje si臋 procesor tekstu jednej marki, wymiana dokument贸w, ponowne ich wykorzystanie oraz wyszukiwanie staje si臋 ca艂kiem proste. W przypadku korzystania z kilku r贸偶nych procesor贸w tekstu mo偶e dochodzi膰 do wielu problem贸w zwi膮zanych z niekompatybilno艣ci膮 dokument贸w.
Klasyfikacja dokument贸w elektronicznych
Z powodu ogromnej r贸偶norodno艣ci danych, aplikacji i protoko艂贸w komunikacyjnych, jest prawie niemo偶liwa, przy zastosowaniu tylko jednego zbioru kryteri贸w, jasna klasyfikacja typ贸w dokument贸w elektronicznych. Technologia dokument贸w elektronicznych rozwija si臋 gwa艂townie, nieustannie dodawane s膮 do niej nowe elementy i mo偶liwo艣ci.
Wprowadzanie r贸偶nych klasyfikacji czasami mo偶e prowadzi膰 do b艂臋d贸w. Dzieje si臋 tak dlatego, poniewa偶 nowe cechy niekt贸rych typ贸w dokument贸w cz臋sto mog膮 „zamazywa膰” elementy odr贸偶niaj膮ce dla wcze艣niej zdefiniowanych klas. Pomimo tego istnieje szereg klas dokument贸w, kt贸re mo偶na zidentyfikowa膰 na podstawie zbioru wsp贸lnych charakterystyk i podobnej funkcjonalno艣ci. Klasyfikacja ta rozci膮ga si臋 od tradycyjnych struktur opartych o aplikacje i聽specyficznych dla urz膮dze艅 wyj艣ciowych, a偶 po bardziej otwarte, standaryzowane i聽og贸lne struktury. Poni偶ej znajduje si臋 opis kilku klas dokument贸w, wyja艣niaj膮cy r贸偶ne wsp贸lne metody, za pomoc膮 kt贸rych dane mog膮 zosta膰 odwzorowane w聽dokumencie elektronicznym.
Standardy bazuj膮ce na aplikacjach (ang. Application-based Standards) - s膮 to takie struktury dokument贸w, kt贸re zwi膮zane s膮 z w艂asnymi, zorientowanymi na aplikacje metodami produkcji dokument贸w. Mo偶na je podzieli膰 na dokumenty w艂asne aplikacji oraz dokumenty wyj艣ciowe.
Dokumenty w艂asne aplikacji (ang. Proprietary Application-based Documents) - s膮 to dokumenty zwi膮zane ze specyficzn膮 aplikacj膮.
Dokumenty wyj艣ciowe (ang. Output Documents) - s膮 to dokumenty u偶ywane w procesie przedstawiania dokumentu 藕r贸d艂owego na urz膮dzeniu wyj艣ciowym, takim jak drukarka lub ploter.
Jako wynik nadmiaru w艂asnych format贸w dokument贸w oraz wzrostu zapotrzebowania u偶ytkownik贸w na wieloplatformowe 艣rodowisko obliczeniowe, powsta艂o wiele otwartych standard贸w (ang. Open Standards) wymiany z艂o偶onych typ贸w dokument贸w. Najcz臋艣ciej te klasy dokument贸w powstawa艂y z zamiarem zapewnienia szerokiej przemys艂owej kompatybilno艣ci. W konsekwencji wiele z聽tych standard贸w jest kontrolowanych i wspieranych przez niezale偶ne organizacje takie jak ISO czy ANSI, lub te偶 s膮 one publicznie dost臋pne poprzez indywidualnych lub wsp贸艂pracuj膮cych producent贸w oprogramowania. Klasy otwartych standard贸w dokument贸w mog膮 by膰 pogrupowane nast臋puj膮co:
Dokumenty wymiany (ang. Interchange Documents) - s膮 to dokumenty wykorzystywane jako 艣rodki translacji pomi臋dzy r贸偶nymi typami dokument贸w.
Dokumenty komunikacyjne (ang. Messaging Documents) - s膮 to dokumenty u偶ywane do wymiany wiadomo艣ci pomi臋dzy u偶ytkownikami lub u偶ytkownikiem i baz膮 danych poprzez sie膰 komputerow膮.
Dokumenty tworzone dynamicznie (ang. Dynamic Compound Documents) - s膮 to dokumenty przeznaczone do spe艂niania funkcji pojemnika dla obiekt贸w danych, kt贸re s膮 dynamicznie po艂膮czone z w艂asnymi 藕r贸d艂ami.
Dokumenty tworzone w procesie (ang. Processable Compound Documents) - s膮 to dokumenty maj膮ce dostarcza膰 uniwersalny, neutralny model kodowania dokument贸w.
Dokumenty widoki (ang. Viewer Documents) - s膮 to dokumenty dostarczaj膮ce platform臋 oraz niezale偶n膮 od aplikacji, tylko do odczytu, struktur臋 dla dystrybucji w pe艂ni sformatowanej kopii oryginalnego dokumentu.
Dokumenty elektronicznych odno艣nik贸w oraz 艂膮czonych form informacji (ang. Electronic Reference and Hypermedia Documents) - s膮 to dokumenty przeznaczone do szybkiego dostarczania informacji umieszczonej wewn膮trz olbrzymich kolekcji dokument贸w elektronicznych, poprzez zastosowanie w聽nich elektronicznych odno艣nik贸w do tych dokument贸w.
Dokumenty multimedialne (ang. Multimedia Documents) - s膮 to dokumenty, kt贸re zawieraj膮 wiele wymieszanych 藕r贸de艂 danych, oraz zorganizowane s膮 w taki spos贸b aby pomaga膰 w nauce lub dostarcza膰 rozrywki.
W oparciu o przedstawion膮 klasyfikacj臋, w dalszej cz臋艣ci rozdzia艂u przedstawiona zosta艂a szersza charakterystyka klas dokument贸w wraz z opisem najpopularniejszych na rynku format贸w dokument贸w z ka偶dego z wy偶ej wymienionych typ贸w.
Dokumenty w艂asne aplikacji
Tradycyjne, zorientowane na aplikacje spojrzenie, dotyczy wi臋kszo艣ci dokument贸w, b臋d膮cych specyficznym wyj艣ciem aplikacji, tak jak zosta艂o to pokazane na rysunku聽8. Pomimo tego, i偶 dotychczas opracowano ju偶 wiele niezale偶nych od platformy i aplikacji struktur dokument贸w, w艂asne formaty aplikacji nadal pozostaj膮 bardzo popularne. Struktury dokument贸w, kt贸re przynale偶膮 do okre艣lonego producenta i/lub aplikacji bywaj膮 okre艣lane mianem „rodzimych” (ang. native) lub „prywatnych” (ang. private)聽[8]. Dla przyk艂adu format pliku .DWG aplikacji AutoCAD, pozostaje w艂asno艣ci膮 firmy „Autodesk”, kt贸ra go opracowa艂a.
Rysunek 8. Koncepcja format贸w dokument贸w opartych o aplikacje.
殴r贸d艂o:聽[1,聽str.154]
Bardzo charakterystyczne dla w艂asnych format贸w dokument贸w jest to, 偶e u偶ywaj膮 one specyficznej dla danej aplikacji semantyki oraz 偶e wyst臋puj膮 one cz臋sto w postaci binarnej. Oznacza to, 偶e producenci u偶ywaj膮 w艂asnych system贸w strukturalnych i proceduralnych etykiet do organizacji danych wewn膮trz ich w艂asnych specyficznych typ贸w dokument贸w. Ponadto, charakterystyczne jest r贸wnie偶 to, 偶e wi臋kszo艣膰 w艂asnych typ贸w dokument贸w jest trudnych do przenoszenia pomi臋dzy innymi aplikacjami lub systemami operacyjnymi, w kt贸rych dane formy etykiet nie s膮 uznawane.
Jak wcze艣niej zosta艂o wspomniane, istnieje wiele przyczyn, z powodu kt贸rych w艂asne formaty dokument贸w pozostaj膮 tak popularne. Jednak偶e, oczywistym jest, 偶e pewna forma przemys艂owej standaryzacji b臋dzie wymagana, aby mog艂a zaistnie膰 w wielkiej skali nieograniczona i wierna wymiana informacji w聽艣rodowisku cyfrowym.
Powszechna standaryzacja aplikacji, maj膮ca na celu przezwyci臋偶enie niekompatybilno艣ci dokument贸w jest ma艂o prawdopodobna. Bior膮c pod uwag臋 pr臋dko艣膰 z jak膮 rozwijanych jest wiele technologii obliczeniowych, oraz w聽rezultacie wychodzenie z u偶ycia technologii, kt贸re je poprzedza艂y, jest ma艂o prawdopodobne, aby pojawi艂a si臋 jakakolwiek uniwersalna standaryzacja aplikacji, pochodz膮ca od jednego tylko dostawcy oprogramowania. R贸wnie偶 istniej膮ce w聽wielu krajach prawo przeciwdzia艂a tego typu zachowaniom monopolistycznym. R贸wnie偶 w膮tpliwym jest, aby zaistnia艂a na wi臋ksz膮 skal臋 jakakolwiek standaryzacja aplikacji stosowanych w sektorze AEC, ze wzgl臋du na du偶膮 liczb臋 uczestnik贸w oraz r贸偶norodno艣膰 dyscyplin. W konsekwencji, je艣li maj膮 zosta膰 osi膮gni臋te na du偶膮 skal臋 korzy艣ci z u偶ywania dokument贸w elektronicznych, musi zosta膰 przyswojony przemys艂owy standard neutralnego formatu dokumentu.
Kolejn膮 mo偶liwo艣ci膮 rozwi膮zania tego problemu, stosowan膮 przez wielu tw贸rc贸w urz膮dze艅 i oprogramowania, jest opracowanie rozmaitych metod wymiany i translacji dokument贸w. Niekt贸re z tych metod om贸wione zostan膮 w聽dalszej cz臋艣ci rozdzia艂u.
Istnieje zbyt wiele r贸偶nych aplikacji i w艂asnych format贸w dokument贸w, aby m贸c je wszystkie wymieni膰. Opr贸cz szerokiej skali specyficznych dla aplikacji format贸w, istniej膮 r贸wnie偶 warianty indywidualnych standard贸w, zale偶nie od wersji oprogramowania, przy u偶yciu kt贸rego zosta艂y utworzone. Dla przyk艂adu, kolejne wersje wi臋kszo艣ci program贸w, stosuj膮 formaty dokument贸w kompatybilne w d贸艂. Oznacza to, 偶e nowsza wersja programu potrafi odczyta膰 dokument utworzony w聽wersji poprzedniej, lecz nie na odwr贸t.
Niekt贸re typowe przyk艂ady w艂asnych format贸w dokument贸w przedstawione zosta艂y w tabeli聽1.
Tabela 1
Przyk艂ad kilku popularnych, w艂asnych format贸w dokument贸w.
Aplikacja |
Spe艂niana funkcja |
Rozszerzenie |
Tw贸rca |
Word for Windows 6.0 |
Procesor tekstu |
DOC |
Microsoft |
AutoCAD Release 13 |
Wykresy CAD |
DWG |
Autodesk |
Lotus 1-2-3 v2.0 |
Arkusz kalkulacyjny |
WKS |
Lotus |
Filemaker Pro v2.0 |
Baza danych |
FM |
Claris |
PageMaker v5.0 |
Sk艂ad tekstu |
PM5 |
Adobe Systems |
殴r贸d艂o:聽[1,聽str.155]
Dokumenty wyj艣ciowe
W celu odwzorowania zawarto艣ci dokumentu na urz膮dzeniu drukuj膮cym (takim jak ploter lub drukarka) stosuje si臋 formaty wyj艣ciowe. Pomimo i偶 format贸w tych zwykle nie stosuje si臋 w oprogramowaniu jako dokument贸w „edytowalnych”, to jednak odpowiadaj膮 one wcze艣niejszej definicji okre艣laj膮cej dokumenty jako pojemniki informacji.
Podczas gdy dokument elektroniczny jest wysy艂any do urz膮dzenia drukuj膮cego, musi on zosta膰 przej臋ty przez element tego urz膮dzenia okre艣lany mianem kontrolera. Kontroler stosuje program do interpretacji wys艂anego do niego zakodowanego dokumentu, kt贸ry nast臋pnie opisuje go dla modu艂u drukuj膮cego w聽j臋zyku stosowanym przez ten modu艂 do odtworzenia dokumentu na papierze聽[1,聽str.155]. J臋zyk ten zawiera informacje o sposobie w jaki sformatowany dokument powinien by膰 przet艂umaczony na instrukcje rozk艂adaj膮ce mikroskopijne kropki czarnego lub kolorowego tuszu na stronie. T艂umaczenie takie jest zwykle bardzo z艂o偶one, gdy偶 musi bra膰 pod uwag臋 szereg typograficznych kwestii. Zasadniczo istniej膮 dwa g艂贸wne typy dokument贸w wyj艣ciowych okre艣lane mianem j臋zyka opisu wyj艣cia (ang. ODL - Output Description Languages) oraz j臋zyka opisu stron (ang. PDL - Page Description Languages).
J臋zyki opisu wyj艣cia (ODL) s膮 to zbiory komend opracowane przez producent贸w do komunikacji ze szczeg贸lnym typem urz膮dze艅 wyj艣ciowych. J臋zyki聽te mog膮, ale nie musz膮 by膰 w postaci 艂atwej do odczytu i zrozumienia dla cz艂owieka. Powszechnie znanym przyk艂adem jest j臋zyk kontroli stron opracowany przez firm臋 Hewlett-Packard, a stosowany do komunikacji z drukarkami tej firmy.
J臋zyki opisu stron (PDL) tworzone s膮 przez producent贸w w celu komunikacji z szerokim zakresem r贸偶nych urz膮dze艅 wyj艣ciowych. J臋zyki te zawsze s膮 proste do odczytu i zrozumienia dla cz艂owieka. S膮 one generalnie bardziej wyrafinowane ni偶 j臋zyki opisu wyj艣cia, a przede wszystkim nie s膮 „skrojone” do 偶adnego szczeg贸lnego urz膮dzenia wyj艣ciowego (rysunek聽9). Najbardziej popularnym obecnie j臋zykiem opisu stron jest opracowany przez firm臋 Adobe Systems j臋zyk PostScript.
Rysunek 9. Urz膮dzenia wyj艣ciowe wspieraj膮ce PDL.
殴r贸d艂o:聽[1,聽str.156]
Najwa偶niejszym aspektem PDL jest to, 偶e s膮 one j臋zykami. Oznacza to, 偶e kiedy informacja zostaje wys艂ana do druku, przesy艂any jest tylko kr贸tki program zamiast olbrzymiej ilo艣ci punkt贸w. W spos贸b znacz膮cy podnosi to szybko艣膰 drukowania. Na dodatek oznacza to, 偶e j臋zyk ten mo偶e zosta膰 prze艂o偶ony lub聽zinterpretowany przez r贸偶ne aplikacje. Dla przyk艂adu PostScript jest powszechnie stosowany jako metoda dystrybucji formatowanych dokument贸w. Dzi臋ki dystrybucji dokumentu przy zastosowaniu PostScript'u u偶ytkownik mo偶e wys艂a膰 go bezpo艣rednio na drukark臋, przegl膮da膰 go przy u偶yciu specjalnych program贸w (np.聽GhostView) lub zaimportowa膰 go do aplikacji wspieraj膮cej PostScript.
Pomimo tych wszystkich zalet, jedn膮 z wad PostScript'u jest relatywnie du偶y rozmiar tworzonych plik贸w, w por贸wnaniu z oryginalnymi formatami dokument贸w z聽kt贸rych zosta艂y utworzone.
Kilka typowych przyk艂ad贸w zar贸wno PDL jak i ODL przedstawionych zosta艂o w tabeli聽2.
Tabela 2
Przyk艂ad kilku j臋zyk贸w opisu wyj艣cia i opisu stron.
J臋zyk |
Rodzaj |
Tw贸rca |
PostScript |
PDL |
Adobe Systems |
Interpress |
PDL |
Xerox |
Reprint |
PDL |
Interleaf |
DDL |
ODL |
Imagen |
HPGL |
ODL |
Hewlett-Packard |
PCL |
ODL |
Hewlett-Packard |
殴r贸d艂o:聽[1, str.157]
Dokumenty wymiany
Dokumenty elektroniczne mog膮 by膰 wymieniane prawie na ka偶dym poziomie wewn膮trz 艣rodowiska cyfrowego. W najprostszym przypadku pliki mog膮 by膰 wymieniane przy u偶yciu dyskietek i przenoszone z jednego komputera na inne. Dzi臋ki zastosowaniu sieci komputerowych przenoszenie plik贸w uleg艂o znacznemu uproszczeniu oraz wzros艂a mo偶liwo艣膰 dost臋pu do du偶ej liczby komputer贸w i聽informacji. Wynikiem tego sta艂o si臋 r贸wnie偶 stosowanie przez wielu u偶ytkownik贸w znacznych ilo艣ci r贸偶norodnych rodzaj贸w plik贸w i typ贸w dokument贸w.
Pomimo szerokiego stosowania w艂asnych format贸w dokument贸w, istnieje wiele sposob贸w, kt贸re mog膮 by膰 u偶yte w prze艂amywaniu niekompatybilno艣ci dokument贸w. Wiele z tych metod jest wynikiem wymaga艅 stawianych przez przemys艂 odno艣nie pracy na wielu platformach sprz臋towych. Podstawowymi wymogami pomy艣lnej wymiany dokument贸w s膮:聽[1,聽str.158]
Neutralna wymiana niezale偶na od sprz臋tu;
Neutralna wymiana niezale偶na od w艂asnego oprogramowania;
Kompletna wymiana zawartych danych;
Kompletna wymiana informacji formatuj膮cych.
Powodzenie rozwi膮zania spe艂niaj膮cego te kryteria cz臋sto w znacznym stopniu jest zale偶ne od z艂o偶ono艣ci wymienianej informacji.
Tak jak to zosta艂o pokazane na rysunku聽10, zasadniczo istniej膮 dwa odr臋bne sposoby wymiany r贸偶nych w艂asnych format贸w dokument贸w:聽[1,聽str.158]
Specyficzny przek艂ad pomi臋dzy systemami
Neutralny format wymiany
Rysunek 10. Metody wymiany w艂asnych format贸w dokument贸w.
殴r贸d艂o:聽[1,聽str.158]
Metoda bezpo艣redniego przek艂adu cz臋sto zaszyta jest wewn膮trz aplikacji, dzi臋ki czemu „obce” dane lub pliki z dokumentami mog膮 by膰 w bardzo prosty spos贸b zar贸wno importowane jak i eksportowane. Pomimo i偶 jest to bardzo wygodne dla u偶ytkownika, to jednak skuteczno艣膰 tego podej艣cia zale偶y w du偶ej mierze od tego na ile dok艂adnie producent oprogramowania interpretuje format dokumentu opracowany przez innego producenta.
Innym podej艣ciem do bezpo艣redniego przek艂adu jest stosowanie aplikacji przeznaczonych specjalnie do t艂umaczenia pomi臋dzy r贸偶nymi formatami dokument贸w. Metod臋 t膮 powszechnie stosuje si臋 przy konwersji pomi臋dzy r贸偶nymi formatami plik贸w graficznych.
Najpowa偶niejszym problemem napotykanym przy bezpo艣rednim przek艂adzie jest olbrzymia ilo艣膰 wymaganych translator贸w. Dla n r贸偶nych format贸w dokument贸w konieczne jest u偶ycie a偶 n*(n-1) r贸偶nych program贸w t艂umacz膮cych.
W celu przezwyci臋偶enia tego problemu coraz powszechniej stosuje si臋 neutralne formaty dokument贸w. Formaty te dostarczaj膮 producentom po艣redni膮 struktur臋 dokument贸w, zwykle dobrze wspart膮 przez przemys艂, dzi臋ki swojej publicznej dost臋pno艣ci.
Dzi臋ki zastosowaniu powszechnych format贸w wymiany dokument贸w, zar贸wno u偶ytkownik jak i producent otrzymuj膮 pewniejsz膮 i wierniejsz膮 metod臋 wymiany dokument贸w. Formaty wymiany bazuj膮 zwykle na ASCII, dzi臋ki czemu s膮 one dobrze przenoszone pomi臋dzy wieloma r贸偶nymi platformami i przy zastosowaniu wielu r贸偶nych protoko艂贸w sieciowych. Przy zastosowaniu neutralnych format贸w wymiany liczba niezb臋dnych translator贸w pomi臋dzy n聽聽r贸偶nymi formatami maleje z n*(n-1) do 2n.
Jedn膮 z najprostszych metod wymiany dokument贸w jest wykorzystanie tekstu ASCII. ASCII jest szczeg贸lnie zalecany przy wymianie zachodz膮cej pomi臋dzy r贸偶nymi platformami lub w przypadku, gdy nie istnieje 偶adna inna forma bezpo艣redniego przek艂adu. Aczkolwiek problem z ASCII jest tego typu, 偶e oryginalny dokument nie mo偶e zawiera膰 偶adnej komendy formatuj膮cej takiej jak informacja o czcionce lub uk艂adzie tekstu. To co zwykle pozostaje jest wy艂膮cznie tre艣ci膮.
W przypadku, gdy musimy wymieni膰 dokumenty pochodz膮ce z bazy danych lub arkusza kalkulacyjnego, mo偶e zosta膰 zastosowana inna forma transferu ASCII. Podej艣cie to stosuje wymian臋 plik贸w ASCII, u偶ywaj膮c znacznik贸w do formatowania informacji zawartej w kom贸rkach lub polach bazy danych czy arkusza kalkulacyjnego. Najpopularniejszymi znacznikami s膮 przecinki oraz znaki聽tabulacji.
Poprzednie przyk艂ady ukazywa艂y jak w prosty spos贸b mo偶na wymienia膰 zawarto艣膰 dokumentu trac膮c jednak przy tym informacj臋 formatuj膮c膮. Czasami聽jednak informacja formatuj膮ca mo偶e okaza膰 si臋 niezwykle istotn膮 z punktu widzenia interpretacji dokumentu. W celu umo偶liwienia zachowania informacji formatuj膮cej w bardziej z艂o偶onych dokumentach, wymagany jest neutralny format etykiet. Metody takie nadal mog膮 bazowa膰 na ASCII.
U偶ycie etykiet w formacie wymiany umo偶liwia zachowanie informacji o聽strukturze dokumentu i po艂o偶eniu tekstu w trakcie procesu wymiany. Wielu聽producent贸w oprogramowania opracowa艂o tego typu formaty wymiany dla swoich w艂asnych format贸w dokument贸w. Niekt贸re powszechnie stosowane standardy dokument贸w stosuj膮cych te metody przedstawione zosta艂y w tabeli聽3.
Tabela 3
Przyk艂ad kilku popularnych standard贸w wymiany dokument贸w.
Standard |
Typ aplikacji |
Tw贸rca / W艂a艣ciciel |
DXF |
Wykresy CAD |
Autodesk |
SIF |
Wykresy CAD |
Intergraph |
IGES |
Wykresy CAD |
ISO, NIST, SAA |
STEP |
Wykresy CAD |
ISO |
SYLK |
Arkusz kalkulacyjny |
Microsoft |
RTF |
Procesor tekstu |
Microsoft |
殴r贸d艂o:聽[1,聽str.161]
Uznanym i cz臋sto stosowanym standardem wymiany dla procesor贸w tekstu i聽program贸w sk艂adu tekstu jest format RTF (Rich Text Formatting) opracowany przez firm臋 Microsoft. Standard ten korzysta z szeregu strukturalnych i聽proceduralnych etykiet do opisu zar贸wno zawarto艣ci jak i informacji formatuj膮cej.
Poniewa偶 formaty wymiany (takie jak RTF) stosuj膮 uznane i dobrze udokumentowane metody strukturyzacji dokumentu, producenci mog膮 tworzy膰 dla nich bardziej niezawodne translatory, ni偶 w przypadku metod bezpo艣redniego przek艂adu dokumentu.
Dokumenty komunikacyjne
Wraz z rozwojem sieci komputerowych, w kt贸rych dzieli si臋 i wymienia dane, wzros艂o zastosowanie system贸w komunikacyjnych. Formaty komunikat贸w zwi膮zane z tymi systemami zaprojektowane s膮 w ten spos贸b aby umo偶liwi膰 bezproblemow膮 wymian臋 informacji pomi臋dzy odleg艂ymi grupami. Formaty komunikacyjne bazuj膮 zwykle na tek艣cie (ASCII), dzieje si臋 tak ze wzgl臋du na jego niezawodno艣膰 w przesy艂aniu poprzez r贸偶ne typy sieci.
Standardy komunikacyjne dziel膮 si臋 na trzy g艂贸wne kategorie: poczt臋 elektroniczn膮, elektroniczn膮 wymian臋 danych EDI oraz us艂ugi faksowe. Ponadto聽nale偶y wymieni膰 typ dokumentu, 艣ci艣le zwi膮zany z tymi standardami i聽okre艣lany mianem elektronicznego formularza.
Poczta elektroniczna (e-mail) jest us艂ug膮, kt贸ra umo偶liwia u偶ytkownikowi sieci wysy艂anie komunikat贸w do innego u偶ytkownika komputera pod艂膮czonego do sieci. Komunikaty te mog膮 by膰 uwa偶ane za dokumenty (zgodnie z definicj膮, w聽kt贸rej dokument okre艣lony zosta艂 jako pojemnik z informacj膮). Podkre艣li膰 nale偶y, 偶e e-mail jest protoko艂em komunikacyjnym 艣ci艣le zwi膮zanym z protoko艂ami stosowanymi w komunikacji sieciowej.
E-mail mo偶e by膰 stosowany do przesy艂ania notatek, zawiadomie艅, list贸w i聽wielu innych typ贸w dokument贸w. Tak jak ju偶 by艂o wcze艣niej wspomniane, dokumenty te wysy艂ane s膮 w postaci ASCII, w zwi膮zku z czym wszelkie dane binarne, kt贸re zostaj膮 wys艂ane jako za艂膮czniki do komunikatu, musz膮 zosta膰 przekonwertowane na ASCII przy pomocy specjalnego programu.
Elektroniczna wymiana danych (EDI) zdefiniowana jest jako „mechanizm przesy艂ania danych biznesowych pomi臋dzy lub wewn膮trz firm (艂膮cznie z ich agentami i po艣rednikami), w postaci ustrukturyzowanych, gotowych do obr贸bki przez komputer danych. Transakcje EDI mog膮 zawiera膰 notowania gie艂dowe, zlecenia zakupu, faktury oraz dowolne inne typy danych biznesowych, kt贸re mog膮 by膰 przedstawione w postaci formularza”聽[1,聽str.169].
EDI zaprojektowane zosta艂o po to aby wyeliminowa膰 drogie i czasoch艂onne pos艂ugiwanie si臋 dokumentami oraz zadania zwi膮zane z wprowadzaniem danych. Stosowanie EDI mo偶e uczyni膰 dzia艂alno艣膰 gospodarcz膮 bardziej efektywn膮.
Znaczna cz臋艣膰 kluczowych cech dokument贸w EDI jest analogiczna do cech odpowiadaj膮cych im papierowych dokument贸w handlowych. Istniej膮 jednak w EDI pewne unikatowe elementy. Mo偶na do nich zaliczy膰 cyfrowe podpisy, elektroniczne pieni膮dze oraz elektroniczne oznaczanie czasu.
Komunikaty EDI s膮 bardzo zbli偶one do e-mail. G艂贸wna r贸偶nica polega na tym, 偶e komunikaty EDI przychodz膮 w z g贸ry okre艣lonym formacie, kt贸ry umo偶liwia oprogramowaniu inwentaryzacyjnemu i obliczeniowemu 艂atwe przetwarzanie zawartych tam danych. Aby by艂o to mo偶liwe, komunikat musi zosta膰 wys艂any przy u偶yciu odpowiedniego standardu takiego jak ANSI X.12 lub United聽Nations EDIFACT (EDI For Administration, Commerce and Transport).
Dzi臋ki powszechnej akceptacji EDI, oraz mi臋dzynarodowej wsp贸艂pracy przy rozwoju standard贸w, EDI mo偶e sta膰 si臋 znacz膮c膮 metod膮 komunikacji w wielu krajach. Powszechnie uwa偶a si臋, 偶e jest ju偶 tylko kwesti膮 czasu to, 偶e EDI stanie si臋 najcz臋stszym sposobem wymiany informacji pomi臋dzy przedsi臋biorstwami [1,聽str.172].
Kolejnym typem dokumentu elektronicznego powi膮zanego z systemami komunikacyjnymi jest formularz elektroniczny. Formularz taki mo偶na okre艣li膰 jako elektroniczny odpowiednik formularza drukowanego na papierze. Formularze powszechnie wykorzystywane s膮 w: aplikacjach, kwestionariuszach, deklaracjach podatkowych, raportach itp.
Formularze elektroniczne mog膮 zosta膰 zaimplementowane na dwa podstawowe sposoby:
Przy u偶yciu wyspecjalizowanych, bazuj膮cych na formularzach aplikacji;
Przy u偶yciu opartych na formularzach interfejs贸w wewn膮trz aplikacji.
Aplikacje bazuj膮ce na formularzach dziel膮 si臋 na dwie cz臋艣ci: oprogramowanie przeznaczone do projektowania formularzy oraz oprogramowanie przeznaczone do ich wype艂niania. Aby utworzy膰 formularz niezb臋dne b臋dzie wykorzystanie przez projektanta obu rodzaj贸w oprogramowania. U偶ytkownik formularza potrzebuje jedynie oprogramowania do wype艂niania go.
Po wype艂nieniu, formularz lub jego zawarto艣膰 mo偶e zosta膰 wys艂ana do innego u偶ytkownika. Gdy formularz zostanie ju偶 wys艂any, mo偶e on by膰 nast臋pnie automatycznie przemieszczany jako element systemu workflow lub systemu zarz膮dzania dokumentami. Oznacza to, 偶e wype艂niony formularz mo偶e by膰 automatycznie transmitowany przez sie膰 komputerow膮 do ustalonej liczby u偶ytkownik贸w w celu podj臋cia przez nich dalszych dzia艂a艅 na dokumencie.
Do aplikacji bazuj膮cych na formularzach mo偶na zaliczy膰 mi臋dzy innymi: „InForms” firmy Novell, „Lotus Forms” firmy Lotus Development, oraz „FormFlow” firmy Derlina.
Generalnie formularze utworzone przy zastosowaniu takich aplikacji nie mog膮 by膰 wymieniane pomi臋dzy r贸偶nymi systemami. Aczkolwiek wiele system贸w wspiera powszechne protoko艂y wymiany komunikat贸w takie jak MAPI lub VIM, dzi臋ki czemu informacja zawarta w formularzach mo偶e by膰 swobodnie przenoszona w sieci komputerowej.
Mo偶liwe jest r贸wnie偶 wykorzystanie formularzy wy艂膮cznie jako interfejs贸w, i聽przekazywanie informacji zawartej wewn膮trz ich p贸l jako oddzielnych plik贸w聽ASCII. Dzi臋ki tej w艂a艣ciwo艣ci formularze mog膮 by膰 wykorzystywane jako interfejsy do transakcji EDI.
Opr贸cz aplikacji formularzowych, szereg innych system贸w informatycznych korzysta z formularzy. Do najpopularniejszych przyk艂ad贸w nale偶膮 systemy zarz膮dzania bazami danych oraz dokumenty hipertekstowe.
Systemy zarz膮dzania bazami danych takie jak Microsoft Access, Claris FileMaker Pro oraz Borland dBase, wykorzystuj膮 formularze jako interfejsy do swoich baz danych. Wiele z element贸w tworz膮cych formularze, takich jak pola wprowadzania danych, przyciski, pola wyboru itp. dost臋pnych jest przy tworzeniu interfejs贸w do danych w wy偶ej wymienionych pakietach. Podstawow膮 r贸偶nic膮 pomi臋dzy tymi formularzami jest to, 偶e s膮 one 艣ci艣le zintegrowane z konkretnym systemem. Najwi臋ksz膮 wad膮 takiego podej艣cia jest to, 偶e formularz taki nie jest w聽pe艂ni odr臋bnym dokumentem, gdy偶 musi on by膰 przez ca艂y czas dost臋pny razem z聽baz膮 danych.
Jedno z narz臋dzi „nawigacji” w Internecie, okre艣lane jako WWW, korzysta ze struktury dokument贸w hipertekstowych HTML. Jedn膮 z cech tego systemu jest to, 偶e umo偶liwia on niezale偶n膮 od platformy oraz oprogramowania metod臋 tworzenia interfejs贸w w oparciu o formularze. J臋zyk HTML wspiera u偶ycie rozwijanych list, p贸l tekstowych oraz p贸l wyboru, aby umo偶liwi膰 u偶ytkownikowi interakcj臋 z systemem informacyjnym lub baz膮 danych. Poniewa偶 HTML jest niezale偶ny od platformy, oznacza to, 偶e klient (korzystaj膮cy z formularza) oraz serwer (zarz膮dzaj膮cy baz膮 danych) mog膮 by膰 na ca艂kowicie odmiennych platformach sprz臋towych.
Dokumenty sk艂adane dynamicznie
Znaczna cz臋艣膰 dokument贸w zawiera wiele r贸偶nych typ贸w danych i z tego powodu okre艣lane s膮 one mianem z艂o偶onych lub sk艂adanych聽[8]. W przesz艂o艣ci aplikacje takie jak procesory tekstu czy pakiety graficzne dzia艂a艂y niezale偶nie od siebie nawzajem. W najlepszym razie by艂y one w stanie zaimportowa膰 okre艣lone typy plik贸w w celu ich dalszej obr贸bki. Jednak偶e dzi臋ki rozwojowi nowych opartych o graficzn膮 komunikacj臋 z u偶ytkownikiem system贸w operacyjnych takich jak Microsoft Windows, OS/2 czy MacOS, powsta艂o szereg r贸偶nych metod komunikacji pomi臋dzy aplikacjami. Metody te pozwalaj膮 programom na 艂atwe kopiowanie, wstawianie i w艂膮czanie informacji zawartych w jednym dokumencie do innego dokumentu. Celem aplikacji zawieraj膮cych obiektowo zorientowane dokumenty jest nie tylko wymiana obiekt贸w z danymi, ale r贸wnie偶 ich ponowne wykorzystanie.
Zwykle, gdy dane 藕r贸d艂owe s膮 wstawiane do dokumentu, po艂膮czenie pomi臋dzy 藕r贸d艂em i dokumentem przestaje istnie膰. Oznacza to, 偶e w przypadku gdy dane zostaj膮 zmienione, dokument nie jest automatycznie aktualizowany. Przyczynia si臋 to do potrzeby cz臋stych rewizji dokument贸w, oraz mo偶e to powodowa膰 powstawanie licznych b艂臋d贸w.
Dzi臋ki 艂膮czeniu dokument贸w z ich 藕r贸d艂em danych, powoduje si臋, 偶e dokument zawsze zawiera dane aktualne. Wewn膮trz dokument贸w opis danych mo偶e zawiera膰 informacj臋 o tym jak zawarte w dokumencie dane s膮 dzielone lub aktualizowane w innych dokumentach. Podej艣cie takie daje grupom roboczym mo偶liwo艣膰 reorganizacji prac zwi膮zanych z generowaniem i aktualizacj膮 dokument贸w聽[4].
Rozw贸j struktur dokument贸w sk艂adanych dynamicznie dokonuje si臋 dopiero od niedawna, i dlatego nie zosta艂y one jeszcze szeroko zaakceptowane. Tabela聽4 przedstawia szereg standardowych metod komunikacji pomi臋dzy aplikacjami oraz standard贸w dynamicznie sk艂adanych dokument贸w.
Tabela 4
Przyk艂ad kilku standard贸w komunikacji pomi臋dzy aplikacjami oraz standard贸w dynamicznie sk艂adanych dokument贸w.
Standard |
Opis |
Tw贸rca |
Cut & Paste |
Kopiuje lub przemieszcza dane wewn膮trz lub pomi臋dzy dokumentami |
Wielu |
Print merge |
Wstawia dane (zwykle z bazy danych) w聽puste pola we wzorcu dokumentu |
Wielu |
Publish & Subscribe |
W艂asna metoda dynamicznego dzielenia danych pomi臋dzy dokumentami |
Apple Computer |
DDE |
„Dynamic Data Exchange” - dynamicznie 艂膮czy dane pomi臋dzy dokumentami |
Microsoft |
OLE |
„Object Linking and Embedding” - standard interaktywnej wymiany obiekt贸w z r贸偶nych aplikacji w sk艂adanych dokumentach |
Microsoft |
OpenDoc |
Specyfikacja sk艂adanych dokument贸w, |
Component Integration Laboratories |
DSOM |
„Distributed System Object Model” - specyfikacja sk艂adanych dokument贸w |
IBM |
CORBA |
„Common Object Request Broker Architecture” - specyfikacja rozproszonego 艣rodowiska z聽przeno艣nymi obiektami |
H-P, DEC, Sun Microsystem |
PDO |
„Portable Distribution Object” - specyfikacja sk艂adanych dokument贸w |
NeXt |
Frameworks |
Specyfikacja sk艂adanych dokument贸w |
Taligent |
殴r贸d艂o:聽[1,聽str.177]
Spo艣r贸d wszystkich dost臋pnych standard贸w, jedynie dwa b臋d膮 mia艂y wi臋ksze znaczenie dla u偶ytkownik贸w komputer贸w. S膮 to standardy OLE i聽OpenDoc. Celem聽obu tych standard贸w jest umo偶liwienie tworzenia na wielu platformach dokument贸w sk艂adanych dynamicznie, kt贸re mog膮 by膰 opracowywane i u偶ywane wsp贸lnie przez wiele os贸b聽[1,聽str.177]. R贸wnie偶 oba te standardy s膮 przedstawicielami nowych, zorientowanych na dokument technologii.
Dokumenty sk艂adane w procesie
Zbi贸r znak贸w ASCII zawsze by艂 postrzegany jako uniwersalna metoda neutralnej wymiany danych. Istnieje jednak pewien niedostatek element贸w w聽ASCII potrzebnych do kodowania z艂o偶onych dokument贸w聽[8]. Wynika on z tego, 偶e ASCII przeznaczony jest g艂贸wnie do wyra偶ania tre艣ci dokumentu, ma za艣 ograniczone mo偶liwo艣ci jego formatowania.
Dokumenty sk艂adane zwykle zawieraj膮 informacj臋, kt贸ra zosta艂a starannie sformatowana, w zwi膮zku z czym zachodzi konieczno艣膰 wyra偶enia ich w trzech wymiarach: tre艣ci, struktury i stylu prezentacji聽[8]. Dlatego te偶 celem neutralnego modelu kodowania dokument贸w jest konwersja zawarto艣ci dokumentu, jego uk艂adu oraz prezentacji, tak aby m贸g艂 by膰 on p贸藕niej u偶ywany przez r贸偶nego typu aplikacje, poddawany dalszej edycji, przechowywany, drukowany oraz przekazywany聽[8].
Mi臋dzynarodowa Organizacja Standaryzacyjna (ISO) jak do tej pory opublikowa艂a dwa standardy otwartej wymiany dokument贸w odpowiadaj膮ce powy偶szym za艂o偶eniom. Pierwszym standardem w tej kategorii by艂 SGML (Standard Generalised Markup Language), opublikowany w 1986r. Drugim standardem by艂a ODA (Open Document Architecture) opublikowana w 1987r. Kolejny model nazywany CDA ukaza艂 si臋 w 1989r.i w znacznym stopniu bazuje na聽ODA聽[1,聽str.180].
Tabela 5
Przyk艂ad kilku popularnych modeli sk艂adu dokumentu w procesie.
Standard |
Opis |
W艂a艣ciciel / Tw贸rca |
SGML (ISO 8879:1986) |
Opis struktury dokument贸w |
ISO |
ODA (ISO 8613:1989) |
Kodowanie sk艂adanych dokument贸w |
ISO |
CDA |
Kodowanie sk艂adanych dokument贸w |
DEC |
殴r贸d艂o:聽[1,聽str.180]
Ka偶dy ze standard贸w przedstawionych w tabeli聽5 cechuje odmienne podej艣cie do sk艂adu dokument贸w. SGML znany jest jako j臋zyk etykiet i stosowany do oznaczania struktury dokument贸w bazuj膮cych na ASCII. ODA oraz CDA zaprojektowane zosta艂y tak, aby dostarcza艂y standardowych metod wymiany sformatowanych strukturalnie i proceduralnie dokument贸w pomi臋dzy r贸偶nymi platformami komputerowymi i aplikacjami. Najbardziej rozpowszechnionym z tych standard贸w jest SGML聽[4].
SGML oferuje neutraln膮 metod臋 organizacji dokumentu przy u偶yciu strukturalnych etykiet. Oznacza to, 偶e dokument mo偶e zosta膰 zorganizowany zgodnie z takimi elementami jak nag艂贸wki, paragrafy, tabele, listy itp. SGML nie u偶ywa jednak 偶adnych etykiet proceduralnych do opisu formatowania dokumentu takich jak uk艂ad strony, czcionka czy marginesy. Innymi s艂owy zawarto艣膰 dokumentu jest rozpatrywana ca艂kowicie oddzielnie od jego formatowania.
Najwi臋ksz膮 zalet膮 stosowania strukturalnych etykiet takich jak w SGML jest to, 偶e zawarto艣膰 dokument贸w mo偶e by膰 przechowywana w spos贸b niezale偶ny od technologii formatowania dokument贸w聽[4]. Poniewa偶 technologie informatyczne ulegaj膮 ci膮g艂ym zmianom, zastosowanie SGML podnosi w znacznym stopniu u偶yteczno艣膰 informacji zawartych w dokumentach.
Dokumenty - widoki
Ocenia si臋, 偶e pomi臋dzy 50 a 80 procent potrzeb u偶ytkownik贸w komputer贸w dotyczy wy艂膮cznie wy艣wietlania dokument贸w na ekranie聽[1,聽str.186]. Fakt ten przyczyni艂 si臋 do opracowania szeregu typ贸w dokument贸w elektronicznych, kt贸rych g艂贸wnym przeznaczeniem jest dostarczanie widoku (wersji nieedytowalnej) dokumentu. Dokumenty te okre艣lane s膮 mianem dokument贸w - widok贸w.
Podczas, gdy istnieje ca艂y szereg r贸偶nych dokument贸w聽-聽widok贸w przeznaczonych do odczytu przez tylko jedn膮 aplikacj臋 lub platform臋, to najbardziej u偶yteczne s膮 te formaty dokument贸w, kt贸re zaprojektowane zosta艂y do zastosowa艅 na wielu r贸偶nych platformach sprz臋towych i programowych. W tabeli聽6 przedstawionych zosta艂o szereg najpopularniejszych format贸w dokument贸w聽- widok贸w.
Tabela 6
Przyk艂ad kilku popularnych format贸w dokument贸w - widok贸w.
Format |
System operacyjny |
Tw贸rca |
Acrobat (PDF) |
MacOS, DOS, Windows, SunOS |
Adobe Systems |
Common Ground |
Solaris, MacOS, Windows |
No Hands Software |
Worldview |
MacOS, Windows, Unix, VMS |
Interleaf |
Portable Digital Document (PDD) |
MacOS |
Apple Computer |
Replica |
MacOS, Windows |
Fallon |
FrameViewer |
MacOS, Windows, X/motif, Unix |
Frame Technologies |
DocViewer |
MacOS |
Apple Computer |
Envoy |
MacOS, Windows |
WordPerfect |
GhostView |
MacOS, OS/2, Windows, Unix, VMS |
Alladin |
殴r贸d艂o:聽[1,聽str.187]
Zadaniem dokument贸w聽-聽widok贸w jest dostarczanie w pe艂ni sformatowanej struktury dokumentu, kt贸ra mo偶e by膰 dystrybuowana pomi臋dzy r贸偶nymi komputerami, niezale偶nie od ich platformy sprz臋towej, systemu operacyjnego lub aplikacji, kt贸ra pos艂u偶y艂a do utworzenia dokumentu. Kiedy u偶ytkownik otrzymuje dokument聽-聽widok, mo偶e wykonywa膰 na nim takie operacje jak przegl膮danie, przeszukiwanie, tworzenie przypis贸w, drukowanie oraz sk艂adowanie w swoim w艂asnym systemie聽[3].
Dokument, kt贸ry zosta艂 przekonwertowany do formatu dokumentu聽-聽widoku, mo偶e by膰 dystrybuowany do u偶ytkownik贸w na wielu r贸偶nych platformach oraz wy艣wietlany niezale偶nie od aplikacji, kt贸ra pierwotnie pos艂u偶y艂a do jego powstania. Ka偶dy odbiorca b臋dzie dysponowa艂 dokumentem o takim samym wygl膮dzie jak dokument 藕r贸d艂owy. Dla przyk艂adu z艂o偶ony raport zawieraj膮cy tekst, grafik臋, arkusz kalkulacyjny i wykresy CAD mo偶e zosta膰 utworzony przy u偶yciu sytemu do sk艂adu tekstu na komputerze Macintosh. Po konwersji na przyk艂ad do formatu PDF, mo偶e by膰 on przekazywany do innych u偶ytkownik贸w niezale偶nie od tego, czy korzystaj膮 oni z systemu operacyjnego MacOS, Windows czy Unix. Jedynym聽wymogiem jest posiadanie przez nich odpowiedniego programu do przegl膮dania tego typu dokument贸w.
Dokumenty elektronicznych odno艣nik贸w oraz 艂膮czonych form informacji
Dokumenty elektronicznych odno艣nik贸w ERD (ang.聽Electronic reference documents) spe艂niaj膮 takie samo zadanie jak kopiowanie powi膮zanych dokument贸w. S膮 one znane r贸wnie偶 pod innymi angielskimi nazwami, takimi jak: „softcopy”, „enhanced documents”, „hypertext” oraz „hypermedia”聽[1,聽str.194]. Dzi臋ki strukturyzacji dokument贸w elektronicznych przy u偶yciu metody elektronicznych odno艣nik贸w, informacja mo偶e by膰 b艂yskawicznie zlokalizowana wewn膮trz olbrzymiej kolekcji dokument贸w.
Koncepcja 艂膮czenia dokument贸w przy pomocy elektronicznych odno艣nik贸w przedstawiona zosta艂a na rysunku聽11.
Rysunek 11. Szereg dokument贸w po艂膮czonych elektronicznymi odno艣nikami.
殴r贸d艂o: Opracowanie w艂asne
Kluczowym elementem system贸w opartych o dokumenty elektronicznych odno艣nik贸w jest zastosowanie struktury dost臋pu do informacji, kt贸ra mo偶e zosta膰 przystosowana do proces贸w skojarzeniowych w ludzkiej pami臋ci聽[4].
W dokumentach bazuj膮cych na papierze (np. ksi膮偶ki) - rozdzia艂y, paragrafy i聽strony nast臋puj膮 kolejno po sobie w porz膮dku zale偶nym nie tylko od intencji autora, ale r贸wnie偶 od fizycznej konstrukcji samego dokumentu. W dokumentach elektronicznych odno艣nik贸w istnieje system po艂膮cze艅, kt贸re pozwalaj膮 czytelnikowi na przyswajanie informacji w dowolnej kolejno艣ci.
Wsp贸lnym dla wszystkich system贸w dokument贸w elektronicznych odno艣nik贸w s膮 koncepcje 艂膮czenia (ang. linking), wertowania (ang. browsing) oraz nawigacji (ang. navigating)聽[4]:
艁膮czenie聽- umo偶liwia zwi膮zanie razem dw贸ch oddzielnych fragment贸w informacji.
Wertowanie聽- oznacza mo偶liwo艣膰 przeszukiwania informacji.
Nawigacja聽- jest to zdolno艣膰 do przemieszczania si臋 pomi臋dzy dokumentami przy u偶yciu alternatywnych dr贸g w celu odszukania interesuj膮cego tematu.
Dzi臋ki zastosowaniu tych technik informacja zawarta w dokumencie mo偶e by膰 dost臋pna w spos贸b nieliniowy.
W tabeli聽7 przedstawionych zosta艂o kilka standard贸w dokument贸w elektronicznych odno艣nik贸w.
Tabela 7
Przyk艂ad kilku system贸w oraz standard贸w dokument贸w elektronicznych odno艣nik贸w.
Standard / Produkt |
Opis |
W艂a艣ciciel / Tw贸rca |
HTML |
Hypertext Markup Language - bazuj膮cy na SGML j臋zyk elektronicznych odno艣nik贸w |
IETF (Internet Engineering Task Force) & W3C (World Wide Web Consorcium) |
DynaText |
Bazuj膮cy na SGML system odwo艂a艅 do dokument贸w elektronicznych |
Electronic Book Technologies |
Explorer |
Bazuj膮cy na SGML system odwo艂a艅 do dokument贸w elektronicznych |
SoftQuad |
FolioViews |
System odwo艂a艅 do dokument贸w elektronicznych |
Folio Corporation |
BookManager |
System odwo艂a艅 do dokument贸w elektronicznych |
IBM |
HyperWriter |
System odwo艂a艅 do dokument贸w elektronicznych |
Ntergaid |
Standard / Produkt |
Opis |
W艂a艣ciciel / Tw贸rca |
KnowledgePro |
System odwo艂a艅 do dokument贸w elektronicznych bazuj膮cy na systemie ekspertowym |
Knowledge Garden |
MS-Help |
Pliki pomocy elektronicznej |
Microsoft |
Hytime |
J臋zyk strukturalny bazuj膮cy na SGML |
ISO |
殴r贸d艂o:聽[1,聽str.197]
Obecnie najbardziej rozpowszechnionym systemem dokument贸w elektronicznych odno艣nik贸w jest World Wide Web (znane r贸wnie偶 jako WWW lub po prostu Web). Jest to jeden z najnowszych no艣nik贸w dost臋pnych w Internecie. WWW jest olbrzymim zbiorem po艂膮cze艅 dokument贸w hipertekstowych. Dokumenty te zawieraj膮 odwo艂ania do innych dokument贸w lub miejsc ftp, gopher, telnet itd. Za pomoc膮 przegl膮darki WWW mo偶na przechodzi膰 od jednego po艂膮czenia do innego, poruszaj膮c si臋 wzd艂u偶 po艂膮cze艅 w dowoln膮 ich stron臋.
Hipertekst jest to tekst z odwo艂aniami. Odwo艂ania te s膮 elementami dokumentu hipertekstowego i s膮 tworzone przez jego autora. Wybranie odwo艂ania powoduje przeniesienie do dokumentu, z kt贸rym bie偶膮cy dokument by艂 powi膮zany lub te偶 do innej cz臋艣ci bie偶膮cego dokumentu.
Dokumenty hipertekstowe w WWW s膮 strukturyzowane przy u偶yciu j臋zyka Hypertext Markup Language (HTML). Jest to j臋zyk, kt贸ry powsta艂 w oparciu o聽j臋zyk opisu struktury dokumentu SGML. Specyfikacja HTML definiuje zbi贸r predefiniowanych element贸w, kt贸re mog膮 pos艂u偶y膰 do oznaczania dokument贸w dla dystrybucji ich w Internecie聽[1,聽str.198]. Przegl膮darki WWW s膮 w stanie interpretowa膰 i聽wy艣wietla膰 dokumenty HTML oraz inne bazuj膮ce na kodach ASCII.
Specyfikacja HTML definiuje szereg element贸w, kt贸re umo偶liwiaj膮 autorowi definiowanie sposobu strukturyzacji dokumentu. Stosuj膮c te elementy, autor mo偶e osi膮ga膰 takie efekty jak:
Okre艣lanie rozmiaru tekstu oraz jego uwydatnianie przy pomocy pogrubionej oraz pochy艂ej czcionki;
Okre艣lanie paragraf贸w;
Wstawianie grafiki (zwykle pliki GIF lub JPEG);
Do艂膮czanie d藕wi臋ku, animacji oraz plik贸w wideo;
Tworzenie:
Elektronicznych odno艣nik贸w;
Interaktywnych formularzy;
Tablic;
List;
Linii separuj膮cych.
Dokumenty multimedialne
Podobnie jak dokumenty elektronicznych odno艣nik贸w, dokumenty multimedialne potrafi膮 korzysta膰 z po艂膮cze艅 fragment贸w informacji oraz narz臋dzi do wyszukiwania, po to aby umo偶liwi膰 u偶ytkownikowi przegl膮danie ich zawarto艣ci. Jednak偶e dokumenty multimedialne zosta艂y specjalnie zaprojektowane do u偶ycia du偶ej liczby „bogatych” 藕r贸de艂 danych takich jak grafika, d藕wi臋k czy wideo, a ich g艂贸wnym celem jest wspieranie procesu uczenia oraz dostarczanie rozrywki. Dokumenty multimedialne s膮 w stanie dostarczy膰 znacznie wi臋kszej r贸偶norodno艣ci danych ni偶 dokumenty drukowane, tak jak przedstawione to zosta艂o na rysunku聽12.
Wszystkie multimedia posiadaj膮 zdolno艣膰 interakcji oraz wi臋kszo艣膰 z nich zaprojektowana jest w ten spos贸b, aby aktywnie anga偶owa膰 u偶ytkownika dokumentu聽[1,聽str.203]. Dla przyk艂adu powszechnym jest jednoczesne prezentowanie u偶ytkownikowi r贸偶nych typ贸w danych takich jak zdj臋cia, animacja, narracja czy podk艂ad d藕wi臋kowy. Multimedia najcz臋艣ciej wykorzystywane s膮 jako: ilustrowane encyklopedie, s艂owniki, przewodniki turystyczne i biznesowe, pomoce do nauki, kolekcje sztuki oraz gry.
Rysunek 12. Rodzaje medi贸w stosowanych w dokumentach multimedialnych oraz drukowanych.
殴r贸d艂o:聽[4]
Jak dotychczas nie istnieje 偶aden szeroko akceptowany standard formatowania, wymiany oraz sk艂adowania dokument贸w multimedialnych聽[4]. Przyczyni艂a si臋 do tego r贸偶norodno艣膰 standard贸w, kt贸re mo偶na zastosowa膰 do ka偶dego typu danych w艂膮czanych do dokument贸w multimedialnych. Ponadto multimedia s膮 stosunkowo now膮 dziedzin膮 rozwoju.
W tabeli聽8 wymienionych zosta艂o kilka standard贸w publikacji oraz formatowania dokument贸w multimedialnych. Wi臋kszo艣膰 z tych standard贸w mo偶na zaliczy膰 do kategorii dokument贸w w艂asnych aplikacji.
Tabela 8
Przyk艂ad kilku produkt贸w z dziedziny dokument贸w multimedialnych.
Standard / Produkt |
Opis |
W艂a艣ciciel / Tw贸rca |
MacroMedia Director |
Aplikacja multimedialna |
Macromedia Inc. |
ScriptX |
W zamierzeniu obiektowo zorientowane, wieloplatformowe 艣rodowisko tworzenia dokument贸w multimedialnych |
Kaledia Labs. |
Hypercard |
Aplikacja multimedialna |
Apple Computers |
Open Media Framework Interface |
Format sk艂adowania i wymiany dokument贸w multimedialnych |
Avoid Technologies |
Bento |
Format sk艂adowania i wymiany dokument贸w multimedialnych |
Apple Computers |
殴r贸d艂o:聽[1,聽str.204]
Najcz臋艣ciej spotykan膮 metod膮 dostarczania dokument贸w multimedialnych jest CD-ROM聽[1,聽str.205]. Dzieje si臋 tak ze wzgl臋du na du偶膮 liczb臋 oraz rozmiar stosowanych plik贸w. Nawet w przypadku zastosowania z艂o偶onych technik kompresji, trudno jest zmniejszy膰 rozmiar plik贸w zawieraj膮cych grafik臋, wideo oraz d藕wi臋k, bez obni偶ania ich jako艣ci; St膮d te偶 konieczno艣膰 stosowania no艣nik贸w informacji o du偶ej pojemno艣ci.
Zestawienie dokument贸w elektronicznych
Poprzednie podrozdzia艂y omawiaj膮 szeroki zakres r贸偶nych typ贸w dokument贸w elektronicznych. Tabela聽9 jest prost膮 metod膮 por贸wnania oraz podsumowania zasadniczych cechy podstawowych grup dokument贸w.
Tabela 9
Podsumowanie g艂贸wnych grup dokument贸w elektronicznych.
Rodzaj dokumentu |
Definicja |
Zastosowanie |
G艂贸wne standardy |
W艂asny aplikacji |
Struktura dokumentu specyficzna dla aplikacji |
Przechowywanie danych aplikacji |
Wiele |
Wyj艣ciowy |
Standaryzowana struktura formatowania do komunikacji z聽urz膮dzeniami wyj艣ciowymi |
Drukowanie i dystrybucja sformatowanych dokument贸w |
PostScript PCL |
Wymiany |
Standaryzowana struktura translacji stosowana do dokument贸w w艂asnych |
Wymiana dokument贸w pomi臋dzy aplikacjami |
DXF RTX |
Komunikacyjny |
Standaryzowana struktura wiadomo艣ci dla asynchronicznej komunikacji |
Wymiana informacji pomi臋dzy odleg艂ymi odbiorcami |
EDI |
Sk艂adany dynamicznie |
Edytowalna struktura dokumentu, dynamicznie 艂膮czona ze 藕r贸d艂em danych |
Dokumenty, kt贸re korzystaj膮 ze zmieniaj膮cych si臋 danych |
OLE OpenDoc |
Sk艂adany w聽procesie |
Neutralna, edytowalna, wieloplatformowa struktura dokumentu |
Ustrukturyzowane, niezale偶ne od platformy dokumenty |
SGML |
Rodzaj dokumentu |
Definicja |
Zastosowanie |
G艂贸wne standardy |
Widok |
Neutralna, nieedytowalna, wieloplatformowa struktura dokumentu |
Dystrybucja |
|
Elektronicznych odno艣nik贸w |
Nieedytowalna struktura dokumentu, powi膮zana odno艣nikami z innymi strukturami |
Publikacje elektroniczne, dost臋p do dokument贸w poprzez odno艣niki |
HTML |
Multimedialny |
Wysoce ustrukturyzowana, o聽bogatej zawarto艣ci struktura dokumentu |
Edukacja, nauka, rozrywka |
Wiele |
殴r贸d艂o:聽[1,聽str.207]
Tak jak to przedstawione by艂o na pocz膮tku tego rozdzia艂u, trudno jest ustali膰 wsp贸lny zbi贸r kryteri贸w, kt贸ry umo偶liwi艂by proste por贸wnanie dokument贸w elektronicznych. Przedstawienie wyczerpuj膮cego zestawienia cech r贸偶nych dokument贸w jest trudne, a nawet niemo偶liwe, ze wzgl臋du na wci膮偶 trwaj膮ce prace nad wieloma standardami. Ponadto wi臋kszo艣膰 z dokument贸w elektronicznych zosta艂a zaprojektowana tak, aby spe艂nia膰 szereg odmiennych zada艅.
Pomimo tego, i偶 wiele dokument贸w elektronicznych posiada wsp贸lne cechy, takie jak np. stosowanie elektroniczne odno艣nik贸w, czy neutralny format kodowania, nie oznacza to, 偶e dokumenty te mog膮 by膰 rozpatrywane jako r贸wnoznaczne. Dla przyk艂adu zar贸wno PDF jak i HTML wspieraj膮 elektroniczne odno艣niki, to dokumenty te zazwyczaj s膮 wykorzystywane do ca艂kowicie r贸偶nych cel贸w. W tym przypadku odno艣niki s膮 jedynie mechanizmem, kt贸ry mo偶e by膰 wykorzystany przez czytelnika do szybkiego poruszania si臋 pomi臋dzy r贸偶nymi cz臋艣ciami dokumentu.
Mo偶na zaobserwowa膰, 偶e wiele cech dokument贸w elektronicznych takich jak poruszanie si臋 wewn膮trz nich czy mo偶liwo艣ci przenoszenia staje si臋 w r贸偶nych ich typach coraz bardziej zbli偶ona. To co wci膮偶 r贸偶ni dokumenty elektroniczne, to ich zasadnicza funkcja, do kt贸rej zosta艂y one specjalnie zaprojektowane, to znaczy: drukowanie, dystrybucja i wymiana.
Charakterystyka wybranych technologii stosowanych w Systemach Zarz膮dzania Dokumentami Elektronicznymi
W ostatnich dwudziestu latach, organizacje na ca艂ym 艣wiecie inwestowa艂y g艂贸wnie w systemy zarz膮dzania bazami danych (SZBD) jako systemy do zarz膮dzania ich informacj膮. Zasadniczo SZBD przeznaczone s膮 do przechowywania, zarz膮dzania, sortowania, informowania i wyprowadzania informacji numerycznej, takiej jak statystyki sprzeda偶y, wykonane i zamierzone plany, inwentarz rachunk贸w i prowadzonych inwestycji.
Architektura numerycznie zorientowanych SZBD (takich jak relacyjne, wielowymiarowe, sieciowe, odwr贸cone listy, lub innych podobnych struktur) jest specyficznie zaprojektowana do wydajnego przetwarzania obszernych mas informacji numerycznej. I podczas gdy ich pot臋ga, szybko艣膰 i mo偶liwo艣ci ci膮gle wzrastaj膮, to ich zasadnicza praca nie wychodzi poza zarz膮dzanie informacj膮 numeryczn膮.
Jednak istotna informacja funkcjonuje nie tylko jako liczby lecz r贸wnie偶 jako聽tekst. Jako fakt, ostatnie badania wskazuj膮, 偶e oko艂o 90 procent informacji korporacji znajduje si臋 w dokumentach, przesy艂kach pocztowych, polisach (politykach), procedurach, dokumentacji, kontraktach lub innych tekstowych komunikatach przedsi臋biorstwa聽[20,聽str.1]. Ta tekstowa informacja znajduje si臋 poza zakresem wspieranego komputerowo zarz膮dzania.
Idea oraz zadania System贸w Zarz膮dzania Dokumentami Elektronicznymi
Zarz膮dzanie dokumentami w du偶ej firmie kojarzy艂o si臋 do niedawna ze stertami papier贸w w szafach. Dzi艣 w dalszym ci膮gu kojarzy si臋 z szafami, tyle 偶e pe艂nymi pude艂ek z dyskietkami i kasetami streamer贸w.
Dokumenty, kt贸re kiedy艣 w臋drowa艂y z pokoju do pokoju dzi艣 s膮 przesy艂ane poprzez sieci na inne kontynenty, za艣 tradycyjn膮 form臋 tekstow膮 zast臋puje dokument, w sk艂ad kt贸rego wchodzi grafika, ruchomy obraz i d藕wi臋k. Technologia informatyczna sprawia, 偶e mo偶liwe jest generowanie i przechowywanie olbrzymich ilo艣ci informacji. U偶ytkownicy zmuszeni s膮 do zajmowania si臋 takimi ilo艣ciami danych, kt贸re jeszcze kilkana艣cie lat temu uznaliby za zupe艂nie niewyobra偶alne i聽niezarz膮dzalne. Zarz膮dzanie dokumentami ju偶 wkr贸tce przestanie by膰 tylko warto艣ciowym narz臋dziem i oszcz臋dno艣ci膮 czasu. Stanie si臋 ono absolutnie niezb臋dnym 艣rodkiem do efektywnego pos艂ugiwania si臋 elektroniczn膮 informacj膮.
Zarz膮dzanie dokumentami elektronicznymi jest „zautomatyzowan膮 kontrol膮 dokument贸w elektronicznych w trakcie ich pe艂nego cyklu 偶ycia wewn膮trz聽organizacji, pocz膮wszy od ich powstania, a偶 po ich ostateczn膮 archiwizacj臋”聽[5,聽str.3].
Wspomnie膰 nale偶y, 偶e zarz膮dzanie dokumentami nie jest jak na razie pojedyncz膮 technologi膮 lecz zbiorem wielu r贸偶nych technologii.
Technologie zarz膮dzania dokumentami wykraczaj膮 daleko poza normalne metody obchodzenia si臋 z danymi cyfrowymi. Ich walory to:聽[21,聽str.98]
Automatyczne zamykanie informacji w plikach w momencie jej tworzenia, uwalniaj膮ce u偶ytkownika od konieczno艣ci bezpo艣redniego manipulowania oraz rozumienia fizycznych system贸w przechowywania informacji;
艁atwe i szybkie odnajdywanie informacji przy u偶yciu kryteri贸w koncepcyjnych nie wi膮偶膮cych u偶ytkownik贸w z fizycznym systemem przechowywania informacji wybranym w momencie, gdy informacja by艂a tworzona.
„System Zarz膮dzania Dokumentami Elektronicznymi umo偶liwia sk艂adowanie dokument贸w w postaci elektronicznej. U艂atwia to pozyskiwanie, udost臋pnianie, 艣ledzenie, rewizje i dystrybucj臋 dokument贸w oraz informacji w nich zawartych. Kompletny System Zarz膮dzania Dokumentami Elektronicznymi dostarcza wszystkich programowych i sprz臋towych narz臋dzi pozwalaj膮cych utrzymywa膰 kontrol臋 nad wszelkimi dokumentami, zar贸wno takimi jak zeskanowane obrazy, jak i plikami, kt贸re zosta艂y utworzone przy pomocy komputera - arkusze kalkulacyjne, dokumenty tekstowe i graficzne”聽[6].
Kompletny SZDE zawiera narz臋dzia do:聽[6]
Obrazowania dokument贸w (ang. document imaging);
Optycznego rozpoznawania znak贸w (ang. optical character recognition);
Pozyskiwania dokument贸w (ang.聽document retrieval);
Sterowania obiegiem dokument贸w (ang. workflow);
Sk艂adowania informacji na dyskach optycznych.
„Fundamentalnym zadaniem systemu zarz膮dzania dokumentami elektronicznymi SZDE (ang. EDMS - Electronic Document Management System) jest lokalizowanie i ci膮g艂e udost臋pnianie potrzebnych dokument贸w w ich rodzimych aplikacjach”聽[21,聽str.98].
SZDE musi radzi膰 sobie z r贸偶nymi nieustrukturalizowanymi danymi takimi jak tekst, obraz, grafika, faksy, dokumenty z r贸偶nych aplikacji, d藕wi臋k i animacja oraz dowolnymi innymi informacjami, kt贸re mog膮 by膰 reprezentowane cyfrowo. Jest to o wiele trudniejsze ni偶 zarz膮dzanie konwencjonaln膮 baz膮 danych, w kt贸rej informacja jest ustrukturalizowana w dobrze znany i przewidywalny spos贸b.
O dokumencie mo偶emy my艣le膰 jak o „pojemniku” zawieraj膮cym r贸偶norodne typy informacji. Dokument dla SZDE jest tym czym rekord dla relacyjnej bazy danych - jest to podstawowa jednostka zarz膮dzania informacj膮. Oprogramowanie SZDE pomaga ko艅cowemu u偶ytkownikowi tworzy膰 bazy danych dokument贸w. Pozwala ono przemieszcza膰 te dokumenty przy pomocy poczty elektronicznej oraz poprzez tworzenie replik baz danych. Dostarcza r贸wnie偶 narz臋dzi do wyszukiwania, zarz膮dzania oraz poruszania si臋 w艣r贸d dokument贸w w bazie danych.
U偶ywaj膮c technologii OLE, DDE, OpenDoc lub „rodzimych” edytor贸w, SZDE pozwala ogl膮da膰 komponenty dokument贸w poprzez uruchomienie aplikacji, w聽kt贸rych zosta艂y one utworzone. Oznacza to, 偶e je艣li dokument zawiera grafik臋, animacj臋 lub d藕wi臋k, SZDE odnajdzie go i pozwoli obejrze膰.
Standardy System贸w Zarz膮dzania Dokumentami Elektronicznymi
Podobnie, jak w ka偶dym innym systemie zarz膮dzania informacj膮, istnieje du偶a liczba uzupe艂niaj膮cych si臋 lub konkuruj膮cych standard贸w opisuj膮cych architektur臋 System贸w Zarz膮dzania Dokumentami Elektronicznymi. Kilka spo艣r贸d najbardziej widocznych standard贸w oraz inicjatyw standaryzuj膮cych zosta艂o przedstawionych poni偶ej:聽[5,聽str.6]
ODMA (Open Document Management API) - jest przemys艂owym liderem w聽d膮偶eniu do wieloplatformowej i mi臋dzyaplikacyjnej komunikacji poprzez standaryzacj臋 dost臋pu klienta do SZDE poprzez publikowanie programowego interfejsu aplikacji (ang. Application Programming Interface). ODMA API pozwala aplikacjom (procesorom tekstu, arkuszom kalkulacyjnym) na komunikowanie si臋 z聽SZDE w 艂atwo adoptowalny spos贸b bez potrzeby oprogramowywania 艂膮cz pomi臋dzy aplikacj膮 i SZDE. Dzi臋ki temu ODMA umo偶liwia wielu r贸偶nym aplikacjom korzystanie z tego samego SZDE.
Do firm, kt贸re wsp贸艂pracuj膮 z ODMA, nale偶膮: Borland, Documentum, Interleaf, Novell, Oracle, PC DOCS, SoftSolutions, Sybase, WordPerfect oraz XSoft聽[5,聽str.6].
Shamrock Document Management Coalition - jest to kolejny przemys艂owy lider w dziedzinie zarz膮dzania dokumentami. Shamrock Coalition ma na celu wyspecyfikowanie programowej warstwy po艣redniej (ang. middleware), kt贸ra ma by膰 umieszczona pomi臋dzy aplikacjami i serwerem dokument贸w, oraz maj膮c膮 dostarcza膰 wsp贸lny zbi贸r narz臋dzi do administrowania, udost臋pniania i聽zabezpieczania dokument贸w. Ma to by膰 przede wszystkim „furtka” (ang.聽gateway) pomi臋dzy aplikacjami i wieloma odmiennymi sk艂adnicami dokument贸w. Podczas gdy ODMA pozwala wielu aplikacjom na dost臋p do tego samego SZDE, Shamrock umo偶liwia aplikacjom dost臋p do wielu SZDE.
Chocia偶 g艂贸wnymi partnerami w Shamrock s膮 firmy Saros i IBM, to jednak znaczna cz臋艣膰 technologii Shamrock opiera si臋 o motor SZDE (ang. DMS engine), b臋d膮cy w艂asno艣ci膮 Saros. Pozostali partnerzy tej technologii to firmy: Adobe, EDS, Frame Technology, Hewlett-Packard, Microsoft, Verity, View Star, Wang, oraz cz艂onkowie ODMA: Documentum, Interleaf, PC DOCS, Sybase i XSoft聽[5,聽str.6].
DEN (Document-Enbled Network) - jest standardem konkurencyjnym w聽stosunku do Shamrock. Powsta艂 jako porozumienie pomi臋dzy firmami Novell i聽Xerox, w celu stworzenia warstwy po艣redniej, maj膮cej umo偶liwi膰 innym producentom prostsze tworzenie aplikacji zarz膮dzania dokumentami w sieci. Obecnie tocz膮 si臋 rozmowy pomi臋dzy tw贸rcami Shamrock i DEN maj膮ce na celu po艂膮czenie tych dw贸ch standard贸w聽[5,聽str.6].
OPENDOC - architektura programowych komponent贸w, dostarczaj膮ca interfejs贸w pozwalaj膮cych niezale偶nie napisanym programom na wsp贸ln膮 prac臋 w聽ramach jednego dokumentu.
OLE (Object Linking and Embedding) - jest to nale偶膮cy do firmy Microsoft standard, pozwalaj膮cy obiektom jednej aplikacji by膰 wstawianymi w innej. Dla聽przyk艂adu, wykres w edytorze tekstu mo偶e by膰 po艂膮czony ze 藕r贸d艂owymi danymi w聽arkuszu kalkulacyjnym. Kiedy dane w arkuszu ulegn膮 zmianie, wykres w聽dokumencie zostanie automatycznie poprawiony. OLE umo偶liwia programom dzielenie zar贸wno danych jak i funkcjonalno艣ci aplikacji 藕r贸d艂owej.
OGM (Object Management Group) jest to przemys艂owe konsorcjum, dostarczaj膮ce specyfikacj臋 struktury obiektowo zorientowanego 艣rodowiska. Struktura ta nazywa si臋 OMA (Object Management Architecture). Okre艣la ona zalecany model klasyfikacji komponent贸w, interfejs贸w oraz protoko艂贸w obiektowo zorientowanego systemu.
Obecnie wi臋kszo艣膰 aplikacji wykorzystuje dedykowane formaty dokument贸w. Standardy SZDE maj膮 umo偶liwi膰 wsp贸艂prac臋 aplikacji z聽r贸偶norodnymi bazami danych dokument贸w, definiowa膰 prawa dost臋pu do dokument贸w oraz specyfikowa膰 konieczne w technologii obiektowej parametry. Przyj臋cie standardu oznacza wprowadzenie go do aplikacji z zakresu pracy grupowej, poczty elektronicznej itd.
Systemy Elektronicznego Obrazowania Dokument贸w
Wsp贸艂czesne technologie zarz膮dzania dokumentami swoimi korzeniami tkwi膮 w systemach elektronicznego obrazowania dokument贸w.
„Poprzez obrazowanie dokument贸w (ang. document imaging) rozumiemy proces, w trakcie kt贸rego dokumenty drukowane oraz filmy s膮 wprowadzane do skanera i konwertowane do postaci elektronicznej. Podczas procesu skanowania dokumenty mog膮 zosta膰 poddane operacji optycznego rozpoznawania znak贸w oraz poindeksowane w celu zapewnienia ich szybkiego pozyskania w聽przysz艂o艣ci”聽[6].
Systemy elektronicznego obrazowania s膮 to zorientowane na bazy danych, aplikacje klient/serwer (tak jak pokazano to na rysunku聽13). Klient (komputer osobisty) tworzy obrazy dokument贸w oraz nimi manipuluje, a tak偶e s艂u偶y jako ko艅c贸wka do serwera obraz贸w.
Do typowych czynno艣ci klienta nale偶y:聽[9,聽str.299]
Digitalizacja obraz贸w przy pomocy skanera. (Proces ten jest zbli偶ony do tego jaki zachodzi w maszynach faksowych; bardzo cz臋sto w艂a艣nie te maszyny s艂u偶膮 jako skanery);
Wy艣wietlenie obrazu po jego digitalizacji, sprawdzenie jako艣ci i w razie konieczno艣ci ponowne skanowanie;
W trakcie wy艣wietlania obrazu dokumentu, wprowadzanie przez operatora do formularza danych uzyskanych z tego obrazu. Jako minimum dokumentowi musi zosta膰 przypisany kod identyfikacyjny;
Kompresowanie obraz贸w (programowo lub sprz臋towo), a nast臋pnie przesy艂anie ich do serwera, na kt贸rym b臋d膮 sk艂adowane;
Klient mo偶e uzyska膰 dost臋p do dokument贸w na serwerze oraz wy艣wietli膰 je. Obrazy mog膮 by膰 wy艣wietlane, drukowane, przesy艂ane faksem lub poczt膮 elektroniczn膮.
Rysunek 13. System (Klient / Serwer) Obrazowania Elektronicznego.
殴r贸d艂o:聽[9,聽str.300]
Po stronie serwera aplikacja zarz膮dza wsp贸艂dzielon膮 baz膮 danych dokument贸w. „Serwery obraz贸w zazwyczaj przechowuj膮 informacj臋 ustrukturyzowan膮 w bazie danych SQL, za艣 same dokumenty (dane binarne) sk艂adowane s膮 w postaci plik贸w na dysku. Du偶e serwery s膮 w stanie obs艂u偶y膰 ponad 200,000 dokument贸w dziennie. Obrazy s膮 du偶e. Przeci臋tny skompresowany obraz zajmuje oko艂o 75 do 100聽KB, ale mog膮 r贸wnie偶 zdarza膰 si臋 takie kt贸re zajmuj膮 2.5聽MB jak na przyk艂ad zdj臋cia rentgenowskie lub szkice in偶ynieryjne. W聽konsekwencji aplikacje mog膮 wymaga膰 bezpo艣redniego dost臋pu do terabajt贸w danych”聽[9,聽str.300].
Serwery obraz贸w zarz膮dzaj膮 przep艂ywem dokument贸w, bezpiecze艅stwem, indeksowaniem obraz贸w (lub metainformacjami) oraz wska藕nikami do systemu plik贸w, gdzie dane binarne s膮 fizycznie sk艂adowane. Oto kilka kluczowych funkcji realizowanych przez te serwery:聽[9,聽str.301]
Zarz膮dzanie elektronicznymi sk艂adnicami plik贸w, zawieraj膮cymi foldery, a聽w聽nich dokumenty;
Automatyzacja obiegu dokumentu poprzez przemieszczanie go zgodnie z聽procesami pracy (workflow);
Tworzenie raport贸w umo偶liwiaj膮cych kierownictwu monitorowanie prac systemu;
Sterowanie r贸偶nymi mediami sk艂adowania dokument贸w.
Optyczne rozpoznawanie znak贸w
Obraz dokumentu jest dla cz艂owieka 藕r贸d艂em bardzo wielu cennych informacji o samym dokumencie. Dysponuj膮c jednak tysi膮cami takich obraz贸w, praktycznie niewykonalnym jest szybkie odszukanie potrzebnych danych. Aby m贸c odnale藕膰 odpowiedni dokument musi by膰 przechowywany nie tylko jego obraz ale r贸wnie偶 zawarta w nim tre艣膰. Dysponuj膮c tre艣ci膮 dokumentu, operacje na nim mo偶na sprowadzi膰 do dobrze poznanego przetwarzania tekst贸w. Najprostszym sposobem by艂oby przepisanie wszystkich dokument贸w w edytorze tekstu w celu ich dalszej obr贸bki, na szcz臋艣cie dzi臋ki technice zwanej optycznym rozpoznawaniem znak贸w operacja ta zostanie wykonana automatycznie.
„Optyczne rozpoznawanie znak贸w (ang. OCR - Optical Character Recognition) - odnosi si臋 do procesu w trakcie kt贸rego zeskanowane obrazy s膮 elektronicznie „czytane” i konwertowane w nadaj膮cy si臋 do edycji tekst. Konwersja ta jest wykonywana po skanowaniu, i mo偶e zwraca膰 zar贸wno pliki zawieraj膮ce wy艂膮cznie tekst (pliki ASCII) jak i tekst sformatowany (np. .PDF, .RTF). Tekst聽generowany poprzez OCR jest cz臋sto wej艣ciem dla przeszukiwanych tekstowo baz danych, pozwalaj膮cych pozyskiwa膰 藕r贸d艂owy zeskanowany obraz bazuj膮c na jego zawarto艣ci”聽[6].
Inteligentne Rozpoznawanie Znak贸w (ang. ICR - Intelligent Character Recognition) jest odmian膮 OCR, kt贸ra u偶ywa wyrafinowanych narz臋dzi leksykalnych. ICR zwykle u偶ywane jest przy konwersji r臋cznie pisanych materia艂贸w do postaci tekstu ASCII.
Oprogramowanie typu OCR rozpoznaj膮ce znaki alfanumeryczne na podstawie analizy tre艣ci pliku graficznego (zawieraj膮cego elektroniczny obraz dokumentu powsta艂y np. na skutek faksowania) jest coraz bardziej popularne w聽wielu zastosowaniach zwi膮zanych z komputerowym zarz膮dzaniem dokumentami. W艂a艣nie wykorzystanie mo偶liwo艣ci oprogramowania OCR i zamiana elektronicznego obrazu dokumentu na wiele znak贸w ASCII w pe艂ni pozwala na wykorzystanie mo偶liwo艣ci skomputeryzowania archiwum, stosowanie technik filtruj膮cych informacj臋, przeszukiwanie tre艣ci zasob贸w bazy tekstowej oraz stosowanie technik hipertekstowych itp.
Niekt贸re produkty umo偶liwiaj膮 pe艂ny odczyt nawet bardzo skomplikowanego w swoim uk艂adzie dokumentu. Rozpoznaj膮 szpalty tekstu i聽wkomponowane w tre艣膰 tabele zawarte w dokumencie. U偶ytkownik pakietu mo偶e po艂膮czy膰 rozpoznane obszary tekstu czy tabel bezpo艣rednio z aplikacjami typu edytor tekstu czy arkusz kalkulacyjny.
Niestety, warto zda膰 sobie spraw臋 z tego, 偶e oprogramowanie OCR nie jest doskona艂e. Dla bardzo wyra藕nego druku dok艂adno艣膰 odczytu mo偶e by膰 nawet lepsza od 99 procent聽[17,聽str.24], jednak nierzadko nawet kilka procent znak贸w jest przez oprogramowanie OCR rozpoznane mylnie - liczba b艂臋d贸w bardzo zale偶y od jako艣ci przetwarzanego obrazu. Wiele program贸w OCR pomaga u偶ytkownikowi przy weryfikacji otrzymanej tre艣ci - wszystkie znaki, wobec kt贸rych przy por贸wnaniu z聽„wszytym” wzorem graficznym program mia艂 jakie艣 „w膮tpliwo艣ci”, s膮 odpowiednio wyr贸偶niane. U偶ytkownik pakietu OCR por贸wnuj膮c wy艣wietlony jednocze艣nie na ekranie obraz dokumentu oraz rozpoznan膮 przez program tre艣膰 mo偶e samodzielnie poprawi膰 niew艂a艣ciwie odczytane znaki.
Tymczasem na rynku pojawi艂o si臋 kilka pakiet贸w, kt贸re poj臋cie rozpoznawania znak贸w przenosz膮 na rozpoznawanie ca艂ych s艂贸w i struktury dokument贸w. Oprogramowanie por贸wnuje ze sob膮 obrazy ca艂ych s艂贸w, bez zbytniego wdawania si臋 w szczeg贸艂y ka偶dego ze znak贸w. Algorytm interpretacji tre艣ci s艂贸w korzysta z dopasowania ich obraz贸w na 艣ci艣le okre艣lonym poziomie prawdopodobie艅stwa. Po wst臋pnej analizie obrazu nast臋puje dok艂adniejsza, kt贸ra „przypatruje” si臋 niezbyt pewnie rozpoznanym znakom alfanumerycznym w聽powi膮zaniu z otaczaj膮c膮 je tre艣ci膮 znak贸w i s艂贸w. Pozwala to na zwi臋kszenie dok艂adno艣ci rozpoznania nawet o 25 procent聽[17,聽str.24].
Podane w艂a艣ciwo艣ci program贸w OCR dotycz膮 rynku ameryka艅skiego, gdzie sprawa automatyzacji odczytu obraz贸w dokument贸w elektronicznych jest bardzo powa偶nie traktowana. Przeniesienie nowych technologii rozpoznawania dokument贸w na rynek polski mo偶e by膰 trudne z tego wzgl臋du, 偶e odchodzi si臋 od rozpoznawania pojedynczych znak贸w (co mo偶na by艂o wzgl臋dnie 艂atwo adaptowa膰 do krajowych warunk贸w) w kierunku rozpoznawania obrazu ca艂ych s艂贸w i nadzoru nad kontekstem otrzymywanej tre艣ci.
Tekstowe bazy danych
Aby lepiej zrozumie膰 czym jest zarz膮dzanie dokumentami, nale偶y najpierw pozna膰 spos贸b w jaki dokumenty s膮 przechowywania i udost臋pniane. Fundamentem聽system贸w zarz膮dzania dokumentami elektronicznymi s膮 bazy danych聽oraz motory wyszukuj膮ce wspieraj膮ce sk艂adowanie oraz pozyskiwanie dokument贸w (ang.聽search/retrieval engines).
„Baza tekstowa (ang. textbase) - najpro艣ciej m贸wi膮c jest to sam tekst. Elementy danych sk艂adowane w bazie tekstowej s膮 blokami tekstu identyfikowanymi poprzez nazw臋. Nazwa ta mo偶e by膰 tak prosta jak numer wyst膮pienia, znak czasowy na faksie, b膮d藕 te偶 mo偶e posiada膰 jakie艣 znaczenie. W聽bazie tekstowej nie ma wymogu, aby skomplikowane dokumenty posiada艂y t膮 sam膮 struktur臋”聽[10,聽str.55].
„Baza dokument贸w (ang. document base) jest to tekst, kt贸ry zosta艂 zaplanowany w formie strukturalnej. Zwykle dokumenty posiadaj膮 nag艂贸wek (ang.聽header record), kt贸ry zawiera informacje o dokumencie oraz cz臋艣膰 g艂贸wn膮 (ang.聽body). Wiele dokument贸w ma budow臋 hierarchiczn膮 wzgl臋dem tej struktury. Ksi膮偶ki s膮 艂amane na rozdzia艂y, rozdzia艂y w paragrafy, paragrafy na sentencje, za艣 ostatecznie sentencje na s艂owa. Podr臋cznik mo偶e sk艂ada膰 si臋 z sekcji, pod-sekcji i聽pod-pod-sekcji. Dokumenty takie jak podr臋czniki mog膮 zawiera膰 osadzon膮 grafik臋 i聽ilustracje”聽[10,聽str.55].
Baza dokument贸w 艂膮czy w sobie szybko艣膰 wyszukiwania tekstu oraz nieograniczon膮 d艂ugo艣膰 p贸l, b臋d膮ce cechami motor贸w przetwarzania tekstu, z聽pot臋g膮, precyzj膮, sortowaniem i raportowaniem - cechami przynale偶nymi do technologii relacyjnych baz danych聽[20,聽str.3]. Upraszczaj膮c, baza dokument贸w jest baz膮 danych zaprojektowan膮 specjalnie do zarz膮dzania informacj膮 tekstow膮, na r贸wni z innymi rodzajami danych takimi jak warto艣ci numeryczne, daty czy obrazy.
Przez wiele lat organizacje wdra偶a艂y u siebie g艂贸wnie systemy umo偶liwiaj膮ce szybki dost臋p do ustrukturalizowanych informacji sk艂adowanych w relacyjnych bazach danych. Jednak informacje takie stanowi膮 zaledwie oko艂o 10 procent wszystkich zasob贸w danych firmy聽[18,聽str.43], podczas gdy pozosta艂e 90 procent istnieje pod postaci膮 tekstu w r贸偶nych dokumentach, podr臋cznikach, raportach, listach email, stronach WWW, faksach, prezentacjach itp. Jeszcze do niedawna wszystkie te tekstowe dane nie by艂y dost臋pne w tak samo 艂atwy i efektywny spos贸b, jak ma to miejsce w przypadku danych ustrukturalizowanych.
Dotychczas organizacje, kt贸re potrzebowa艂y dost臋pu do obu tych typ贸w danych, stosowa艂y relacyjne bazy danych oparte o SQL do przechowywania danych ustrukturalizowanych, podczas gdy tekst sk艂adowany by艂 w p艂askich plikach (ang.聽flat file) w systemie i dost臋pny poprzez dedykowane motory wyszukiwania i聽pozyskiwania (rysunek聽14). Niestety, w motorach tych zazwyczaj brakowa艂o kluczowych funkcji zarz膮dzania danymi, takich jak zapewnianie bezpiecze艅stwa i聽integralno艣ci transakcji, powszechnie wyst臋puj膮cych w systemach zarz膮dzania relacyjnymi bazami danych. Kolejnym problemem zwi膮zanym z tym rozwi膮zaniem jest to, 偶e tekst sk艂adowany w relacyjnej bazie danych nie mo偶e by膰 bezpo艣rednio przeszukiwany przy u偶yciu j臋zyka zapyta艅 SQL. Takie podw贸jne rozwi膮zanie jest drogie i zazwyczaj wymaga dodatkowej warstwy po艣redniej, koordynuj膮cej zmian臋 danych oraz zapytania pomi臋dzy motorem wyszukuj膮cym tekst i systemem zarz膮dzania baz膮 danych.
Rysunek 14. Osobne sk艂adowanie danych tekstowych i ustrukturalizowanych.
殴r贸d艂o:聽[18,聽str.43]
Starsze SZDE operuj膮ce na relacyjnych bazach danych powoli zast臋powane s膮 poprzez systemy korzystaj膮ce z baz danych zorientowanych obiektowo. Aczkolwiek ju偶 obecnie wi臋kszo艣膰 dostawc贸w SZDE wykorzystuje w nich systemy zarz膮dzania bazami danych b臋d膮cych po艂膮czeniem technologii relacyjnej i聽obiektowej okre艣lane mianem uniwersalnych serwer贸w baz danych聽[5,聽str.4]
Technologia ta traktuje tekst jako rodzimy typ danych w relacyjnej bazie danych. Eliminuje to potrzeb臋 stosowania kosztownych podw贸jnych rozwi膮za艅, czyni膮c jedn膮 bezpieczn膮 i skalowaln膮, relacyjn膮 baz臋 danych miejscem sk艂adowania zar贸wno ustrukturalizowanych jak i tekstowych danych. Ponadto dostarcza ujednoliconego interfejsu, dzi臋ki kt贸remu tekstowa informacja mo偶e by膰 szybko wyszukana i dostarczona poprzez zapytania SQL, cz臋sto w kombinacji z聽powi膮zanymi ustrukturalizowanymi danymi (rysunek 15).
Rysunek 15. Zastosowanie uniwersalnych serwer贸w baz danych do sk艂adowania tekstu.
殴r贸d艂o:聽[18,聽str.43]
Zapytanie SQL operuj膮ce na danych tekstowych mo偶e wygl膮da膰 nast臋puj膮co:聽[18,聽str.44]
SELECT SCORE (0), title
FROM docs_table
WHERE organization = 'Support'
AND CONTAINS (docs_table.text, 'WebServer', 0) > 0
ORDER BY SCORE (0);
Zapytanie to zwraca tytu艂y wszystkich dokument贸w zawieraj膮cych przynajmniej jeden raz s艂owo `WebServer' oraz posiadaj膮ce w strukturalnym polu (organization) warto艣膰 `Support'. Wyniki zapytania prezentowane s膮 w porz膮dku zgodnym z ilo艣ci膮 wyst膮pie艅 s艂owa `WebServer'.
Wyszukiwanie dokument贸w
Oprogramowanie do wyszukiwania tekstu (ang. text retrieval software) pozwala na pozyskiwanie dokument贸w z bazy danych poprzez wprowadzenie s艂贸w kluczowych w tekstowe pola poszukiwa艅. Dokumenty zawieraj膮ce wprowadzony tekst s膮 „wyci膮gane” z bazy danych i prezentowane w li艣cie uporz膮dkowanej wed艂ug trafno艣ci poszukiwanych s艂贸w.
„Wyszukiwanie dokument贸w (ang. document retrieval) - jest to proces, podczas kt贸rego mo偶na wyszukiwa膰 oraz pozyskiwa膰 zarchiwizowane dokumenty z聽bazy danych. Wykonywane jest to poprzez wprowadzanie informacji do formularza zapyta艅 do bazy danych”聽[6].
Formularz zapyta艅 do bazy danych (ang. database query screen) jest to wygenerowany przez komputer formularz, kt贸ry pozwala na poszukiwanie informacji zawartej w bazie danych (rysunek聽16). Poprzez wprowadzenie informacji w聽zdefiniowane pola tekstowe, poleca si臋 komputerowi poszukiwanie w聽bazie danych dokument贸w, kt贸re zawieraj膮 t臋 informacj臋. Niekt贸re systemy zarz膮dzania dokumentami pozwalaj膮 na dostosowywanie formularza zapyta艅, tak aby przyjmowa艂 on informacje odpowiednie dla bazy danych, kt贸ra ma by膰 przeszukiwan膮.
Rysunek 16. Przyk艂ad formularza zapyta艅 do bazy danych - wyszukiwanie dokument贸w.
殴r贸d艂o: Opracowanie w艂asne
„Wyszukana informacja (ang. retrieval information) jest to informacja niezb臋dna dla ko艅cowego u偶ytkownika do pozyskania dokumentu po tym jak dokument ten zosta艂 ju偶 odnaleziony przez system (ANSI/AIIM TR40-1995). Informacja taka mo偶e przyjmowa膰 posta膰 nazw p贸l, p贸l danych lub ich kombinacji”聽[6].
Istniej膮 dwa podstawowe typy wyszukiwania informacji w dokumencie: przeszukiwanie nag艂贸wk贸w oraz przeszukiwanie cz臋艣ci g艂贸wnej dokument贸w. Wi臋kszo艣膰 wst臋pnego wyszukiwania informacji jest wykonywana na nag艂贸wkach, dlatego bardzo wa偶ne jest, aby posiada艂y one ten sam format. Wyszukiwanie wewn膮trz cz臋艣ci g艂贸wnej dokumentu polega g艂贸wnie na dopasowaniu do szukanego tekstu (np.聽s艂owa lub wyra偶enia).
Nag艂贸wek jest rekordem posiadaj膮cym pola, kt贸re dotycz膮 ca艂ego dokumentu. Mo偶e by膰 on przeszukiwany tak jak relacyjna baza danych, co jest znacznie szybsze od szukania tekstu. Informacja w nag艂贸wku mo偶e zawiera膰 prawie wszystko, lecz najbardziej powszechne jest umieszczanie tam: tytu艂u, autora (autor贸w), daty publikacji, kodu klasyfikacji oraz streszczenia lub listy s艂贸w kluczowych.
Zanim tekst zostanie poddany przeszukiwaniu, zwykle zostaje on poddany procesowi indeksowania. Indeksowanie polega na analizie i identyfikacji r贸偶nych fragment贸w informacji zawartej w dokumencie, a nast臋pnie umieszczeniu tej informacji w bazie danych聽[6]. Stosowanie indeks贸w w znacznym stopniu przy艣piesza wyszukiwanie dokument贸w elektronicznych w bazie danych.
„Indeks jest to plik zawieraj膮cy lokalizacj臋 wszystkich znacz膮cych s艂贸w wewn膮trz dokumentu”聽[10,聽str.57]. Korzystaj膮c z indeksu oraz specjalnych tekstowych j臋zyk贸w zapyta艅 (ang.聽text query languages) jeste艣my w stanie szybko i聽sprawnie wyszukiwa膰 potrzebne nam informacje.
Najtrudniejszym krokiem w procesie indeksowania jest odr贸偶nienie s艂贸w znacz膮cych (ang. significant words) od tak zwanych „szum贸w” (ang. noise words). Za聽„szumy” w j臋zyku polskim mo偶emy uzna膰 takie s艂owa jak „i”, „on”, „lub”, poniewa偶 wyst臋puj膮 one praktycznie wewn膮trz ka偶dego tekstu, i nikt nie by艂by sk艂onny do wyszukiwania informacji za ich pomoc膮.
Przep艂yw zada艅 i dokument贸w - Workflow
Aplikacje zarz膮dzaj膮ce obiegiem z艂o偶onych dokument贸w powoli staj膮 si臋 dominuj膮cym oprogramowaniem w przedsi臋biorstwach. Zapewniaj膮 nie tylko dost臋p do dokument贸w ale tak偶e ich archiwizacj臋 oraz 艣ledzenie obiegu i聽wykorzystania.
Workflow jest g艂贸wnym elementem systemu zarz膮dzania dokumentami. Pozwala on organizacjom sprawowa膰 kontrol臋 oraz zwi臋kszy膰 efektywno艣膰 „przep艂ywu” dokument贸w zgodnie z procesami pracy. Workflow zazwyczaj implementowany jest jako osobny pakiet oprogramowania, istnieje jednak trend w艂膮czania go do du偶ych zintegrowanych system贸w zarz膮dzania dokumentami.
Workflow zdefiniowany jest jako „koordynator zada艅, danych i ludzi maj膮cy na celu uczynienie proces贸w pracy efektywniejszymi i lepiej dostosowuj膮cymi si臋 do zmian”聽[5,聽str.4]. Sprawuje on kontrol臋 nad informacj膮 we wszystkich fazach tych proces贸w. „艢cie偶ka” konkretnego dokumentu zdeterminowana jest typem dokumentu, procesami zarz膮dzaj膮cymi dokumentem oraz regu艂ami organizacyjnymi (rysunek聽17).
Workflow wspiera takie zadania jak:聽[5,聽str.4]
okre艣lanie autora (ang.聽authoring);
rewizje (ang.聽revising);
przemieszczanie (ang.聽routing);
komentowanie (ang.聽commentary);
zatwierdzanie (ang.聽approval);
warunkowe rozdzielanie (ang.聽conditional branching);
ustanawianie ostatecznych termin贸w oraz kluczowych punkt贸w w dzia艂aniu (ang.聽establishment of deadlines and milestones).
Rysunek 17. Przyk艂ad „艣cie偶ki” dokumentu w systemie workflow.
殴r贸d艂o:聽[9,聽str.302]
Narz臋dzia workflow pozwalaj膮 zmieni膰 rytm pracy przedsi臋biorstwa i je艣li s膮 stosowane w艂a艣ciwie, zwi臋kszy膰 wydajno艣膰 i konkurencyjno艣膰 firmy. Dotyczy to tych firm, kt贸rych procesy produkcyjne s膮 nieod艂膮cznie zwi膮zane z eksploracj膮 system贸w informatycznych, opartych na sieciach komputerowych. Narz臋dzia takie usprawniaj膮 drog臋 zada艅 i dokument贸w, pozwalaj膮c poszczeg贸lnym pracownikom 艣ledzi膰 obieg tych zasob贸w i wymienia膰 na ten temat informacje.
Narz臋dzia workflow przesz艂y w ostatnim czasie du偶膮 ewolucj臋. Nie s膮 to ju偶 艣ci艣le specjalizowane programy adresowane do okre艣lonej grupy u偶ytkownik贸w, ale narz臋dzia uniwersalne, kt贸re mog膮 zarz膮dza膰 przep艂ywem wszystkich zada艅 i聽dokument贸w (finansowych, biznesowych, dokument贸w tekstowych i graficznych itp.). Narz臋dzia takie radz膮 sobie z plikami dowolnego formatu. Mog膮 wi臋c to by膰 zwyk艂e pliki tekstowe ASCII, rysunki tworzone przez aplikacje CAD, arkusze kalkulacyjne, elektroniczne formularze czy pliki graficzne tworzone przy u偶yciu聽skanera.
Granica mi臋dzy r贸偶nymi aplikacjami u偶ytkowymi (workflow, zarz膮dzanie dokumentami czy systemy zarz膮dzania bazami danych) systematycznie si臋 zaciera. Wiele produkt贸w workflow ma obecnie dost臋p do plik贸w rezyduj膮cych w pami臋ci serwer贸w i stacji roboczych pracuj膮cych w sieci, a tak偶e mo偶e si臋 komunikowa膰 z聽systemami zarz膮dzania dokumentami i bazami danych. Pliki towarzysz膮ce pewnym zadaniom mog膮 by膰 przesy艂ane osobom zainteresowanym w formie do艂膮czonych folder贸w. Pliki takie mog膮 reprezentowa膰 dokumenty, kt贸re nale偶y uaktualni膰 czy przetworzy膰. Poszczeg贸lne wersje jednego dokumentu s膮 wtedy ca艂y czas 艣ledzone przez system zarz膮dzania dokumentami. Po uko艅czeniu prac nad takim dokumentem mo偶e on by膰 zapisany do bazy danych wsp贸艂dzielonej przez wszystkich pracownik贸w przedsi臋biorstwa.
Narz臋dzia typu workflow mo偶na podzieli膰 na dwie grupy: produkcyjne i聽podr臋czne (typu ad聽hoc)聽[7,聽str.46].
Te pierwsze pozwalaj膮 automatyzowa膰 kompleksowe procesy biznesowe, kt贸re w przedsi臋biorstwie nie podlegaj膮 du偶ym zmianom. S膮 to narz臋dzia obs艂uguj膮ce takie procesy jak: zak艂adanie i zawiadywanie repozytoriami zawieraj膮cymi dokumenty wsp贸艂dzielone przez ca艂e grupy pracownik贸w oraz 艣ledzenie w czasie rzeczywistym obiegu zada艅 i dokument贸w.
Narz臋dzia workflow typu podr臋cznego (ad聽hoc) wspieraj膮 dla odmiany niewielkie procesy przep艂ywu dokument贸w i zada艅. Cech膮 tych narz臋dzi jest to, 偶e mo偶na je szybko przeprofilowa膰 i przystosowa膰 do zawiadywania przep艂ywem dokument贸w w okre艣lonym 艣rodowisku pracy. Obs艂uguj膮 one z regu艂y okre艣lone rodzaje dokument贸w czy zada艅. Pakiety typu ad聽hoc pozwalaj膮 u偶ytkownikom przesy艂a膰 formularze elektroniczne przy u偶yciu poczty e-mail, do艂膮czaj膮c je do w艂a艣ciwych plik贸w pocztowych.
Narz臋dzia budowania system贸w workflow pozwalaj膮 definiowa膰: 聽[7,聽str.47]
zasady obiegu dokument贸w;
u偶ytkownik贸w korzystaj膮cych z us艂ug systemu;
przywileje u偶ytkownik贸w;
艣cie偶ki i regu艂y dzia艂alno艣ci biznesowej towarzysz膮cej poszczeg贸lnym rodzajom dokument贸w i elektronicznych folder贸w.
Jedn膮 z cech odr贸偶niaj膮cych systemy workflow typu produkcyjnego od system贸w typu ad聽hoc jest to, 偶e te pierwsze oferuj膮 narz臋dzia graficzne, a聽konkretnie programy pozwalaj膮ce tworzy膰 „sieci przep艂ywu dokument贸w” i聽pokazywa膰 wykresy i rysunki odzwierciedlaj膮ce „trasy obiegu dokument贸w”.
„Graficzne narz臋dzia tworzenia schemat贸w workflow (ang. Graphical Route Developer Tools) - pozwalaj膮 na 艂atwe tworzenie i modyfikacj臋 dr贸g obiegu dokument贸w w organizacji poprzez rysowanie tych dr贸g na ekranie monitora. Najcz臋艣ciej b臋d膮 one tworzy艂y obrazy przy pomocy przystosowanych do tego program贸w graficznych (rysunek聽18). W efekcie u偶ytkownicy tworz膮 map臋 przedstawiaj膮c膮, w jaki spos贸b chc膮, aby dokumenty „p艂yn臋艂y” poprzez ich organizacj臋”聽[6].
Rysunek 18. Przyk艂ad graficznego narz臋dzia tworzenia schematu workflow.
殴r贸d艂o: Ekran demonstracyjny programu „Workflow Factory”
Ka偶de przedsi臋biorstwo, kt贸re powa偶nie traktuje usprawnienie proces贸w produkcyjnych, powinno zainteresowa膰 si臋 narz臋dziami workflow i pr贸bowa膰 wdro偶y膰 jedno z nich u siebie. Dost臋pna jest ju偶 ca艂a gama produkt贸w: od prostych narz臋dzi typu ad聽hoc (podr臋czne), opartych na wykorzystywanym ju偶 w聽przedsi臋biorstwie systemie pocztowym, do rozbudowanych pakiet贸w workflow typu produkcyjnego, kt贸re wspieraj膮 skomplikowane procesy technologiczne.
Samo narz臋dzie nie jest w stanie dokona膰 cud贸w, b臋dzie ono pracowa膰 tak dobrze, jak dobrze zostanie zaprojektowany ca艂y system obiegu zada艅 i聽dokument贸w w przedsi臋biorstwie. Mo偶na przecie偶 zautomatyzowa膰 b艂臋dnie zaprojektowany cykl produkcji, ale prawid艂owo zaprojektowany system zarz膮dzania obiegiem zada艅 i dokument贸w potrafi w du偶ym stopniu usprawni膰 prac臋 ka偶dego przedsi臋biorstwa.
Zastosowanie optycznych technologii do sk艂adowania dokument贸w elektronicznych
Coraz cz臋艣ciej stosowan膮 metod膮 dostarczania oraz przechowywania dokument贸w elektronicznych staj膮 si臋 dyski optyczne. Jest to zwi膮zane z tym, 偶e technologie optycznego sk艂adowania dokument贸w posiadaj膮 szereg zalet w聽por贸wnaniu z tradycyjnymi magnetycznymi technologiami takimi jak ta艣my magnetyczne, dyskietki i twarde dyski. G艂贸wne zalety optycznych no艣nik贸w informacji to:聽[13]
bardzo du偶a g臋sto艣膰 zapisu;
ma艂a wra偶liwo艣膰 na pole magnetyczne;
wysoka odporno艣膰 na fizyczne uszkodzenia w urz膮dzeniach odczytuj膮cych i聽zapisuj膮cych;
proste 艂adowanie i wyjmowanie.
Najwa偶niejsz膮 z tych zalet jest du偶a g臋sto艣膰 zapisu; na dysku optycznym mo偶na przechowywa膰 znacznie wi臋cej informacji ni偶 na dysku magnetycznym o聽por贸wnywalnej wielko艣ci. Dzieje si臋 tak g艂贸wnie z dw贸ch powod贸w. Po pierwsze 艣cie偶ki zapisu (ang.聽tracks) na dyskach optycznych s膮 po艂o偶one bli偶ej siebie, gdy偶 laser mo偶e by膰 pozycjonowany precyzyjniej ni偶 g艂owica magnetyczna. Po drugie fizyczna przestrze艅 wymagana do optycznego zapisu bitu informacji jest znacznie mniejsza ni偶 wymagana przy zapisie magnetycznym. Dzi臋ki wy偶ej wspomnianym zaletom, no艣niki optyczne sta艂y si臋 masowym medium do sk艂adowania dokument贸w elektronicznych.
Wyr贸偶nia si臋 trzy rodzaje optycznych no艣nik贸w informacji:聽[13]
CD-ROM;
WORM;
Dyski magneto-optyczne.
„CD-ROM (ang. Compact Disc-Read Only Memory) - jest to dysk s艂u偶膮cy do przechowywania du偶ej liczby danych elektronicznych. CD-ROM mo偶e maksymalnie przechowywa膰 do 680 MB danych komputerowych. No艣nik ten jest bardzo tani i trwa艂y, w razie konieczno艣ci mo偶e on by膰 niedrogo powielony w聽tysi膮cach kopii. W odr贸偶nieniu od dysku optycznego, kt贸ry mo偶e by膰 zapisywany wiele razy, CD-ROM s艂u偶y wy艂膮cznie do odczytu”聽[6].
WORM (ang.聽Write Once, Read Many Times) - jak sugeruje angielska nazwa, jest to czyste optyczne medium, kt贸re mo偶e zosta膰 zapisane jednokrotnie, za艣 odczytywane wiele razy, tak jak normalny CD-ROM. Dzi臋ki WORM dyski optyczne mo偶na produkowa膰 we w艂asnym zakresie, bez potrzeby korzystania z聽drogich us艂ug innych firm. WORM jest idealnym no艣nikiem do sk艂adowania du偶ych ilo艣ci w艂asnych, rzadko zmieniaj膮cych si臋 danych.
„Dysk magneto-optyczny (ang.聽Magneto-Optical Disc) - jest to dysk (o聽艣rednicy 5陆, 12 lub 14 cali) pokryty warstw膮 zapisywalnego stopu, mog膮cy przechowywa膰 du偶膮 ilo艣膰 dokument贸w elektronicznych. Informacja binarna jest zapisywana na dysk oraz odczytywana z聽dysku w spos贸b optyczny (zwykle przy pomocy lasera)”聽[6].
Prezentacja potrzeb oraz wymaga艅 stawianych systemom zarz膮dzania dokumentami elektronicznymi na przyk艂adzie studium przedsi臋wzi臋cia „Systemu biurowego administracji rz膮dowej”
Wolny rynek oznacza dla organizacji gospodarczych ci膮g艂膮 konkurencj臋. Wymusza ona na tych organizacjach ci膮g艂e podnoszenie efektywno艣ci ich funkcjonowania. D膮偶膮c do tego organizacje zmuszone s膮 do rekonstrukcji swoich proces贸w gospodarczych z wykorzystaniem nowych technologii informatycznych. Staj膮 one przed wyzwaniem komputeryzacji coraz to nowych dziedzin swojej dzia艂alno艣ci.
W mniejszym stopniu rynek oddzia艂uje na administracj臋 pa艅stwow膮. Zasadniczy wp艂yw na jej reorganizacj臋 maj膮 spe艂niane przez ni膮 funkcje w聽pa艅stwie, przepisy prawne oraz konieczno艣膰 dostosowywania si臋 do struktur ponadpa艅stwowych. Realizacja zada艅 stoj膮cych przed administracj膮 pa艅stwow膮 w聽coraz wi臋kszym stopniu uzale偶niona jest technologii informatycznej.
Zar贸wno w organizacjach gospodarczych jak i w administracji pa艅stwowej funkcjonuje wiele wyspecjalizowanych system贸w informatycznych, realizuj膮cych cz膮stkowe zadania. Ze wzgl臋du na specyfik臋 danych i proces贸w, wiele z dziedzin dzia艂alno艣ci tych organizacji nie zosta艂o jak dotychczas skomputeryzowanych. Potrzeba integracji istniej膮cych system贸w oraz komputeryzacji kolejnych obszar贸w, „popycha” te organizacje w kierunku system贸w zarz膮dzania dokumentami elektronicznymi.
Przyk艂adem prezentuj膮cym spos贸b wyra偶ania potrzeb w zakresie zarz膮dzania dokumentami elektronicznymi jest specyfikacja projektu pod nazw膮 „System biurowy administracji rz膮dowej” realizowanego przez Departament 艁膮czno艣ci i聽Informatyki MSWiA. Przedmiotem przedsi臋wzi臋cia opisanego w tym rozdziale jest system biurowy dla potrzeb Ministerstwa Spraw Wewn臋trznych i聽Administracji, tzn. system zarz膮dzaj膮cy przep艂ywem dokument贸w i spraw jawnych.
Cel przedsi臋wzi臋cia
Celem przedsi臋wzi臋cia projektowego jest zbudowanie systemu informatycznego wspieraj膮cego zarz膮dzanie dokumentami i sprawami w聽Ministerstwie Spraw Wewn臋trznych i Administracji z zamiarem:
Usprawnienia i uporz膮dkowania obiegu dokument贸w i spraw;
Zebrania do艣wiadcze艅 przeznaczonych do formu艂owania zalece艅 dla urz臋d贸w administracji rz膮dowej do budowy system贸w tej klasy.
Osi膮gni臋cie wy偶ej wymienionego celu strategicznego powinno nast膮pi膰 poprzez realizacj臋 nast臋puj膮cych cel贸w taktycznych:
Usprawnienie opracowywania, przep艂ywu i wyszukiwania dokument贸w dotycz膮cych za艂atwianych spraw oraz stworzenie nowych mo偶liwo艣ci archiwowania;
Umo偶liwienie 艣ledzenia procesu obiegu dokument贸w i zwi膮zanego z nim stanu spraw;
Dostarczenie wy偶szej jako艣ci us艂ug biurowych w zakresie wymiany informacji poprzez:
Przekazywanie udokumentowanych wiadomo艣ci roboczych drog膮 elektroniczn膮 bez konieczno艣ci obecno艣ci (w odniesieniu do rozm贸w telefonicznych) odbiorcy w chwili jej nadania - do „skrzynki pocztowej” odbiorcy;
Upowszechnienie dost臋pu do telefaksu - umo偶liwienie przy艂膮czania kolejnych abonent贸w bez znacznego zwi臋kszania koszt贸w;
Usprawnienie organizacji pracy grupowej kierownictwu kom贸rek organizacyjnych i pracownik贸w merytorycznych;
Stworzenie mo偶liwo艣ci szybkiego wyszukiwania informacji bazowych, np. tekst贸w akt贸w prawnych, danych adresowych i telefonicznych, rozk艂ad贸w jazdy itp., potrzebnych w za艂atwianiu spraw;
Stworzenie mo偶liwo艣ci organizowania przechowywania i szybkiego wyszukiwania osobistych informacji na indywidualnym stanowisku pracy;
Opracowanie wniosk贸w z do艣wiadcze艅 zebranych podczas eksploatacji u偶ytkowej systemu i sformu艂owanie zalece艅 dla urz臋d贸w administracji rz膮dowej.
Oczekiwane efekty
Wdro偶enie systemu informatycznego realizuj膮cego wszystkie zak艂adane cele powinno przynie艣膰 nast臋puj膮ce efekty u偶ytkowe wymierne i niewymierne:
Efekty wymierne:
Skr贸cenie czasu rozstrzygania spraw;
Zmniejszenie ryzyka zdekompletowania dokumentacji sprawy;
Skr贸cenie czasu reakcji urz臋du na interwencj臋 petenta.
Efekty niewymierne:
Zbli偶enie techniki i organizacji pracy biurowej do standard贸w obowi膮zuj膮cych w krajach Unii Europejskiej;
Poprawa jako艣ci rozstrzyganych spraw;
Poprawa opinii petenta o urz臋dzie;
Uporz膮dkowanie i ujednolicenie obiegu dokument贸w;
Zwi臋kszenie rangi zawodu urz臋dnika;
Wzrost autorytetu urz臋du jako instytucji pa艅stwowej.
Analiza uwarunkowa艅 i zagro偶e艅
Podczas realizacji przedsi臋wzi臋cia budowy biurowego systemu informatycznego MSWiA nale偶y uwzgl臋dni膰 nast臋puj膮ce uwarunkowania i聽zagro偶enia uporz膮dkowane wzgl臋dem obszaru systemu i wp艂ywu na powodzenie przedsi臋wzi臋cia:
Wewn臋trzne zalety:
U艣wiadomiona potrzeba istnienia systemu biurowego w艣r贸d wielu pracownik贸w, a przede wszystkim sprzyjaj膮ca opinia kierownictwa Ministerstwa;
Okres nowelizacji instrukcji normuj膮cych procedury zarz膮dzania dokumentami podczas rozstrzygania spraw oraz przekazywania do cel贸w archiwalnych;
Powszechne zastosowanie sprz臋tu komputerowego w sekretariatach kom贸rek organizacyjnych ministerstwa, cho膰 tylko do realizacji prostych funkcji biurowych (edytowanie tekst贸w).
Wewn臋trzne s艂abo艣ci:
Brak do艣wiadcze艅 du偶ej liczby pracownik贸w ministerstwa w pos艂ugiwaniu si臋 informatycznymi narz臋dziami pracy biurowej w og贸le i ca艂kowity brak do艣wiadcze艅 z u偶ytkowania system贸w takiej samej klasy jaka jest przedmiotem niniejszego przedsi臋wzi臋cia;
Konieczno艣膰 zmiany przyzwyczaje艅 w dziedzinie technologii wykonywania tych samych czynno艣ci jakie s膮 realizowane aktualnie metodami tradycyjnymi;
Niejednolito艣膰 praktycznie realizowanych procedur kancelaryjnych w聽kom贸rkach organizacyjnych ministerstwa;
Przewidywane zagro偶enia „interes贸w” niekt贸rych grup zawodowych poprzez przewidywan膮 utrat臋 „wolno艣ci”;
Zbyt ma艂e zatrudnienie specjalist贸w w dziedzinie informatyki w kom贸rkach organizacyjnych ministerstwa maj膮cych bezpo艣redni i natychmiastowy kontakt z u偶ytkownikami;
Ma艂e prawdopodobie艅stwo zatrudnienia np. administrator贸w systemu, ze wzgl臋du na stosunkowo niski poziom p艂ac;
Brak odpowiednich do potrzeb funduszy na rozw贸j informatyki w MSWiA w jego bud偶ecie.
Zewn臋trzne szanse:
Bogata oferta rynkowa narz臋dzi i 艣rodowisk do budowy system贸w wspomagaj膮cych przep艂yw dokument贸w i obs艂ug臋 spraw;
Mo偶liwo艣膰 skorzystania z do艣wiadcze艅 innych urz臋d贸w administracji rz膮dowej posiadaj膮cych systemy takiej samej klasy jaka jest przedmiotem niniejszego przedsi臋wzi臋cia.
Zewn臋trzne zagro偶enia:
D艂ugotrwa艂e zwi膮zanie si臋 z partnerem handlowym w okresie projektowania, wdra偶ania a p贸藕niej w okresie utrzymania i rozwoju systemu;
Mo偶liwo艣膰 uzale偶nienia si臋 od dostawcy na d艂u偶szy czas;
Brak rozwi膮za艅 formalnoprawnych dotycz膮cych dokumentu elektronicznego.
Opis stanu aktualnego
G艂贸wn膮 funkcj膮 systemu biurowego b臋d膮cego przedmiotem opracowania jest zarz膮dzanie przep艂ywem dokument贸w pomi臋dzy elementami organizacyjnymi MSWiA.
Procedury realizowane w obszarze systemu przedstawione zosta艂y w聽tabeli聽10, za艣 charakterystyka g艂贸wnych zasob贸w danych przedstawiona zosta艂a w聽tabeli聽11.
G艂贸wnym strumieniem danych wej艣ciowych systemu biurowego s膮 dokumenty wchodz膮ce. Dokumenty pochodz膮 od nast臋puj膮cych 藕r贸de艂 zewn臋trznych i wewn臋trznych:
Obywateli;
Instytucji zewn臋trznych;
Kancelarii departament贸w i biur;
Sekretariat贸w departament贸w i biur;
Sekretariat贸w wydzia艂贸w.
Odbiorcami dokument贸w wychodz膮cych ze 藕r贸de艂 zewn臋trznych i聽wewn臋trznych s膮:
Kancelaria Biura Dyrektora Generalnego jako g艂贸wny odbiorca dokument贸w;
Kancelarie innych departament贸w i biur;
Sekretariaty wydzia艂贸w;
Tabela 10
Realizowane procedury - stan aktualny.
Lp. |
Nazwa procedury |
Wykonawcy |
Stan wspomagania komputerowego |
Cechy procedury |
Obs艂uga wyprowadzania dokumentu zewn臋trznego |
Kancelarie departament贸w i biur Sekretariaty wydzia艂贸w |
R臋cznie Komputerowo |
Stabilno艣膰 |
|
Obs艂uga wysy艂ania dokumentu wewn臋trznego |
Sekretariaty wydzia艂贸w Kancelarie departament贸w i biur |
R臋cznie |
Stabilno艣膰 |
|
Obs艂uga obiegu dokument贸w |
Wszystkie kom贸rki organizacyjne |
R臋cznie |
Stabilno艣膰 |
|
Zarz膮dzanie sprawami |
Wszystkie kom贸rki organizacyjne |
R臋cznie |
Stabilno艣膰 |
|
Zarz膮dzanie zasobem archiwalnym |
Centralne Archiwum |
R臋cznie Komputerowo |
Stabilno艣膰 |
|
Dekretacja pisma |
Kadra kierownicza MSWiA |
R臋cznie |
Stabilno艣膰 |
|
Akceptacja pisma |
Kadra kierownicza MSWiA |
R臋cznie |
Stabilno艣膰 |
殴r贸d艂o:聽[22,聽str.29]
Dokumenty wychodz膮ce maj膮 posta膰 g艂贸wnie wydruk贸w komputerowych (z聽edytor贸w tekstu), maszynopis贸w oraz r臋kopis贸w. Dostarczane s膮 poczt膮,
faksem, poprzez go艅ca, osobi艣cie lub na komputerowym no艣niku informacji. Wykorzystanie dokument贸w w systemie biurowym jest w przewa偶aj膮cej wi臋kszo艣ci r臋czne, w ma艂ym stopniu komputerowe. Ocenia si臋, 偶e do MSWiA wp艂ywa dziennie oko艂o 1000 dokument贸w.
Ministerstwo Spraw Wewn臋trznych i Administracji nie posiada biurowego systemu informatycznego. Eksploatowane s膮 natomiast specjalistyczne systemy dziedzinowe usprawniaj膮ce realizacj臋 rozstrzyganych spraw. Ponadto, w du偶ym stopniu wykorzystywane s膮 narz臋dzia komputerowego wspomagania realizacji zada艅 w dziedzinie prac biurowych do wykonywania elementarnych czynno艣ci.
Tabela 11
Charakterystyka g艂贸wnych zasob贸w danych - stan aktualny.
Lp. |
Nazwa zasobu |
Spos贸b utrzymania |
Zbiory dokument贸w |
R臋cznie |
|
Dzienniki korespondencyjne i podawcze, indeksy, skorowidze, wykazy itd. |
R臋cznie Komputerowo (KORES) |
|
Ewidencja zada艅 podj臋tych przez kierownictwo MSWiA |
Komputerowo (MS-Access) |
|
Ewidencja spraw zwi膮zanych ze wsp贸艂prac膮 z聽Sejmem聽RP |
Komputerowo (MS-Access) |
|
Ewidencja spraw zwi膮zanych ze wsp贸艂prac膮 z聽Senatem聽RP |
Komputerowo (MS-Access) |
|
Ewidencja spraw zwi膮zanych ze wsp贸艂prac膮 z Trybuna艂em Konstytucyjnym |
Komputerowo (MS-Access) |
|
Ewidencja spraw zwi膮zanych ze wsp贸艂prac膮 z Rzecznikiem Praw Obywatelskich |
Komputerowo (MS-Access) |
|
Ewidencja akt贸w prawnych w procesie legislacji |
Komputerowo (MS-Word) |
|
Kalendarz posiedze艅 Komisji Sejmowych i Senackich |
Komputerowo (MS-Word) |
|
Zas贸b archiwalny |
R臋cznie Komputerowo (Canofile) |
|
Ewidencja zasobu archiwalnego |
R臋cznie Komputerowo (Isis) |
殴r贸d艂o:聽[22,聽str.32]
Komputerowe wspomaganie wykonywania czynno艣ci biurowych sprowadza聽si臋 do:
Opracowywania dokument贸w z wykorzystaniem edytor贸w tekstu i arkuszy kalkulacyjnych (g艂贸wne zastosowanie 艣rodk贸w informatyki);
Archiwowania element贸w zasobu archiwalnego i wyszukiwanie informacji z聽tej cz臋艣ci (system Canofile i baza danych Isis w Centralnym Archiwum MSWiA);
Wymiany wiadomo艣ci poczt膮 elektroniczn膮 (Podsekretarz Stanu oraz kierownictwo Departamentu 艁膮czno艣ci i Informatyki i Departamentu PESEL);
Nadawania i odbioru faks贸w z wykorzystaniem komputera;
Korzystania z tekst贸w akt贸w prawnych (system LEX);
Prowadzenia podr臋cznych baz informacji o sprawach (w Biurze Dyrektora Generalnego).
Poza nielicznymi zastosowaniami 艣rodk贸w informatyki do cel贸w biurowych i聽pomijaj膮c specjalistyczne systemy informatyczne, zarz膮dzanie obiegiem dokument贸w w MSWiA wykonywane jest r臋cznie a obowi膮zuj膮ce w tym zakresie unormowania formalnoprawne s膮 nienowoczesne i nie wspieraj膮 tego procesu. Oznacza to, 偶e:
Kierownictwo nie ma mo偶liwo艣ci skutecznego kontrolowania jako艣ci i聽terminowo艣ci wykonania zada艅 przez podleg艂ych pracownik贸w;
Referenci za艂atwiaj膮cy sprawy maj膮 utrudniony dost臋p do potrzebnych w ich pracy zasob贸w informacyjnych, w szczeg贸lno艣ci do dokument贸w archiwalnych.
R臋czny system zarz膮dzania obiegiem dokument贸w nie zapewnia odpowiedniego stopnia bezpiecze艅stwa informacji, cho膰by ze wzgl臋du na 艂atwy dost臋p do dokument贸w papierowych. System dotychczasowy jest nieergonomiczny i聽czasoch艂onny.
Opis stanu proponowanego
Podstawowe og贸lne r贸偶nice w stosunku do stanu aktualnego s膮 nast臋puj膮ce:
Wyst臋puje pe艂na obs艂uga informatyczna obiegu wszystkich dokument贸w MSWiA, poprzez rejestracj臋 ich metryk;
Obieg papierowych egzemplarzy dokument贸w b臋dzie stopniowo redukowany do stanu niezb臋dnego.
Proponowane procedury w obszarze systemy przedstawione zosta艂y w聽tabeli聽12. Zmiany proceduralne w systemie informatycznym charakteryzuj膮 si臋 nast臋puj膮cymi w艂a艣ciwo艣ciami:
Wyra藕nym rozgraniczeniem procedur;
Jednolitym, sformalizowanym sposobem realizacji procedur;
Komputerowym wspomaganiem realizacji wi臋kszo艣ci procedur.
Tabela 12
Realizowane procedury - stan proponowany.
Lp. |
Nazwa procedury |
Wykonawcy |
Stan wspomagania komputerowego |
Cechy procedury |
Obs艂uga wyprowadzania dokumentu zewn臋trznego |
Kancelarie departament贸w i biur |
Komputerowo |
Gotowo艣膰 na zmiany |
|
Obs艂uga wysy艂ania dokumentu wewn臋trznego |
Kancelarie departament贸w i biur |
Komputerowo |
Gotowo艣膰 na zmiany |
|
Obs艂uga obiegu dokumentu |
Wszystkie kom贸rki organizacyjne |
Komputerowo |
Gotowo艣膰 na zmiany |
|
Zarz膮dzanie zmianami |
Wszystkie kom贸rki organizacyjne |
Komputerowo |
Gotowo艣膰 na zmiany |
|
Zarz膮dzanie zasobem archiwalnym |
Centralne Archiwum |
R臋cznie Komputerowo |
Stabilno艣膰 |
|
Dekretacja pisma |
Katedra kierownicza MSWiA |
Komputerowo |
Stabilno艣膰 |
|
Akceptacja pisma |
Katedra kierownicza MSWiA |
Komputerowo |
Stabilno艣膰 |
|
Administrowanie systemem informatycznym |
Kom贸rki organizacyjne obs艂ugi informatycznej |
Komputerowo |
Gotowo艣膰 na zmiany |
殴r贸d艂o:聽[22,聽str.36]
Wprowadzenie 艣rodk贸w informatycznych do systemu biurowego wymaga opracowania procedur zarz膮dzania jego funkcjonowaniem a tam, gdzie to b臋dzie potrzebne, przeprowadzenia niezb臋dnych zmian organizacyjnych. Charakter i聽zakres tych zmian zostanie okre艣lony w projekcie. Ponadto, system musi mie膰 „zaszyty” taki zestaw zdarze艅 dla realizacji procedur, aby uwzgl臋dni膰 specyfik臋 poszczeg贸lnych kom贸rek organizacyjnych.
Charakterystyka g艂贸wnych zasob贸w danych przedstawiona zosta艂a w聽tabeli聽13. Podstawowe r贸偶nice systemu docelowego w stosunku do stanu obecnego s膮 nast臋puj膮ce:
Znacznie wi臋ksza ilo艣膰 dokument贸w b臋dzie przechowywana na komputerowych no艣nikach informacji;
Prowadzone obecnie ewidencje komputerowe spraw (g艂贸wnie dla potrzeb kierownictwa) zast膮pione zostan膮 ewidencjami prowadzonymi w聽planowanym systemie biurowym;
Ewidencja zasobu archiwalnego prowadzona obecnie tylko cz臋艣ciowo z聽zastosowaniem informatyki b臋dzie ca艂kowicie skomputeryzowana;
Zostan膮 stworzone mo偶liwo艣ci 艣wiadczenia us艂ug informacyjnych wymienionych w tabeli聽13 w podtytule „zasoby pomocnicze”.
W odniesieniu o ostatniej pozycji powy偶szej specyfikacji nale偶y zaznaczy膰, 偶e wyszczeg贸lniono tylko przyk艂adowe us艂ugi informacyjne. Wykaz us艂ug w聽systemie docelowym zostanie zamieszczony w projekcie biurowego systemu informatycznego, po zbadaniu rzeczywistych potrzeb u偶ytkownik贸w. Ponadto, nie jest mo偶liwe obecnie przedstawienie wszystkich tego rodzaju 艣wiadcze艅, gdy偶 sukcesywnie pojawiaj膮 si臋 na rynku informatycznym coraz nowsze propozycje.
Tabela 13
Charakterystyka g艂贸wnych zasob贸w danych - stan proponowany.
Lp. |
Nazwa zasobu |
Spos贸b utrzymania |
Zbiory dokument贸w |
Komputerowo R臋cznie |
|
Rzeczowy Wykaz Akt |
Komputerowo |
|
Kartoteka pracownik贸w |
Komputerowo |
|
Indeks kom贸rek organizacyjnych |
Komputerowo |
|
Ewidencja spraw |
Komputerowo |
|
Ewidencja dokument贸w |
Komputerowo |
|
Tablica standardowych rozdzielnik贸w dokument贸w |
Komputerowo |
|
Zas贸b archiwalny |
R臋cznie Komputerowo (Canofile) |
|
Ewidencja zasobu archiwalnego |
Komputerowo |
|
Zasoby pomocnicze |
||
Teksty akt贸w prawnych zewn臋trznych |
Komputerowo |
|
Teksty akt贸w prawnych wewn臋trznych |
Komputerowo |
|
„Tablice og艂osze艅” |
Komputerowo |
|
Biuletyn prasowy |
Komputerowo |
|
Listy dyskusyjne |
Komputerowo |
|
Wykazy telefoniczne wewn臋trzne |
Komputerowo |
|
Ksi膮偶ki telefoniczne zewn臋trzne |
Komputerowo |
|
Rozk艂ady jazdy |
Komputerowo |
|
S艂owniki, encyklopedie |
Komputerowo |
|
Katalog zasob贸w bibliotecznych |
Komputerowo |
殴r贸d艂o:聽[22,聽str.40]
G艂贸wne strumienie danych oraz miejsca ich dostawc贸w i odbiorc贸w pozostaj膮 bez zmian w stosunku do stanu obecnego. Zmienia si臋 natomiast spos贸b obs艂ugi tych strumieni:
Ka偶dy dokument wprowadzany jest do systemu poprzez swoj膮 metryk臋;
Na pocz膮tku incydentalnie, a w miar臋 rozwoju systemu masowo, dokumenty wp艂ywaj膮ce do MSWiA b臋d膮 posiada艂y poza metryk膮 r贸wnie偶 zeskanowany obraz;
Dokumenty wychodz膮ce poza obszar MSWiA mog膮 by膰 przekazywane elektronicznie o ile odbiorca dokumentu jest przygotowany do takiego odbioru;
Dokumenty wewn臋trzne ministerstwa powinny mie膰 g艂贸wnie posta膰 elektroniczn膮 (edytory tekstu, arkusze kalkulacyjne, programy do przygotowywania prezentacji itd.).
Przewiduje si臋, 偶e we wszystkich kom贸rkach organizacyjnych Ministerstwa Spraw Wewn臋trznych i Administracji b臋dzie wykorzystywany jeden zintegrowany biurowy system informatyczny.
Docelowy system informatyczny MSWiA powinien spe艂nia膰 nast臋puj膮ce wymagania:
Komunikacja u偶ytkownika z systemem w standardzie graficznym;
Ka偶dy u偶ytkownik powinien mie膰 dost臋p do wszystkich zasob贸w informacyjnych, do kt贸rych jest uprawniony, niezale偶nie od fizycznego miejsca ich rozmieszczenia;
Operacje u偶ytkowe powinny by膰 pozbawione wszelkich czynno艣ci dotycz膮cych 艣rodowiska technicznego;
Przyjazno艣膰 i intuicyjno艣膰 prezentacji wynik贸w przetwarzania;
Odporno艣膰 na niew艂a艣ciw膮 obs艂ug臋;
Rozbudowany i przejrzysty system wspomagania dzia艂a艅 u偶ytkownika;
Zabezpieczenia przed utrat膮 informacji i nieupowa偶nionym dost臋pem;
Mo偶liwo艣膰 tworzenia raport贸w przy pomocy prostego j臋zyka zapyta艅.
Zako艅czenie
Przedstawiona praca zawiera om贸wienie zagadnie艅 zwi膮zanych z聽wykorzystaniem dokument贸w elektronicznych oraz charakteryzuje najwa偶niejsze technologie informatyczne s艂u偶膮ce do zarz膮dzania tymi dokumentami.
Dokumenty elektroniczne na dobre zadomowi艂y si臋 ju偶 w naszych biurach i聽domach. Pomimo tego, i偶 obecnie najcz臋艣ciej spotykan膮 ich form膮 jest ta wykorzystywana w pakietach biurowych oraz w us艂ugach sieci Internet, to jednak zakres ich zastosowa艅 jest znacznie szerszy i stale si臋 powi臋ksza.
Nale偶y by膰 艣wiadomym tego, 偶e w dziedzinie dokument贸w elektronicznych jeszcze nie wszystko zosta艂o powiedziane. W najbli偶szym czasie nale偶y si臋 spodziewa膰 wprowadzenia wielu nowych standard贸w okre艣laj膮cych sposoby kodowania dokument贸w elektronicznych. Szczeg贸lnie oczekiwane jest tu wprowadzenie jednolitego standardu opisu dokument贸w multimedialnych.
Du偶e znaczenie na tym polu mo偶e mie膰 mi臋dzy innymi zapowied藕 firmy Microsoft („dyktatora” w dziedzinie oprogramowania biurowego) o wprowadzeniu do aplikacji w przysz艂ych wersjach pakietu Office mo偶liwo艣ci zapisu i odczytu dokument贸w w formacie XML (ang.聽Extensible Markup Language). Oznacza to, 偶e by膰 mo偶e ju偶 za kilka lat XML b臋dzie dominuj膮cym standardem kodowania dokument贸w. Niestety obecnie XML nie doczeka艂 si臋 jeszcze 艣cis艂ej specyfikacji, kt贸r膮 mo偶na by艂oby zaprezentowa膰 w tym opracowaniu.
R贸wnie偶 technologie zarz膮dzania dokumentami elektronicznymi nie s膮 jeszcze w pe艂ni dojrza艂e. Brak jest dotychczas powszechnie akceptowalnych standard贸w w tej dziedzinie. Firmy, kt贸re dzi艣 decyduj膮 si臋 na wdra偶anie systemu zarz膮dzaj膮cego dokumentami elektronicznymi, musz膮 opiera膰 si臋 na narz臋dziach oferowanych przez okre艣lonego producenta. W przeciwnym razie mog膮 je oczekiwa膰 przykre niespodzianki zwi膮zane z niekompatybilno艣ci膮 pakiet贸w oferowanych przez r贸偶nych producent贸w.
Pomimo pewnych niedoskona艂o艣ci nowych technologii zarz膮dzania dokumentami elektronicznymi, potrafi膮 one znacznie lepiej, w por贸wnaniu do tradycyjnych rozwi膮za艅, zaspokaja膰 potrzeby informacyjne firm. Obecnie istniej膮 ju偶 przedsi臋biorstwa i instytucje, kt贸re swoj膮 dzia艂alno艣膰 w znacznym stopniu opieraj膮 na systemach zarz膮dzania dokumentami elektronicznymi. W wielu innych systemy te stanowi膮 uzupe艂nienie funkcjonuj膮cych tam system贸w informatycznych. Wraz聽z聽up艂ywem czasu oraz doskonaleniem si臋 i tworzeniem nowych rozwi膮za艅 w聽tej dziedzinie systemy zarz膮dzania dokumentami elektronicznymi b臋d膮 w coraz wi臋kszym stopniu uzupe艂nia膰, a nast臋pnie zast臋powa膰 tradycyjne systemy zarz膮dzania informacj膮. Systemy zarz膮dzania dokumentami elektronicznymi stan膮 si臋 dominuj膮cym oprogramowaniem w przedsi臋biorstwach i instytucjach.
Spis literatury
Duyshart B., The Digital Document. A handbook for Architects, Engineers and the Construction Industry, Butterworth Heinemann, 1996.
Southall R., Visual Structure and the Transmission of Meaning, Document Manipulation and Typography: Proceedings of the International Conference on Electronic Publishing, van Vleit, J.C. (ed.), Cambridge University Press, Cambridge 1988.
Ames, P., Beyond Paper: The official Guide to Adobe Acrobat, Adobe Press, Mountain View CA, 1993.
Wood, J.M., Desktop Magic: Electronic Publishing, Document Management, and Workgroups, Van Nostrand Reinhold, New York 1995.
Cleveland G., Overview of Document Management Technology, National Library of Canada, 1995.
http://www.ifla.org/ifla/VI/5/op/udtop2.htm
Workflow - rytm pracy, Sieci Komputerowe i Telekomunikacja, Marzec 1996.
Williams L., Compound Documents: What could be better than ASCII, Dr.聽Dobb's Journal, March 1993.
Orfali R., Harkey D., Edwards J., Essential Client/Server Survival Guide, Van Nostrand Reinhold, New York 1994.
Celko J., Understanding and Managing Textbases, DBMS October聽1996.
Encyklopedia Popularna PWN, Warszawa 1992.
Papierowa wojna, Computerworld 3 Lipca 1995.
Wypych w., Kr贸tka historia publikacji elektronicznych, PcKurier Marzec 1997.
Hall A.D., Podstawy techniki system贸w, PWN Warszawa 1968.
Zarz膮dzanie dokumentami, NetWorld Wrzesie艅 1997.
Oprogramowanie OCR - nowe technologie, Computerworld 26聽Czerwca 1995.
O'Leary A., Managing Mission - Critical Text, Byte September聽1997.
Nowicki W., Z papieru do komputera, Computerworld 17聽listopada聽1997.
Podstawy SoftSolution, Software Grudzie艅 1995.
Studium przedsi臋wzi臋cia biurowego systemu informatycznego Ministerstwa Spraw Wewn臋trznych i Administracji, Departament 艁膮czno艣ci i Informatyki MSWiA, Warszawa 1997.
Spis rysunk贸w
Rysunek 1. Relacja zachodz膮ca poprzez dokument pomi臋dzy autorem i聽czytelnikiem.
Spis tabel
Tabela聽1. Przyk艂ad kilku popularnych, w艂asnych format贸w dokument贸w. 28
Tabela聽2. Przyk艂ad kilku j臋zyk贸w opisu wyj艣cia i opisu stron. 31
Tabela聽3. Przyk艂ad kilku popularnych standard贸w wymiany dokument贸w. 34
Tabela聽4. Przyk艂ad kilku standard贸w komunikacji pomi臋dzy aplikacjami oraz standard贸w dynamicznie sk艂adanych dokument贸w. 39
Tabela聽5. Przyk艂ad kilku popularnych modeli sk艂adu dokumentu w聽procesie. 40
Tabela聽6. rzyk艂ad kilku popularnych format贸w dokument贸w widok贸w. 42
Tabela聽7. Przyk艂ad kilku system贸w oraz standard贸w dokument贸w elektronicznych odno艣nik贸w 44
Tabela聽8. Przyk艂ad kilku produkt贸w z dziedziny dokument贸w multimedialnych 47
Tabela聽9. Podsumowanie g艂贸wnych grup dokument贸w elektronicznych. 48
Tabela聽10. Realizowane procedury - stan aktualny. 77
Tabela聽11. Charakterystyka g艂贸wnych zasob贸w danych - stan aktualny 78
Tabela聽12. Realizowane procedury - stan proponowany. 80
Tabela聽13. Charakterystyka g艂贸wnych zasob贸w danych - stan proponowany. 82
Informacja jest to wiadomo艣膰, kt贸ra zmniejsza stopie艅 niepewno艣ci co do otaczaj膮cej nas rzeczywisto艣ci聽[15,聽str.494-499].
Etykiety (ang. markup tags) zwykle sk艂adaj膮 si臋 z jednostek kodu komputerowego, kt贸re osadzane s膮 wewn膮trz specyfikacji dokumentu wirtualnego.
Obrazy rastrowe - graficzne obrazy, sk艂adaj膮ce si臋 g艂贸wnie z kropek.
Linotyp - maszyna do sk艂adania tekstu z oddzielnych matryc, wybieranych za pomoc膮 klawiatury oraz do odlewania przy ich u偶yciu ca艂ych wierszy聽[11,聽str.449].
Monotypia - technika graficzna p艂aska; na p艂ycie metalowej lub szklanej wykonuje si臋 barwn膮 kompozycj臋 wolno schn膮cymi farbami i odciska na zwil偶onym papierze; powstaje tylko jedna odbitka, gdy偶 prawie ca艂a farba przenosi si臋 na papier聽[11,聽str.525].
AEC (ang. Architecture, Engineering and Construction) - og贸lny termin u偶ywany g艂贸wnie w przemy艣le obliczeniowym do wsp贸lnego okre艣lenia dzia艂alno艣ci architektonicznej, in偶ynieryjnej i聽konstrukcyjnej聽[1,聽str.47].
Aplikacje bazuj膮ce na formularzach bywaj膮 r贸wnie偶 okre艣lane mianem pakiet贸w formularzowych.
Hipertekst oraz WWW opisane s膮 w punkcie 2.10聽-聽Dokumenty elektronicznych odno艣nik贸w oraz 艂膮czonych form informacji.
Istnieje wiele r贸偶nych wersji specyfikacji HTML. Najnowsz膮 wersj膮 jest HTML 4.0.
Technika tego typu cz臋sto okre艣lana jest r贸wnie偶 mianem „Zapytania Przez Przyk艂ad” (ang.聽Query By聽Example).
42
89