62 Â
WIAT
N
AUKI
Lipiec 1999
M
àdrej g∏owie doÊç dwie s∏o-
wie”. Ludzie potrafià zerknàç
na t´ stron´, zobaczyç napisy
du˝à czcionkà, a poni˝ej bloki ma∏ego
tekstu, i ju˝ wiedzà, ˝e to poczàtek ar-
tyku∏u w czasopiÊmie. Spoglàdamy na
wykaz towarów spo˝ywczych i domy-
Êlamy si´, ˝e chodzi o list´ zakupów do
zrobienia. W rz´dach cyfr potrafimy wy-
szukaç stan naszego konta bankowego.
OczywiÊcie komputery nie sà tak mà-
dre: nale˝y im podaç dok∏adnie, o jakie
rzeczy chodzi, jak sà one ze sobà powià-
zane i co z nimi nale˝y zrobiç. XML
(Extensible Markup Language – rozsze-
rzalny j´zyk znakowania informacji
1
) ma
umo˝liwiç przetwarzanie informacji za-
wierajàcej swój w∏asny opis. Ta pozornie
prosta zmiana w sposobie, w jaki kom-
putery komunikujà si´ ze sobà, mo˝e
sprawiç, ˝e Internet wykroczy znacznie
poza proste przekazywanie informacji,
obejmujàc wiele nowych dziedzin dzia-
∏alnoÊci ludzkiej. W istocie, odkàd
W3C (World Wide Web Consortium)
ukoƒczy∏o definiowanie XML na poczàt-
ku 1998 roku, standard ten zaczà∏ roz-
przestrzeniaç si´ w nauce, medycynie
i przemyÊle niczym ogieƒ na prerii.
Ten entuzjastyczny odzew jest wyra-
zem nadziei, ˝e XML rozwià˝e niektó-
re z najwi´kszych problemów Interne-
tu. K∏opoty tej sieci sà powszechnie
znane: mimo ˝e sygna∏y podró˝ujà nià
nieomal z pr´dkoÊcià Êwiat∏a, to prze-
p∏yw informacji cz´sto odbywa si´ w
˝ó∏wim tempie; poza tym, choç w sieci
jest dost´pna praktycznie ka˝da infor-
macja, zdarza si´, ˝e odnalezienie tej po-
trzebnej graniczy niemal z cudem.
XML
a
Sieç drugiej generacji
Hipertekst wraz z globalnà siecià Internet
zapoczàtkowa∏y rewolucj´.
Nowy element: j´zyk XML,
powinien jej dokonaç
Jon Bosak i Tim Bray
XML POKONUJE BARIER¢ niekompatybilnoÊci
ró˝nych systemów komputerowych, umo˝liwiajàc
internautom szybsze i ∏atwiejsze wyszukiwanie
oraz wymian´ danych naukowych, produktów ko-
mercyjnych i wieloj´zycznych dokumentów.
BRUCIE ROSCH
XML
a
Sieç drugiej generacji
Â
WIAT
N
AUKI
Lipiec 1999 63
Oba powy˝sze problemy w du˝ej
mierze wynikajà z natury g∏ównego j´-
zyka w Internecie – HTML (Hypertext
Markup Language – j´zyk hipertek-
stowego znakowania informacji). Z do-
tychczas wynalezionych ten odniós∏ naj-
wi´kszy sukces w dziedzinie elektro-
nicznej prezentacji tekstu. Jest on jed-
nak doÊç powierzchowny, gdy˝ opisu-
je w zasadzie tylko, w jaki sposób prze-
glàdarka internetowa powinna wy-
Êwietliç na ekranie tekst, obrazki i przy-
ciski kontrolne. Nastawienie tego j´zyka
na wyglàd, choç sprzyja ∏atwemu na-
uczeniu si´ go, powoduje szereg istot-
nych ograniczeƒ.
Jedno z nich to trudnoÊç zrealizowa-
nia witryny internetowej, która by∏aby
czymÊ wi´cej ni˝ dobrym faksem wy-
sy∏ajàcym ka˝demu na ˝àdanie infor-
macje. Ludzie i firmy pragnà tworzyç
witryny przyjmujàce zamówienia od
klientów, przesy∏ajàce dane medyczne
o pacjentach, a nawet sterujàce pracà fa-
bryki lub instrumentami naukowymi
gdzieÊ na drugim koƒcu Êwiata. HTML
nie opracowano do tych celów.
Na przyk∏ad lekarz w USA jest w sta-
nie Êciàgnàç za pomocà Internetu dane
o uczuleniach pacjenta na pewne leki,
ale nie mo˝e tych danych wys∏aç pocz-
tà elektronicznà do kole˝anki, aby wczy-
ta∏a je bezpoÊrednio do bazy danych
szpitala. Jej komputer nie umia∏by zin-
terpretowaç otrzymanej informacji – dla
niego by∏by to tekst w stylu <H1> be∏-
kot, be∏kot </H1> <BOLD> be∏kot, be∏-
kot </BOLD>. Legendarny programi-
sta Brian Kernighan zauwa˝y∏ kiedyÊ,
˝e problem z powiedzeniem: „dosta-
niesz to, co widzisz”, polega na tym, ˝e
to, co widzisz, to dok∏adnie to i tylko to,
co dostaniesz.
W powy˝szym przyk∏adzie napisy
w nawiasach ostrych zwane sà znaczni-
kami. HTML nie ma znacznika do ozna-
czenia uczulenia na lek, co ujawnia innà
wad´ tego j´zyka: jest on zbyt sztywny.
Dodanie do definicji HTML nowego
znacznika to biurokracja, która mo˝e za-
braç wiele lat – trwa tak d∏ugo, ˝e tylko
nieliczni tego próbujà. A przecie˝ ka˝de
zastosowanie, nie tylko wymiana danych
medycznych, wymaga w∏asnych, specy-
ficznych znaczników.
To t∏umaczy powolnoÊç dzia∏ania
sklepów internetowych, katalogów wy-
sy∏kowych i generalnie wszystkich wi-
tryn interakcyjnych w Internecie. Je˝eli
zamawiajàc jakiÊ towar za poÊrednic-
twem Sieci, zmienimy iloÊç lub metod´
jego wysy∏ki, to zanim zobaczymy nowà
liczb´ na ekranie komputera, nasza
przeglàdarka za˝àda od odleg∏ego, prze-
cià˝onego serwera wys∏ania ca∏ej uak-
tualnionej strony z grafikà i innymi to-
warzyszàcymi elementami. A w tym
czasie nasz pot´˝ny komputer czeka
bezczynnie, gdy˝ w HTML zdefiniowa-
no tylko <H1>, <BOLD> itp., a nie
znaczniki cen i opcje wysy∏ki.
Brak specyficznych znaczników to
tak˝e niezadowalajàce efekty poszuki-
waƒ informacji w Internecie: nie ma
znacznika ceny, informacja o cenie nie
mo˝e wi´c byç jednym z kryteriów
wyszukiwania.
Troch´ nowego, troch´ starego
Teoretycznie rozwiàzanie jest bardzo
proste: nale˝y u˝ywaç znaczników, któ-
re mówià, czym jest dana informacja,
a nie – jak ma wyglàdaç na ekranie. Na
przyk∏ad w zamówieniu powinny byç
znaczniki ceny, rozmiaru, iloÊci i kolo-
ru, a nie, jak proponuje HTML, wyt∏usz-
czonego druku – <BOLD>, paragrafu –
<P> itp. Program b´dzie wi´c móg∏ zi-
Star Trek: Insurrection
is showing at the MondoPlex 2000.
Show
tim
es are at 2:15, 4:30, 6:45, 9:00 and 11:15.
Tickets are $8.50 each for adults
and $5.00 each for children.
Star Trek
MondoPlex
2:15 4:30
6:45 9:00
11:15
Shake-
speare...
<movie>
<title>
Star Trek: Insurrection
</title>
<star>
Patrick Stewart
</star>
<star>
Brent Spiner
</star>
<theatre>
<theatre-name>
MondoPlex 2000
</theatre-name>
<showtime>
1415
</showtime>
<showtime>
1630
</showtime>
<showtime>
1845
</showtime>
<showtime>
2100
</showtime>
<showtime>
2315
</showtime>
<price>
<adult-price>
8.50
</-price>
<child-price>
5.00
</-price>
</price>
</theatre>
<theatre>
<theatre-name>
Bigscreen 1
</theatre-name>
<showtime>
1930
</showtime>
<price>
<adult-price>
6.00
</adult-price>
</price>
</theatre>
</movie>
<movie>
<title>
Shakespeare in Love
</title>
<star>
Gwyneth
WZORZEC
FORMATU
DLA TEKSTU
MÓWIONEGO
WZORZEC
FORMATU
DLA
WYÂWIETLANIA
NA EKRANIE
ZWYK¸EGO PC
WZORZEC
FORMATU
DLA KOMPUTERA
PALMTOP
File Edit View Special
Star Trek
Shakespeare in
Select a showtime
Buy tickets
PLIK wzbogacony znacznikami XML, zawierajà-
cy na przyk∏ad repertuar kin w ca∏ym mieÊcie,
mo˝e byç zaprezentowany w formie zale˝nej od
u˝ytego wzorca formatowania: w postaci tekstu,
tabel, zestawieƒ i grafiki na monitorze kompute-
ra stacjonarnego, wyselekcjonowanych linijek
tekstu na wyÊwietlaczu komputera typu palmtop
lub te˝ czytanych fragmentów tekstu, je˝eli wy-
brana informacja zosta∏a skierowana do telefonu
u˝ytkownika Internetu.
<
XML wraz z XSL pozwalajà
raz zredagowanà publikacj´ podawaç
w najró˝niejszych postaciach.
/>
LAURIE GRACE
64 Â
WIAT
N
AUKI
Lipiec 1999
dentyfikowaç dokument jako zamówie-
nie od klienta i wykonaç odpowiednie
czynnoÊci: wyÊwietliç informacj´ we
w∏aÊciwym formacie, zarejestrowaç za-
mówienie lub (czemu nie?) prosiç o wy-
s∏anie przedstawiciela, który nazajutrz
zrobi w naszym domu pokaz najnow-
szych kreacji.
Jako cz∏onkowie grupy roboczej kon-
sorcjum W3C (jest nas oko∏o tuzina) za-
cz´liÊmy pracowaç nad takim rozwià-
zaniem w 1996 roku. Mimo ˝e pomys∏
mia∏ pot´˝ne implikacje, nie by∏ on ca∏-
kowicie oryginalny. Od stuleci druka-
rze dodawali na marginesach r´kopi-
sów notatki, które informowa∏y zece-
rów, jak majà sk∏adaç tekst. W miar´
up∏ywu czasu te adiustacje stawa∏y si´
coraz bardziej sformalizowane. Po dzie-
si´cioleciach pracy International Or-
ganization for Standardization (ISO)
znormalizowa∏a w roku 1986 system
tworzenia nowych j´zyków znakowa-
nia informacji.
Ten j´zyk, zwany SGML (Standard
Generalized Markup Language – uogól-
niony standardowy j´zyk definiowania
znakowania informacji) s∏u˝y do opisu
j´zyków, czyli jest metaj´zykiem. Oka-
za∏ si´ on bardzo przydatny w wielu du-
˝ych przedsi´wzi´ciach edytorskich, na
przyk∏ad w encyklopediach. Zresztà
sam HTML zosta∏ zdefiniowany za po-
mocà SGML. Jedyny k∏opot z SGML to
fakt, ˝e jest on zbyt ogólny. Naszpiko-
wany zmyÊlnymi konstrukcjami, które
mia∏y skróciç kod (w latach osiemdzie-
siàtych nale˝a∏o oszcz´dzaç ka˝dy bajt).
SGML okaza∏ si´ wi´c zbyt z∏o˝ony dla
przeglàdarek internetowych.
Nasza grupa stworzy∏a XML, usu-
wajàc z SGML wiele „wodotrysków”.
Pozwoli∏o to zdefiniowaç prostszy, bar-
dziej strawny metaj´zyk. XML sk∏ada
si´ z zestawu regu∏, wed∏ug których
ka˝dy mo˝e zdefiniowaç od podstaw
swój w∏asny j´zyk znakowania infor-
macji. Gwarantujà one, ˝e szybki i nie-
wielki program, tzw. parser (czyli ana-
lizator sk∏adni), da sobie rad´ ze wszy-
stkimi takimi j´zykami.
Rozwa˝my powtórnie przypadek le-
karza, który chce przes∏aç dane me-
dyczne pacjenta do specjalisty. JeÊli
w medycynie u˝yje si´ XML do zdefi-
niowania w∏asnego j´zyka znakowania
danych (wiele oÊrodków ju˝ zacz´∏o nad
tym pracowaç), to list elektroniczny na-
szego lekarza b´dzie zawiera∏ tekst ta-
kiego rodzaju: <patient> (znacznik pa-
cjenta) <name> (znacznik nazwiska)
nazwisko </name> (koniec zakresu
znacznika nazwiska) <drug-allergy>
(znacznik uczulenia na lek) lista leków
uczulajàcych pacjenta </drug-allergy>
(koniec zakresu znacznika uczulenie na
lek) </patient> (koniec zakresu znacz-
nika pacjenta). W tych warunkach jest
rzeczà prostà tak zaprogramowaç kom-
puter, aby rozumia∏ powy˝sze terminy
medyczne i doda∏ odpowiednià infor-
macj´ do swojej bazy danych.
XML to analog j´zyka esperanto,
który umo˝liwia porozumiewanie si´
ró˝nych komputerów dzia∏ajàcych pod
rozmaitymi systemami operacyjnymi
(wspó∏czesny odpowiednik wie˝y Ba-
bel), podobnie jak HTML umo˝liwi∏
ka˝demu u˝ytkownikowi czytanie do-
kumentów publikowanych w Internecie.
O ile jednak wi´kszoÊç danych kompu-
terowych mo˝e byç interpretowana tyl-
ko przez komputery, o tyle informacja
zapisana w XML jest zrozumia∏a tak˝e
dla ludzi, gdy˝ jest to zwyk∏y tekst.
Pot´ga XML bierze si´ stàd, ˝e opar-
ty on jest na niewielkiej liczbie dobrze
dobranych regu∏. Zgodnie z pierwszà
z nich znaczniki zawsze wyst´pujà pa-
rami. Podobnie jak nawiasy obejmujà
pewien tekst (tj. ka˝dy znacznik
<znacz> ma znacznik koƒca swego za-
kresu </znacz>) i mo˝na je dowolnie
zagnie˝d˝aç.
Regu∏a zagnie˝d˝ania nak∏ada na
ka˝dy dokument napisany w XML pew-
nà prostà struktur´ nazywanà przez in-
formatyków drzewem. Tak jak w drze-
wie genealogicznym ka˝dy kawa∏ek
tekstu i obrazek jest albo przodkiem, al-
bo potomkiem innego elementu, a rela-
cje te sà jednoznaczne. Drzewa tego ty-
pu nie sà w stanie reprezentowaç ka˝dej
informacji, ale nadajà si´ do wi´kszoÊci
zastosowaƒ informatycznych. A co naj-
wa˝niejsze, ∏atwo jest pisaç programy
obs∏ugujàce struktury typu drzewo. Je-
Êli nasze konto bankowe ma struktur´
drzewa, jest rzeczà prostà napisaç pro-
gram, który wyÊwietli transakcje na
koncie w dowolnym porzàdku lub na
przyk∏ad poka˝e tylko list´ ju˝ zreali-
zowanych czeków.
Innà mocnà stronà XML jest to, ˝e
u˝ywa on standardu Unicode, który
umo˝liwia kodowanie znaków i ∏àcze-
nie w jednym tekÊcie wi´kszoÊci j´zy-
ków. W HTML, podobnie jak w wi´k-
szoÊci edytorów tekstu, dokument
powstaje w jednym j´zyku, na przyk∏ad
po angielsku, arabsku czy japoƒsku. Je-
Êli oprogramowanie, którego u˝ywamy,
nie zna liter danego j´zyka, ca∏y doku-
ment jest dla nas bezu˝yteczny. Czasa-
mi bywa jeszcze gorzej: zdarza si´, ˝e
teksty napisane na Tajwanie sà nie-
zrozumia∏e w ChRL, gdy˝ u˝ywa si´
tam innego systemu kodowania pikto-
gramów. Za to poprawne oprogramo-
wanie w XML daje sobie rad´ z tymi
k∏opotami. Tak wi´c XML pozwala na
wymian´ informacji nie tylko pomi´dzy
komputerami ró˝nych typów, lecz tak-
˝e pomi´dzy ludêmi ró˝nych kultur
i narodowoÊci.
Koniec z czekaniem w Internecie
W miar´ rozpowszechniania si´ XML
szybkoÊç dzia∏ania Internetu powinna
zauwa˝alnie wzrosnàç. DziÊ kompute-
ry komunikujàce si´ z Internetem, nieza-
le˝nie od tego, czy sà to pot´˝ne stacje
robocze, czy proÊciutkie palmtopy, po-
trafià zaledwie pobraç formularz, wy-
pe∏niç go i przes∏aç z powrotem do ser-
wera; czynnoÊç t´ powtarza si´ a˝ do
skutku. JeÊli jednak dodamy (w ramach
XML) informacj´ semantycznà i struktu-
ralnà, lokalny komputer mo˝e wziàç na
siebie du˝à cz´Êç przetwarzania danych.
To nie tylko odcià˝y serwery interneto-
we, ale tak˝e radykalnie zmniejszy ob-
cià˝enie ca∏ej Sieci.
Aby to zrozumieç, wyobraêmy sobie,
˝e w internetowym biurze podró˝y
poprosiliÊmy o list´ lotów z Londynu
do Nowego Jorku w dniu 4 lipca. Do-
staniemy zapewne spis tak d∏ugi, ˝e
jego wyÊwietlenie wymaga∏oby wielo-
krotnego przewijania ekranu. List´ mo-
˝emy skróciç, podajàc wi´cej szczegó-
∏ów: czas odlotu, cen´ biletu lub lini´
lotniczà. Aby to uczyniç, musimy jed-
nak wys∏aç te ograniczenia i czekaç na
odpowiedê serwera. Gdyby lista by-
∏a sformu∏owana w XML, to serwer biu-
ra podró˝y wys∏a∏by nam wraz z listà
lotów maleƒki programik w j´zyku Ja-
wa
2
, który obs∏u˝y∏by nasze konkretne
poszukiwania w u∏amku sekundy, bez
odwo∏ywania si´ do dalekiego serwe-
ra. JeÊli ten zysk czasowy pomno˝ymy
przez miliony u˝ytkowników Inter-
<
XML pozwala na wymian´
informacji nie tylko pomi´dzy
komputerami ró˝nych typów,
lecz tak˝e pomi´dzy ludêmi
ró˝nych kultur i narodowoÊci.
/>
Â
WIAT
N
AUKI
Lipiec 1999 65
7/4/99
Sun
7/4/99
Sun
7/4/99
Sun
New York(JFK)
Arrive 10:55 am
New York(JFK)
Arrive 11:25 am
New York(JFK)
Arrive 11:45 am
New York(JFK)
Arrive 12:00 pm
ed Flights - JFK - XML Browser
Favorites Help
Softland
A
irlines
115
Softland
A
irlines
118
Softland
A
irlines
120
Softland
A
irlines
116
Softland
A
irlines
129
Softland
A
irlines
127
Softland
A
irlines
125
Softland
A
irlines
123
Softland
A
irlines
117
Softland
A
irlines
119
Softland
A
irlines
121
Edit
8:00 am
8:45 am
8:55 am
10:00 am
10:55 am
12:00 pm
1:15 pm
1:55 pm
2:00 pm
2:00 pm
2:05 pm
7h 55m
7h 55m
7h 55m
7h 55m
7h 55m
7h 55m
7h 55m
7h 55m
7h 55m
7h 55m
7h 55m
7/4/99
Sun
7/4/99
Sun
7/4/99
Sun
7/4/99
Sun
7/4/99
Sun
7/4/99
Sun
7/4/99
Sun
7/4/99
Sun
7/4/99
Sun
7/4/99
Sun
7/4/99
Sun
London(LHR)
Depart 8:00 am
London(LHR)
Depart 8:45 am
London(LHR)
Depart 8:55 am
London(LHR)
Depart 10:00 am
London(LHR)
Depart 10:55 am
London(LHR)
Depart 12:00 pm
London(LHR)
Depart 1:15 pm
London(LHR)
Depart 1:55 pm
London(LHR)
Depart 2:00 pm
London(LHR)
Depart 2:00 pm
London(LHR)
Depart 2:05 pm
New York(JFK)
Arrive 10:55 am
New York(JFK)
Arrive 11:40 am
New York(JFK)
Arrive 11:45 am
New York(JFK)
Arrive 12:00 am
New York(JFK)
Arrive 1:45 pm
New York(JFK)
Arrive 2:55 pm
New York(JFK)
Arrive 4:10 pm
New York(JFK)
Arrive 4:50 pm
New York(JFK)
Arrive 4:55 pm
New York(JFK)
Arrive 4:55 pm
New York(JFK)
Arrive 5:00 pm
to
to
to
to
to
to
to
to
to
to
to
File
Edit
Scheduled Flights - JFK - XML Browser
View
Favorites
Help
Softland
Airlines
115
Softland
Airlines
118
Softland
Airlines
120
Softland
Airlines
116
Softland
Airlines
129
Softland
Airlines
127
Softland
Airlines
125
Softland
Airlines
123
Softland
Airlines
117
Softland
Airlines
119
Softland
Airlines
121
e
Select your seat for Softland flight #118
Heathrow to NY Kennedy July 4, 1999
Flight Confirmation - XML Browser
Your reservation will be entered.
You must purchase your tickets
within 72 hours. Proceed?
Yes
No
Cancel
?
Book flight
Show fare
restrictions
Enter new
itinerary
Fare restrictions:
•
Must stay over a Saturday night.
•
Tickets must be purchased within
24 hours of reservation and not less than
7 days prior to flight.
•
Tickets are nonrefundable. Changes to
itinerary will result in $75 fee and
payment of difference in fare.
Show remaining
seats
File Edit
Softland Airlines Flight Finder - XML Browse
View Favorites Help
e
Book a flight
Leaving from
Going to
This search is limited to adult round trip coach fa
Click "Book a flight" to do a more detailed searc
Try our fast Roundtrip
Fare Finder:
Register first
Departing
Returning
More search options
Time
Time
1 adult
3/19/99
3/19/99
evening
evening
Softland
Airlines
HIPER¸ÑCZE XML pozwala wyÊwietliç list´ pozycji do
wyboru. Mo˝na na przyk∏ad wstawiç grafik´ na bie˝àcà
stron´ – w naszym przyk∏adzie plan miejsc na pok∏adzie
interesujàcego nas samolotu
(czerwona strza∏ka). Inne
mo˝liwoÊci to uruchomienie ma∏ego programu, który za-
rezerwuje nam miejsce w wybranym locie
(˝ó∏ta strza∏ka)
lub te˝ wyÊwietlenie dodatkowych informacji jego doty-
czàcych
(zielona strza∏ka). Hiper∏àcze mo˝e te˝ oczywi-
Êcie przenieÊç nas na innà stron´
(niebieska strza∏ka).
netu, to oszcz´dnoÊci na czasie oka˝à si´
olbrzymie.
W miar´ jak informacja w Internecie
b´dzie coraz cz´Êciej znakowana XML-
-owymi znacznikami, coraz ∏atwiej uzy-
skamy poszukiwanà informacj´. DziÊ,
gdy polecimy wyszukiwarce znaleêç in-
formacj´ dotyczàcà „pracy dla maklerów
gie∏dowych”, zostaniemy zalani rekla-
mami, a wÊród nich prawdopodobnie
znajdzie si´ bardzo ma∏o rzeczywistych
ofert pracy. Wi´kszoÊç z nich ukryta jest
bowiem w dzia∏ach „Og∏oszenia drob-
ne” witryn internetowych czasopism, co
na ogó∏ umyka programom wyszukujà-
cym. Newspaper Association of Ameri-
ca tworzy ju˝ j´zyk znaczników w XML
specyficzny dla drobnych og∏oszeƒ, co
znakomicie u∏atwi poszukiwania w tych
dzia∏ach.
Jednak jest to tylko rozwiàzanie tym-
czasowe. Bibliotekarze ju˝ dawno temu
wpadli na pomys∏, ˝e aby szybko odna-
leêç informacje, nie nale˝y przeglàdaç
ca∏ego zbioru ksià˝ek, lecz skondenso-
wany jego obraz: fiszki w katalogu bi-
blioteki. Tego typu informacj´ o infor-
macji nazywamy metadanymi.
Ju˝ od samego poczàtku cz´Êcià pro-
jektu XML by∏o stworzenie bliêniaczego
standardu dla metadanych. RDF (Re-
source Description Framework – sche-
mat opisu zasobów danych) ukoƒczo-
ny w lutym br. powinien staç si´ dla
Internetu tym, czym fiszki biblioteczne
dla bibliotek. Metadane w formacie RDF
uczynià poszukiwania w Internecie
szybszymi i bardziej precyzyjnymi.
W Sieci nie ma wielu bibliotekarzy, ale
ka˝dy posiadacz witryny chce przede
wszystkim byç dostrze˝ony przez in-
nych. Spodziewamy si´ wi´c, ˝e wzrost
liczby dokumentów opisanych w stan-
dardzie RDF dorówna tempu zdumie-
wajàcego rozwoju Internetu, gdy tylko
ludzie docenià pot´g´ tego standardu.
Istniejà oczywiÊcie inne sposoby od-
najdywania informacji ni˝ szukanie.
W koƒcu Internet jest jednym hipertek-
stem, a miliardy jego stron po∏àczone sà
hiper∏àczami – tymi podkreÊlanymi s∏o-
wami, na które klikamy myszkà, aby
przenieÊç si´ na innà stron´. Mo˝liwoÊci
hiper∏àczy te˝ wzrosnà z nastaniem
LAURIE GRACE
66 Â
WIAT
N
AUKI
Lipiec 1999
XML, gdy˝ nowy standard, zwany
XLink, pozwoli na wybranie nowej stro-
ny z listy serwerów, na których jest ona
dost´pna. Konsorcjum W3C zamierza
og∏osiç specyfikacje XLink jeszcze w tym
roku. Inne rodzaje hiper∏àczy b´dà mo-
g∏y wstawiç tekst lub grafik´ w miejsce,
które klikn´liÊmy, bez koniecznoÊci
opuszczenia aktualnie oglàdanej strony.
Zapewne najbardziej po˝ytecznà ce-
chà XLinku b´dzie jednak to, ˝e potrafi
on wskazywaç stron´ internetowà po-
Êrednio, za pomocà odniesienia do wpi-
su w centralnej bazie danych. JeÊli dana
strona internetowa zmienia adres, jej au-
tor b´dzie ∏atwo móg∏ poprawiç wszelkie
odniesienia do niej, zmieniajàc jeden tyl-
ko zapis w bazie danych. To powinno
wyeliminowaç znany nam wszystkim
b∏àd „404 File Not Found”, który wyst´-
puje wtedy, gdy zerwane jest hiper∏àcze.
Po∏àczenie bardziej wydajnego prze-
twarzania danych, bardziej precyzyj-
nych wyszukiwaƒ i wi´ksze mo˝liwoÊci
hiper∏àczy zrewolucjonizujà struktur´
Internetu i pozwolà na zupe∏nie nowe
sposoby dost´pu do informacji. Z punk-
tu widzenia internauty stanie si´ szyb-
sza, bardziej u˝yteczna i b´dzie mia∏a
wi´ksze mo˝liwoÊci.
Zrób to sam
OczywiÊcie, wszystko to nie jest takie
proste. XML pozwala ka˝demu zdefinio-
waç nowy, w∏asny j´zyk, ale zaprojekto-
wanie dobrego j´zyka to przedsi´wzi´cie,
które wymaga d∏u˝szego namys∏u. A fa-
za projektowania to tylko poczàtek: zna-
czenie zdefiniowanych przez nas znacz-
ników nie b´dzie czytelne dla innych,
jeÊli nie zrobimy odpowiedniego opisu,
a komputer nie b´dzie wiedzia∏, co z ni-
mi zrobiç, jeÊli nie napiszemy odpowied-
niego oprogramowania.
Chwila namys∏u wystarcza, aby zro-
zumieç przyczyn´. Gdyby wystarczy∏o
dodanie znaczników do zamówienia,
aby komputer móg∏ je przetworzyç, to
XML w ogóle nie by∏by potrzebny. Na-
wet programiÊci nie byliby potrzebni –
maszyny same zrozumia∏yby, co nale-
˝y zrobiç.
XML nie ma magicznych mocy spraw-
czych. Jego regu∏y sà jednak jasne; bie-
rze on na siebie du˝à cz´Êç detali infor-
matycznych, tak ˝e ludzie o wspólnych
zainteresowaniach mogà skoncentrowaç
si´ na naprawd´ trudnym zagadnieniu
– uzgodnieniu, w jakiej postaci wymie-
niaç dane. To nie jest proste, ale boryka-
my si´ z tym problemem nie od dziÊ.
Do takich uzgodnieƒ musi dojÊç, gdy˝
namno˝y∏o si´ tyle wzajemnie niezgod-
nych systemów komputerowych, ˝e jest
to przyczynà opóênieƒ, wzrostu kosz-
tów i ba∏aganu w ka˝dej niemal dzie-
dzinie ˝ycia. Ludzie chcà wymieniaç po-
glàdy i handlowaç w Internecie bez
przymusu u˝ywania tego samego sprz´-
tu. Tworzenie j´zyków ze znacznikami
specyficznymi dla danej dziedziny jest
du˝à wygodà. Obecny zalew akroni-
mów koƒczàcych si´ na ML (Markup
Language) potwierdza s∏usznoÊç takie-
go podejÊcia, pokazujàc, jak wiele po-
mys∏ów mo˝na zrealizowaç w ramach
XML w nauce i biznesie.
Aby zdefiniowaç nowy j´zyk w ra-
mach XML, twórcy powinni uzgodniç
trzy rzeczy: jakie znaczniki b´dà do-
puszczalne, w jaki sposób mo˝na je za-
gnie˝d˝aç i jak je dalej przetwarzaç.
Dwa pierwsze punkty – s∏ownik i struk-
tur´ j´zyka – zazwyczaj definiuje si´
w DTD (Document Type Definition –
definicja typu dokumentu). Standard
XML nie zmusza projektanta j´zyka do
stosowania DTD, ale wi´kszoÊç nowo
powstajàcych j´zyków zapewne b´dzie
jà zawiera∏a, gdy˝ upraszcza to bardzo
pisanie oprogramowania korzystajàce-
go ze zdefiniowanych znaczników.
ProgramiÊci potrzebujà tak˝e doku-
mentacji, która poda znaczenie nowo
zdefiniowanych znaczników. Na przy-
k∏ad HTML ma w∏asnà DTD, ale tak˝e
setki stron dokumentacji, która s∏u˝y pro-
gramistom podczas pisania przeglàda-
rek i innych programów dla Internetu.
Dla u˝ytkowników wa˝ne jest to, co
robi program, a nie co opisujà znaczni-
ki. W wielu przypadkach potrzebne jest
wyÊwietlenie na ekranie informacji za-
pisanej w XML. Jednak znaczniki XML
nie dajà ˝adnych wskazówek, jak doku-
ment ma wyglàdaç na ekranie.
Kwestia formatu
To akurat jest zaletà dla wydawców,
którzy cz´sto pragnà „raz zredagowaç,
ale publikowaç wielokrotnie”: tak przy-
gotowaç materia∏, aby mo˝na go by∏o
wydawaç w najró˝niejszych postaciach,
zarówno na papierze, jak i elektronicz-
nie. W XML robi si´ to, znakujàc w do-
kumencie znaczenie zawartych w nim
danych niezale˝ne od medium, za po-
mocà którego b´dzie dokonana prezen-
tacja. Nast´pnie mo˝na do takiego do-
kumentu zastosowaç wzorce formatu
(stylesheets), automatycznie przeforma-
towaç dokument na potrzeby danego
medium. Obecnie trwajà prace nad zde-
finiowaniem standardu dla wzorców
formatów w XML, zwanego XSL (Exten-
sible Stylesheet Language).
Najnowsze wersje wielu przeglàdarek
internetowych potrafià ju˝ prawid∏owo
Nowe j´zyki nauki
J
´zyki ze znacznikami pozwalajà na efektywnà
wymian´ informacji pomi´dzy naukowcami.
W szczególnoÊci matematyków od dawna fru-
strowa∏o, ˝e w Internecie mo˝na by∏o pokazy-
waç wzory matematyczne wy∏àcznie jako obraz-
ki. J´zyk
MathML, zdefiniowany wiosnà ub. r.,
pozwala dziÊ przenosiç wzory bezpoÊrednio z wi-
tryn internetowych do programów s∏u˝àcych do
obliczeƒ symbolicznych.
Chemicy posun´li si´ dalej, tworzàc nowe przeglàdarki dla j´zyka CML (
Chemi-
cal Markup Language, oparty na XML), które graficznie przedstawiajà zwiàzki che-
miczne opisywane w witrynach internetowych pos∏ugujàcych si´ CML. CML oraz
ciàgle jeszcze b´dàcy w fazie opracowywania
Astronomy Markup Language po-
magajà naukowcom przedrzeç si´ przez gàszcz informacji. Na przyk∏ad astrono-
mowie, podajàc wspó∏rz´dne galaktyki, otrzymujà wszystkie zdj´cia i informacje
dotyczàce tego obiektu.
XML bywa pomocny nie tylko przy analizie eksperymentów, ale nawet w czasie
ich przeprowadzania. In˝ynierowie z NASA zacz´li w zesz∏ym roku opracowywaç j´-
zyk AIML
(Astronomical Instrument ML), który pozwoli naukowcom sterowaç z zie-
mi teleskopem na podczerwieƒ SOFIA, latajàcym w stratosferze na pok∏adzie Boein-
ga 747. W przysz∏oÊci prawdopodobnie naukowcy z ca∏ego Êwiata b´dà sterowaç
zdalnie teleskopami, a nawet satelitami za pomocà przeglàdarek internetowych.
Wracajàc na ziemi´, nale˝y wspomnieç o j´zyku
Biosequence ML (BSML), dzi´-
ki któremu genetycy mogà wymieniaç i przetwarzaç informacje zdobywane w setkach
badaƒ mapujàcych i dekodujàcych geny ró˝nych organizmów. Przeglàdarka rozumie-
jàca BSML zosta∏a opracowana i jest rozpowszechniana za darmo przez firm´ Visu-
al Genomics z Columbus w Ohio. Pozwala ona biologom na przeszukiwanie olbrzy-
mich banków danych genetycznych i pokazywanie wyników w postaci zrozumia∏ych
wykresów i map, a nie, jak dotychczas, jako nieklarownych ciàgów liter.
Â
WIAT
N
AUKI
Lipiec 1999 67
odczytaç dokument w XML i automa-
tycznie za∏adowaç do pami´ci wzorzec
formatu niezb´dny do prawid∏owego po-
kazania dokumentu na ekranie monitora.
U˝ytkownik mo˝e nawet nie wiedzieç,
˝e oglàda stron´ XML, a nie HTML, ale
powinien zauwa˝yç, ˝e w przypadku
XML dost´p b´dzie szybszy, a strona wy-
godniejsza w u˝yciu.
Zyskajà na tym tak˝e niewidomi. Od-
powiednie wzorce formatu pozwalajà
na prezentacj´ dokumentu brajlem lub
nawet g∏osem. Tak˝e kierowcy, którzy
chcà ˝eglowaç po Internecie w czasie
jazdy samochodem, b´dà pewnie wole-
li wys∏uchaç wyszukanej informacji.
Mimo ˝e Internet sta∏ si´ b∏ogos∏awieƒ-
stwem dla naukowców, to handel (a ra-
czej przewidywany jego rozwój) jest
g∏ównym motorem lawinowego rozkwi-
tu Sieci. Niedawny skok w obrotach skle-
pów internetowych zyska∏ rozg∏os, ale
transakcje internetowe mi´dzy firmami
wzrastajà równie szybko. Przep∏yw to-
warów w procesie produkcyjnym a˝ pro-
si si´ o automatyzacj´. Jednak˝e systemy
opierajàce si´ na z∏o˝onej, bezpoÊredniej
wymianie danych mi´dzy programami
nadzorujàcymi ró˝ne fazy produkcji si´
nie sprawdzi∏y, gdy˝ zak∏adajà one nie-
zmiennoÊç produkcji, co w rzeczywisto-
Êci si´ nie zdarza.
Ju˝ od wieków ludzie dokonywali
transakcji, wymieniajàc standardowe
dokumenty: zamówienia, listy przewo-
zowe towarów, faktury, potwierdzenia
odbioru itd. W dzia∏alnoÊci handlowej
dokumenty te spe∏niajà nale˝ycie swo-
jà rol´, gdy˝ nie wymagajà od stron zna-
jomoÊci wewn´trznych regu∏ post´-
powania partnera. Ka˝dy dokument
podaje tylko informacj´, której potrze-
buje kontrahent, i nic ponadto. Wymia-
na podobnych dokumentów jest praw-
dopodobnie w∏aÊciwym sposobem
prowadzenia dzia∏alnoÊci handlowej
w Internecie. Lecz HTML nie zosta∏
stworzony do tego celu.
Ale w∏aÊnie XML s∏u˝y do wymiany
dokumentów. Wydaje si´, ˝e Êwiatowy
handel elektroniczny b´dzie uzale˝nio-
ny od wymiany uzgodnieƒ zapisanych
w XML – miliony takich dokumentów
zacznà krà˝yç po Internecie.
Tak wi´c Internet z dokumentami
w XML b´dzie miejscem, w którym da
si´ prowadziç dzia∏alnoÊç gospodarczà
szybciej, lepiej i wygodniej. Z drugiej
strony twórcom witryn internetowych
postawi si´ wy˝sze wymagania. B´dzie-
my potrzebowali ca∏ych batalionów pro-
gramistów, aby wykorzystaç w pe∏ni
mo˝liwoÊci nowego j´zyka XML. Tak
wi´c dni samouka internetowego sà po-
liczone. Przyszli projektanci witryn mu-
szà nie tylko tworzyç teksty i grafik´,
lecz tak˝e definiowaç wspó∏zale˝ne wie-
lopoziomowe DTD, tworzyç drzewa da-
nych, struktury hiper∏àczy, metadane –
wszystko to b´dzie stanowi∏o o bardziej
odpornej i uniwersalnej strukturze przy-
sz∏ego Internetu.
T∏umaczy∏
Aleksy Bartnik
Wi´cej informacji mo˝na uzyskaç pod
adresem: www.sciam.com/1999/0599issue
/0599bosak.html
Przypisy redakcji:
1
Do∏àczone do tekstu znaczniki interpretowane sà
przez przeglàdarki internetowe, pozwalajàc im od-
powiednio sformatowaç tekst i grafik´ odebranà
z odleg∏ych komputerów (serwerów), a wi´c przy-
gotowaç stron´ do wyÊwietlenia na ekranie moni-
tora lub do wydrukowania. Z uwagi na tradycje
drukarskie j´zyk taki bywa czasami okreÊlany ja-
ko j´zyk adiustacyjny. RozszerzalnoÊç oznacza do-
puszczenie wprowadzania do j´zyka nowych kon-
strukcji. Prezentacja informacji w Sieci w postaci
kolejno po∏àczonych ze sobà dokumentów (cz´sto
Êciàganych z ró˝nych odleg∏ych komputerów) na-
zywana jest hipertekstem. Ograniczenie roli kom-
putera u˝ytkownika Internetu do formatowania
hipertekstu powoduje, ˝e wszelkie obliczenia do-
konywane sà na serwerach u˝yczajàcych informa-
cji przed jej wys∏aniem do odbiorcy. I tak na przy-
k∏ad uaktualnienie licznika odwiedzin witryny
wymaga wywo∏ania wyspecjalizowanego, cz´sto
odleg∏ego serwera, który dokona odpowiednich
(ale bardzo prostych) obliczeƒ i ich wynik odeÊle
zamawiajàcemu w postaci gotowego do wyÊwie-
tlenia obrazka.
2
J´zyk Jawa umo˝liwia pisanie programów, które
mogà byç wykonywane na dowolnym kompute-
rze – wystarczy tylko, aby w system operacyjny te-
go komputera wbudowana by∏a tzw. wirtualna ma-
szyna Jawy interpretujàca nades∏any program. Taki
programowy emulator jest stosunkowo wolny, sys-
tem operacyjny zaÊ, w który jest on wbudowany,
wymaga tak du˝ych zasobów komputera, ˝e
w praktyce nie mo˝na go zainstalowaç na kompu-
terach starszych ni˝ trzyletnie. Zmusza to rzesze
u˝ytkowników Internetu do modernizacji lub za-
kupu nowych komputerów. Nowe komputery
umo˝liwiajà dalszà rozbudow´ oprogramowania
itd. Zrozumia∏e jest wi´c, ˝e rozwój technologii in-
ternetowych popiera nie tylko handel, ale tak˝e
producenci komputerów i oprogramowania.
Informacje o autorach
JON BOSAK i TIM BRAY odegrali kluczowà rol´ w tworzeniu XML. Bosak zajmuje si´ two-
rzeniem systemów informatycznych dla Internetu w firmie Sun Microsystems w Mountain
View w Kalifornii. W ramach W3C zorganizowa∏ on grup´ roboczà, która opracowa∏a XML,
i przewodniczy∏ jej. DziÊ jest przewodniczàcym Grupy Koordynujàcej XML w ramach
W3C i przedstawicielem tej grupy w Organization for the Advancement of Structured Infor-
mation Standards. Bray jest wspó∏autorem specyfikacji j´zyka XML 1.0 oraz zwiàzanej z nià
specyfikacji Namespaces in XML. Wspó∏przewodniczy W3C XML Syntax Working Group.
Kierowa∏ tak˝e New Oxford English Dictionary Project w University of Waterloo w 1986 ro-
ku; jest jednym z za∏o˝ycieli Open Text Corporation w 1989, a w 1996 roku za∏o˝y∏ w Vancouver
w Kanadzie firm´ informatycznà Textuality.
Inne obcoj´zyczne
wydania
LE SCIENZE
Piazza della Repubblica, 8
20121 Milano
ITALY
NIKKEI SCIENCE, INC.
1-9-5 Otemachi
Chiyoda-ku,
Tokyo 100-66,
JAPAN
POUR LA SCIENCE
Éditions BELIN
8, rue Férou
75006 Paris
FRANCE
INVESTIGACION Y CIENCIA
Prensa Cientifica, S.A.,
Muntaner, 339 pral. l.a.
08021 Barcelona,
SPAIN
SPEKTRUM DER WISSENSCHAFT
Verlagsgesellschaft mbH
Vangerowstrasse 20
69115 Heidelberg,
GERMANY
KE XUE– Chongqing Branch
Institute of Scientific & Technical
Information of China
P.O. Box 2104
Chongqing, Sichuan
PEOPLES REPUBLIC OF CHINA
MAJALLAT AL-OLOOM
Kuwait Foundation for the
Advancement of Sciences
P.O. Box 20856
Safat, 13069
KUWAIT
290010, Lwów,
ul. Pekarska 69
UKRAINA