50 Â
WIAT
N
AUKI
Maj 1997
W
ostatnich latach za sprawà
handlu mi´dzynarodowego
i filmów z Hollywood wzrós∏
wp∏yw kultury amerykaƒskiej na resz-
t´ Êwiata. Poniewa˝ Internet dociera do
coraz bardziej odleg∏ych zakàtków glo-
bu, rodzi si´ oczywiste pytanie: czy
wzmocni si´ tendencja do powszechne-
go u˝ywania j´zyka angielskiego? A
mo˝e sieciowy Êwiat zostanie wzboga-
cony raczej przez ró˝norodnoÊç j´zy-
ków? Niektórzy obserwatorzy uwa˝a-
jà, ˝e j´zyki lokalne w cyberÊwiecie nie
przetrwajà: zapanuje angielski.
Taka absolutna dominacja b´dzie
mia∏a negatywne skutki uboczne. Wi´k-
szoÊç ludzi u˝ywa angielskiego jako
drugiego j´zyka i jego znajomoÊç bywa
bardzo podstawowa, wystarczajàca za-
ledwie, by zrozumieç prognoz´ po-
gody, a nawet i to nie zawsze. Podczas
powa˝niejszych dyskusji niemal wszy-
scy wykazujà sk∏onnoÊç do wypowia-
dania si´ w swoim ojczystym j´zyku.
JeÊli Internet uniemo˝liwi wieloj´zy-
czny dialog, jego rola jako narz´dzia
u∏atwiajàcego mi´dzynarodowe kon-
takty ulegnie powa˝nemu ogranicze-
niu. Szerzyç si´ b´dà b∏´dy i niepo-
rozumienia, a wielu u˝ytkowników zo-
stanie odci´tych od niebywa∏ych mo-
˝liwoÊci, jakie oferuje komunikacja
globalna.
W przysz∏oÊci b´dziemy z pewnoÊcià
mieli do czynienia z kilkoma czynnikami,
które wp∏ynà negatywnie na zró˝nico-
wanie j´zyków w Internecie. Obecnie
oko∏o 60% komputerów pod∏àczonych
do Internetu znajduje si´ w Stanach Zjed-
noczonych. Poza Amerykà Pó∏nocnà
i niektórymi krajami Europy wi´kszoÊci
pod∏àczeƒ do Internetu dokonano nie-
dawno i majà one ograniczony charak-
ter. Jednak liczba po∏àczeƒ mi´dzy kom-
puterami wzrasta wsz´dzie. Wraz ze
zmniejszaniem si´ kosztów instalacji sie-
ci komunikacyjnych populacja u˝ytkow-
ników Internetu stanie si´ to˝sama z po-
pulacjà posiadaczy komputerów.
Dzi´ki niskim kosztom i teoretycz-
nie nieskomplikowanym zasadom u˝yt-
kowania Internet umo˝liwia niektórym
z piszàcych, zw∏aszcza u˝ywajàcym al-
fabetu ∏aciƒskiego, publikowanie lub
wymian´ informacji w ich ojczystym
j´zyku. Niektórzy z popu-
laryzatorów rodzimych j´-
zyków ju˝ teraz wykorzystu-
jà to medium do swoich ce-
lów. Na przyk∏ad oko∏o 30%
wszystkich dokumentów pu-
blikowanych w j´zyku fran-
cuskim pochodzi z Quebecu,
mimo ˝e francuskoj´zyczni
Kanadyjczycy stanowià zale-
dwie 5% ludzi mówiàcych
w tym j´zyku. Globalny cha-
rakter Internetu promuje rów-
nie˝ j´zyk, który jest, przynaj-
mniej z grubsza, zrozumia∏y
przez najwi´kszà liczb´ ludzi.
Dlatego jestem przekonany,
˝e skutkiem b´dzie upo-
wszechnienie dzi´ki Interne-
towi j´zyków miejscowych
w komunikacji lokalnej i j´-
zyka angielskiego w ograni-
czonych kontaktach mi´dzy-
narodowych.
OczywiÊcie trudnoÊci tech-
niczne podczas prób komu-
nikowania si´ w wi´kszoÊci
j´zyków sà niebagatelne.
Sprz´t i oprogramowanie zo-
sta∏y zaprojektowane z my-
Êlà o przetwarzaniu tekstów angielskich.
Problemy pojawiajà si´ nawet podczas
u˝ywania standardowych znaków ∏a-
ciƒskich. W poczàtkach istnienia Arpa-
netu, poprzednika Internetu, pocztà
elektronicznà mo˝na by∏o przesy∏aç tyl-
ko teksty w siedmiobitowym kodzie
ASCII. (W kodzie tym ka˝demu ze 128
znaków odpowiada siedmioelemento-
wy ciàg zer i jedynek.) Obecnie Mi´dzy-
narodowa Organizacja Standaryzacji
RAPORT SPECJALNY
WIELOJ¢ZYCZNOÂå
W INTERNECIE
Bruno Oudet
SERWER WYKORZYSTUJÑCY UNICODE, standard kodowania Êwiatowych alfabetów, mo˝e przed-
stawiç na ekranie tekst w wybranym j´zyku.
ALIS TECHNOLOGIES
Â
WIAT
N
AUKI
Maj 1997 51
(ISO) zaleca u˝ywanie standardu ISO-
-Latin, co jest technicznie mo˝liwe dzi´-
ki oÊmiobitowemu protoko∏owi Extend-
ed Simple Mail Transport Protocol.
W ISO-Latin mo˝na zapisaç 256 znaków
– pozwala to na wyÊwietlanie znaków
wyst´pujàcych we wszystkich zachod-
nioeuropejskich j´zykach. Niestety, po-
niewa˝ wiele pod∏àczonych do sieci
komputerów jest wyposa˝onych w
przestarza∏e oprogramowanie, ósmy
bit czasem si´ gubi, co sprawia, ˝e ko-
munikat staje si´ prawie nieczytelny.
W 1995 roku wysy∏a∏em za poÊredni-
ctwem Internetu codzienne wiadomo-
Êci po francusku do 12 tys. u˝ytkowni-
ków: 8.5 tys. z nich prosi∏o o wersj´
w siedmiobitowym kodzie ASCII za-
miast w oÊmiobitowym ISO-Latin.
Mimo ˝e niektóre z najnowszych
programów mogà porozumiewaç si´
z u˝ytkownikiem w wielu j´zykach,
wi´kszoÊç jest zasadniczo dwuj´zycz-
na: „zna” j´zyk lokalny, na przyk∏ad ja-
poƒski, oraz angielski. KtoÊ móg∏by
stwierdziç, ˝e techniczne przeszkody
zwiàzane ze stosowaniem innych alfabe-
tów majà charakter przejÊciowy. Stop-
niowo wprowadza si´ Unicode (ISO
10646), standard umo˝liwiajàcy zako-
dowanie znaków wi´kszoÊci j´zyków
Êwiata. Pozwala on na otrzymywanie
komunikatów w niemal dowolnym j´-
zyku (choç nie zawsze bedà one w∏aÊci-
wie wyÊwietlone na ekranie).
Jednak do prawdziwie wieloj´zyczne-
go Internetu, w którym autor po prostu
w∏àczy cytat z greki do rosyjskiego tek-
stu, a ca∏y dokument da si´ prawid∏owo
odczytaç na komputerze w Ameryce Po-
∏udniowej, droga jeszcze daleka. Poja-
wiajà si´ ju˝ standardy oprogramowa-
nia z takimi mo˝liwoÊciami. Niestety,
najwi´ksi producenci programów, wal-
czàc o dominacj´ na rynku i tworzàc co-
raz to nowe wersje swoich produktów,
nie dajà w tym wyÊcigu prawie ˝adnych
szans ma∏ym z regu∏y firmom opraco-
wujàcym programy wieloj´zyczne.
W codziennym ˝yciu pomocà w prze-
kraczaniu barier j´zykowych s∏u˝à t∏u-
macze. Mo˝na ich równie˝ wykorzystaç
w Internecie, ale ze wzgl´du na obfitoÊç
i ró˝norodnoÊç korespondencji nie ode-
grajà znaczàcej roli. Tylko t∏umaczenia
maszynowe mogà przybli˝yç nas do
Êwiata, byç mo˝e utopijnego, w którym
wszyscy uczestnicy wirtualnej Kon-
ferencji Narodów Zjednoczonych b´dà
u˝ywali swoich ojczystych j´zyków,
a ich wypowiedzi w symultanicznym
przek∏adzie stanà si´ dost´pne w po-
zosta∏ych j´zykach.
Badania nad maszynowym t∏umacze-
niem trwajà ju˝ od przesz∏o 50 lat z ró˝-
nymi wynikami. Liczba rzeczywiÊcie
u˝ywanych systemów jest niewielka,
a zlokalizowane sà one g∏ównie w Japo-
nii, Kanadzie i Europie, która boryka si´
z najliczniejszymi problemami w kwestii
wieloj´zycznych t∏umaczeƒ. Elektronicz-
ni t∏umacze sà z regu∏y dwuj´zyczni.
Muszà to byç narz´dzia bardzo specja-
listyczne, aby uzyskiwane dzi´ki nim
zgrubne t∏umaczenia nadawa∏y si´ do
redagowania.
Pierwszym powszechnie dost´pnym
systemem by∏ Systran. Móg∏ on t∏uma-
czyç 14 „par” j´zyków i by∏ dost´pny
ju˝ w roku 1983 we francuskiej sieci Mi-
nitel. Systran jest obecnie wykorzysty-
wany przez Komisj´ Europejskà, dla
której t∏umaczy setki tysi´cy stron rocz-
nie. Innym pozytywnym przyk∏adem
jest system Meteo, s∏u˝àcy do przek∏ada-
nia kanadyjskich biuletynów meteoro-
logicznych z angielskiego na francuski
i odwrotnie. System ten przetwarza 80
tys. s∏ów (oko∏o 400 biuletynów) dzien-
nie i wymaga tylko 3–5 ingerencji redak-
cyjnych na ka˝de 100 s∏ów.
Wieloj´zyczne t∏umaczenia skorzy-
stajà z opracowywanej w∏aÊnie przez
kilka zespo∏ów metody dwustopniowej.
Tekst jest najpierw dok∏adnie analizo-
wany i dzielony na cz´Êci sk∏adowe (ty-
tu∏, akapit, zdanie), a wàtpliwoÊci, jeÊli
to mo˝liwe, wyjaÊnia si´ w kontaktach
osobistych z autorem. Nast´pnie doko-
nuje si´ t∏umaczenia na poÊrednià, ab-
strakcyjnà reprezentacj´, która z kolei
jest podstawà przek∏adów na wiele ró˝-
nych j´zyków. Wysi∏ek si´ op∏aca, gdy
tekst trzeba przet∏umaczyç na wi´cej ni˝
10 j´zyków. Uniwersytet Narodów Zjed-
noczonych w Tokio og∏osi∏ niedawno
dziesi´cioletni program wspó∏pracy
w celu implementacji takiego w∏aÊnie
dwustopniowego systemu.
Tak naprawd´ jednak wieloj´zyczny
Internet zaistnieje dopiero dzi´ki zorga-
nizowanemu mi´dzynarodowemu wy-
si∏kowi. Czy sprawa ta oka˝e si´ dla
wszystkich priorytetowa? Odpowiedê
nie jest oczywista. Du˝o ∏atwiej zdecy-
dowaç si´ na angielski.
T∏umaczy∏
Edwin Bendyk
BRUNO OUDET przewodzi francu-
skiej sekcji Internet Society. Uzyska∏
tytu∏ doktora nauk ekonomicznych we
Francji i Stanach Zjednoczonych. Jest
profesorem w Uniwersytecie im. Jose-
pha Fouriera w Grenoble i prowadzi bada-
nia w Laboratorium Leibniza w IMAG
Institute.
Inne wydania obcoj´zyczne:
LE SCIENZE
Piazza della Repubblica, 8
20121 Milano
ITALY
NIKKEI SCIENCE, INC.
1-9-5 Otemachi
Chiyoda-ku,
Tokyo 100-66,
JAPAN
POUR LA SCIENCE
Éditions BELIN
8, rue Férou
75006 Paris
FRANCE
INVESTIGACION Y CIENCIA
Prensa Cientifica, S.A.,
Muntaner, 339 pral. l.a.
08021 Barcelona,
SPAIN
SPEKTRUM DER WISSENSCHAFT
Verlagsgesellschaft mbH
Vangerowstrasse 20
69115 Heidelberg,
GERMANY
KE XUE– Chongqing Branch
Institute of Scientific & Technical
Information of China
P.O. Box 2104
Chongqing, Sichuan
PEOPLES REPUBLIC OF CHINA
MAJALLAT AL-OLOOM
Kuwait Foundation for the
Advancement of Sciences
P.O. Box 20856
Safat, 13069
KUWAIT