Zalewski,P Tim Berners Lee o potędze sieci semantycznej


Zalewski Piotr Internet Standard, 13 lipca 2007
Tim Berners-Lee o potędze Sieci semantycznej
Jak Sieć semantyczna zmieni nasz sposób korzystania z Internetu? Kiedy będzie można mówić o Web 3.0? Dlaczego
neutralność internetu jest ważna? Jak powstało WWW? Na te pytania można znalezć odpowiedzi w wywiadzie jakiego
ojciec WWW, Tim Berners-Lee udzielił dziennikarzowi IDG Peterowi Moonowi.
Zgodnie ze Słownikiem Wyrazów Obcych PWN, "semantyczny" to "dotyczący znaczenia wyrazów,
znaczeniowy". Tim Berners-Lee, człowiek który w 1989 w szwajcarskim ośrodku CERN stworzył podwaliny World
Wide Web, użył tego terminu by ochrzcić nim nową, nadchodzącą sieć Web.
Semantyczna Sieć Web (ang. Semantic Web) to zestaw technologii nad którymi pracuje w Cambridge,
Massachusetts jako dyrektor World Wide Web Consortium. Urodzony w Londynie w 1955 roku, 49 lat pózniej, w 2004
roku został uhonorowany przez królową Elżbietę II tytułem szlacheckim. W naszym ekskluzywnym wywiadzie
wyjaśnia na czym polega jego wizja przyszłości opartej o Semantyczną Sieć Web (nazywaną po polsku również Siecią
semantyczną), wynalazku który jego zdaniem jest nieporównywalny do czegokolwiek wcześniej.
Jak mam się do Pana zwracać - Sir Timothy, Profesorze Timothy czy Panie Berners-Lee?
Możesz mówić do mnie Tim.
A więc Tim, moje pierwsze pytanie jest jak najbardziej oczywiste: Czy mógłbyś wytłumaczyć w kilku prostych
słowach czym jest Sieć semantyczna?
Rzeczywiście, jestem o to pytany dość często. Na początek chcę zwrócić uwagę na pewną kwestię: we
własnym komputerze masz pliki - dokumenty, które możesz przeczytać oraz pliki z danymi, które są używane przez
aplikacje, jak kalendarze, systemy bankowe, arkusze kalkulacyjne. Zawierają one dane, które są używane przez
dokumenty, z których korzysta się poza siecią. I nie można ich w sieci Web umieścić.
Na przykład, jeśli oglądasz stronę WWW, to możesz znalezć na niej informacje o wykładzie czy imprezie,
w której chciałbyś uczestniczyć. To wydarzenie odbywa się w określonym miejscu, o określonej porze, wiadomo, że
jest grupa ludzi z nim związana. Jednak Ty musisz najpierw przeczytać treść strony, następnie oddzielnie otworzyć
kalendarz i wpisać potrzebne informacje. Jeśli ponownie chcesz trafić na stronę zawierającą informacje o imprezie, to
musisz jeszcze raz wpisać jej adres. Jeśli chcesz uzyskać informacje biznesowe dotyczące uczestników to musisz
wyciąć informacje ze strony i wkleić do swojej książki adresowej, ponieważ dane z książki, z danymi ze strony WWW
nie są w żaden sposób zintegrowane.
A więc Semantyczna Sieć Web opiera się na integracji informacji.
Kiedy korzystasz z aplikacji, powinieneś mieć możliwość umieszczenia w niej danych, które możesz
odpowiednio konfigurować. Powinieneś mieć możliwość poinformowania swojego komputera "idę na tę imprezę".
A gdy to mówisz, to maszyna rozumie tę informację. Semantyczna Sieć Web polega na umieszczaniu plików
zawierających dane w sieci Web. To nie tylko sieć dokumentów, ale także informacji, danych, treści. Semantyczna Sieć
danych, powinna zawierać możliwie dużo aplikacji, które komunikują się ze sobą. Po raz pierwszy powstanie jeden
powszechny format danych dla wszystkich aplikacji, baz danych i stron WWW.
Semantic Web w Wikipedii
Semantic Web - jest to projekt, który ma przyczynić się do utworzenia i rozpowszechnienia standardów opisywania
treści w Internecie w sposób, który umożliwi maszynom i programom (np. tzw. agentom) przetwarzanie informacji
w sposób odpowiedni do ich znaczenia. Wśród standardów Semantic Web znajdują się m.in. OWL, RDF, RDF Schema
(inaczej RDFS). Znaczenia zasobów informacyjnych określa się za pomocą tzw. ontologii.
Semantic Web jest wizją Tima Bernersa-Lee (twórcy standardu WWW i pierwszej przeglądarki internetowej,
a także przewodniczącego W3C). W swoich założeniach Semantic Web ma korzystać z istniejącego protokołu
komunikacyjnego, na którym bazuje dzisiejszy Internet. Różnica miałaby polegać na tym, że przesyłane dane mogłyby
być 'rozumiane' także przez maszyny. Owo 'rozumienie' polegałoby na tym, że dane przekazywane byłyby w postaci,
w której można by powiązać ich znaczenia między sobą a także w ramach odpowiedniego kontekstu.
Informacje przekazywane w ramach Semantic Web wymagałyby nie tylko samych danych, ale także
informacji o tychże (tzw. meta-danych). To właśnie meta-dane zawierałyby sformułowania dotyczące relacji między
danymi oraz prawa logiki, które można do nich zastosować. Dzięki temu można by:
* powiązać różne dane znajdujące się w Internecie w ramach wspólnych jednostek znaczeniowych (np. strony dotyczące
filmów, dziedzin nauki, kuchni francuskiej, etc.)
* rozróżnić dane, które dla maszyn są w tej chwili nierozróżnialne ze względu na identyczny zapis tekstowy (np. zamek
- urządzenie do zamykania drzwi; urządzenie do łączenia w ustalonym położeniu elementów ubrania; okazała budowla
mieszkalno-obronna)
* przeprowadzać na tychże danych wnioskowania , tzn. otrzymywać informacje na ich temat, które nie są zawarte
'explicite' (np. na podstawie danej "Ewa jest żoną Adama", możemy też dowiedzieć się, że Ewa jest kobietą, Adam
mężczyzną, Adam jest mężem Ewy, żaden inny mężczyzna nie jest mężem Ewy, etc.)
s.
1
Zalewski Piotr Internet Standard, 13 lipca 2007
Czy to Ty zaproponowałeś termin "Sieć semantyczna"? Można o niej mówić Web 3.0? Jaka jest różnica między
Web 2.0 a Web 3.0?
Tak, to byłem ja. Napisałem o tym w 1999 roku w mojej książce "Weaving the Web". Web 2.0 to termin, za
pomocą którego określa się przede wszystkim sposób korzystania z sieci Web. Mamy treści tworzone przez
użytkowników i osoby logujące się do serwisów Web. Mamy nadających etykiety, wysyłających zdjęcia, tworzących
serwisy społecznościowe. A więc Web 2.0 dotyczy przede wszystkim sieci Web opartej na społecznościach. Nie ja
wymyśliłem ten termin. Pierwszy raz zaproponował go Tim O'Reilly w 2003 roku.
Jeśli chodzi o Web 3.0 to niektórzy używają tego słowa mówiąc o nadchodzącej nowej architekturze sieci.
Niektórzy mają na myśli nadchodzące regulacje dotyczące technologii WWW. Jednak trzeba się skupić przede
wszystkim na przyszłości technologii Web. Powszechny problem, który dotyczy zasobów w wersji 2.0, jest taki, że
informacje, które oglądamy nie znajdują się na witrynie, a w bazie danych. Tak naprawdę one nie są w sieci Web.
A więc ludzie nie mogą ich wykorzystać ponownie i przetworzyć. Możesz mieć profesjonalną stronę WWW
z informacjami o twoich przyjaciołach, kolegach i ludziach z którymi pracujesz oraz trafić na inną stronę WWW
dotyczącą innych społeczności. Przy Web 2.0 nie masz pełnego obrazu, nikt nie ma pełnego obrazu. Niektórzy twierdzą,
że Web 3.0 nastąpi wtedy, gdy twoja witryna pokaże dane, które możesz w dowolny sposób dostosować do swoich
potrzeb. Na przykład, jeśli jakiś z serwisów, które korzystają z technologii Web, będzie zawierał istotne dane dotyczące
jednego z moich przyjaciół, to ja będę mógł rozkazać komputerowi: "Pobierz te informacje, przejrzyj je i dodaj do
danych, które mam na ten temat z innych witryn. Następnie przedstaw tę osobę z szerszej perspektywy.".
Na czym polega różnica między siecią Web opartą na dokumentach, a siecią Web opartą na danych?
Tych różnic jest wiele. Wezmy na przykład dane bankowe. Można je oglądać na dwa sposoby. Jeśli po prostu
oglądasz stronę internetową, to nie różnią się one wiele od takich, które mógłbyś przeczytać na zwykłej kartce papieru.
Jeśli oglądałbyś je na witrynie Web 3.0 to być może mógłbyś skorzystać z wyszukiwania Java zmieniając kolejność
danych i mieć do nich znacznie lepszy dostęp.
Dzisiaj, jeśli przygotowujesz się do czegoś, np. zapłacenia podatku, to używasz oprogramowania typu
Quicken czy MS Money. Gdy to robisz, to przecież nie uruchamiasz strony internetowej, ale jakiś zbiór danych.
Właśnie na tym polega różnica między danymi a dokumentami. Gdy patrzysz na swoje dane bankowe w postaci
dokumentu to właściwie możesz je tylko przeczytać. Kiedy pracujesz z prawdziwymi danymi, to możesz się dowiedzieć
np. - ile podatku musisz zapłacić, jak wysokie masz rachunki. Możesz robić mnóstwo rzeczy.
Nie mamy możliwości robienia tego z danymi w sieci Web. Jeśli można by to zrobić z danymi, to ich
charakterystyka wytworzyłaby standard, który działałby tylko w bankach. Taki finansowy standard dla danych
bankowych. Zupełnie odrębne będą standardy dla, dajmy na to, kalendarzy. To czego nie można zrobić dzisiaj, to
zapytać komputera "Kiedy wypisałem ten czek? Kiedy miałem tamto spotkanie?". Nie możesz połączyć ze sobą
pojedynczych informacji z różnych zbiorów danych, dopóki nie będziesz używał Semantycznej Sieci Web.
Semantyczna sieć jest znacznie potężniejsza, ponieważ można połączyć ludzi i dane dotyczące osób, miejsc, czy czasu.
Ale czy to niczym nieskrępowane połączenie pomiędzy danymi personalnymi, firmowymi i rządowymi, nie
spowoduje, że ludzie zaczną się poważnie obawiać zagrożenia prywatności?
Tak. Nawet ja mam podobne obawy! Istotnym aspektem technologii Semantycznego Web jest technologia
którą nazwaliśmy "pochodzenie" (ang. provenance) - skąd pochodzi informacja i w jaki sposób może być użyta. Nasza
grupa badaczy z MIT pracuje nad systemem, który pokaże jakie są dozwolone sposoby wykorzystania tej informacji,
sprawdzi skąd ona pochodzi, poinformuje co może oznaczać i zabezpieczy przed użyciem w niewłaściwy sposób.
Nadaliśmy tej właściwości nazwę "odpowiedzialności informacyjnej" (ang. information accountability).
Żeby określić moje preferencje co do tego, jak mogą być używane moje prywatne dane, będę pewnie musiał
posiadać jakieś umiejętności techniczne. Czy nie będzie to barierą dla wielu osób?
Po pierwsze, jeśli używasz prywatnych danych w Sieci semantycznej, to nie są one dostępne w sieci Web.
Masz swoją prywatną sieć Web dla wszystkich danych i wykorzystujesz ją do nawigacji lokalnej. Nie umieszczasz ich
w ogólnodostępnym Internecie. Wiele narzędzi, jak Quicken czy MS Money, jest zaprojektowane do pracy lokalnej,
a dane wymieniane są z bankiem za pomocą bezpiecznego kanału. W takim wypadku nie korzystasz z technologii Web,
nie wędrujesz po Internecie, nie umieszczasz w sieci prywatnych danych.
Mówimy o tym, że możesz łączyć na swoim pulpicie informacje osobiste - do których masz prawa, te
informacje firmowe, do których masz prawa oraz informacje dostępne publicznie, w całym swoim bogactwie.
Mówiłeś, że ludzie będą potrzebowali dodatkowych umiejętności by poradzić sobie z tymi danymi. Czasami
rzeczywiście tak jest. Na przykład, żeby korzystać z kalendarza stwarzasz nowe dane, zgadza się? Kiedy tworzysz
książkę adresową, również powstaje informacja. Te rozwiązania mają interfejsy, które pozwalają zrobić zawsze to
czego potrzebujesz i nigdy nie będziesz mieć problemów z danymi, chyba, że używasz niekompatybilnego
oprogramowania. Obecnie pracujemy nad tym, by opracowywana przez nas technologia była dostępna dla firm
i organizacji pracujących nad dużą liczbą dokumentów. To prawda, że nie mamy jak na razie rozwiązań, z których
w łatwy sposób mogłyby korzystać małe dzieci, czy ich babcie. Jednak i nad tym pracujemy. Mamy zespół, który
s.
2
Zalewski Piotr Internet Standard, 13 lipca 2007
zajmuje się tylko tym, by ludzie, normalni ludzie, mogli pracować ze swoimi danymi.
Czy w momencie kiedy Sieć semantyczna będzie już w pełni działała, nadejdzie czas drugiego boomu
internetowego?
W pewnym sensie olbrzymie zainteresowanie Internetem na nowo już się zaczęło, a sieć na pewno nie
osiągnęła jeszcze swojego pełnego potencjału. A istnieje już prawie 16 lat. Semantyczny Web zdobędzie popularność
kiedy ludzie zaczną z niego korzystać do przetwarzania danych, kiedy zaczną korzystać z niego na coraz to nowe
sposoby, dodając dane własne czy korzystając z danych rządowych. Myślę, że to zajmie wiele lat.
Na czym polega neutralność Internetu? Jaki masz do niej stosunek?
W skrócie neutralność Internetu polega na tym, że jeśli ja zapłacę za dostęp do sieci, i ty zapłacisz za dostęp,
to możemy się skomunikować, bez względu na to kim jesteśmy. W tej chwili jesteśmy świadkami dziejowego momenty
w rozwoju Internetu, a więc eksplozji popularności wideo, czego najlepszym przykładem jest YouTube.
Załóżmy teraz, że jestem w Massachusetts i chcę znalezć brazylijski film. Idę do Internetu gdzie odnajduję
moją ulubioną niezależną produkcję. Jednak firma z Massachusetts blokuje transmisję i mówi: "Nie możemy Ci na to
pozwolić, ponieważ to my sprzedajemy filmy. Tak, dajemy dostęp do Internetu, ale nie do oglądania filmów. Chcemy
kontrolować jakie filmy możesz kupić."
Mamy też przykłady firm telekomunikacyjnych, które chciały blokować usługi telefonii internetowej. Jestem
tym zmartwiony i wraz z kilkoma innymi zaangażowanymi ludzmi robię co mogę żeby do tego nie doszło. Myślę, że
bardzo ważne jest, by Internet był otwarty dla wszystkich, bez względu na to kim się jest. Właśnie na tym polega
neutralność sieci. Bardzo ważne by Internet na zawsze taki pozostał.
W 2003 r. kilka państw zaproponowało, by Internet był administrowany międzynarodowo, przez organizacje
podobne do Unii Europejskiej czy Organizację Narodów Zjednoczonych. Czy Waszyngton kiedykolwiek zgodzi
się na coś takiego?
Myślę, że z biegiem czasu w przestrzeń Internetu będzie wkraczać coraz więcej biurokracji. To nieuchronne.
Ważne żeby ludzie z różnych rejonów, z krajów rozwijających się, mieli dostęp do Internetu możliwie szybko. Jednak
administrowanie czymś tak ogromnym przez jedną machinę biurokratyczną nigdy nie będzie możliwe. Na razie nie
wiadomo nawet, jaką formę miałoby przyjąć takie zarządzanie. Mogę jednak powiedzieć, że bardzo ważne by sieć była
wolna od rządowych zapędów, a internauci od cenzury.
Powiedziałeś kiedyś, że WWW powstało, by zniwelować frustracje jakie napotykałeś w CERN. Na czym polegały
te frustracje, jak powstała sieć Web?
CERN to wspaniała mieszanka kultur - zjeżdżają się tam ludzie z całego świata, by zająć się swoją pasją, czyli
fizyką. W 1989 roku napisałem notatkę, w której wyjaśniłem jakby to było gdyby istniała sieć Web, wspomniałem m.in.
o hipertekście, o tym, że można dodawać i modyfikować dane. Chodziło mi o to, żeby cała informacja zawarta w sieci
CERN była łatwo dostępna. Chciałem stworzyć narzędzia, dzięki którym ludzie mogą wspólnie korzystać z informacji.
By mogli razem tworzyć oprogramowanie, czy planować eksperymenty naukowe.
A więc sieć była od początku zaprojektowana po to, by można było wspólnie projektować. Pierwszymi
narzędziami była przeglądarka i edytor stron, dzięki którym pracownicy CERN mogli przeczytać dokument, poprawić
go, a następnie przesłać, dodając odnośniki do innych stron powiązanych tematycznie.
A frustracja wzięła się stąd, że chciałem mieć możliwość wygodnej pracy z ludzmi z innych krajów, w których
używali innych maszyn, innych systemów bazodanowych i i gdzie zapisywali dane w innych formatach.
Wielu badaczy zarobiło na sieci miliony, jednak ty zawsze wolałeś skupić się na standardach rozwoju sieci. Nie
uważasz, że straciłeś życiową szansę, ponieważ nie opatentowałeś projektu Web?
Nie, ponieważ, gdyby Web było prawnie zastrzeżone to ludzie nigdy by go nie używali i nie przyczynili by się
do jego rozwoju. Projekt nigdy by nie opuścił laboratorium, a dzisiaj byśmy o nim nie rozmawiali.
Niektórzy ludzie, jak Nova Spivak czy współzałożyciel Microsoft Paul Allen przedstawiają oś czasu, na której
zaznaczone są przyszłe momenty rozwoju sieci, Web 3.0 ma się pojawić w okolicach roku 2010, a Web 4.0 w
okolicach r. 2020. Czy wyobrażasz sobie jak miałoby wyglądać Web 4.0?
Nie, zupełnie nie. Ja myślę o prawdziwej technologii. Nie wymyśliłem terminu Web 3.0. Sieć się nieustannie zmienia.
Jeśli chcesz wiedzieć co interesuje mnie obecnie, to jest to kilka technologii powiązanych ze sobą. W przypadku Web
2.0 jest kilka technologii jak JavaScript, czy inne, które są standardami umożliwiającymi ludziom robienie różnorakich
rzeczy. Te standardy, które pojawiają się dzisiaj, przyspieszą rozwój mobilnegoWeb, który umożliwia korzystanie z
sieci na bardzo wielu różnych urządzeniach.
W przyszłości będziemy mieli Semantyczną Sieć Web, która umożliwi tworzenie całego mnóstwa nowych
rzeczy. Jedna z ciekawszych cech technologii sieciowych jak Internet, Web czy Semantyczny Web, polega na tym, że
ludzie, którzy ich używają, przekraczają najśmielsze wyobrażenia twórców tych technologii. Wezmy choćby Vintona
s.
3
Zalewski Piotr Internet Standard, 13 lipca 2007
Cerfa i Roberta Kahna, którzy w 1974 wynalezli protokół TCP/IP, umożliwiający komunikację komputerów w sieci
Internet.
Kiedy ja wynalazłem Web, to myślałem głównie o infrastrukturze. Zaprojektowałem go jako podstawę wielu
rzeczy. Web 2.0, sieci społeczne i masa innych rzeczy, działają na samym wierzchołku tego co stworzyłem. Kiedy
Semantyczny Web za parę lat zagości w naszych domach, będzie wykorzystywany do rzeczy, o których dzisiaj nie
możemy mieć pojęcia. Innymi słowy, naiwne jest wyobrażanie sobie jak będzie wyglądał Web 4.0, kiedy nawet nie
wiemy do czego zostanie wykorzystany Web 3.0.
Aby Web 3.0 odniosło sukces, ludzie którzy dzisiaj studiują muszę mieć pomysły na wykorzystanie nowej
technologii. I będą projektować fantastyczne rzeczy. Analogicznie do tego, jak fenomenalne projekty Web 2.0 powstają
dzisiaj. Ludzie pracujący z Semantyczną Siecią Web, będą tworzyć rzeczy znacznie potężniejsze. Trudno je sobie
wyobrazić. My musimy budować taką sieć Web, żeby stanowiła przede wszystkim dobrą infrastrukturę. I nigdy nie
powinna być używana do jakichś specyficznych, ściśle określonych celów. Powinna być jedynie fundamentem dla
przyszłych projektów.
Przekład tekstu "The future of the Web as seen by its creator", Peter Moon, IDG Now (Brazil). Tytuł oraz wstęp od
redakcji.
s.
4


Wyszukiwarka

Podobne podstrony:
Sieci komputerowe wyklady dr Furtak
Ogolne zasady proj sieci wod kan
sieci
Sieci elektroenergetzcyne
punkty sieci po tyczMx
Sieci telekomunikacyjne Łączność bezprzewodowa
monter sieci i urzadzen telekomunikacyjnychr5[02] z2 01 n
ZWYCIĘSTWO W SIECI
Lee Smith Fifth Element
4 Sieci komputerowe 04 11 05 2013 [tryb zgodności]

więcej podobnych podstron