racji zadań przez użytkowników w obrębie ograniczonej usługi serwisu. Jest io ocen z organizacyjnego lub technicznego punktu widzenia. Tymczasem użytkownik nie wij/ globalnej biblioteki cyfrowej jako pojedynczej instytucji czy współdziałających zasobów nieudanych, lecz jako globalny zbiór przydatnych mu dokumentów, w związku z czym bardziej użyteczne byłoby podejście holistyczne. Badania holistyczne mogłyby dotycźyó użytkownika, na przykład nauczyciela akademickiego przygotowującego zajęcia.« p0. legać na obserwacji wszystkich narzędzi, które ta osoba wykorzystuje (a me tylko |yc|, które oferuje jakaś biblioteka tradycyjna lub serwis GBC) i sprawdzaniu ich efektywności we wzajemnych kombinacjach.
Zwolennikiem holistycznego podejścia do oceny bibliotek cyfrowych jest Scott Niebo), son. który przedstawił koncepcję takiej oceny z kilku punktów widzenia: użytkownika, bibliotekarza, decydenta [Nicholson 200*1], Ocenę prowadzić można za pomocą matrycy te. matów i punktów widzenia na ocenę (elementy składowe systemu, efektywność systemu, użyteczność systemu, sposób posługiwania się systemem, interakcje z użytkownikiem)] dzięki której wybierane są: przedmiot i sposób oceny. Zastosowanie takiego modelu po! zwala na uzyskanie interesujących danych z każdej perspektywy i o wszystkich zagadnie, niach. Nic daje on możliwości zastosowania jednej miary oceny, gdyż tylko jednoczesne użycie wielu miar może pozwolić na holistyczne zrozumienie całego systemu.
Duże znaczenie dla przyszłego rozwoju GBC. jako internetowej infrastruktury wie-dzy. ma idea Semantycznego Webu. Jest on nową generacją Webu, którego twórcy starają się używać takiej reprezentacji informacji, aby była ona zrozumiała nie tylko dla ludzi, ale takie dla maszyn i nie tylko do celów poprawnego jej wyświetlania, ale również dla automatycznego stosowania, integracji i wielokrotnego wykorzystania przez wiele aplikacji. jest to jeden z najbardziej nośnych tematów badawczych ostatnich lat, z pogranicza sztucznej inteligencji i sieci rozległych - i jedna z głównych sfer działalności World Wide Web Consortium (W3C)14.
U podstaw Semantycznego Webu leży zmiana sposobu myślenia o danych [Daconta, Obst. Smith 2003, s. 2). Początkowo były one zamknięte w odrębnych aplikacjach; uważano je za wtórne w stosunku do przetwarzania danych. Tego typu niepoprawne podejście doprowadziło do zjawisk, które były przyczyną powstania wyrażenia GIGO”, wskazującego na zależność pomiędzy jakością danych i rezultatami ich przetwarzania. Oznacza ono. że dobre oprogramowanie jest całkowicie zależne od jakości danych. Informatycy zauważyli to. co dla bibliotekarzy zawsze było oczywiste: że dane są najważniejsze, muszą więc być odpowiednio weryfikowane i chronione. Semantyczny Web ma zapewniać obsługę danych w Sieci na poziomie odpowiadającym zakresem zarządzaniu danymi w bibliotekach [Grcenbcrg 2007, s. 207J. W tym celu powstały obiektowe języki programowania. stawiające dane na pierwszym miejscu. Wciąż jednak dane zamknięte były w poszczególnych aplikacjach, więc ich dostawcy mogli zamykać dostęp do danych, na przykład dla zwiększenia swojej konkurencyjności. Wraz z rozwojem Internetu i Webu. takich narzędzi jak XMLoraz Semantycznego Webu, dane uwalniane są z poszczególnych aplikacji. Ukierunkowanie ku danym przetwarzanym automatycznie wymusza tworzenie bardziej inteligentnych systemów, w tym serwisów GBC.
“ hiip://www.w3.org/,
*' GIGO - skrót od „gatbage in. garbage out", czyli śmieci na wejściu, śmieci na wyjściu (chodzi o wejście i wyjście systemu przetwarzania danych).
Semantyczny Web ma być środowiskiem, w którym dane będą hardziej zrozumiale dla komputerów dzięki strukturalnemu opisowi ich zawartości. Jego elementem jc- t równie? infrastruktura tworzona dla „inteligentnych" agentów (oprogramowanie), przemierzaj,j-tych Web w celu wykonywania złożonych działań na danych dla .woich użytkowników, co pociąga za sobą potrzebę pełnej integracji agentów z Webem i optymalne wykorzystanie jego infrastruktury (wysyłanie komunikatów, bezpieczeństwo, uwierzytelnienie, usługi katalogowe i zasady usług aplikacyjnych). W Semantycznym Webie następuje jawna deklaracja wiedzy, zawartej w aplikacjach Webowych, inteligentna integracja informacji semantyczny dostęp do Internetu i automatyczne pobieranie informacji z tekstu l.sługi Web współdziałają ze sobą na wielką skalę, dzięki czemu powstaje Web usług mterpre-towalnych przez komputery, wyszukiwanych, wykonywanych i komponowanych przez inteligentnych agentów.
Można wyróżnić cztery etapy wzrostu „inteligencji" danych, od najprostszych do danych zawierających ilość informacji wystarczającą do prowadzenia maszynowych wnioskowań na ich temat:
• Teksty i bazy danych przed XML. Jest to etap początkowy, gdzie większość danych podporządkowuje się aplikacji. Inteligencja dotyczy więc raczej aplikacji, niż danych.
• Dokumenty XMLdla określonych zastosowań (dziedzin). Na tym etapie dane uniezależniają się od aplikacji w obrębie określonej dziedziny. Mogą przemieszczać się między aplikacjami, ich semantyka jest automatycznie interpretowana przez narzędzia indeksujące.
• Przestrzenie nazw, takie jak taksonomie i inne słowniki kontrolowane, przypominające tradycyjne JIW, stosowane w SIW. Na tym etapie dane mogą pochodzić z różnych dziedzin i zastosowań. Są one klasyfikowane za pomocą hierarchicznych taksonomii, które mogą być także wykorzystywane do wyszukiwania danych. Taksonomia opisuje relacje pomiędzy poszczególnymi kategoriami danych.
• Metadane, pozwalające na identyfikację oraz wykorzystanie relacji pomiędzy obiektami. W coraz większym stopniu tworzone są automatycznie (zob. p. 4.2),
• Ontologic i reguły (zob. p. 2.7). Ostatni etap pozwala na wnioskowanie nowych danych z danych istniejących na podstawie reguł wnioskowania, stanowiących łącznic model dziedziny. Dane są opisywane przez relacje i skomplikowane wyrażenia formalne, na których wykonywane są operacje logiczne. Na tym etapie nie istnieją już one jako pojedyncze, odrębne jednostki, lecz jako skomplikowany mikrosystem.
Semantyczny Web związany jest z danymi „inteligentnymi"; jest to maszynowo przetwarzana sieć inteligentnych danych, niezależnych od aplikacji, łączliwych, sklasyfikowanych, stanowiących część większego systemu (ontologii) [Daconta, Obst, Smith 2003, s. 4]. Dla umożliwienia realizacji idei Semantycznego Webu stworzona została bogata infrastruktura, którą można podzielić na cztery kategorie:
• Języki dla Semantycznego Webu: głównie XML i jego aplikacje: RDF, RDFS, OWI1
• Ontologic, umożliwiające dostęp do sieci wiedzy czytelnej dla maszyn i przez nie przetwarzanej. Wiedza kodowana jest w formatach opartych na XML.
• Kodowanie semantyczne stron Semantycznego Webu: dla umożliwienia rozumienia treści udostępnianych w Web muszą one być kodowane, czyli opisane za pomocą terminologii zdefiniowanej w ontologii lub różnych ontologiach.
• Usługi Semantycznego Webu: są to aplikacje programowe pozwalające użytkownikom i agentom na bezpośrednie ich wywoływanie. Mogą być wyszukiwane, opisywane i udostępniane w intranetach, extranetach i w Internecie, w oparciu o XML i standardowe protokoły Webu.
Architektura Semantycznego Webu przedstawiona została w mojej poprzedniej publi-
OWL - Web Ontology Language; podstawą lej technologii jest wyróżnianie klas i ich własności wraz z tworzeniem złożonych relacji pomiędzy nimi.