Istnienie danych i metadanych w fam ■
relacji między treściami. realizmacvm;C c>',rowcJ umotliwii tworzenia dowolnych i innych. Często powstają one w!2 ^ użytkowników, iwydawcy
obserwacji sposobów po łuciwanTsf^ •’,rnkc,e au 0,na,>'"«oj j i Sługiwania się przez uczonego narzędziami wyszukiwawczym;
podczas poszukiwania rozwiązania problemu. W wyniku akty wności użytkowników po. wstaje gęsta sieć odnośników i 2biory etykiet. Potrzeba manualnego (jawnego) tworzenia metadanych opisowych, będących odpowiednikiem tradycyjnego opisu formalnego i rzeczowego może wydawać się więc problematyczna'*.
Metadane tworzone przez człowieka, zarówno jawnie, jak i niejawnie, są przydatne do realizacji takich funkcji, jak;
• Ułatwienie komunikacji i wymiany danych pomiędzy serwisami globalnej biblioteki
• Rozbudowa opisu obiektu, przydatna z różnych względów; słowa i terminy użyte przez autora są niepoprawne, albo też dokument w ogóle jest nictckstowy (grafika, obiekt trój. wymiarowy, nagranie dźwiękowe, film); również dane z badań naukowych bez okre-ślenia kontekstu (opis badań, w tym metoda, narzędzia) stanowią tylko mc meznaczącc
tablice liczb lub ciekawe obrazki [Borgman 2008, s. 34].
• Dostarczanie danych uzupełniających o obielcie, lak,eh jak jego lokal, nacja lob sposob wykoizystania; w len sposób rozszciza się pojęcie opisu jego., sci .
• Dostarczanie Mormagiop®^ <**•“•1| Prowenla,CJ" oblcklu' w icco rozmiarach i inne iiiodyfikacje.
• Zabiie^ńie opisyoameeo oblekło, fizycaiego lob cyfrowego, za pomoc, cyfrowych sumptów szemko mpooWbnunycb w Sreci, klore pozoslaj, w mej nawę. po oso-
• "^Ztar^*inlcleW«cj organizaypdo zasobu obiektów cyfrowych.
F 7 ; .. wyszywania podobieństw i odrębności, na podsta-
• Przedstawianie (meia)danych o określonych, .słotnych cechach obrcktu.
• 'obslugi,echnicznCJ P°wczególnych obiek,ów’zasobów
Mc?a^c te traktowane mogą być przez narzędzia indeksujące tak. jak każdy tekst, specyficzne w tym, że są surogatami-suplementami danych, i także poddawane indeksowaniu pełnorekstowetnu. którego efekty wspomagają indeksowanie danych. Paradoksal-nie wiec okazać się może, że rekordy metadanych w serwisach GBC tworzone są bardziej dla wyszukiwarek internetowych niż żywych użytkowników.
■
Termin ..metadane” po raz pierwszy zastosowany został w kontekście systemów zarządzania bazą danych jako ogólna nazwa dla wszystkich rodzajów danych uzupełniających, niezbędnych dla opisu, obsługi, zarządzania i wykorzystania danych. Już we wczesnym etapie rozwoju Webu, w syntaktyce HTTP. przewidziana została etykieta <meta> w celu umożliwienia dołączania dodatkowych danych, nie wyświetlanych jako standardowy tekst dokumentu. Początkowo sądzono, że etykieta ta wykorzystywana będzie przez właściciela strony Web. Niestety, bardzo szybko okazało się, że twórcy stron Web albo nie by li w ogóle zainteresowani dodawaniem metadanych, albo nadużywali tych funkcji.
W efekcie twórcy wyszukiwarek zaczęli ignorować metadane wpisywane na stronę Web, więc zaprzestano ich stosowania. Obecnie nowe nadzieje w tym zakresie wiąże się z mi-
metadanych często tworzono kategorie metadanych jako kontinuum
' 5areW-je°d najmniej uslmkluryzowanych, za które uważano indeksowanie pcłnoleksio-we. po ręcznie iwotzonc. ustnikturwowan.. „,l„, t. . . . . • , ,
[Wcibel. Jumella, Cuhro 19971 * 7’ M interpretację opisywanych obieklow
wyszukiwarki o|0'yn °ecnie ,echniki indeksowania pelnolekstowego, szczególnie rozwijane przez
20518 y M ^ budowane, że takie prosie podziały straciły rację bytu.
kroformitamt (/oh. p. 4.2). Juk iwicrtl/i Icrfoiicc Urooks. liniowe lunV.«. liniowanie •' y s/uktwarck typu Google wymaga ml ich użytkowników pewnego rodzaju „igiulflliwji". c/yli bruku pełnej wiedzy o sposobie ich il/inlnniii (llrnoks 20Q4|, Wy*/ukiw»rki mutrą uwzględniać przede wszystkim teksty bezpośrednio udostępniane użytkownikowi Stosu-wonie metadanych przeniosło się więc ze (rodownki stron prywatnych i komercyjnych do obszaru publikacji naukowych o kontrolowanych trcłciiich (w tym occn.t jakości), takich, jak portale dziedzinowe, biblioteki cyfrowe, repozytoria, czasopisma elektroniczne i inne. Umieszczane lam bazy metadanych mogą być indeksowane pr/cz wyszukiwarki tak, jak każdy inny tekst (o ile spełniają warunki techniczne, no przykład mc są częścią ukrytego Webu). Tworzenie metadanych w repozytoriach staje się ich wąskim gardłem, stąd propozycje zamieszczania obiektów nawet z minimalnymi nieudanymi, które później, w razie potrzeby zostaną uzupełnione. Najważniejsza bowiem wydaje się możliwość dotarcia do elektronicznej wersji dokumentu, nawet pozbawionej rozbudowanych metadanych [Adams 2008],
Gwałtowny rozwój zastosowań sieciowych miał dwojaki wpływ na stosowanie metadanych. Z jednej strony, doprowadz.il do powstania wielkiej liczby nowych standardów metadanych. wyspecjalizowanych w obsłudze określonych dziedzin wiedzy i działalności praktycznej, treści, funkcji i zastosowań. Z drugiej strony, lak wielka różnorodność rozwiązań spowodowała stosowanie metadanych do zapewnienia zarówno technicznego, jak i semantycznego współdziałania między systemami, co ma zasadnicze znaczenie dla funkcjonowania globalnej biblioteki cyfrowej. Metadane wspomagają w szczególności uzyskanie współdziałania semantycznego, osiąganego głównie za pomocą tworzenia tablic konwersji (mapowania) pomiędzy schematami metadanych oraz wykorzystania schematów powszechnie znanych i stosowanych, takich jak Dublin Core, jako swoistego „przełącznika". Dla osiągnięcia wyższego poziomu współdziałania semantycznego systemy muszą posiadać zdolność do wymiany danych o precyzyjnie określonym znaczeniu oraz do tłumaczenia znaczenia danych do formy zrozumiałej dla systemu. W tym zakresie stosowane są ontologie.
Dalszy wzrost roli metadanych wiązany jest z zastosowaniami naukowymi, charakteryzującymi się produkowaniem olbrzymich zasobów danych, Istnienie metadanych o właściwej jakości umożliwia optymalne wykorzystanie zgromadzonych danych. Metadane stają się niezbędnym warunkiem tworzenia narzędzi badawczych następnej generacji, takich jak wyspecjalizowane wyszukiwarki, narzędzia służące eksploracji danych i ich wizualizacji, stanowiących podstawę tworzenia wyspecjalizowanych serwisów globalnej biblioteki cyfrowej. Są także zasadniczym elementem IIN, w zakresie obslugi i ochrony danych.
Więcej infonnacji na temat metadanych tworzonych przez wyszukiwarki przedstawię w dalszej części rozdziału. Tułaj poprzestanę na najważniejszych cechach schematów metadanych, tworzonych przez człowieka (nazywanych metadanymi „ustrukturyzowany-mi"). Są to:
• Moduiowość: pozwala projektantowi schematu metadanych na tworzenie nowych tworów w oparciu o wcześniej istniejące schematy. Elementy danych z różnych schematów, słowników czy innych elementów składowych, można ze sobą łączyć w sposób umożliwiający współdziałanie na poziomie syntaktycznym i semantycznym.
• Rozszerzalność: twórcy schematów metadanych muszą stworzyć możliwość ich przyszłego rozszerzania i rozbudowy w przypadku zaistnienia nowych potrzeb.
• Szczegółowość: proces tworzenia metadanych jest kosztowny, więc z ekonomicznego punktu widzenia jest wskazane tworzenie schematów metadanych na tyle szczegółowych, aby spełniały stawiane im wymagania funkcjonalne i tylko te.
' Wielojęzyczność: jeżeli schematy metadanych mają być stosowane w tak zróżnicowanym środowisku jak Internet, powinny one brać pod uwagę wielość stosowanych ję-
107