656 ARTYKUŁY
związane z trudnością modyfikacji czy też liczbą metadanych. Jego struktura staje się tym samym podatna na modyfikacje. W przypadku cyfrowego katalogu bibliotecznego struktura ta pozostaje taka sama dla wszystkich użytkowników, katalogjest bowiem „jeden”. Problem niezgodności struktury katalogu z różnymi sposobami porządkowania wiedzy, stosowanymi przez użytkowników biblioteki, bynajmniej nie znika. Co więcej, staje się nawet bardziej widoczny, gdyż cyfrowe katalogi udostępniane są Online, co drastycznie zwiększa liczbę i różnorodność ich użytkowników. Wielu z nich gubi się w gąszczu kategorii oferowanych przez katalogi dużych bibliotek, odzwierciedlonym w interfejsach użytkownika typowych systemów OPAC. Wielu użytkowników nie próbuje nawet przeglądać zasobów biblioteki, korzystając z symboli klasyfikacyjnych czy też haseł przedmiotowych. Zamiast tego poszukują oni na stronie interfejsu elektronicznego katalogu przycisku opatrzonego słowem „Szukaj”, oczekując, że pozwoli on na sformułowanie zapytania w języku zbliżonym do języka naturalnego, podobnie jak w internetowych systemach wyszukiwawczych.
Cyfryzacja katalogu bibliotecznego nie tylko uelastycznia jego strukturę, ale pozwala przede wszystkim na automatyzację procesu przeszukiwania jego zawartości: umożliwia wyszukiwanie zawartych w nim informacji tekstowych. Jednym z podstawowych celów wyznaczania tematycznej struktury księgozbioru uwidocznionej w tradycyjnym katalogu rzeczowym było ułatwienie użytkownikowi dotarcia do interesujących go publikacji przy założeniu, że proces przeglądania kart katalogowych jest żmudny i długotrwały, a hierarchia klas tematycznych lub alfabetycznie uporządkowany ciąg haseł przedmiotowych to drzewo decyzyjne, pozwalające na minimalizację liczby oglądanych kart katalogowych przez czytelnika poszukującego określonych informacji. Wyszukiwarka pełnotekstowa redukuje przydatność takiego narzędzia. Przejrzenie całego katalogu w poszukiwaniu dokumentów opisanych wybranym hasłem (słowem kluczowym, frazę zawartą w opisie rzeczowym, tytule, adnotacji) jest niemożliwe, a może nawet okazać się czynnością trywialną. Można w tym miejscu zadać pytanie: „Skoro tradycyjne systemy tematycznego opracowania piśmiennictwa przestają być istotne dla wyszukiwania informacji w katalogu, to czy warto stosować je w ogóle?”. Jest ono szczególnie istotne w przypadku cyfryzacji nie tylko samego katalogu bibliotecznego - czyli metadanych - lecz całej treści biblioteki. W dużej mierze zostaje zatarta wówczas różnica pomiędzy metadanymi oraz samymi danymi. Jak wspomniano już wcześniej, istotą metadanych jest znaczny stopień kompresji informacji - co prawda stratnej, lecz pozwalającej na automatyczne przeszukiwanie. W przypadku w pełni cyfrowej biblioteki kompresja nie występuje - nie występują zatem także straty semantyczne - jednocześnie dzięki możliwości analizy treści cyfrowych przez narzędzia automatyczne zostaje zachowana efektywność wyszukiwania informacji. Istnieją jednak i takie zasoby, które pomimo swojej cyfrowej, wirtualnej natury nie poddają się w prosty sposób analizie maszynowej. Przykładem tego rodzaju zasobów informacji są zdjęcia cyfrowe, których semantyki nie udaje się dotychczas automatycznie analizować1. Mogłoby się zatem wydawać, że jedynym sposobem organizacji kolekcji takich dokumentów jest klasyczny proces katalogowania, podczas którego zostaną one poddane klasyfikacji i opisane zgodnie z wymogami pewnego języka.
Należy zaznaczyć, że opracowano już algorytmy pozwalające identyfikować w sposób w pełni automatyczny pewne cechy obrazów cyfrowych, takie jak obecność określonych kształtów, np. ludzkiej twarzy czy też pora dnia i roku.