CYFROWE BIBLIOTEKI A WYSZUKIWANIE INFORMACJI 655
informacji przez przeciętnego człowieka. Aby odszukać książkę, zawierającą poszukiwane treści bez wykorzystania pewnego systemu klasyfikacji lub haseł przedmiotowych, należałoby odczytać zawartość wszystkich książek przechowywanych w bibliotece.
Klasyfikowanie i porządkowanie obiektów w różnego rodzaju klasy i hierarchie jest czynnością naturalną dla większości ludzi. Nawet tak prozaiczne czynności jak segregowanie codziennych zakupów czy porządkowanie korespondencji wymagają dokonania klasyfikacji obiektów. W większości przypadków takie codzienne klasyfikowanie to proces podświadomy, zgodny z indywidualnym systemem klasyfikacji danego człowieka. W swojej istocie jest on jednak podobny do procesu katalogowania materiałów bibliotecznych, choć oczywiście w tym drugim przypadku system klasyfikacji jest nieporównanie bardziej skomplikowany oraz formalnie skodyfikowany.
Kodyfikacja ta, choć pozornie niezbędna dla późniejszego wykorzystania katalogu w procesie wyszukiwania, jest jednak źródłem problemów. Naturalny dla każdego człowieka, „wbudowany” system klasyfikacji, jest bowiem w dużej mierze cechą osobniczą i pozostaje różny dla różnych ludzi. Systemy klasyfikacji, podobnie jak wykazy haseł przedmiotowych, wykorzystywane w bibliotekach, są z konieczności arbitralne. To użytkownicy biblioteki muszą przystosować swój sposób organizacji wiedzy, a nawet swój sposób myślenia, do struktury katalogu bibliotecznego. De facto muszą zatem ją poznać, zanim zaczną się nią posługiwać.
Zarówno w przypadku klasyfikacji „profesjonalnej”, jaką stosuje się w bibliotece, jak też klasyfikacji „amatorskiej”, używanej w życiu codziennym, dochodzi niekiedy do sytuacji, w których podjęcie decyzji o sklasyfikowaniu jakiegoś elementu okazuje się trudne bądź wręcz niemożliwe. Dzieje się tak wówczas, gdy klasyfikowany obiekt można przyporządkować do dwóch różnych klas w danym systemie klasyfikacji. Nie jest to możliwe w klasyfikacjach sensu stricte, czyli klasyfikacjach logicznych, w których klasy muszą być rozłączne. System porządkowania, który dopuszcza kwalifikowanie obiektu do więcej niż jednej klasy nie może być też stosowany wtedy, gdy klasyfikowanie wiąże się z fizycznym przemieszczaniem obiektów, co ma miejsce wówczas, gdy za pomocą systemu klasyfikacyjnego organizuje się księgozbiór na półkach, jak również wtedy, gdy porządkuje się korespondencję1. W takiej sytuacji może okazać się, że miejsce najbardziej właściwe dla danego obiektu nie istnieje w stosowanym systemie klasyfikacji. W organizacji bibliotecznych księgozbiorów problem ten uwidacznia się wtedy, gdy włączana jest do nich książka, której tematyka wymyka się ramom ustalonego porządku, nie pasując semantycznie do profilu żadnej z dotychczas istniejących kategorii.
SIŁA WYSZUKIWANIA
Wiele problemów skutecznej organizacji dostępu do treści zawartych w zbiorach bibliotecznych rozwiązało przeniesienie katalogu bibliotecznego do przestrzeni wirtualnej. Katalogu elektronicznego nie dotyczą ograniczenia
Problem dotyczy także większości systemów poczty elektronicznej, w których poczta porządkowana jest przez użytkownika w hierarchicznej strukturze folderów czy też skrzynek pocztowych. Nie dotyczy zaś systemów, w których zastosowano właśnie asocjacyjne podejście do wyszukiwania informacji (poprzez połączenie efektwnego pelnotekstowego przeszukiwania treści wiadomości oraz systemu opisywania poprzez arbitralnie wybrane słowa kluczowe) takich jak GMail (Tang, 2008).