są dopasowane do określonego wzorca. Wzorzec ten jest zazwyczaj zapytaniem użytkownika systemu, który formułuje swoje potrzeby informacyjne w postaci słów kluczowych. Wybór dokumentów pasujących do zapytania jest dokonywany automatycznie przez system wyszukiwawczy za pomocą mechanizmów, które porównują zawartość dokumentu z zapytaniem użytkownika i są w stanie ocenić ich dopasowanie (kryterium wyboru).
Klasyczne metody stosowane w systemach wyszukiwawczych opierają się na prostej strukturze reprezentacji wiedzy, gdzie dokumenty reprezentowane są przez zbiory słów kluczowych (tzw. bag of words). Najbardziej znanymi modelami zapytań kierowanych do systemu wyszukiwawczego z wykorzystaniem tej reprezentacji wiedzy są model logiczny (ang. boolean model), model wektorowy (ang. vector space model), model probabilistyczny, model LSI (ang. latent semantic indexing) czy model sieci neuronowej [BaRil999],
Bardziej złożone struktury reprezentacji wiedzy to: słownik
definicyjny (glosariusz), słownik dziedzinowy, taksonomia, tezaurus, sieć semantyczna i ontologia. Struktury te wprowadzają różne relacje leksykalne pomiędzy przechowywanymi w nich konceptami.
Tezaurus to zbiór semantycznie i hierarchicznie powiązanych konceptów wykorzystywanych w określonej dziedzinie wiedzy. Koncepty zawarte w tezaurusach uporządkowane są przez relacje synonimii oraz hiperonimii i hiponimii. Systemy wyszukiwawcze oparte o tezaurusy wykorzystują je do indeksowania obiektów. Koncepty są indeksowane deskryptorami (pozostałe pojęcia będące w relacji hiperonimii - hiponimii to askryptory). Korzyści wynikające ze stosowania tezaurusów w systemach wyszukiwawczych zostały dobrze opisane w [BaRi 1999].
Najlepszą strukturą dla odzwierciedlania powiązań semantycznych między konceptami jest sieć semantyczna. Jest ona grafem skierowanym