audio lub wiitco cnlryhnie, lub też l*|C/one zc sobą pozwalając na stosowanie riokumcn. IcSw iUidio\vuuiiln>vh, Takimi kodekami są na przykład DivX. stosujące kompresję typu MPFG-4. Ogólnie zasada ich działania jest podobna, jak dla grafiki: możliwa jest kormpre-sja wysokiego stopnia, ale stratna, lub bezstratna, jednak dająca gorsze rezultaty.
Wśród wielu stosowanych formatów wymienić można dla przykładu takie, jak formaty w ideo; MPEti. AV1. QuickTimc oraz formaty obiektów dźwiękowych WAV, AlFI- i AU. Tak duża różnorodność jest nic tyle potrzebą techniczną, co wynikiem konkurencji mię. dzy firmami komercyjnymi, popierającymi te rozwiązania (Microsoft, Sun. Apple i in.). Nic sprzyja ona niestety ujednoliceniu formatów zasobów GBC. Kłopoty sprawiają także metody wyszukiwania informacji multimedialnej, sposoby zapewnienia użytkownikom dostępu do różnych części obiektów, opis treści tych obiektów, ocena poprawności pro* cesu digitalizacji.
Digitalizacja sygnałów fizycznych, analogowych w swojej naturze, jest trudnym zadaniem. do którego niezbędne jest doświadczenie i dbałość o szczegóły. Efekty zależą na przykład od właściwego oświetlenia obrazu oraz poziomu zapisu dźwięku. Od wyboru formatu wyjściowego zależy także stopień utraty danych, czyli liczba utraconych szczegółów*. Zasadnicza decyzja dotyczy więc akceptowalnego poziomu strat generowanych przez format. Bywają zastosowania, w* których nie można tolerować żadnych strat, nawet kosztem gwałtownie rosnącego zapotrzebowania na pojemność pamięci; często należą do nich aplikacje w* nauce i komunikacji naukowej (archiwizacja).
W przypadku reprezentacji bezstratnej, czynności związane z edycją obiektów są prostsze i bardziej pewne. Istnieją co prawda narzędzia pozwalające na odtwarzanie i edycję obiektów w formatach skompresowanych, jednak na kolejnych dekompresjach i kompresjach bardzo traci jakość obiektu, który w efekcie może stać się nawet bezużyteczny. W związku z tym edycję wykonuje się na obiektach w formatach o niskiej kompresji, takich jak WAV czy AIFF (pliki dźwiękowe), dopiero końcowy rezultat zapisując w formacie typu MP3 (MPEG Audio Layer 3), zapewniającym wysoką kompresję przy wciąż niezłej jakości dźwięku.
Obecnie czymś normalnym stało się przesyłanie obiektów multimedialnych w sieci, bez w zględu na używane platformy sprzętowe. Zamiast zdawać się na jedno, stale stosowane rozwiązanie, użytkownicy mogą wybrać najbardziej odpowiadający iin format, na który konwertowane są żądane obiekty, bez względu na format, w którym zostały wykonane. Pozwala to na dostęp użytkowników do materiałów w najlepszej dla nich formie, z jednoczesnym uwzględnieniem dostępnej przepustowości sieci.
W środowisku globalnej biblioteki cyfrowej funkcjonuje i ewoluuje coraz bardziej obszerny zestaw formatów, w których obiekty cyfrowe mogą być przechowywane i udostępniane. a także narzędzia służące do ich przetwarzania** oraz zasady stosowania formatów, ich wyboru, tworzenia, wykorzystania i archiwizacji. Jednocześnie coraz szybciej rozwijają się nowe formy treści, charakteryzujące się powszechnością stosowania, zróżnicowaniem i coraz większym skomplikowaniem. Wraz z pojawianiem się nowych formatów lub nowych zastosow ań istniejących, coraz bardziej widoczna jest ich istotna rola w przechowywaniu (archiwizacji) i udostępnianiu informacji. Format danych ma też wpływ na możliwości ich wyszukiwania. 1 2
iirówno ich treść, jak i forma może wynikać ze sposobu funkcjonowania programu t'|V rowcgo. W praktyce języki kodowania służą tworzeniu niewielkich i doić pro* k2^Łpjogramów sterujących wyświetlaniem obrazu na monitorze S w najprostszym przypadku kodowanie wykorzystuje się do określenia struktury do-nentów oraz do opisu ich wyglądu na ekranie użytkownika Obejmuje takie elementy. ku n(Jt|zinl tekstu na sekcje, tytuły (nagłówki), listy numerowane, cytowania (odnośniku J ■ oinnianc multimedia. Jego zadaniem jest również identyfikacja meladanych związa-f kodowanym dokumentem. Oznacza to, że podczas kodowania posługujemy się rykiem złożonym homologicznie (Wojciechowski 2000. s. 25],
^ pierwszym językiem służącym kodowaniu dokumentów, z którego w jakimś stopniu ywodzą się wszystkie inne. jest SGML. Został on utworzony przez przemysł wydawniczy. Stosowane w nim etykiety pozwalają na tworzenie rozbudowanej struktury dokumentów: kodowanie obejmuje takie elementy struktury tekstu, jak tytuł, data. autor. >|ównu część tekstu z podziałem na rozdziały i podrozdziały Dostarczają także informacji o sposobie prezentacji dokumentu i zastosowanych elementach typograficznych, takich jak zmiany w wyglądzie typograficznym i przejście do nowego wiersza. Etykiety SGML zbudowane są ze znaków ASCII, do tworzenia plików SGML nic ma więc potrzeby używania specjalnego oprogramowania. Dzięki temu pliki te łatwo jest przesyłać w sieci. <>dyż kody są z punktu widzenia zastosowanych znaków częścią tekstu dokumentu, nie muszą być specjalnie interpretowane, jak na przykład zmiany fontów w większości edytorów tekstów. Mimo tych cech SGML nie jest zbyt przydatny do stosowania w bibliotece cyfrowej ze względu na poziom skomplikowania samego kodu. jak i oprogramowania do jego przetwarzania, a także niedostateczne współdziałanie, utrudniające wymianę obiektów SGML pomiędzy różnymi systemami.
W zakresie języków kodowania istnieją obecnie trzy poziomy rozwiązań. Hypertesi Markup Language (HTML) jest uproszczonym językiem kodowania sposobu wyświetlania dokumentu, który służy głównie jego prezentacji. Pozwala na tworzenie zarówno tekstu dokumentu, jak i etykiet opisujących jego format i strukturę przez formowanie nagłówków, akapitów, list, odnośników hipertekstowych i in. HTML jest uproszczoną wersją SGML. powszechnie stosowaną w Webie. HTML jest przykładem prostego zestawu etykiet, pozwalającego na rozpowszechnianie dokumentów, tworzonych /a pomocą tych etykiet. Prostota tego rozwiązania może także stwarzać problemy, szczególnie, gdy chcemy za pomocą tych prostych struktur opisać złożoną infonnację.
I:\tcnsiblc Markup Language (XML), znajdujący się na drugim poziomic, jest kolejną odmianą SGML, specjalnie zaprojektowaną dla Wcbu jako struktura bardziej otwarta. Zawiera on elastyczny mechanizm opisywania struktury dokumentów oraz meladanych. a także służy przechowywaniu i przekazywaniu dokumentów. XML tworzony był z myślą o łatwiejszym przesyłaniu dokumentów niż SGML, ma także mniejsze wymagania codo oprogramowania aplikacyjnego. Nic zawiera on predefiniowanego zestawu etykiet, przez co pozwala na lepszą wymianę dokumentów. Język jest niezależny od platform) sprzętowej czy sollwarowej, przez co jest bardzo odpowiedni do zastosowania w bibliotece cyfrowej.
Kolejnym językiem kodowania jest RDF (Rcsource Description Framcwork), który może być traktowany jako trzeci poziom struktury. Jest to format stanowiący aplikację XML, służący kodowaniu metadanych, czyli informacji ustrukUiryzowancj.
73
• Wymienić można narrędzia do walidacji, identyfikacji i charakteryzacji formatów typu JIIOVE (JSTOR/
łarvard Objęci Validation Environment) ery repozytoria formatów, takie jak (JDFR (Global Digital Format Repository). (worxony przez Harward Univ. i OCLC.