Metadane obiektów
informacyjnych
Piotr Celiński
pgc@post.pl
Metadane obiektów informacyjnych
2
Obiekt informacyjny
Każdy obiekt przenoszący informację.
Przykłady:
Tekst
Zdjęcie
Nagranie dźwiękowe
Film
Książka
Strona internetowa
Metadane obiektów informacyjnych
3
Co to jest metainformacja?
• Metadane lub metainformacje – „dane o
danych”.
• Informacje opisujące obiekt informacyjny.
Przykłady:
• Dane z katalogu bibliotecznego
• Nazwa, typ, data utworzenia pliku
• Tytuł, reżyser, scenarzysta filmu
Metadane obiektów informacyjnych
4
Po co nam metadane?
• Do opisu obiektów informacyjnych
• Umożliwiają przeszukiwanie obiektów
nietekstowych
• Do klasyfikacji
• Do definiowania relacji między obiektami
• Do zarządzania obiektami informacyjnymi
• Do dystrybucji informacji
• Do kojarzenia obiektów informacyjnych
posiadających wspólne cechy
• Do skutecznego sprzedawania informacji
Metadane obiektów informacyjnych
5
Jakie powinny być dobre metadane?
• Muszą mieć strukturę
• Czytelne dla maszyn (nie zawsze
spełnione)
• Czytelne dla ludzi (nie zawsze spełnione)
• Niezależne od języka (gdzie jest to
możliwe)
• Niezależne od form gramatycznych
• Wstawione automatycznie, gdzie to
możliwe
Metadane obiektów informacyjnych
6
Przykład - tekst
Tytuł
Data
Czas
Źródło
Autorzy
Kraj
Miasto
Metadane obiektów informacyjnych
7
Struktura informacji
POL
Kod kraju
ls
Kod autora
kow
Kod autora
row
Kod autora
PAP
Źródło
14:43
Czas
2006-11-08
Data
Ekolodzy organizują "Pociąg dla Rospudy"
Tytuł
Zawartość
Nazwa
Metadane obiektów informacyjnych
8
Jak to się ma do wymagań?
TAK
TAK
TAK
TAK
TAK
TAK
TAK
NIE
Cz. m.
TAK
-
-
-
TAK
TAK
TAK
NIE
n. j.
TAK/REF
TAK/REF
TAK/REF
TAK/REF
TAK/REF
TAK
TAK
TAK
Cz. cz.
POL
Kod kraju
ls
Kod autora
kow
Kod autora
row
Kod autora
PAP
Źródło
14:43
Czas
2006-11-08
Data
Ekolodzy organizują
"Pociąg dla Rospudy"
Tytuł
Zawartość
Nazwa
Metadane obiektów informacyjnych
9
Przykład spełnienia wszystkich kryteriów
Nadawca:
06004000
06 – Problemy ochrony środowiska
004 – Polityka ochrony środowiska
000 –
Odbiorca:
06004000
06 – Environmental Issues
004 –Environmental Politics
000 –
Metadane obiektów informacyjnych
10
Jak to osiągnięto?
• Wspólny, standardowy system
kategoryzacji
• Przekazywanie informacji w formie
czytelnej dla maszyny (kod kategorii)
• Przekazywania informacji w formie
czytelnej dla człowieka (nazwy kategorii w
języku nadawcy)
• System u odbiorcy pobiera nazwy
kategorii na podstawie kodu w języku
odbiorcy
Metadane obiektów informacyjnych
11
Przykłady standardów
• Kategoryzacja wg systemu Subject
Reference (liczbowy kod kategorii oraz
nazwa w języku dostawcy)
• Kody krajów wg ISO 3166 – trzyliterowy
kod kraju
• Typ informacji
• Potencjalny odbiorca
• Scena na fotografii
Więcej: http://www.iptc.org
Metadane obiektów informacyjnych
12
Przykład – nagłówek witryny internetowej
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-2">
<meta name="Author" content="Caesar.pl // 5v.pl">
<meta name="Classification" content="cms internet multimedia web www internet
software">
<meta name="Description" content="5v.pl Caesar.pl projektowanie stron
internetowych, webdesign multimedia, programowanie on-line i PC, CMS
Warszawa">
<meta name="Keywords" content="sklep internetowy CMS webdesign multimedia
projektowanie stron internetowych strony pages Warszawa webpages web cms
website internet strony www grafika graphic">
<META name="verify-v1" content="y0RTF0FML5j
+59PKMC9MYzAqO5lIRzTgQY0ZTgZk+VE=" />
Metadane obiektów informacyjnych
13
Obiekt nietekstowy
Metadane obiektów informacyjnych
14
Metadane zdjęcia
Metadane obiektów informacyjnych
15
Przykładowy zestaw metadanych
• Tytuł
• Nagłówek
• Opis
• Autorzy obiektu
• Status autorów
• Autorzy opisu
• Data wydarzenia
• Czas wydarzenia
• Kraj
• Region
• Miasto
• Dzielnica
• Kategorie
• Priorytet
• Słowa kluczowe
• Identyfikator danych
stałych
• Źródło
• Dostarczyciel
• Data i czas embarga
• Data i czas ważności
• Język metadanych
• Informacje o prawach
autorskich
Metadane obiektów informacyjnych
16
Pola powtarzalne i niepowtarzalne
• Przykłady pól powtarzalnych: autorzy
obiektu, kategorie, słowa kluczowe,
autorzy opisu
• Przykłady pól niepowtarzalnych: tytuł,
nagłówek, opis, data wydarzenia, czas
wydarzenia, priorytet,
Metadane obiektów informacyjnych
17
Metadane w wyszukiwaniu informacji
• Obiekty tekstowe
Możliwe przeszukiwanie pełnotekstowe
(typu „google”), w wielu wypadkach
wystarczające, zawężenie zakresu np.
poprzez podanie zakresu dat lub autora
• Obiekty nietekstowe
Przeszukiwanie na podstawie metadanych
lub pełnotekstowego przeszukania opisu
obiektu – jak w przypadku obiektów
tekstowych
Metadane obiektów informacyjnych
18
Metadane w automatycznym
konfekcjonowaniu i klasyfikowaniu
informacji
• Tworzenie specjalizowanych serwisów
dotyczących wybranych zagadnień np.
ekonomia, sport, pogoda, notowania
giełdowe, raporty emitentów papierów
wartościowych itp
Metadane obiektów informacyjnych
19
Jak doprecyzować opis obiektu?
• Może się zdarzyć, że użycie
standardowych wartości dla kategorii,
kraju itp. nie jest wystarczające
• Należy umiejętnie dobrać słowa kluczowe
opisujące obiekt – np. nazwę geograficzną
miejsca gdzie zostało wykonane zdjęcie
(jeżeli nie jest to miejscowość), nazwisko
osoby na zdjęciu itp.
• Użyć mianownika liczby pojedynczej
Metadane obiektów informacyjnych
20
Metadane do celów dziennikarskich i
innych
• To samo zdjęcie może być wykorzystane
jako wiadomość oraz ilustracja
• Zestaw metadanych służących informacji
dziennikarskiej nie nadaje się do zdjęć
ilustracyjnych
• Potrzebny jest inny zestaw kategorii, inne
słowa kluczowe,
inny sposób myślenia
przy oznaczaniu zdjęcia metadanymi
Metadane obiektów informacyjnych
21
Kategorie dziennikarskie i ilustracyjne
Dziennikarskie
•
Sztuka, kultura, rozrywka
•
Prawo i wymiar sprawiedliwości
•
Katastrofy i wypadki
•
Ekonomia, biznes, finanse
•
Edukacja
•
Ochrona środowiska
•
Zdrowie
•
Zainteresowania
•
Praca
•
Styl życia i wypoczynek
•
Polityka
•
Religie i wierzenia
•
Nauka i technologia
•
Zagadnienia społeczne
•
Sport
•
Niepokoje, konflikty, wojny
•
Pogoda
Ilustracyjne
•
Praca i biuro, biznes
•
Dzieci i nastolatki
•
Medycyna
•
Uroda i pielęgnacja
•
Życie codzienne
•
Nauka i przemysł
•
Historia i sztuka
•
Rolnictwo i żywność
•
Geografia i turystyka
•
Przedmioty
Metadane obiektów informacyjnych
22
Przykłady słów kluczowych dla zdjęcia
informacyjnego i ilustracyjnego
Informacyjne
• Konferencja
• Iksiński
• Manifestacja
• Rospuda
Ilustracyjne
• Zachód słońca
• Nostalgia
• Tęsknota
• Woda
• Góra
• Różowy