PNOK 2 deep web & semantic web

background image

Głęboki Internet

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Głęboki Internet

Internet nieprzezroczysty,

Internet prywatny,

Internet o ograniczonym dostępie,

Niewidzialny Internet.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Internet nieprzezroczysty

Strony nieindeksowane przez tradycyjne
wyszukiwarki z powodu:

są celowo pomijane,

są pomijane ze względu na

częstotliwość indeksowania,

są niepodłączone i nie posiadają

linkowania.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Internet prywatny

Internet celowo ukryty przed
wyszukiwarkami za pomocą:

blokowania dostępu hasłem,

blokowania dostępu robotom,

użycia odpowiednich meta tagów.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Internet o ograniczonym

dostępie

Zasoby niedostępne dla wyszukiwarek z
powodu:

wymaganego hasła;

struktury bazy danych;

braku linkowania do wszystkich

zasobów.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Niewidzialny Internet

Zasoby, których wyszukiwarki nie są w
stanie odczytać. Najczęściej jest to
spowodowane wykorzystaniem
nieczytelnych formatów danych (flash,
video, rar.), może to być także
powodowane przez dynamicznie
generowaną zawartość.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Semantyczny Web

mgr Jacek

Włodarski

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Web 3.0

Jest to termin opisujący dalszą ewolucję
Internetu. Zakłada on konwersję
aktualnego przepływu danych do
modelu bazy danych. Wymaga to
przetworzenia zawartości Internetu do
postaci czytanej przez różnego typu
aplikacje i systemy komputerowe.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Web 3.0

Web 3.0 opiera się na aplikacjach
wykorzystujących sztuczną inteligencję
oraz rozwiązania semantyczne.
Kluczowym projektem Web 3.0 jest
Semantyczny Web. Jest on projektem
World Wide Web Consortium (W3C).

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

World Wide Web Consortium

założona 1 października 1994 roku
przez Tima Berners-Lee, twórcę WWW
oraz autora pierwszej przeglądarki
internetowej i serwera WWW,

zajmuje się ustanawianiem standardów
pisania i przesyłu stron WWW.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Semantyczny Web -

założenia

Wszystkie treści umieszczone w Webie
są zrozumiałe dla maszyny,

forma zapisu danych jest
interpretowalna dla maszyny, bądź
łatwo konwertowalna do takiej formy,

maszyna jest w stanie odczytywać oraz
wywnioskowywać relacje między
elementami Webu.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Semantyczny Web -

przeszkody

Zbyt niski poziom zaawansowania
automatycznego przetwarzania języka
naturalnego,

brak struktury i wiedzy w dokumentach
Web, które mogłyby być natychmiast
przetwarzane maszynowo.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Semantyczny Web – poziomy

architektury

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Poziom pierwszy

Uniform Resource Identifier (URI) –
podstawowy protokół adresowania
dokumentu,

Unicode – metoda kodowania
dokumentu.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Poziomy schematów

Definiują obiekty, relacje i ich
ograniczenia,

przedstawiają także relacje hierarchiczne,

pojęcia definiowane są jako klasy lub
podklasy innych pojęć,

do klas dołączane są ich cechy ze
zdefiniowanymi elementami i
zadeklarowanymi dziedziną i zakresem.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Schemat XML (XMLS)

Zestaw definicji elementów składowych
dokumentu XML określających jego
formalną strukturę,

pozwala na uzyskanie większej kontroli
nad regułami gramatyki niż DTD
(Document Type Definition),

pozwala parserowi na ocenienie
poprawności dokumentu.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

RDF

RDF pozwala na zapis danych w postaci grafu
skierowanego.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

RDF

background image

Schemat RDF (RDFS)

Wprowadza do grafów klasy i podklasy,

pozwala na wspólne grupowanie
danych mających cechy wspólne,

pozwala na grupowanie dowolnej danej
w wielu klasach.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Poziom ontologii

Dostarcza metainformacji służących
zdefiniowaniu pojęć i relacji,

wykorzystuje konstrukcje niedostępne
na poziomach schematu,

technologie tworzone dla tego poziomu
reprezentują konstrukcje ontologiczne
w formacie czytelnym maszynowo.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Poziom ontologii

background image

Poziom ontologii

background image

Poziom logiczny

Ściśle zintegrowany z poziomem
ontologii, uzupełniając go o możliwości
wnioskowania,

dokonuje konwersji definicji pojęć i
relacji na język logiki zrozumiałej dla
komputera.

A = B i B = C → A = C

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Web Ontology Language

(OWL)

OWL to język ontologii, pozwalający na
formalny opis znaczenia terminologii
stosowanej w dokumentach Web.
Posiada bardziej rozbudowaną
semantykę niż RDFS, dzięki czemu
komputery są w stanie realizować
zadania wnioskowania na podstawie
tych dokumentów.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Przewaga OWL nad XML oraz

XMLS

XML jest formatem komunikatu,
natomiast ontologie są reprezentacją
wiedzy,

OWL posiada narzędzia mogące
prowadzić wnioskowania na temat
ontologii.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Poziom potwierdzenia

Umożliwia procesy służące weryfikacji
prawdziwości stwierdzeń,

wykorzystuje szereg wnioskowań.

Czy A jest rodzajem B? Jeśli A jest
rodzajem C i B = C, to A jest rodzajem
B.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Poziom zaufania

Umożliwia realizację procesów
gwarantujących poprawność stwierdzeń
w zasobach Web,

opiera się na mechanizmach
wartościowania stwierdzeń,

jest podstawą „Webu zaufania” (Web of
Trust
).

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Narzędzia przetwarzania

dokumentów semantycznych

Simple API for XML (SAX)

Szybkość,

efektywne zarządzanie pamięcią,

brak swobodnego dostępu do dokumentu.

Document Object Model (DOM)

Swobodny dostęp do dokumentu,

duże wymagania pamięciowe,

mała efektywność analizy syntaktycznej.

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Podstawy prawne

działalności informacyjnej

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Ustawa o dostępie do informacji publicznej

Ustawa o prawie autorskim i prawach
pokrewnych

Ustawa o ochronie danych osobowych

Ustawa o udostępnianiu informacji
gospodarczych

Ustawa o udostępnianiu informacji o
środowisku

Ustawa o Krajowym Rejestrze Sądowym

Ustawy regulujące działalność

informacyjną

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 1.
1. Każdy ma prawo do ochrony dotyczących
go danych osobowych.
2. Przetwarzanie danych osobowych może
mieć miejsce ze względu na dobro publiczne,
dobro osoby, której dane dotyczą, lub dobro
osób trzecich w zakresie i trybie określonym
ustawą.

Ustawa o ochronie danych

osobowych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 6.
1. W rozumieniu ustawy za dane osobowe uważa się
wszelkie informacje dotyczące zidentyfikowanej lub
możliwej do zidentyfikowania osoby fizycznej.
2. Osobą możliwą do zidentyfikowania jest osoba, której
tożsamość można określić bezpośrednio lub pośrednio,
w szczególności przez powołanie się na numer
identyfikacyjny albo jeden lub kilka specyficznych
czynników określających jej cechy fizyczne,
fizjologiczne, umysłowe, ekonomiczne, kulturowe lub
społeczne.

Ustawa o ochronie danych

osobowych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 6.

3. Informacji nie uważa się za
umożliwiającą określenie tożsamości
osoby, jeżeli wymagałoby to
nadmiernych kosztów, czasu lub działań.

Ustawa o ochronie danych

osobowych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

1. Przetwarzanie danych jest dopuszczalne tylko wtedy, gdy:

1) osoba, której dane dotyczą, wyrazi na to zgodę, chyba że chodzi o
usunięcie dotyczących jej danych,
2) jest to niezbędne dla zrealizowania uprawnienia lub spełnienia
obowiązku wynikającego z przepisu prawa,
3) jest to konieczne do realizacji umowy, gdy osoba, której dane
dotyczą, jest jej stroną lub gdy jest to niezbędne do podjęcia działań
przed zawarciem umowy na żądanie osoby, której dane dotyczą,
4) jest niezbędne do wykonania określonych prawem zadań
realizowanych dla dobra publicznego,
5) jest to niezbędne dla wypełnienia prawnie usprawiedliwionych celów
realizowanych przez administratorów danych albo odbiorców danych, a
przetwarzanie nie narusza praw i wolności osoby, której dane dotyczą.

Ustawa o ochronie danych

osobowych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 33.
1. Na wniosek osoby, której dane dotyczą,
administrator danych jest obowiązany, w terminie
30 dni, poinformować o przysługujących jej
prawach oraz udzielić, odnośnie do jej danych
osobowych, informacji, o których mowa w art. 32
ust. 1 pkt 1–5a.
2. Na wniosek osoby, której dane dotyczą,
informacji, o których mowa w ust. 1, udziela się na
piśmie.

Ustawa o ochronie danych

osobowych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 34.
Administrator danych odmawia osobie, której dane
dotyczą, udzielenia informacji, o których mowa w art.
32 ust. 1 pkt 1–5a, jeżeli spowodowałoby to:

1) ujawnienie wiadomości zawierających informacje niejawne,
2) zagrożenie dla obronności lub bezpieczeństwa państwa, życia
i zdrowia ludzi lub bezpieczeństwa i porządku publicznego,
3) zagrożenie dla podstawowego interesu gospodarczego lub
finansowego państwa,
4) istotne naruszenie dóbr osobistych osób, których dane
dotyczą, lub innych osób.

Ustawa o ochronie danych

osobowych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 36.
1. Administrator danych jest obowiązany zastosować
środki techniczne i organizacyjne zapewniające
ochronę przetwarzanych danych osobowych
odpowiednią do zagrożeń oraz kategorii danych
objętych ochroną, a w szczególności powinien
zabezpieczyć dane przed ich udostępnieniem osobom
nieupoważnionym, zabraniem przez osobę
nieuprawnioną, przetwarzaniem z naruszeniem
ustawy oraz zmianą, utratą, uszkodzeniem lub
zniszczeniem.

Ustawa o ochronie danych

osobowych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 2.
1. Przez informacje gospodarcze rozumie się
dane dotyczące:

1) podmiotu będącego osobą prawną lub jednostką
organizacyjną nieposiadającą osobowości prawnej (…)
2) osoby fizycznej (…)
3) osoby fizycznej prowadzącej działalność
gospodarczą (…)
4) zobowiązania pieniężnego (…)
5) posłużenia się podrobionym lub cudzym
dokumentem (…)

Ustawa o udostępnianiu

informacji gospodarczych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 4.
Udostępnianie informacji gospodarczych
osobom trzecim nieoznaczonym w chwili
przeznaczania tych informacji do udostępniania
następuje wyłącznie za pośrednictwem biura
informacji gospodarczej, chyba że udostępnianie
następuje w celu sprzedaży wierzytelności przez
ogłoszenie publiczne lub przepisy prawa
przewidują inny tryb udostępniania danych.

Ustawa o udostępnianiu

informacji gospodarczych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 14.
1. Wierzyciel może przekazać do biura informacje
gospodarcze o zobowiązaniu dłużnika będącego
konsumentem wyłącznie wówczas, gdy są
spełnione łącznie następujące warunki:

1) zobowiązanie powstało w związku z określonym
stosunkiem prawnym, w szczególności z tytułu umowy o
kredyt konsumencki oraz umów, o których mowa w art.
187 ustawy z dnia 17 listopada 1964 r. – Kodeks
postępowania cywilnego (Dz. U. Nr 43, poz. 296, z późń.
zm.));

Ustawa o udostępnianiu

informacji gospodarczych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 14.

2) łączna kwota wymagalnych zobowiązań dłużnika będącego
konsumentem wobec wierzyciela wynosi co najmniej 200
złotych oraz są one wymagalne od co najmniej 60 dni;
3) upłynął co najmniej miesiąc od wysłania przez wierzyciela
listem poleconym albo doręczenia dłużnikowi będącemu
konsumentem do rąk własnych, na adres do doręczeń
wskazany przez dłużnika będącego konsumentem, a jeżeli nie
wskazał takiego adresu – na adres miejsca zamieszkania,
wezwania do zapłaty, zawierającego ostrzeżenie o zamiarze
przekazania danych do biura, z podaniem firmy i

adresu

siedziby tego biura.

Ustawa o udostępnianiu

informacji gospodarczych

mgr Jacek Włodarski

Uniwersytet

Warszawski

background image

Art. 15.
1. Wierzyciel może przekazać do biura
informacje gospodarcze o zobowiązaniu
dłużnika niebędącego konsumentem wyłącznie
wówczas, gdy są spełnione łącznie następujące
warunki:

1) zobowiązanie powstało w związku z określonym
stosunkiem prawnym, w szczególności z tytułu
umowy związanej z wykonywaniem działalności
gospodarczej;

Ustawa o udostępnianiu

informacji gospodarczych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 15.

2) łączna kwota wymagalnych zobowiązań dłużnika
niebędącego konsumentem wobec wierzyciela wynosi co
najmniej 500 złotych oraz są one wymagalne od co najmniej 60
dni;
3) upłynął co najmniej miesiąc od wysłania przez wierzyciela
listem poleconym albo doręczenia dłużnikowi niebędącemu
konsumentem do rąk własnych, na adres do doręczeń wskazany
przez dłużnika niebędącego konsumentem, a jeżeli nie wskazał
takiego adresu – na adres siedziby dłużnika lub miejsca
wykonywania działalności gospodarczej, wezwania do zapłaty,
zawierającego ostrzeżenie o zamiarze przekazania danych do
biura, z podaniem firmy i adresu siedziby tego biura.

Ustawa o udostępnianiu

informacji gospodarczych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 21.
1. Biuro ujawnia tylko aktualne informacje gospodarcze.
2. Biuro dokonuje aktualizacji informacji gospodarczych na
wniosek wierzyciela, nie później niż w terminie 7 dni od dnia
otrzymania wniosku.
3. Biuro może przechowywać informacje gospodarcze dotyczące
dłużników niebędących konsumentami w brzmieniu sprzed
dokonania ich aktualizacji. Informacje te stanowią informacje
archiwalne i mogą być przetwarzane dla celów statystycznych.
5. Biuro przechowuje informacje archiwalne przez okres nie
dłuższy niż 10 lat od dnia, kiedy informacje te stały się
informacjami archiwalnymi.

Ustawa o udostępnianiu

informacji gospodarczych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 23.
Każdy ma prawo dostępu do dotyczących go
informacji gospodarczych przechowywanych przez
biuro, przekazanych zgodnie z art. 14–18. Dostęp w
zakresie informacji gospodarczych dotyczących
dłużników będących konsumentami jest bezpłatny,
jeżeli następuje nie częściej niż raz na 6 miesięcy. W
pozostałych przypadkach do-stęp podlega opłacie
zgodnie z obowiązującym w biurze cennikiem, nie
wyższej niż 0,5% minimalnego wynagrodzenia za
pracę

Ustawa o udostępnianiu

informacji gospodarczych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 24.
1. Podmiot, który zawarł z biurem umowę o
ujawnianie informacji gospodarczych, może
wystąpić do biura o ujawnienie informacji
gospodarczych o zobowiązaniach dłużnika
będącego konsumentem, jeżeli posiada jego
upoważnienie. Upoważnienie jest ważne nie
dłużej niż 30 dni od dnia jego udzielenia.

Ustawa o udostępnianiu

informacji gospodarczych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 27.
1. Biuro jest obowiązane prowadzić rejestr
zapytań. Każdy ma prawo uzyskania informacji z
rejestru zapytań w zakresie dotyczącym
ujawniania jego danych, z zastrzeżeniem ust. 4.
4. Nie podaje się informacji o złożeniu zapytania
do rejestru zapytań, jeżeli z zapytaniem
wystąpiły podmioty, o których mowa w art. 25
ust. 1.

Ustawa o udostępnianiu

informacji gospodarczych

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 4.
Każdy ma prawo do informacji o środowisku i jego ochronie na
warunkach określonych ustawą.
Art. 5.
Każdy ma prawo uczestniczenia, na warunkach określonych
ustawą, w postępowaniu wymagającym udziału
społeczeństwa.
Art. 8.
Organy administracji są obowiązane do udostępniania
każdemu informacji o środowisku i jego ochronie znajdujących
się w ich posiadaniu lub które są dla nich przeznaczone.

Ustawa o udostępnianiu

informacji o środowisku

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 13.
Od podmiotu żądającego informacji o
środowisku i jego ochronie nie wymaga się
wykazania interesu prawnego lub faktycznego.
Art. 14.
1. Organ administracji udostępnia informację o
środowisku i jego ochronie bez zbędnej zwłoki,
nie później niż w ciągu miesiąca od dnia
otrzymania wniosku.

Ustawa o udostępnianiu

informacji o środowisku

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 17.
Organ administracji może odmówić udostępnienia
informacji o środowisku i jego ochronie, jeżeli:

1) wymagałoby to dostarczenia dokumentów lub danych
będących w trakcie opracowywania;
2) wymagałoby to dostarczenia dokumentów lub danych
przeznaczonych do wewnętrznego komunikowania się;
3) wniosek jest w sposób oczywisty niemożliwy do
zrealizowania;
4) wniosek jest sformułowany w sposób zbyt ogólny.

Ustawa o udostępnianiu

informacji o środowisku

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Art. 21.
1. Dane o dokumentach zawierających
informacje o środowisku i jego ochronie
zamieszcza się w publicznie dostępnych
wykazach.
3. W publicznie dostępnych wykazach mogą
być też zamieszczane dane o innych
dokumentach zawierających informacje o
środowisku i jego ochronie.

Ustawa o udostępnianiu

informacji o środowisku

mgr Jacek Włodarski

Uniwersytet Warszawski

background image

Narzędzia przetwarzania

dokumentów semantycznych

Sabina Cisek, Infobrokering w praktyce:
zasady wyszukiwania informacji w
Internecie

http://eprints.rclis.org/18457/1/Cisek_info

brokering_internet.pdf

mgr Jacek Włodarski

Uniwersytet Warszawski


Document Outline


Wyszukiwarka

Podobne podstrony:
Nahotko,M Semantyczny Web i je Nieznany
CW2006EX Mill Turn data sheet web
WEB OF SINCE TWOIM PRZYJACIELEM
opracowania wykonywanie pomiarow WEB
Datenblaetter im Web
bioinformatyka w13 2008 9 web
Godzina dziennie z Web Analytics
bioinformatyka w2 2008 web
Dragon Magazine 349 Web Supplement
Leki przeciwbolowe web
bioinformatyka w9 2008 web
14 Publikowanie dokumentów w sieci Web
Web i social media HISTORIA SIECI
No Quarter Magazine 07 Web Extra Cygnar History 101
bioinformatyka w6 2008 web
DW Navigator only for web id 14 Nieznany
bioinformatyka w11 2008 web
CW2006EX Turn data sheet web

więcej podobnych podstron