Głęboki Internet
mgr Jacek Włodarski
Uniwersytet Warszawski
Głęboki Internet
Internet nieprzezroczysty,
Internet prywatny,
Internet o ograniczonym dostępie,
Niewidzialny Internet.
mgr Jacek Włodarski
Uniwersytet Warszawski
Internet nieprzezroczysty
Strony nieindeksowane przez tradycyjne
wyszukiwarki z powodu:
są celowo pomijane,
są pomijane ze względu na
częstotliwość indeksowania,
są niepodłączone i nie posiadają
linkowania.
mgr Jacek Włodarski
Uniwersytet Warszawski
Internet prywatny
Internet celowo ukryty przed
wyszukiwarkami za pomocą:
blokowania dostępu hasłem,
blokowania dostępu robotom,
użycia odpowiednich meta tagów.
mgr Jacek Włodarski
Uniwersytet Warszawski
Internet o ograniczonym
dostępie
Zasoby niedostępne dla wyszukiwarek z
powodu:
wymaganego hasła;
struktury bazy danych;
braku linkowania do wszystkich
zasobów.
mgr Jacek Włodarski
Uniwersytet Warszawski
Niewidzialny Internet
Zasoby, których wyszukiwarki nie są w
stanie odczytać. Najczęściej jest to
spowodowane wykorzystaniem
nieczytelnych formatów danych (flash,
video, rar.), może to być także
powodowane przez dynamicznie
generowaną zawartość.
mgr Jacek Włodarski
Uniwersytet Warszawski
Semantyczny Web
mgr Jacek
Włodarski
mgr Jacek Włodarski
Uniwersytet Warszawski
Web 3.0
Jest to termin opisujący dalszą ewolucję
Internetu. Zakłada on konwersję
aktualnego przepływu danych do
modelu bazy danych. Wymaga to
przetworzenia zawartości Internetu do
postaci czytanej przez różnego typu
aplikacje i systemy komputerowe.
mgr Jacek Włodarski
Uniwersytet Warszawski
Web 3.0
Web 3.0 opiera się na aplikacjach
wykorzystujących sztuczną inteligencję
oraz rozwiązania semantyczne.
Kluczowym projektem Web 3.0 jest
Semantyczny Web. Jest on projektem
World Wide Web Consortium (W3C).
mgr Jacek Włodarski
Uniwersytet Warszawski
World Wide Web Consortium
założona 1 października 1994 roku
przez Tima Berners-Lee, twórcę WWW
oraz autora pierwszej przeglądarki
internetowej i serwera WWW,
zajmuje się ustanawianiem standardów
pisania i przesyłu stron WWW.
mgr Jacek Włodarski
Uniwersytet Warszawski
Semantyczny Web -
założenia
Wszystkie treści umieszczone w Webie
są zrozumiałe dla maszyny,
forma zapisu danych jest
interpretowalna dla maszyny, bądź
łatwo konwertowalna do takiej formy,
maszyna jest w stanie odczytywać oraz
wywnioskowywać relacje między
elementami Webu.
mgr Jacek Włodarski
Uniwersytet Warszawski
mgr Jacek Włodarski
Uniwersytet Warszawski
Semantyczny Web -
przeszkody
Zbyt niski poziom zaawansowania
automatycznego przetwarzania języka
naturalnego,
brak struktury i wiedzy w dokumentach
Web, które mogłyby być natychmiast
przetwarzane maszynowo.
mgr Jacek Włodarski
Uniwersytet Warszawski
Semantyczny Web – poziomy
architektury
mgr Jacek Włodarski
Uniwersytet Warszawski
Poziom pierwszy
Uniform Resource Identifier (URI) –
podstawowy protokół adresowania
dokumentu,
Unicode – metoda kodowania
dokumentu.
mgr Jacek Włodarski
Uniwersytet Warszawski
Poziomy schematów
Definiują obiekty, relacje i ich
ograniczenia,
przedstawiają także relacje hierarchiczne,
pojęcia definiowane są jako klasy lub
podklasy innych pojęć,
do klas dołączane są ich cechy ze
zdefiniowanymi elementami i
zadeklarowanymi dziedziną i zakresem.
mgr Jacek Włodarski
Uniwersytet Warszawski
Schemat XML (XMLS)
Zestaw definicji elementów składowych
dokumentu XML określających jego
formalną strukturę,
pozwala na uzyskanie większej kontroli
nad regułami gramatyki niż DTD
(Document Type Definition),
pozwala parserowi na ocenienie
poprawności dokumentu.
mgr Jacek Włodarski
Uniwersytet Warszawski
RDF
RDF pozwala na zapis danych w postaci grafu
skierowanego.
mgr Jacek Włodarski
Uniwersytet Warszawski
RDF
Schemat RDF (RDFS)
Wprowadza do grafów klasy i podklasy,
pozwala na wspólne grupowanie
danych mających cechy wspólne,
pozwala na grupowanie dowolnej danej
w wielu klasach.
mgr Jacek Włodarski
Uniwersytet Warszawski
Poziom ontologii
Dostarcza metainformacji służących
zdefiniowaniu pojęć i relacji,
wykorzystuje konstrukcje niedostępne
na poziomach schematu,
technologie tworzone dla tego poziomu
reprezentują konstrukcje ontologiczne
w formacie czytelnym maszynowo.
mgr Jacek Włodarski
Uniwersytet Warszawski
Poziom ontologii
Poziom ontologii
Poziom logiczny
Ściśle zintegrowany z poziomem
ontologii, uzupełniając go o możliwości
wnioskowania,
dokonuje konwersji definicji pojęć i
relacji na język logiki zrozumiałej dla
komputera.
A = B i B = C → A = C
mgr Jacek Włodarski
Uniwersytet Warszawski
Web Ontology Language
(OWL)
OWL to język ontologii, pozwalający na
formalny opis znaczenia terminologii
stosowanej w dokumentach Web.
Posiada bardziej rozbudowaną
semantykę niż RDFS, dzięki czemu
komputery są w stanie realizować
zadania wnioskowania na podstawie
tych dokumentów.
mgr Jacek Włodarski
Uniwersytet Warszawski
Przewaga OWL nad XML oraz
XMLS
XML jest formatem komunikatu,
natomiast ontologie są reprezentacją
wiedzy,
OWL posiada narzędzia mogące
prowadzić wnioskowania na temat
ontologii.
mgr Jacek Włodarski
Uniwersytet Warszawski
Poziom potwierdzenia
Umożliwia procesy służące weryfikacji
prawdziwości stwierdzeń,
wykorzystuje szereg wnioskowań.
Czy A jest rodzajem B? Jeśli A jest
rodzajem C i B = C, to A jest rodzajem
B.
mgr Jacek Włodarski
Uniwersytet Warszawski
Poziom zaufania
Umożliwia realizację procesów
gwarantujących poprawność stwierdzeń
w zasobach Web,
opiera się na mechanizmach
wartościowania stwierdzeń,
jest podstawą „Webu zaufania” (Web of
Trust).
mgr Jacek Włodarski
Uniwersytet Warszawski
Narzędzia przetwarzania
dokumentów semantycznych
Simple API for XML (SAX)
–
Szybkość,
–
efektywne zarządzanie pamięcią,
–
brak swobodnego dostępu do dokumentu.
Document Object Model (DOM)
–
Swobodny dostęp do dokumentu,
–
duże wymagania pamięciowe,
–
mała efektywność analizy syntaktycznej.
mgr Jacek Włodarski
Uniwersytet Warszawski
Podstawy prawne
działalności informacyjnej
mgr Jacek Włodarski
Uniwersytet Warszawski
Ustawa o dostępie do informacji publicznej
Ustawa o prawie autorskim i prawach
pokrewnych
Ustawa o ochronie danych osobowych
Ustawa o udostępnianiu informacji
gospodarczych
Ustawa o udostępnianiu informacji o
środowisku
Ustawa o Krajowym Rejestrze Sądowym
Ustawy regulujące działalność
informacyjną
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 1.
1. Każdy ma prawo do ochrony dotyczących
go danych osobowych.
2. Przetwarzanie danych osobowych może
mieć miejsce ze względu na dobro publiczne,
dobro osoby, której dane dotyczą, lub dobro
osób trzecich w zakresie i trybie określonym
ustawą.
Ustawa o ochronie danych
osobowych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 6.
1. W rozumieniu ustawy za dane osobowe uważa się
wszelkie informacje dotyczące zidentyfikowanej lub
możliwej do zidentyfikowania osoby fizycznej.
2. Osobą możliwą do zidentyfikowania jest osoba, której
tożsamość można określić bezpośrednio lub pośrednio,
w szczególności przez powołanie się na numer
identyfikacyjny albo jeden lub kilka specyficznych
czynników określających jej cechy fizyczne,
fizjologiczne, umysłowe, ekonomiczne, kulturowe lub
społeczne.
Ustawa o ochronie danych
osobowych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 6.
3. Informacji nie uważa się za
umożliwiającą określenie tożsamości
osoby, jeżeli wymagałoby to
nadmiernych kosztów, czasu lub działań.
Ustawa o ochronie danych
osobowych
mgr Jacek Włodarski
Uniwersytet Warszawski
1. Przetwarzanie danych jest dopuszczalne tylko wtedy, gdy:
1) osoba, której dane dotyczą, wyrazi na to zgodę, chyba że chodzi o
usunięcie dotyczących jej danych,
2) jest to niezbędne dla zrealizowania uprawnienia lub spełnienia
obowiązku wynikającego z przepisu prawa,
3) jest to konieczne do realizacji umowy, gdy osoba, której dane
dotyczą, jest jej stroną lub gdy jest to niezbędne do podjęcia działań
przed zawarciem umowy na żądanie osoby, której dane dotyczą,
4) jest niezbędne do wykonania określonych prawem zadań
realizowanych dla dobra publicznego,
5) jest to niezbędne dla wypełnienia prawnie usprawiedliwionych celów
realizowanych przez administratorów danych albo odbiorców danych, a
przetwarzanie nie narusza praw i wolności osoby, której dane dotyczą.
Ustawa o ochronie danych
osobowych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 33.
1. Na wniosek osoby, której dane dotyczą,
administrator danych jest obowiązany, w terminie
30 dni, poinformować o przysługujących jej
prawach oraz udzielić, odnośnie do jej danych
osobowych, informacji, o których mowa w art. 32
ust. 1 pkt 1–5a.
2. Na wniosek osoby, której dane dotyczą,
informacji, o których mowa w ust. 1, udziela się na
piśmie.
Ustawa o ochronie danych
osobowych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 34.
Administrator danych odmawia osobie, której dane
dotyczą, udzielenia informacji, o których mowa w art.
32 ust. 1 pkt 1–5a, jeżeli spowodowałoby to:
1) ujawnienie wiadomości zawierających informacje niejawne,
2) zagrożenie dla obronności lub bezpieczeństwa państwa, życia
i zdrowia ludzi lub bezpieczeństwa i porządku publicznego,
3) zagrożenie dla podstawowego interesu gospodarczego lub
finansowego państwa,
4) istotne naruszenie dóbr osobistych osób, których dane
dotyczą, lub innych osób.
Ustawa o ochronie danych
osobowych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 36.
1. Administrator danych jest obowiązany zastosować
środki techniczne i organizacyjne zapewniające
ochronę przetwarzanych danych osobowych
odpowiednią do zagrożeń oraz kategorii danych
objętych ochroną, a w szczególności powinien
zabezpieczyć dane przed ich udostępnieniem osobom
nieupoważnionym, zabraniem przez osobę
nieuprawnioną, przetwarzaniem z naruszeniem
ustawy oraz zmianą, utratą, uszkodzeniem lub
zniszczeniem.
Ustawa o ochronie danych
osobowych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 2.
1. Przez informacje gospodarcze rozumie się
dane dotyczące:
1) podmiotu będącego osobą prawną lub jednostką
organizacyjną nieposiadającą osobowości prawnej (…)
2) osoby fizycznej (…)
3) osoby fizycznej prowadzącej działalność
gospodarczą (…)
4) zobowiązania pieniężnego (…)
5) posłużenia się podrobionym lub cudzym
dokumentem (…)
Ustawa o udostępnianiu
informacji gospodarczych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 4.
Udostępnianie informacji gospodarczych
osobom trzecim nieoznaczonym w chwili
przeznaczania tych informacji do udostępniania
następuje wyłącznie za pośrednictwem biura
informacji gospodarczej, chyba że udostępnianie
następuje w celu sprzedaży wierzytelności przez
ogłoszenie publiczne lub przepisy prawa
przewidują inny tryb udostępniania danych.
Ustawa o udostępnianiu
informacji gospodarczych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 14.
1. Wierzyciel może przekazać do biura informacje
gospodarcze o zobowiązaniu dłużnika będącego
konsumentem wyłącznie wówczas, gdy są
spełnione łącznie następujące warunki:
1) zobowiązanie powstało w związku z określonym
stosunkiem prawnym, w szczególności z tytułu umowy o
kredyt konsumencki oraz umów, o których mowa w art.
187 ustawy z dnia 17 listopada 1964 r. – Kodeks
postępowania cywilnego (Dz. U. Nr 43, poz. 296, z późń.
zm.));
Ustawa o udostępnianiu
informacji gospodarczych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 14.
2) łączna kwota wymagalnych zobowiązań dłużnika będącego
konsumentem wobec wierzyciela wynosi co najmniej 200
złotych oraz są one wymagalne od co najmniej 60 dni;
3) upłynął co najmniej miesiąc od wysłania przez wierzyciela
listem poleconym albo doręczenia dłużnikowi będącemu
konsumentem do rąk własnych, na adres do doręczeń
wskazany przez dłużnika będącego konsumentem, a jeżeli nie
wskazał takiego adresu – na adres miejsca zamieszkania,
wezwania do zapłaty, zawierającego ostrzeżenie o zamiarze
przekazania danych do biura, z podaniem firmy i
adresu
siedziby tego biura.
Ustawa o udostępnianiu
informacji gospodarczych
mgr Jacek Włodarski
Uniwersytet
Warszawski
Art. 15.
1. Wierzyciel może przekazać do biura
informacje gospodarcze o zobowiązaniu
dłużnika niebędącego konsumentem wyłącznie
wówczas, gdy są spełnione łącznie następujące
warunki:
1) zobowiązanie powstało w związku z określonym
stosunkiem prawnym, w szczególności z tytułu
umowy związanej z wykonywaniem działalności
gospodarczej;
Ustawa o udostępnianiu
informacji gospodarczych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 15.
2) łączna kwota wymagalnych zobowiązań dłużnika
niebędącego konsumentem wobec wierzyciela wynosi co
najmniej 500 złotych oraz są one wymagalne od co najmniej 60
dni;
3) upłynął co najmniej miesiąc od wysłania przez wierzyciela
listem poleconym albo doręczenia dłużnikowi niebędącemu
konsumentem do rąk własnych, na adres do doręczeń wskazany
przez dłużnika niebędącego konsumentem, a jeżeli nie wskazał
takiego adresu – na adres siedziby dłużnika lub miejsca
wykonywania działalności gospodarczej, wezwania do zapłaty,
zawierającego ostrzeżenie o zamiarze przekazania danych do
biura, z podaniem firmy i adresu siedziby tego biura.
Ustawa o udostępnianiu
informacji gospodarczych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 21.
1. Biuro ujawnia tylko aktualne informacje gospodarcze.
2. Biuro dokonuje aktualizacji informacji gospodarczych na
wniosek wierzyciela, nie później niż w terminie 7 dni od dnia
otrzymania wniosku.
3. Biuro może przechowywać informacje gospodarcze dotyczące
dłużników niebędących konsumentami w brzmieniu sprzed
dokonania ich aktualizacji. Informacje te stanowią informacje
archiwalne i mogą być przetwarzane dla celów statystycznych.
5. Biuro przechowuje informacje archiwalne przez okres nie
dłuższy niż 10 lat od dnia, kiedy informacje te stały się
informacjami archiwalnymi.
Ustawa o udostępnianiu
informacji gospodarczych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 23.
Każdy ma prawo dostępu do dotyczących go
informacji gospodarczych przechowywanych przez
biuro, przekazanych zgodnie z art. 14–18. Dostęp w
zakresie informacji gospodarczych dotyczących
dłużników będących konsumentami jest bezpłatny,
jeżeli następuje nie częściej niż raz na 6 miesięcy. W
pozostałych przypadkach do-stęp podlega opłacie
zgodnie z obowiązującym w biurze cennikiem, nie
wyższej niż 0,5% minimalnego wynagrodzenia za
pracę
Ustawa o udostępnianiu
informacji gospodarczych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 24.
1. Podmiot, który zawarł z biurem umowę o
ujawnianie informacji gospodarczych, może
wystąpić do biura o ujawnienie informacji
gospodarczych o zobowiązaniach dłużnika
będącego konsumentem, jeżeli posiada jego
upoważnienie. Upoważnienie jest ważne nie
dłużej niż 30 dni od dnia jego udzielenia.
Ustawa o udostępnianiu
informacji gospodarczych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 27.
1. Biuro jest obowiązane prowadzić rejestr
zapytań. Każdy ma prawo uzyskania informacji z
rejestru zapytań w zakresie dotyczącym
ujawniania jego danych, z zastrzeżeniem ust. 4.
4. Nie podaje się informacji o złożeniu zapytania
do rejestru zapytań, jeżeli z zapytaniem
wystąpiły podmioty, o których mowa w art. 25
ust. 1.
Ustawa o udostępnianiu
informacji gospodarczych
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 4.
Każdy ma prawo do informacji o środowisku i jego ochronie na
warunkach określonych ustawą.
Art. 5.
Każdy ma prawo uczestniczenia, na warunkach określonych
ustawą, w postępowaniu wymagającym udziału
społeczeństwa.
Art. 8.
Organy administracji są obowiązane do udostępniania
każdemu informacji o środowisku i jego ochronie znajdujących
się w ich posiadaniu lub które są dla nich przeznaczone.
Ustawa o udostępnianiu
informacji o środowisku
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 13.
Od podmiotu żądającego informacji o
środowisku i jego ochronie nie wymaga się
wykazania interesu prawnego lub faktycznego.
Art. 14.
1. Organ administracji udostępnia informację o
środowisku i jego ochronie bez zbędnej zwłoki,
nie później niż w ciągu miesiąca od dnia
otrzymania wniosku.
Ustawa o udostępnianiu
informacji o środowisku
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 17.
Organ administracji może odmówić udostępnienia
informacji o środowisku i jego ochronie, jeżeli:
1) wymagałoby to dostarczenia dokumentów lub danych
będących w trakcie opracowywania;
2) wymagałoby to dostarczenia dokumentów lub danych
przeznaczonych do wewnętrznego komunikowania się;
3) wniosek jest w sposób oczywisty niemożliwy do
zrealizowania;
4) wniosek jest sformułowany w sposób zbyt ogólny.
Ustawa o udostępnianiu
informacji o środowisku
mgr Jacek Włodarski
Uniwersytet Warszawski
Art. 21.
1. Dane o dokumentach zawierających
informacje o środowisku i jego ochronie
zamieszcza się w publicznie dostępnych
wykazach.
3. W publicznie dostępnych wykazach mogą
być też zamieszczane dane o innych
dokumentach zawierających informacje o
środowisku i jego ochronie.
Ustawa o udostępnianiu
informacji o środowisku
mgr Jacek Włodarski
Uniwersytet Warszawski
Narzędzia przetwarzania
dokumentów semantycznych
Sabina Cisek, Infobrokering w praktyce:
zasady wyszukiwania informacji w
Internecie
http://eprints.rclis.org/18457/1/Cisek_info
brokering_internet.pdf
mgr Jacek Włodarski
Uniwersytet Warszawski