Model danych, kartografia wykłady


2. Modelowanie

2.1 Modelowanie informacji geograficznej

Dla zdefiniowania lokalizacji informacji geograficznej należy użyć 3 poziomy informacji:

-geometryczne (przedstawia geometrie obiektów geograficznych)

- topologiczny opisuje relacje topologiczne pomiędzy obiektami geometrycznymi (powiązanie, bliskość)

- semantyczny opisujący warstwę obiektów geograficznych

2.1.1 Dane geometryczne

Dane geometryczne składają się z punktów, linii i poligonów (wymiary odpowiednio 0,1,3). Linie można zdefiniować jako:

-zbiór odcinków,

- zbiór linii krzywych ( są bardziej skomplikowane niż odcinki np. krzywe kubiczne),

- połączenie odcinków i krzywych.

Poligon jest serią linii, które tworzą obszar zamknięty.. Poligon może zawierać w sobie inne poligony (np. wyspa na jeziorze).

2.1.2 Dane topologiczne

Dane geograficzne można przedstawić przy pomocy węzłów i łuków. Łuki tworzy się z początku i końca poligonu. Węzły posiadają łuki wchodzące i wychodzące.

Łuki wchodzące orientowane są w kierunku węzła, węzeł definiuje się jako wierzchołek końcowy tego poligonu. I odwrotnie dla łuków wychodzących węzeł jest wierzchołkiem początkowym. Węzeł pojawia się za każdym razem kiedy pojawiają się łuki.

Gdy dane przedstawiane są na płaszczyźnie nazywamy je grafami dwuwymiarowym. Z takim wyborem E2 możemy wypowiedzieć pojęcie płaszczyzny a co jest minimalnym cyklem dwuwymiarowym. Każdy łuk może być powiązany z lewym lub prawym „fensem”. Jeżeli łuk nie jest połączony z poligonem (luźny) wtedy jego prawy i lewy „fens” są takie same.

Informacja topologiczna jest absolutnie niezbędne dla generalizacji jako że zwykły zbiór odcinków i punktów nie może dostarczyć wystarczającej ilości informacji. Można używać różnych przedstawień topologii (np. siec, topologia pełna, mapa kombinatoryjna), im detale bardziej szczegółowe tym lepsze.

Rys.

2.1.3 Dane semantyczne

Dane semantyczne są definiowane nie geometrycznie a opisami danych geograficznych tworząc pewne całości zarówno proste (budynki, odcinki dróg, skrzyżowania) i złożone (grupy budynków, całe drogi i skrzyżowania z autostradą) . Każdej całości czy obiektowi możemy przypisać informacje określające jego cechy takie jak nazwę czy numer.

2.2 Modelowanie danych

2.2.1 Struktura modelowania danych

Dla opisu modelowania danych ogólnie rzecz biorąc stosuje się pojęcie zapożyczone z teorii zbiorów.

-Elementem zasadniczym, jest obiekt,

-Obiekty podobnie zgrupowane są w jednej klasie (zbioru),

-Dla zdefiniowania tych obiektów przypisuje się im atrybutu.

Obiekty podobnej klasy posiadają taką samą listę atrybutów, choć ich wartości mogą ulegać zmianie.

-Związki pomiędzy obiektami nazywane są relacjami. Relacje i atrybuty definiowane są na poziomie klasy i stąd są matematycznymi relacjami pomiędzy pokrewnymi zbiorami,

-Kiedy kompiluje się bazy danych definiuje się klasy, atrybuty i relacje pomiędzy obiektami,

Zdefiniowanie atrybutów oznacza:

-podanie jego typu (boolowskie, całkowite, rzeczywiste, charakterystyczne, inne),

-podanie kardynalności,

-domenę atrybutu (z listy lub podzbioru),

-sposób określenia wartości (przypisana, obliczona, wywiedziona).

Relacje mogą być:

-kompozycji (wartość, komponent),

-opisu (jest przedstawiony jako, blisko ..., przepływa przez, styka się z ..)

Inne informacje mogą być dodane w zależności od np. jakości danych (precyzja, ważność, wiarygodność) oraz linearyzacja (źródło, data, uaktualnianie). Zbiór klas, atrybutów i relacji jakie przypisane są bazie danych znany jest „schemat danych”. Model danych opisuje ramę w jakich zdefiniowany jest „schemat danych”. Model użyty w tej pracy jest wyprowadzony z modelu teorii zbiorów.

str. 8

2.2.2 Wybór przedstawień danych geometrycznych i semantycznych

Istniej kilka schematów danych z, pomiędzy których można wybrać sposób przedstawienia informacji geograficznych. Zasadniczo wybór zależy od przeznaczenia mapy i zastosowanego systemu zarządzania bazą danych. Np. można wybrać połączenie poziomów geometrycznego i semantycznego tak, że geometria staje się atrybutem obiektu geograficznego. Z drugiej strony można oddzielić geometrie od semantyki. W takim przypadku powszechnie definiuje się 3 podklasy:

-obiekty geometryczne : łuk, węzeł, krawędź,

- obiekty proste: obiekty semantycznie powiązane z obiektami geometrycznymi,

- obiekty złożone: konstrukcje z obiektów prostych lub złożonych

Np. droga państwowa jest obiektem złożonym składającym się z odcinków drogi. Odcinki drogi są obiektami prostymi złożonymi z obiektów geometrycznych: łuki. Skrzyżowanie na autostradzie jest obiektem złożonym obiektów prostych: drogi dojazdowe, itd.

Również możliwe jest pominięcie obiektów złożonych poprzez przepisanie atrybutów obiektom prostym, które obejmują obiekty złożone. (Np. obiekt złożony droga państwowa nr 7 może zostać pominięta a odcinkami drogi, które wchodzą w jej skład można przyznać atrybut „nazwa drogi” i wartość E7).

W zależności od użytej specyfikacji dane można pogrupować tematycznie (np. drogi, wykorzystanie gruntów, hydrografia). Każdy temat obejmuje dane geometryczne i semantyczne i posiada pewien zakres. Wielopoziomowe bazy danych nie są adoptowane do generalizacji, ponieważ trudno jest zapanować nad konfliktem bliskości pomiędzy różnymi poziomami. Co więcej trudno jest zachować integralność obiektu, gdy obiekty sąsiadujące rozdzielone są poprzez obiekty napisane na różnych poziomach (np. dwa budynki po przeciwnych stronach drogi).

W bazach danych o jednym poziomie, geometria obiektu może być wspólna dla różnych typów obiektów. Linia można równocześnie przedstawiać- geometrie drogi i granice np. lasu. Ponieważ obiekty te mają wspólną geometrie łatwiej jest zapewnić im kolineacje i opanować konflikty.

  1. Modelowanie obiektów geometrycznych i semantycznych

Ogólnie biorąc geometria obiektów opisywana jest jako zbiór punktów. W rozdziale 5 zobaczymy, że niektóre typy algorytmów upraszczania wymagać będą bardziej szczegółowego opisu typu geometrycznego w celu dokonania wyboru odpowiedniego algorytmu. Np. obiekt liniowy można opisać jako zbiór krzywych wielomianowych które łatwiej jest zniekształcić na zbiór odcinków. str.9

Atrybuty można przypisać obiektom geometrycznym w celu lepszego ich zdefiniowania [Buttenfield,91]. Np.

Gdy niektóre algorytmy wymagają takich parametrów warto je obliczyć i zachować przed rozpoczęciem operacji. Możliwe jest też przewidzenie typu potrzebnych atrybutów a w miarę potrzeby obliczenie ich wartości.

Co się tyczy obiektów semantycznych, niektórzy autorzy twierdzą, że geograficzne bazy danych powinny stać się czymś więcej niż prostym zbiorem punktów, linii, powierzchni posiadających określone atrybuty. Aby to uzyskać należy zintegrować pojęcia z wyższych poziomów, które wyjaśniają naturę fenomenów i struktur. [Neyegres 91].

Oczywistym jest obiekt, który zawiera informacje pozwalające na lepszą definicje tym łatwiejszy jest wybór w generalizacji. Odmiennie niż w przypadku map, gdzie czytelnik może wykryć złożone relacje pomiędzy obiektami prostymi a złożonymi, przy bazach danych z reguły nie można dokonać tego rodzaju analizy poznawczej. Np.

Często należy wiedzieć czy obiekt należy czy też nie do bardziej złożonej całości zanim jest się w stanie przeprowadzić generalizacje. W rezultacie jednym z pierwszych kroków jest określenie natury obiektów złożonych jakie bierze się pod uwagę i dopiero wtedy mogą one być skonstruowane z obiektów nie zgeneralizowanej bazy danych.

2.2.4 relacje pomiędzy obiektami

Nyerges dzieli informacje o obiektach na dwa znaczenia: wewnętrzne i zewnętrzne [Nyerges 91]

- znaczenie wewnętrzne obejmuje przestrzenne, czasowe i tematyczne aspekty obiektu,

- znaczenie zewnętrzne oparte jest na relacji obiektu z fenomenami geograficznymi.

Bogate bazy danych powinna zawierać znaczenia zarówno wewnętrzne jak i zewnętrzne.

Laurini [Laurini,92] dzieli relacje przestrzenne na trzy części:

- metryczne (odległość, kierunek),

- topologiczne (orientacja, sąsiedztwo, powiązania),

- rządowe (włączenie, wyłączenie).

Kilpelainen twierdzi, że dla prawidłowego opanowania konfliktów wewnątrz i międzyobiektowych należy znać relacje geometryczne pomiędzy jakimkolwiek obiektami.

- punkt punkt, jaka jest bliskość ?

- punkt linia, jaka jest bliskość? czy jest na linii?

- punkt powierzchnia, czy jest wewnątrz powierzchni?

- linia/ punkt, czy są połączone?

- linia linia, czy się przecinają ?

- linia powierzchnia, czy jest zewnątrz, czy się przecina?

- powierzchnia/ punkt, czy zawiera punkt?

- powierzchnia linia, czy zawiera linię?

- powierzchnia/ powierzchnia, czy się stykają , czy się nakładają?

str.10

Zrozumienie relacji powiązania i bliskości pomiędzy obiektami wydaje się być coraz bardziej kluczowe dla generalizacji. Poznanie bliskości obiektów pozwala na identyfikacje obiektów sąsiadujących gdzie występują konfliktu Zrozumienie gdzie istnieją relacje powiązania i jak je zachować zezwala na przekształcenie i przesuwanie obiektów przy jednoczesnym zachowaniu topologicznej konsekwencji (związku).

rys.

Zachowanie relacji powiązania polega na:

-przekształcaniu danych wyjściowych w jednopoziomowej bazie danych (jak pokazano poniżej) w zgodzie teoriami grafu planarnego,

-zachowanie relacji topologicznych na poziomie geometrii obiektu,

-dodanie ograniczeń każdego przesunięcia łuków i węzłów, co albo zachowuje relacje powiązania albo określa nowy stan powiązania. Np., jeżeli należy przesunąć skrzyżowanie, węzeł skrzyżowania można odzyskać wszystkie powiązane łuki poprzez relacje, łuki wchodzące i wychodzące. Pozwoliłoby to na przesunięcie dróg wchodzących w grę poprzez pojedyncze przesunięcie tego skrzyżowania. Innym problemem jest metoda przeniesienia tego procesu (czy go osłabić, w jakim kierunku, jak dalece).

Trudniejszym problemem są zmiany rozmiarów obiektów (np. powierzchnia w punkt) ponieważ nowe obiekty geometryczne muszą zostać stworzone dla zastąpienia wyjściowych przy zachowaniu powiązań obiektów (np. jeżeli skrzyżowanie składa się z kilku łuków i zmieniamy je w węzeł, węzeł ten powinien dalej być powiązany z głównymi drogami pozostającymi).

Badania generalizacji coraz częściej wprowadzają pojęcie bliskości (Beard, Muller, Nyerges, the IGN). Problem polega na poznaniu kiedy (w jakiej odległości) i jak (jaką metodą) należy ją obliczyć. Proste obliczenie odległości pomiędzy wszystkimi obiektami geometrycznymi jest zadaniem bezużytecznym. Dla uwzględnienia relacji bliskości istnieją dwie możliwości strategii

  1. za nim nastąpi modelowanie lokalizacji obiektów odległości pomiędzy obiektami są obliczone, uwzględnione w modelu i następnie kontrolowane podczas generalizacji albo przez ich zachowanie lub ponowne obliczenie w zależności od niezbędnych modyfikacji (zmiana położenia albo rozmiaru),

  2. przy niektórych operacjach odległości pomiędzy obiektami oblicza się gdy jest to niezbędne.

Pierwsza strategia daje dość wiarygodne narzędzie dla kontroli i wykrywania danych albo prowadzi do czasochłonnego tworzenia baz danych, którymi ciężko jest zarządzać ze względu na potrzebną pamięć i procedury kolineacyjne (powiązań).

Druga strategia proponuje budowę bazy danych nie tak bardzo odmiennej od klasycznej ale stwarza ryzyko ograniczenia automatycznego rozwiązywania konfliktów. Albo wiele konfliktów trudno będzie wykryć co wiąże się z długą fazą pośrednią albo wiele odległości będzie pominiętych co wymagać będzie ich obliczania na bieżąco i spowolni cały system.

Te dwie strategie różnią się znacznie i dlatego ten kompromis pomiędzy nimi jest rozwiązaniem idealnym.

Relacja bliskości może zostać użyta dla powiązania obiektów posiadających wspólne obiekty złożone np. gdy istnieje potrzeba usunięcia kilku budynków z zbioru budynków w strefie miejskiej oraz pominięcie innych. Jeżeli da się powiązać te budynki i rozpoznać sposób ich rozrzucenia przy użyciu siatki, której precyzja powiązana jest z położeniem budynków, można wtedy wpierw zgeneralizować siatkę i wtedy użyć zachowane przecięcia jako wskaźniki gdzie należy usunąć zachowane budynki w nowo zgeneralizowanej strukturze. Powiązanie budynków i stąd struktura siatki powinny być oparte na kryterium semantycznym (obiekty powinny być powiązane przez ich podobieństwo w naturze) i geometrycznie (budynki powinny być zawarte wewnątrz określonego obszaru pozostając jednocześnie blisko siebie).

[Neyrges 91] stwierdza że struktury takie oparte są na istnieniu relacji sąsiedztwa pomiędzy obiektami. Sąsiedztwo daje zbiór obiektów połączonych relacjami, który funkcjonuje jako całość geograficzna, czyli obiekt złożony zwany też „meta obiektem”. W ten sposób pojęcie bliskości może być użyte dla tworzenia obiektów złożonych i rozwiązywania konfliktów.

Str.12

Modelowanie i definicja danych

3.1 Wprowadzenie

W naukach o Ziemi i informacji geograficznej postrzeganie świata może być dwojakie: jako różnych zjawisk lub jako zjawisk w jakiś sposób połączonych ze sobą. Sposób, w jaki dane są modelowane i dzielone na struktury, dostarcza informację i w wyniku tego większą ilość wiedzy na podstawie danych. W środowisku GIS dane często są oddzielone od ich interpretacji czy znaczenia (rozumienia), zaś interpretacje danych nie zawsze są wyraźnie zachowane. Dzieje się tak częściowo w wyniku ograniczenia sprzętowego i programowego w zakresie przechowywania danych, a częściowo ponieważ komputery niezbyt efektywnie posługują się językiem naturalnym, który jest w dalszym ciągu głównym sposobem kodowania interpretacji i znaczenia danych [Shapiro, 1987; Tsichritzis i Lochovsky, 1981]. W niektórych punktach jednak dane powinny być połączone z interpretacją przy użyciu struktur, które w pewien sposób umożliwiają wielość interpretacji czy abstrakcji otrzymanych z tych samych danych. Od momentu, gdy przy generalizacji abstrakcja danych znalazła się na innych poziomach niż skala, a sposób wykorzystania danych w aplikacjach znacząco się zmienił, prowadząc również do abstrakcji, można stwierdzić, że podstawowy model danych pozwala na maksymalną elastyczność wykorzystania danych, zapewniając jednocześnie stabilne ich środowisko. Dodatkowo, rozpatrując abstrakcję jako proces generalizacji oraz jako proces modelowania, model danych powinien być dostatecznie giętki, aby zapewnić wizualizację danych w wieloraki sposób, jak również wielu danych w sposób jednakowy, jeśli zajdzie taka potrzeba. Na przykład na pewnych poziomach generalizacji i odpowiednio do pewnych kontekstów interpretacja powinna dopuszczać, że jeziora i rzeki prezentowane są tylko jako rzeki. W ten sposób, w kontekście generalizacji model dopuszcza zmienny poziom abstrakcji zależnie od skali i aplikacji.

W idealnej sytuacji ostateczny model danych będzie umożliwiać wykonanie interpretacji zjawisk geograficznych w odniesieniu do wszystkich potrzeb aplikacji lub generalizacji. Dopóki nasza wiedza o środowisku jest niekompletna i nieskończona, jest niepodobnym i przez to ważnym, aby model danych był wyposażony w stosowną ilość znaczeń, odpowiednio do pożądanego wykorzystania danych.

3.2 Wybór modelu danych

Baza danych, która może właściwie odpowiadać na lub przystosowywać się do procesów abstrakcyjnych wymaganych w generalizacji, jak również abstrakcje wymagane przez różne konteksty aplikacji, powinny w dużym stopniu opierać się na leżącym u podstaw koncepcyjnym modelu danych i wynikających z niego translacjach danych do projektu i struktur logicznych tego modelu. Formułowanie modelu koncepcyjnego powinno być poprzedzone przez analizy typów danych odpowiednio do kontekstu, do którego będą dołączane. Przez to opracowanie modelu koncepcyjnego powinno się zogniskować na strukturyzacji danych i zdefiniowaniu związków pomiędzy elementami, niezbędnych dla aplikacji. Proces ten winien być niezależny od aktualnej fizycznej implementacji, innymi słowy, koncepcyjny model danych powinien być transformowalny do modeli logicznych - relacyjnych, hierarchicznych, sieciowych lub zorientowanych obiektowo.

Projekt modelu logicznego, który w procesie projektowania bazy danych odzwierciedla ideę modelu koncepcyjnego, opracowywany w relacji do ustalonego systemu zarządzania bazą danych. Proces ten przekłada funkcje modelu koncepcyjnego na język systemu zarządzania bazą danych.

3.2.1 Wybór danych i aplikacji

Do opisu koncepcyjnego modelu danych niezbędny jest przegląd danych wraz z komentarzem na temat ich planowanego czy przewidywanego wykorzystania. Dane wybrane do testowania są wydzielone poniżej wraz z ich definicjami i wymogami odnośnie ich przetwarzania w kontekście aplikacji. Przedstawiono również krótko niektóre związki pomiędzy różnymi typami danych.

Przy wyborze danych do testowania transformacji kontekstowych niezbędnym był wybór takiego zbioru danych, którym można byłoby zarządzać, a jednocześnie, aby zbiór taki mógł być dostępny w postaci map konwencjonalnych w różnych skalach dla celów porównawczych. Jako takie, wybrane „elementy mapy” są w normalnych warunkach uznawane za podstawowe obiekty mapy. Dane bazowe uzupełniają (wspierają) dane tematyczne i mogą zawierać elementy jak np. granice administracyjne, miasta, drogi oraz warstwę hydrografii. Dane geometryczne i tematyczne wybrane do celów badawczych będą generalizowane z uwzględnieniem ich zawartości informacyjnej. Dzięki temu każdy element mapy będzie zachowywał wszystkie atrybuty na równi z aspektami przestrzennymi, takimi jak topologia. Zastosowany tutaj zbiór danych zapewnia przetwarzanie strukturalne oraz zachowanie kontekstu przestrzennego dla danych tematycznych, dlatego też wybrane elementy zapewniają zbiór danych tematycznych możliwych do zarządzania, nadający się również do przeprowadzania analiz.

Przy selekcji danych geometrycznych i tematycznych do celów testowych rozważano również kilka innych aspektów, np. typy danych geometrycznych, które będą przetwarzane. Wybór padł na trzy podstawowe elementy geometryczne: punkty, linie i powierzchnie. W przypadku danych typu punktowego przy selekcji powinien zostać również uwzględniony opis tematyczny w postaci hierarchii klasyfikacji, (np. superklasa - obszar zaludniony, poziomy klas oraz poziomy obiektów). Obiekty typu liniowego powinny być wybierane do testowania na podstawie kryteriów wyszczególnionych w rozdziale Błąd! Nie można odnaleźć źródła odsyłacza.. Dane powierzchniowe zostały wybrane do testowania łączenia wieloboków wewnątrz hierarchii klasyfikacji, jak również do testowania łączenia obiektów należących do różnych klas (np. jeziora i rzeki) oraz różnych typów obiektów (np. linie i powierzchnie). Wybrane dane wraz z ogólną definicją danych i ich typów zawiera tabela 3.א

Tabela ג:

Ogólne definicje wybranych testowych danych tematycznych i geometrycznych.

0x01 graphic
0x01 graphic

3.2.2 Abstrakcja i przestrzenne modelowanie danych

Nie istnieje jednoznaczna teoria w zakresie procesu generalizacji map [Brassel i Weibel, 1988], i w wyniku tego procesy abstrakcji zawarte w opracowaniu map uproszczonych mogą przyjmować różne postaci. Jest to po części wynikiem aspektów mapy, takich jak przeznaczenie mapy i związek tego przeznaczenia z elementami, które na tej mapie się znajdują. Niektóre z nich mogą zostać uznane za ważne i niezbędne, inne zaś - za mniej ważne. Przy takim podejściu generalizacja jest procesem zależnym od użytkownika i aplikacji. Procesy zawarte w generalizacji uwarunkowane są również czynnikami takimi, jak percepcja, znajomość i inne procesy o charakterze intelektualnym [Brassel i Weibel, 1988]. Muller [1990] podsumował niektóre z podstawowych założeń w zakresie prac związanych z generalizacją, oddziałujące w pewnym (założonym) stopniu na przeznaczenie mapy, środowisko aplikacji, percepcję i znajomość.

  1. Jest wiele możliwych alternatywnych rozwiązań w generalizacji.

  2. Generalizacja przeprowadzona przez dwóch różnych kartografów zwykle dostarcza dwóch różnych rozwiązań.

Z tego powodu, wykorzystując model danych będący w koniunkcji z aplikacjami do generalizacji, jest ważne, aby wewnętrzna zmienność, którą można założyć w procesie generalizacji, została odzwierciedlona w podstawowej strukturze modelu danych. Ponieważ generalizacja przedsiębrana jest zwykle w kontekście aplikacji lub pewnej formie przestrzennego modelowania danych, niektóre wymagania odnośnie struktur danych, niezbędnych w przestrzennym modelowaniu, powinny być zachowane również w aplikacjach do generalizacji i należy je testować także w tym świetle. Na przykład przestrzenne modelowanie danych charakteryzowane jest częściowo przez manipulację obiektami, które są zwykle wysoko zestrukturyzowane i często złożone z innych obiektów. Przykładem tutaj może być zastosowanie aplikacji, w której modelowane są obiekty takie, jak metropolie, miasta, drogi i budynki [Kemp, 1990]. Miasto jest obiektem złożonym, który może zawierać inne obiekty, jak np. tereny zurbanizowane, tereny rezydencjalne, przemysłowe itp., prezentowane jako obszary, drogi i linie kolejowe, prezentowane jako obiekty liniowe. Jeżeli będziemy rozpatrywać możliwość tranzytu osobowego (publicznego), przetwarzanie danych będzie wymagało nie tylko informacji o charakterze przestrzennym, takich jak geometria, topologia czy położenie, lecz także informacji tematycznych. Aspekty te są powszechne dla wielu typów modelowania przestrzennego i odnoszą się również do aplikacji do transformacji kontekstowych. Dlatego, w kontekście modelowania przestrzennego i odpowiadającej mu generalizacji, model powinien dopuszczać następujące aspekty:

  1. modelowanie elementów graficznych i tematycznych w sposób zintegrowany,

  2. modelowanie danych tematycznych z jednego poziomu pomiaru do innego jak np. transformowanie odległości lub podział danych na porządkowe i nominalne,

  3. zdolność do geometrycznego transformowania różnych poziomów abstrakcji tematycznych na różne skale przedstawienia.

Pomimo braku teorii generalizacji, model danych powinien spełniać wymienione oczekiwania. Wymaga to działań takich, jak dekompozycja danych, identyfikacja encji i obiektów oraz ustalenia związków przestrzennych i tematycznych.

3.2.3 Pojęcia niezbędne w modelowaniu danych

Właściwy opis modelowania danych wymaga kilku definicji. Ważne są trzy kategorie definicji, a jak dotąd żadna z nich nie posiada zestandaryzowanej terminologii. Pierwszą kategorię stanowi terminologia geograficzna. Używając terminów geograficznych próbujemy zrozumieć i opisać nasze postrzeganie świata. Terminologia geograficzna jest wysoce abstrakcyjna i wymaga wiele percepcji, wiedzy, umiejętności wnioskowania i semantyki i przewyższa dalece aspekty techniczne systemów informacji przestrzennej i kartografii automatycznej.

Drugi poziom terminologii sięga do terminologii bazy danych. Na tym poziomie próbujemy przełożyć nasze postrzeganie świata rzeczywistego na język środowiska cyfrowego. Natomiast abstrakcyjna i kontekstowa natura terminologii geograficznej stanowi przeszkodę w projektowaniu modelu będącego „prawdziwym przedstawieniem” świata rzeczywistego. Pomimo to, wewnątrz takich granic koncepcyjnych, środowisko cyfrowe daje możliwość interpretacji otaczającej rzeczywistości.

Trzeci i ostatni poziom definicji dotyczy terminologii geometrycznej bazującej na teorii grafów. Poziom ten jest uznawany za poziom operacyjny, który zawiera aspekty podstawowe niezbędne do skonstruowania modelu cyfrowego.

Tabela 3.ב przedstawia zestawienie niektórych pojęć ważnych przy wyborze modelu danych i jego translacji na struktury logiczne. W każdej z trzech kategorii definicji pokazane są odpowiednie przykłady, w niektórych przypadkach łącznie z aspektami odpowiadającymi jednej spośród wielu kategorii terminów. (zob. również Dodatek 3.1)

Tabela ג

Pojęcia geograficzne, bazodanowe i geometryczne

0x01 graphic

0x01 graphic

0x01 graphic
0x01 graphic

3.3 Wybór koncepcyjnego modelu danych

Model danych w swoich koncepcyjnych założeniach musi wspierać i odpowiadać wymaganiom generalizacji. Jako taka, wewnętrzna zmienność, przewidywana w generalizacji powinna być sterowalna odpowiednio do modelu koncepcyjnego i realizowalna przez przełożenie na struktury logiczne.

Przy zapewnieniu, że koncepcyjny model danych będzie zgodny z wymogami generalizacji z wykorzystaniem transformacji kontekstowych, opisano kilka potrzeb (wymagań). Potrzeby te występują przy translacji modelu koncepcyjnego na logiczne struktury danych, a następnie przy przetwarzaniu tych struktur z wykorzystaniem modelu generalizacji omówionego szerzej w rozdziale Błąd! Nie można odnaleźć źródła odsyłacza..

Model danych powinien:

  1. Mieć możliwość translacji na struktury logiczne tak, aby można było dokonywać na danych wielorakich interpretacji czy abstrahowania.

  2. Umożliwiać różne poziomy abstrakcji odpowiednio do różnych wymagań związanych z generalizacją, jak np. wymogi aplikacji czy skali.

  3. Umożliwiać generalizację i specjalizację obiektów wewnątrz hierarchii klasyfikacji oraz dostosowywać połączenia pomiędzy różnymi klasami obiektów, jak np. rzeki i jeziora.

  4. Umożliwiać przetwarzanie danych graficznych i tematycznych w sposób niezależny lub w sposób zintegrowany zależnie od potrzeb, dla których wykonuje się mapę.

3.3.1 Formalny model struktury danych

Model wykorzystywany do testowania generalizacji opartej na regułach bazuje na formalnej strukturze danych (formal data structure, FDS)dla jednowartościowych map wektorowych opracowanych przez Molenaara [1989, 1990 i 1991]. Dla celów badań formalna struktura danych, omówiona tutaj, sprawdzona została w przestrzeni dwuwymiarowej.

FDS stanowi topologiczny model danych posiadający możliwość zapewnienia realizacji wszystkich wymienionych powyżej wymagań dla transformacji kontekstowych. Zarządza zarówno geometrycznymi, jak i tematycznymi aspektami geoinformacji, używając elementarnych typów danych, jak punkty, linie, obszary oraz zbiorów geometrycznych linków (powiązań) pomiędzy typami danych i obiektami w celu zapewnienia „obiektowo zorientowanej” struktury danych. Środowisko ułatwia przeprowadzanie analiz związków topologicznych pomiędzy elementami geometrycznymi i obiektami, i konstrukcji obiektów złożonych. Na rysunku 3.ג widoczne są połączenia pomiędzy identyfikatorem obiektu, danymi geometrycznymi i danymi tematycznymi na bardzo ogólnym poziomie. Strzałki pomiędzy elipsami wskazują zależność typu „jeden do wielu”, np. wiele obiektów należących do jednej klasy. Rysunek 3.ד pokazuje bardziej szczegółowy model koncepcyjny i pokazuje hierarchę ważności łuków i węzłów (node'ów) w strukturze globalnej.

0x01 graphic

Rys. ג Podstawowa struktura FDS

Przy wykorzystaniu FDS należy podkreślić następujące warunki: (używana terminologia odpowiada tej, która została opisana w rozdziale 3.2.4 i może się różnić od terminologii podanej w literaturze)

  1. klasy obiektów muszą się wzajemnie wykluczać, to znaczy, każdy obiekt posiada dokładnie jedną klasę etykiet,

  2. klasa obiektów zawiera dane geometryczne jednego typu,

  3. rozpatrując mapę jako graf, wszystkie punkty użyte do opisu geometrii są traktowane jako węzły,

  4. łuki w tym grafie są reprezentowane geometrycznie jako odcinki linii prostych,

  5. dla każdej pary węzłów jest co najwyżej jeden łuk, który je łączy. Dodatkowo, węzły mogą być połączone w jeden lub więcej łańcuchów.

  6. dla każdego łuku a = {np, nq}, w którym np ≠ nq, graf może nie zawierać pętli,

  7. dla każdego geometrycznego typu danych jest tylko jedno zdarzenie połączenia z obiektami; np. łuk może być co najwyżej jednym obiektem liniowym i posiadać obszar po lewej i jeden obszar po prawej stronie.

3.3.2 Związki topologiczne

Przy użyciu FDS można zidentyfikować kilka związków topologicznych, które czynią model przydatnym narzędziem do analiz. Na przykład, związki topologiczne obecne w FDS kierują właściwościami takimi, jak sąsiedztwo, wyspa, rozgałęzienie, skrzyżowanie, przecięcie, koniec, wnętrze itd. Te zdolności mogą być wykorzystywane do różnych manipulacji, będących fundamentalnymi wymaganiami dla generalizacji. Algorytmy do przemieszczania obiektów mogą być upraszczane przez związki takie, jak ograniczenie obszaru linią, zwłaszcza w szczegółowych mapach topograficznych dla obszarów zurbanizowanych. Algorytmy do łączenia obiektów mogą również podlegać tym uproszczeniom, np. jeden obszar styka się z innym. Związki te i inne przedstawiono na rysunku 3.ה. Wreszcie, jak większość modeli koncepcyjnych, FDS może być przedstawiany w kilku modelach logicznych jak relacyjny, hierarchiczny, sieciowy czy zorientowany obiektowo.

0x01 graphic

Rys ג FDS dla jednowartościowych map wektorowych w przestrzeni dwuwymiarowej

3.4 Podsumowanie

Abstrahowanie i definicje obiektów są w dużym stopniu zależne od użytkownika i kontekstu. Dlatego ważne jest, aby model danych był dopasowywany i/lub rozwijany w odniesieniu do kontekstu, w którym będzie stosowany. Wyboru formalnej struktury danych dokonano w oparciu o związki topologiczne oraz relatywną łatwość, z jaką generalizacja w formie transformacji kontekstowych może być wykonywana przy użyciu FDS jako podstawy. Niezbędne dla celów generalizacji jest rozróżnienie wewnątrz modelu pomiędzy komponentami tematycznymi i geometrycznymi. Model zawiera również koncepcję hierarchii klas, zapewniając w ten sposób możliwość projektowania koncepcyjnego struktur podklas, klas i superklas na poziomie logicznej struktury danych. Wymagania dla transformacji kontekstowych należy rozumieć także w ten sposób, że struktury danych uformowane wewnątrz kontekstu FDS muszą dopuszczać dekompozycję danych jak również ich łączenie. W projekcie koncepcyjnym FDS translacje struktur logicznych umożliwiają tak dekompozycję jak i łączenie danych, co jest podstawą procesu generalizacji.



Wyszukiwarka