Typ |
zalety |
niedogodności |
nsiacOT |
Prosta struktura. topologa. łatwy doslęp do wyszukiwania danych ianakz, szybki i efektywny dzięki bezpośredniemu dosiępowi do danych. Może operować dużymi zbiorami danych. |
Ograniczona reprezentacja rzeczywstosc. Ograniczona elastyczność zarządzania danymi |
octowy |
Umożlrwg złożoną reprezentację świata realnego. Akceptoje wiele poziomów agregacji i generalizacji. Zachowuje historię bazy danych. Integruje sę dobrze z modelami symulacyjnymi. |
Ztożone modele rudne do zaprojektowania i stw> Trudności w wymanie danych z mym bazami danych. Złożone modele są wolne w realizacji numerycznej. |
retecypo- ctwektowy |
Cbełdy są opcjonalne da modelu relacyjnego i są używane głównie da zachowana htegralnośd relacyjnej bazy danych. Tabkcc rozszerzone w stosunku do relacyjnej bazy danych są używane do dokumentowania reguł atrytxAćw izateżnośd przestrzennych. Szybki w realizacje |
Kompromis rmęczy modelem relacyjnym iobiek- |
noj. Takii* warstwy stanowi.-) np. drogi, pokrycie terenu, sieć osadnicza. Tablica zawiera tyle wierszy, ile obiektów wyróżniono w danej warstwie i tyle kolumn, iloma atrybutami są charakteryzowane obiekty. Tablice, w których zapisuje się dane przestrzenne, zawierają kolumny kodujące lokalizację (shape coluinn) w skompresowanym zapisie binarnym. W relacyjnej bazie danych można łączyć ze sobą wiele tablic poprzez ich wspólne kolumny.
łączenie tablic (ang. join = połączyć, skojarzyć, zespalać) jest źle tłumaczone na polski jako tworzenie relacji. To, że w wyniku łączenia powstają nowe tablice mówi zdanie zaczerpnięte od P.A. Longleya [35j: „Daiabase tables can be joined together to create new relalions,, czyli „Tablice bazy danych mogą być łączone dla tworzenia nowych tablic".
Nazwa ,.relacyjna baza danych" (relational database) pochodzi nie od relacji (zależności) między tablicami, bo takich zależności nic ma i każda z tablic może spełniać swoją rolę samodzielnie. Pochodzi od tego, że twórca relacyjnego modelu baz danych E.F. Codd użył pojęcia relacji stosowanego w teorii mnogości w matematyce. W matematyce definiuje się relację jako podzbiór iloczynu kartezjańskiego zbioru wartości. Reprezentacją relacji jest dwuwymiarowa tablica złożona z kolumn i wierszy. W podejściu praktycznym zastosowanym do baz danych relacja oznacza więc tablicę.
E.F. Codd sformułował w roku 1970 pięć podstawowych zasad projektowania struktury tablic dla relacyjnych baz danych. Są one stosowane w dalszym ciągu. Dzięki swojej prostocie i dużemu wyborowi oprogramowania (Microsoft Access, Microsoft SQL, IBM DB2, Informix Dynamie Server, Oracle Universal Server), relacyjne bazy danych opanowały 95 % rynku przestrzennych i nie-przestrzennych baz danych.
Ponieważ jednak model relacyjny ma kilka niedogodności w zastosowaniach do danych przestrzennych (trudności w pełnym zapisywaniu obiektów w jednej bazie danych, zapisywaniu obiektów o dużej różnorodności, stawianiu złożonych zapytań) opracowano obiektowo zorientowany model danych. Model ten teorety cznie powinien lepiej opisywać rzeczywistość, bo operuje całymi obiektami i ich powiązaniami z otoczeniem, a nie zatomizowanymi pojedynczymi cechami, jak model relacyjny. W praktyce jednak tworzenie obiektowych baz danych i korzystanie / nich jest skomplikowane i ten model nie spełnił pokładanych w nim oczekiwań, mimo dostępności oprogramowania.
Wprowadzono więc wiele modyfikacji do oprogramowania dla modelu relacyjnego, które zwiększyły możliwość tworzenia zbiorów o dużej objętości dla obiektów z dużą liczbą cech i dostosowały język zapytań do potrzeb analiz przestrzennych. Obecnie jest więc dostępne oprogramowanie do tworzenia relacyjno-obiektowych baz danych (IBM DB2, Spatial Extender, Informix Spatial Datablade, Oracle Spatial Option). Spełnia ono wiele funkcji wymaganych od oprogramowania dla GlSu.
Zalety i niedogodności omówionych trzech typów baz danych zestawiono w tablicy według komentarzy R. Tomlinsona zawartych w „Thinking about GIS" (Tabela 2).
Tabela 2. Porównanie relacyjnych, obiektowych i relacyjno-obiektowych baz danych według R.Tomlinsona.
Dla celów tego projektu przebadano metodykę tworzenia relacyjnych, obiektowych i relacyjno-obiektowych baz danych wraz z oprogramowaniem do tworzenia tych baz danych. Analiza była zdeterminowana produktami dostępnymi na rynku, rodzajami oprogramowania stosowanego w jednostkach Urzędu Marszałkowskiego i doświadczeniami własnymi wykonawców.
Jako docelowy system zarządzania bazami danych będzie zalecany system Oracle.
Mimo, że jest on powszechnie stosowany do zarządzania nieprzestrzennymi bazami danych, to ma również moduły do równoczesnego zarządzania danymi przestrzennymi i nieprzestrzennymi (spatial option).
Do tworzenia pojedynczych baz danych, zanim będą przekonwertowane do środowiska Oracle, będzie zalecane oprogramowanie Microsoft Access, jako powszechnie dostępne, łatwe do nauczania i dobrze współpracujące 7. częścią graficzną baz danych.
Ponieważ dotychczas jednostki Urzędu Marszałkowskiego gromadziły wicie danych korzystając z arkuszy MS Excel, opracowano metodę konwersji tych danych do środowiska MS Access.
d) Łączenie danych opisowych
z geometrycznymi
Wspomniano już wielokrotnie, że bazy danych przestrzennych zawierają dane o lokalizacji i zasięgu przestrzennym obiektów, nazywane często danymi geometrycznymi, oraz dane opisowe przedstawiające właściwości obiektów, nazywane danymi semantycznymi lub atrybutami. W początkowym okresie tworzenia systemów informacji przestrzennej łączenie danych opisowych z danymi geometrycznymi stanowiło poważny problem techniczny. Współczesne oprogramowanie czyni to szybko i niezauważalnie.
Obiekty świata realnego (obiekty przestrzenne) są przedstawiane w obrazach abstrakcyjnych tego świata (modelach) w zapisie wektorowym jako punkty, linie (łamane), powierzchnie (wielokąty zamknięte) i wielo-ściany, a w zapisie rastrowym jako piksele (zbiory pikseli) i woksele (piksele trójwymiarowe). Przy tworzeniu baz danych przestrzennych w jednej warstwie tematycznej umieszcza się jeden typ obiektów (punktowe, liniowe, powierzchniowe) i zapisuje się je w jednej tablicy. Jest więc potrzebna osnowa geometryczna punktowa, liniowa i powierzchniowa, ale niezależnie od jej typu, sposób zapisu danych geometrycznych jest taki sam. Są zapisane współrzędne punktów (jednego lub sekwencji punktów) i systemowy identyfikator dla każdego obiektu (punktu, odcinka łamanej, poligonu), nieraz jeszcze inne identyfikatory, np. TERYT dla jednostek administracyjnych, identyfikatory IMGW dla odcinków cieków.
Osnowę geometryczną punktową tworzą więc np. współrzędne punktów osadniczych (miejscowości przedstawione jako punkt, a nie jako poligon), ich identyfikatory i nazwy własne. Każdy zbiór danych charakteryzujących punkt osadniczy (liczba ludności, powierzchnia, typ administracyjny, wykaz instytucji i firm znajdujących się w miejscowości itd.) można połączyć z osnową geometryczną, jeśli w tablicy danych opisowych i w tablicy danych geometrycznych będzie jedna wspólna kolumna, np. nazwa miejscowości. Ponieważ, jednak identyfikacja poprzez nazwę miejscowości nie jest jednoznaczna, bo jest wiele miejscowości o tej samej nazwie, to trzeba dodawać drugi identyfikator (w jakiej gminie jest położona miejscowość) lub stworzyć unikalny identyfikator dla każdej miejscowości. Dopiero wtedy można jednoznacznie łączyć dane opisowe z osnową geometryczną i wybierać dane z bazy danych według miejscowości. Ilustruje to rysunekl2.
Osnowę geometryczną liniową tworzą sektory dróg, cieków wodnych i innych obiektów liniowych, jak linie elektroenergetyczne, gazociągi, rurociągi paliw płynnych. Elementami jednostkowymi tej osnowy, do których przypisuje się dane opisowe, są odcinki (sektory). Sposób podziału całej sieci na odcinki jest różny dla różnych rodzajów sieci.
Jeśli w przypadku obiektów punktowych część opisową bazy danych można tworzyć niezależnie od osnowy geometrycznej i później połączyć obie części, to w przypadku obiektów liniowych wcześniej musi być stworzona osnowa geometryczna. Sektory elementów liniowych otrzymują unikalne identyfikator)' i dopiero wtedy tym sektorom przypisuje się atrybuty. Oczywiście, w fazie roboczej rolę osnowy geometrycznej mogą pełnić papierowe mapy z zaznaczonymi sektorami sieci i ich identyfikatorami.
Konsultacja bazy danych i wizualizacja może sie odbywać poprzez dowolny z atrybutów zapisanych w bazie danych. Przykład przedstawia rysunek 13.
Osnowę geometryczną dla obiektów powierzchniowych mogą stanowić granice jednostek administracyjnych, granice jednostek innych podziałów terytorialnych, poli-
55