Przez konwersje danych rozumie się w SIP najczęściej zamianę mapy lub zdjęcia lotniczego z postaci analogowej (papierowej) na postać cyfrowa. Dokonuje sie tego przez skanowanie lub ręczna digitalizację.
W sytuacji, kiedy dla wszystkich baz danych systemu jest przygotowana w postaci cyfrowej jednolita osnowa geometryczna, ten rodzaj konwersji danych nie ma już tak dużego znaczenia jak kilka lat wcześniej. Niemniej procesowi skanowania, kalibracji danych po skanowaniu i ich dalszemu przetwarzaniu poświęcono w tym zadaniu sporo uwagi. Po pierwsze dlatego, że dla pozyskania wielu danych tematycznych (glebowych, geologicznych) istnieje w dalszym ciągu potrzeba skanowania archiwalnych map papierowych, po drugie zaś w trakcie skanowania i przetwarzania danych popełnia się wiele błędów obniżających jakość danych wprowadzanych do systemu.
Również wiele błędów popełnia się przy zamianie danych rastrowych na postać wektorową. Poprawności metodycznej tej operacji również poświęcono sporo uwagi.
Powstało więc małe opracowanie metodyczne mówiące, jak poprawnie krok po kroku te procesy powinny przebiegać (A. Głażew-ski, „Przetiwrzanie danych kartograficznych").
Operacje skanowania i wektoryzacji nie wyczerpują całości problematyki konwersji i przetwarzania danych. Inne zagadnienia występujące w tym obszarze były rozwiązywane w ramach różnych projektów pilotowych.
Metodyka przetwarzania danych rastrowych i łączenia ich z danymi wektorowymi była najszerzej badana w projekcie pilotowym „Mapy i zdjęcia satelitarne".
Metodyka łączenia danych wektorowych i opisowych była rozwijana we wszystkich projektach pilotowych, w których łączono dane opisowe z baz danych GUS z osnową geometryczną uzyskaną z BDO.
Metody wizualizacji danych były testowane przy druku wiciu wariantów mapy satelitarnej, przy bazach danych przyrodniczych (pokrycie terenu, gleby) i przy bazach
danych up.ui\«h na danych MalyMwmJ. (bezrobocie, demografia, rduLuj.i, rnlnutwo) Opracowano specjalna aplikację po/walajacą na szybkie generowanie map na podstawie danych statystycznych.
Niezbędne operacje, zależnie od stosowanego oprogramowania, zostały opisane w poszczególnych projektach pilotowych.
Konwersja i przetwarzanie danych sa bardziej złożone, jeśli dotyczą danych pozyskiwanych z różnych źródeł i różnymi metodami. Mówimy wtedy o integracji danych z różnych źródeł. Występują tu klasyczne i rozwiązane już metodycznie:
• doprowadzanie danych geometrycznych do jednej skali i jednego odwzorowania kartograficznego,
■ doprowadzanie danych opisowych do takiej samej klasyfikacji.
Operacje na danych geometrycznych są łatwiejsze, bo w wielu oprogramowaniach istnieją moduły do konwersji danych między odwzorowaniami. Jednakże zależnie od jakości i rodzaju materiałów źródłowych, typu terenu i celu opracowania należy zadecydować, jaki typ transformacji będzie najlepszy i jaki stopień wielomianu zastosować.
Niewiele osób zdaje sobie sprawę z faktu, i ze zwiększając stopień wielomianu uzyskuje się lepsze wyniki na punktach wpasowania, ale zmniejsza się dokładność punktów położonych między punktami wpasowania.
Potrzebna też jest umiejętność oceny, w jaki sposób należy wyznaczyć współrzędne punktów, które będą wykorzystane jako punkty wpasowania oraz jak rozmieścić i identyfikować te punkty. Dla jakich celów wystarczy wyznaczenie współrzędnych z mapy topograficznej (w jakiej skali?), dla jakich z pomiaru GPS, a dla jakich z ortofotomapy?
Obecnie przy dużej łatwości wykonywania pomiarów GPS i niedużych ich kosztach, współrzędne punktów z pomiarów GPS należy stosować nie tylko dla wykonania transformacji, ale i dla oceny bezwzględnej karto-metryczności produktu po transformacji.
Nie podajemy tu konkretnych liczb i konkretnych zaleceń, bo zależą one od rodzaju danych, które są poddawane transformacji.
Np. trudniejsze i bardziej pracochłonne jest przetwarzanie danych geometrycznych z mapy glebowo-rolniczej wydrukowanej na podkładzie nie zawierającym ani współrzędnych
geograficznych, ani współrzędnych płaskich, a łatwiejszo przetwarzanie danych z mapy geologicznej wykonanej na podkładzie mapy w układzie 1942.
Użytkownikom danych obrazowych (zdjęć satelitarnych, zdjęć lotniczych, ortofotomap) mało jest znany fakt, że każda transformacja geometryczna obrazu rastrowego pogarsza wartość interpretacyjna obrazu poprzez prze-próbkowanie (nadanie pikselom nowych wartości radiometrycznych). W niektórych przypadkach może pogorszyć jakość obrazu do 30 %. Dlatego jeśli istnieje potrzeba łączenia obrazu rastrowego, np. mapy satelitarnej z obrazem wektorowym (np. sieć dróg, granice administracyjne) lepiej jest przed nałożeniem obu obrazów transformować obraz wektorowy do geometrii obrazu rastrowego, a nie odwrotnie. Miedzy innymi z tego powodu, aby uniknąć późniejszych transformacji mapy satelitarnej województwa, opracowano ja w odwzorowaniu UTM i w układzie PUG 92.
Przetwarzanie danych opisowych to głównie ujednolicenie klasyfikacji obiektów i wartości atrybutów. Są to operacje uciążliwe w przypadku korzystania z materiałów źródłowych wykonywanych w różnych instytucjach i w różnych latach. Bardziej stabilne są klasyfikacje obiektów topograficznych, bardziej zmienne klasyfikacje obiektów przyrodniczych, choć i w przypadku obiektów topograficznych na różnych mapach stosuje sie odmienne klasyfikacje obszarów zabudowanych i dróg.
Klasycznym przykładem zmienności klasyfikacji obiektów przyrodniczych są typy gleb. Takie same gleby są zaliczane do różnych typów i mają różne symbole na mapach klasyfikacyjnych, mapach głebowo-rolniczych, w Systematyce Gleb Polskiego Towarzystwa Gleboznawczego. W systemach o zasięgu regionalnym trzeba jeszcze dodawać nazwy według FAO i WRB. Tabele korelacyjne, które próbuje się zestawiać, stwarzają tylko ramy do porównań. Pełną transformację nazw uwzględniającą specyfikę terenu może wykonać tylko ekspert. Taką pracę wykonano w projekcie pilotowym „Gleby". Podobne problemy występują przy innych przyrodniczych bazach danych.
Do przetwarzania danych zalicza się również kompresję i dekompresję danych. Są to operacje wykonywane powszechnie, najczęściej bez udziału i świadomości użytkownika, bo są wbudowane w oprogramowanie. Oceniane są pozytywnie bo zmniejszają objętość zbiorów. Mniej znany jest fakt, że po tych operacjach następuje strata części danych. Uspokajająco dla użytkownika brzmią komentarze, że są to stiaty, które nie są widoczne po wizualizacji danych, bo oko ludzkie nie jest w stanie tych strat zauważyć.
Nie ma to konsekwencji praktycznych, jeśli są interpretowane produkty wizualizacji (na papierze lub na ekranie). Ma konsekwencje, jeśli analizuje się dane numeryczne i wyciąga wnioski na podstawie danych numerycznych.
Użytkownik danych powinien mieć świadomość, z jakim produktem ma do czynienia, aby mógł ocenić jakość danych i jakość wyników analiz. Te informacje powinny być zawarte w metadanych dotyczących każdego materiału źródłowego.
Są czynione obietnice, że już są i niedługo będą powszechnie dostępne metody kom-presji/dekompresji danych bez straty zawartości. SPOT Image podaje, że takie metody kompresji zastosowano do rejestracji danych rejestrowanych przez skanery satelity SPOT5 przed ich przesłaniem do stacji naziemnych wraz z metodami dekompresji w stacjach naziemnych.
Przetwarzanie danych jest konieczne, jeśli różne dane źródłowe są zapisane w różnych formatach. W obszarze danych przestrzennych stosowano ponad 50 formatów zapisu danych, więc podjęto próby ujednolicenia i poszukiwania formatów pośrednich umożliwiających przekazywanie danych między formatami. Przykładem są interfejsy typu APIS (Application Programming Interfaces), np. Feature Manipultaion Engine oferujące transfer między 60 różnymi formatami, a w Polsce SWING i SWDE.
Warsztatowo dobrze jest już opanowane posługiwanie się danymi zapisanymi w Arc-View, ArcGIS, Maplnfo, Geomedia, formatach ERDAS i IDRISI. Są to już sprawy na poziomie technologicznym, nie metodycznym i nie są tu rozwijane.
Jednakże mały przewodnik po formatach danych i metodach transferu danych powinien być przygotowany dla przyszłych użytkowników S1P Mazowsza, jak też ta tematyka powinna być szerzej potraktowana podczas szkoleń na II i III poziomie.
47