Analiza przestrzenno - ekonomiczna
Wykład 19.10.2012
Zagadnienia wprowadzające
Podstawowe problemy związane z prowadzeniem analizy ekonomiczno-przestrzennej to przede wszystkim zróżnicowane uwarunkowania:
Celów poznawczych oraz
Celów utylitarnych badań (utylitarny tzn. praktyczny)
W gospodarce oraz jej przestrzennych aspektach, a szczególnie w polityce regionalnej i lokalnej, mają bardzo duże znaczenie odniesienia o charakterze porównawczym.
Pozycjonują one jednostki przestrzenne, w różnych układach, umożliwiając formułowanie programów i strategii rozwoju, a także oddziałują na procesy decyzyjne w polityce regionalnej.
Przestrzenna analiza ekonomiczna nie jest jedynie wyspecjalizowaną dziedziną analizy ekonomicznej, analogiczną do analizy konsumpcji, analizy produkcji czy analizy handlu międzynarodowego.
Wprowadzenie czynnika przestrzeni do analizy ekonomicznej jest innym (tzn. bardziej pełnym) sposobem podejścia do wszelkiej analizy o charakterze ekonomicznym (Ponsard).
Klasyczna analiza ekonomiczna nie uwzględnia aspektów przestrzennych.
Np.. W mikroekonomii:
Teoria konsumenta -wybory dotyczą dóbr niezlokalizowanych
Teoria producenta -nie określa usytuowania wytwórców w układzie przestrzennym
Teoria cen -zakłada, że podaż i popyt spotykają się na rynkach, bez określonej formy zasięgu oraz lokalizacji przestrzennej
Teoria ogólnej równowagi -zajmuje się współzależnościami między równowagami cząstkowymi oraz ich uwarunkowaniami i zależność o niepotrzebnym charakterze
W wypadku makroekonomii jest podobnie: gdy regionalne i lokalne struktury, struktury agregatów państwowych (np. produkcja przemysłowa, usługi zdrowotne, ruch turystyczny) nie są wyodrębnione, wówczas równowagi globalne mogą ukrywać nierównowagi cząstkowe (wprawdzie wyrównanie, ale zgeneralizowane).
Analiza ekonomiczna dokonywana jest tak, jakby oddziaływanie przestrzeni nie odgrywało żadnej roli w procesach gospodarczych. Tradycyjna analiza ekonomiczna formułuje prawa opierające się na założeniu, że wszystkie przedmioty i dobra znajdują się w tym samym miejscu (jednym miejscu). Takie postawienie sprawy ma fundamentalne znaczenie teoretyczne i praktyczne.
Z ekonomicznego punktu widzenia przestrzeń nie ma neutralnego charakteru.
Metody oceny procesów zachodzących w różnych skalach
Wzrastające znaczenie badań porównawczych w prowadzeniu polityki społecznej, gospodarczej i regionalnej powoduje, że rośnie zainteresowanie metodami umożliwiającymi ich przeprowadzenie.
Spośród wielu sposobów analizowanie zjawisk w ujęciu przestrzennym do szczególnie efektywnych i często stosowanych można zaliczyć metody taksonomiczne.
Metody taksonomiczne
Dzięki stosowaniu tych odpowiednich miar i wskaźników umożliwiają porównanie obiektów (jednostek przestrzennych) charakteryzowanych przez wiele cech.
Stosowanie metod taksonomicznych w znacznym stopniu obiektywizuje oceny, a tym samym i proces porównywania obiektów tego typu (jednostek przestrzennych)
Miary taksonomiczne często są stosowane także do oceny konkurencyjności jednostek przestrzennych oraz ich gospodarek i społeczności umożliwiającej sporządzanie rankingów (list klasyfikacyjnych) tych struktur.
Inne sposoby oceny procesów zachodzących w różnych skalach:
Współczynnik koncentracji (np.. Lorenza)
Współczynnik korelacji (np.. Spearmana)
Badania reszt regresji -rozmieszczenie największych odchyleń od średniej dla zjawiska w przestrzeni
Współczynniki zmienności
I wiele innych…
Działalność człowieka niezależnie od swojego charakteru (gospodarczego, kulturalnego, społecznego, politycznego, religijnego i in.) wiąże się bezpośrednio albo pośrednio z przestrzenią w niej bowiem się dokonuje.
W szczególności działalność gospodarcza i aktywność społeczno-kulturalna, odbywając się w przestrzeni, zależy od jej właściwości. Równocześnie oddziałując na te właściwości staje się czynnikiem ich kształtowania (tzn. tych właściwości).
Przestrzeń
Praktycznie każda decyzja (niezależnie od jej wagi i zakresu oddziaływania) dotycząca rozwoju społeczno-gospodarczego (wyłączając wstępne i ogólne ustalenia) uwzględnia czynniki przestrzeni.
Przestrzeń, jej cechy właściwości oraz elementy składowe są jednym z aspektów procesu planowania społeczno-gospodarczego. Zarówno w sensie działalności naukowo-badawczej jak i planowania przestrzennego (analiza ekonomiczno-przestrzenna jest narzędziem planowania przestrzennego).
W analizie ekonomiczno-przestrzennej mamy do czynienia z różnymi rodzajami przestrzeni:
Geodezyjna
Geograficzna
Ekonomiczna (odwołuje się do działalności gospodarczej),
Społeczna,
Kulturowa.
W analizie ekonomiczno-przestrzennej znaczenie ma przede wszystkim pojęcie przestrzeni ekonomicznej i społecznej.
Badania analizy przestrzenno-ekonomicznej
Badania związane z analizą przestrzenno-ekonomiczną obejmują poszukiwania wyjaśnień i związków pomiędzy zjawiskami gospodarczymi, cechami populacji oraz charakterystykami przestrzeni.
Charakterystyczne są cztery grupy uwarunkowań osiąganych efektów badawczych, zależą one od:
Skali badań
Lokalna, regionalna, ogólnokrajowa, międzynarodowa
Obiektu badań
Ludzie, ich działalność, wytwory jej działalności
Ujęcia czasowego
Statyczne, dynamiczne, prognostyczne
Rodzajów analizowanej działalności w ujęciu przestrzennym
Usługi, handel, transport i łączność, przemysł przetwórczy i budownictwo, rolnictwo, przemysł wodociągowy
Wykład 09.11.2012
Cele analizy ekonomiczno przestrzennej
Zasadniczym celem tak rozumianej analizy jest diagnoza gospodarcza jednostek terytorialnych różnej skali ( najczęściej struktury lokalnej, regionalnej, miasta, regionu, kraju, grupy państw).
Analiza obejmuje następujące elementy:
Zasoby regionu wraz z ich rozmieszczeniem oraz prognozą wykorzystania
Poziom rozwoju społeczno – gospodarczego
Struktury społeczno – ekonomicznej
Struktury przestrzennej
Chodzi przy tym nie tyle o opis badanych zjawisk społecznych i gospodarczych, co o poznanie ich struktury, określenie dynamiki rozwoju.
Analiza ekonomiczno – przestrzenna jako narzędzie w planowaniu
Analiza jest częścią szeroko rozumianego procesu planistycznego:
Powinna być narzędziem ilustracji tzw. stanu wyjściowego gospodarki jednostki terytorialnej i dostarczać informacji oraz diagnozować stan istniejący
Powinna być jednym z instrumentów kształtowania lub przynajmniej wyobrażenia stanu, który będzie albo stanu prognozowanego
Zadanie analizy składa się z wielu szczegółowych zadań zróżnicowanych warunkami rozwoju sił wytwórczych, konkretnych celów polityki społeczno – gospodarczej
Zadania analizy ekonomiczno – przestrzennej
Zadania analizy są uwarunkowane:
Właściwościami rozwoju sił wytwórczych
Konkretnymi celami polityki społeczno – gospodarczej
Warunkami pracy badawczej
Realizacji zadań tego typu służą różne metody, a ich wyboru dokonuje się stosując kryterium przydatności do potrzeb planowania rozwoju.
Ponadto dobór metod badania musi spełniać kilka dalszych warunków:
Umożliwić zbadanie istotnych z punktu widzenia rozwoju elementów struktury gospodarczej
Określać zasadnicze cechy właściwości tych elementów
Posiadać szerokie możliwości interpretacyjne i to zarówno statystyczno – analityczne jak i kartograficzne
Wartościowa poznawczo i zawierać walor obiektywności (mierzalność, testowanie, kryteria statystyczne), (bez „moja”, „mój”)
Były sprawdzane w badaniach tzn. istnieją przykłady ich zastosowania
Trudności związane z wartościowaniem poszczególnych metod oraz ich własności sprawiły, że w niektórych przypadkach warto rozważyć kilka sposobów ujęć interpretacyjnych tej samej metody lub rozwiązań metodycznych tego samego problemu.
Większość ujęć sprowadza się do klasyfikowania lub syntezowania obserwowanych zjawisk, do określenia wzajemnych związków, ich siły i relacji, a także do odtworzenia prawnych procesów wykrywania istniejących układów itp..
Z punktu widzenia potrzeb planowania rozwoju szczególne znaczenie mają badania systematyzująco-klasyfikujące, których wynikiem jest synteza organizacji funkcjonalnej przestrzeni społeczno-ekonomicznej.
Zagadnienie podstawowej jednostki badawczej.
W badaniach przestrzennych, podobnie jak i każdych innych badaniach, zasadniczym zagadnieniem jest określenie elementarnej jednostki badawczej (jedn. Przestrzennej, podstawowej jednostki) nazwanej także obiektem.
Określenie podstawowej jednostki badawczej -i co za tym idzie -jej wielkości, zależy od:
Celów badawczych
Charakteru materiału informacyjnego, na którym opiera się badanie
W badaniach przestrzennych podstawowymi jednostkami są najczęściej jednostki administracyjnego podziału kraju (województwa, powiaty, gminy). Są to jednak jednostki zróżnicowane pod względem wielkości i kształtu (pseudonaturalne)
Dla określonych celów analitycznych niezbędne jest posługiwanie się figurami geometrycznymi, regularnymi w kształcie i równej powierzchni, takimi jak: trójkąt równoboczny, kwadrat (10x10km), sześciokąt foremny (sztuczne).
Wykład 23.11.2012
Przy określaniu obiektu badawczego ważne jest również określenie jego umiejscowienia w przestrzeni. Umiejscowienie podstawowe jednostki badawczej posiada szczególne znaczenie w procedurze łączenia podobnych do siebie podstawowych jednostek przestrzennych w jednostki większe – strefy.
Warto dodać, że procedura wydzielania układów strefowych dotyczy zarówno zjawisk ciągłych przestrzennie jak i nieciągłych.
Pierwszy przypadek występuje w badaniu użytkowaniu ziemi, typów środowiska, rozmieszczenia ludności ( przyjmuje się, że jest ono ciągłe przestrzennie).
Drugi przypadek ma miejsce szczególnie w badaniu struktury przestrzennej gospodarki, urbanizacji, uprzemysłowienia, działalności usługowej.
Przestrzenna procedura klasyfikacyjna dotycząca zjawisk nieciągłych zawiera w sobie momenty generalizacji – pewne cechy właściwe określonym lokalizacjom, przypisuje się pewnym obszarom, co zawiera pewien element konwencji. Powoduje to niekiedy znaczne trudności badawcze dotyczące problemu wielkości i kształtu jednostki przestrzennej oraz wpływu tych parametrów na uzyskane wyniki.
Dobór cech w analizie ekonomiczno – przestrzennej
Od właściwego doboru cech (zmiennych „opisujących” badane zjawisko) zależy poprawność każdego badania, w tym również badania problemów ekonomiczno-przestrzennych
Nie jest możliwe wskazanie jednego, ogólnego sposobu na właściwy dobór cech we wszystkich badaniach społeczno-ekonomicznych.
Dobór cech zależy od charakteru, przedmiotu i celu określonego badania.
Możliwa jest próba uogólnienia doświadczeń płynących z prowadzenia badań wielocechowych, tj. takich w których badane zjawisko opisywane jest nie przez jedną cechę, lecz przez większą ich ilość.
Dobór cech i ich przekształcenia
W takiej sytuacji nie należy posługiwać się bezwzględnymi wartościami cech lecz pewnymi ich miarami relatywnymi.
Trzeba dokonać przekształcenia rzeczywistych wartości tych cech w cechy znormalizowane (standardowe), a tym samym przeobrazić macierz informacji rzeczywistej w macierz informacji standardowej.
Znane są różne metody normalizacji (standaryzacji) cech.
Procedury normalizacji zmiennych przestrzennych
Poprawne wyznaczeniem mierników odległości taksonomicznej jest warunkowane przeprowadzeniem normalizacji cech.
Cel normalizacji:
Doprowadzenie różnoimiennych cech do wzajemnej porównywalności (postulat addytywności)
Ujednolicenie charakteru zmiennych przez przekształcenia destymulant (wiążą się odwrotnie proporcjonalnie) w stymulant (wiążą się wprost proporcjonalnie) i odwrotnie (postulat jednolitej preferencji)
Wyeliminowanie z obliczeń wartości niedodatnich (postulat dodatności)
Zastąpienie zróżnicowanych zakresów zmienności poszczególnych cech zakresem stałym (postulat stałości rozstępu lub stałości wartości ekstremalnych)
Najważniejszy postulat to addytywność (porównywalność)
Zazwyczaj spotykane w literaturze metody normalizacji realizujące ten postulat dzielą się na 4 grupy:
Rangowanie zmiennych, polegające na zastępowaniu realizacji zmiennych diagnostycznych ich rangami, wynikającymi z uporządkowania obserwacji zgodnie z rosnącymi wartościami zmiennych
xi′ = j (i = l, …, n)
x- unormowana i-ta realizacja zmiennej
j- kolejny numer pozycji, jaką zajmuje i-ta realizacja zmiennej w uporządkowanym niemalejąco szeregu jej wartości
n- liczba obserwacji
Wykład 30.11.2012
Procedury opierające się na przekształcenia ilorazowych, w zależności od przyjętego układu odniesienia normalizację zmiennej x, można uzyskać następującymi sposobami
$$x_{i}^{'} = \frac{x_{i}}{A}\ \ (i = 1,\ldots,n)$$
A-może przyjąć następujące wartości
maxi {xi}, mini {xi}, $\overset{\overline{}}{x}$, $\sum_{i = 1}^{n}x_{i}$
Gdy układ odniesienia A przyjmuje wartość 0, stosowanie przekształceń ilorazowych jest nie możliwe
Grupa metod normalizacji polega na standaryzacji zmiennych-najczęściej stosowana procedura
Najprostsze i najpopularniejsze metody normalizacji cech (standaryzacja)
i – obiekt badania
j – cecha (zmienna, wskaźnik)
yij – rzeczywista wartość j-tej cechy dla i-tego obiektu
yj – średnia
sj- odchylenie standardowe j-tej cechy
$\mathbf{y}_{\mathbf{\text{ij}}}^{\mathbf{'}}\mathbf{=}\frac{\mathbf{y}_{\mathbf{\text{ij}}}\mathbf{-}{\overset{\overline{}}{\mathbf{y}}}_{\mathbf{j}}}{\mathbf{\text{sj}}}$ $\mathbf{y}_{\mathbf{\text{ij}}}^{\mathbf{'}}\mathbf{=}\frac{\mathbf{y}_{\mathbf{\text{ij}}}\mathbf{-}{\overset{\overline{}}{\mathbf{y}}}_{\mathbf{j}}}{\mathbf{y}_{\mathbf{j}}}$ ${\overset{\overline{}}{\mathbf{y}}}_{\mathbf{\text{ij}}}\mathbf{=}\frac{\mathbf{y}_{\mathbf{\text{ij}}}}{{\overset{\overline{}}{\mathbf{y}}}_{\mathbf{j}}}$ $\mathbf{y}_{\mathbf{\text{ij}}}^{\mathbf{'}}\mathbf{=}\frac{\mathbf{y}_{\mathbf{\text{ij}}}}{\mathbf{\text{sj}}}$
Stosowanie tej grupy metod jest niemożliwe tylko w przypadku s=0, a więc w sytuacji, gdy wszystkie realizacje zmiennej są jednakowe.
Grupa metod to unitaryzacja. Polega na kilku typowych przekształceniach
$x_{i}^{'} = \frac{x_{i}}{B}$ $x_{i} = \sqrt{\frac{x_{i} - min\left( x_{i} \right)}{B}}$
$$x_{i}^{'} = \frac{x_{i} - \overset{\overline{}}{x}}{B}$$
$x_{i}^{'} = \frac{x_{i} - \overset{\overline{}}{x}}{B}$ B = max(xi) − min(xi)
$$x_{i} = \left( \frac{x_{i} - min\left( x_{i} \right)}{B} \right)^{2}$$
Aby zapewnić postulat jednorodności preferencji zmiennych można we wstępnej fazie zastosować przekształcenie odwrotnościowe. Gdy jest niemożliwe, przeprowadza się następujące operacje
$$x_{i}^{'''} = \left\{ \begin{matrix}
x_{i}^{''},\ gdy\min\left( x_{\text{ij}}^{''} \right) > 0 \\
x_{i}^{''} + \partial,\ gdy\min\left( x_{\text{ij}}^{''} \right) \leq 0 \\
\end{matrix} \right.\ $$
$$\partial = m\left( x_{\text{ij}}^{''} \right) + \frac{1}{5}\text{sx}$$
m-liczba zmiennych
minxij″ - to wartość minimalna w całej macierzy danych normalizowanych (a nie tylko jednej zmiennej)
sx – to odchylenie standardowe również obliczone na podstawie wszystkich elementów macierzy (xij″)
Pierwszy składnik powyższego wyrażenia doprowadza wszystkie realizacje zmiennych znormalizowanych do wartości nieujemnych, a drugi eliminuje wartości zerowe.
Należy również zaznaczyć, że stała sigma przesuwa wartości wszystkich zmiennych w górę o jednakową wielkość, dzięki czemu zachowane zostają wzajemne relacje między poszczególnymi zmiennymi.
Najprostsze i najpopularniejsze metody normalizacji (standaryzacji) cech.
Za najlepszą uważa się pierwszą z metod standaryzacyjnych, natomiast za najbardziej prymitywną trzecią-nie uwzględnia dyspersji cech w poszczególnych jednostkach przestrzennych, a wartość danej cechy odnosi się jedynie do średniej wartości cechy obliczonej z całego zbioru jednostek przestrzennych.
Metoda ta ma jednak pewne walory interpretacyjne. Wyraża mianowicie stopień odchylenia danej cechy od średniej wartości tej cechy ( w sposób wymierny i jednoznaczny).
Doświadczenie płynące z dziedziny wielocechowych badań nakazuje ostrożność w podejściu do normalizacji ( a w szczególności standaryzacji cech).
Każdy rodzaj normalizacji zmniejsza wariancję cech a tym samym zniekształca wyniki badań.
W klasycznych metodach taksonomicznych oraz w konstrukcji wszelkiego rodzaju wskaźników syntetycznych normalizacja jest jednak zabiegiem koniecznym.
Pojęcie macierzy geograficznej (tablica danych)
Duże znaczenie w analizie e-p ma tzw. MACIERZ GEOGRAFICZNA. Określone zjawiska (cechy) charakteryzujące występujące w konkretnych miejscach w przestrzeni to tzw. fakty przestrzenne (geograficzne).
Gdy rozpatrujemy to samo zjawisko (cechę) ma ono w wielu miejscach różne natężenie, to charakteryzuje jego przestrzenne zróżnicowanie.
Zapisując dane o różnych zjawiskach dla wielu miejsc w układ tablicy prostokątnej, uzyskamy macierz danych przestrzennych lub przestrzenno czasowych.
Gdy informacje zebrane są dla jednego przedziału czasowego (np. rok, miesiąc, dekada, lata) to mówimy o dwuwymiarowej macierzy danych.
Więcej przedziałów czasowych – trójwymiarowe macierze danych.
Cała macierz jest pewnego rodzaju tablicą charakterystyki społeczno gospodarczej obszaru
Wiersz macierzy dwuwymiarowej obszaru obrazuje poziom wszystkich badanych cech w danym obiekcie (charakterystyka obiektu, jednostki przestrzennej)
Obiektem może być miejscowość, gmina, województwo, kraj
Kolumna przedstawia ukształtowanie się danej cechy w różnych obiektach – to tzw. fakt przestrzenny
Poj. Macierzy geograficznej – wielowymiarowa przestrzeń społeczno-ekonomiczna
Procedura statystyczna umożliwiająca badanie macierzy geograficznej w sposób określony w pkt. 3,4,5 (analiza wielocechowa) stwarza konieczność odwołania się do abstrakcyjnej n-wymiarowej przestrzeni matematycznej (euklidesowej) nazywanej w tego typu badaniach wielowymiarową przestrzenią społeczno-ekonomiczną
Jeśli chcemy badać zbiór obiektów określonych przy uwzględnieniu p-cech (np.10,25 itd.) musimy zbiór tych obiektów traktować jako chmurę punktów umieszczonych w p-wymiarowej przestrzeni.
Odpowiednio określone macierz danych stanowią podstawę wielu różnego rodzaju badań ekonomiczno przestrzennych
Wykład 07.12.2012
Klasyfikacja – grupowanie obiektów
Generalnie klasyfikacja jest czynnością związaną z analizą oddziaływania elementów zbioru na podzbiory (tzw. człony klasyfikacji)
Chodzi przy tym o taki podział aby różnice pomiędzy elementami (obiektami) wchodzącymi w skład jednego podzbioru były jak najmniejsze ale różnice były jak najmniejsze ale różnice pomiędzy elementami różnych podzbiorów jak największe
Termin klasyfikacja oznacza też efekt procedury klasyfikacyjnej, czyli odnosi się do otrzymanych z podziału zbioru podzbiorów
Klasyfikacja – identyfikacja – procedura regionalizacyjna
Przyjmuje się, że określanie klasyfikacja odnosi się do procedury zaliczania obiektów do klas typologicznych wraz z wydzieleniem tych klas
Procedura zaliczania obiektów do klas uprzednio wydzielonych nosi nazwę identyfikacji
Są również inne określenia takiej procedury w zależności od przedmiotu i charakteru klasyfikacji
Np. klasyfikacja przestrzenna często nazywana jest procedurą regionalizacyjną, chodzi tu o wyodrębnienie obszarów jednorodnych (generalnie) z układów przestrzennych o większym zróżnicowaniu
Podstawową kwestią klasyfikacji jest poprawność wydzielenia klas, tj. uzyskanie efektu tak, aby przeprowadzona klasyfikacja była wartościowa poznawczo
Uzyskanie klasyfikacji o takim walorze zależy od dwóch zasadniczych kwestii, od tego:
Jakie zastosujemy kryteria klasyfikacji
Jakie zastosujemy metody wydzielenia klas
Zasadą jest, że procedura wydzielenia klas powinna odpowiadać wymaganiom rozłączności i zupełności
W takim przypadku dany obiekt badany należy do jednej i tylko jednej klasy, każdy z obiektów wchodzi w skład którejś z wydzielonych klas
Klasyfikacja może być przeprowadzona przez:
Podział zbioru obiektów
Grupowanie obiektów
Podział nazywany jest klasyfikacją dedukcyjną. Grupowanie określa się jako klasyfikację indukcyjną
Ustalanie granic klasy może być dokonane ex ante, tj. przed badaniem zbioru, który ma podlegać klasyfikacji lub ex post – po dokonaniu pewnej analizy statystyczno-matematycznej zbioru
Pierwsze ujęcie jest zwykle subiektywne – aby się uchronić przed zbytnim subiektywizmem należy dysponować wynikami odpowiednich analiz jakościowych, wyjaśniających istotę badanego zjawiska
Drugie ujęcie często grozi formalizmem
Klasyfikacja jako procedura wydzielenia klas obejmuje 5 etapów:
Zbiór zmiennych diagnostycznych (cech)
Redukcja wymiarów przestrzeni obserwacji
Wyznaczenie kryterium klasyfikacji
Wybór metody i techniki klasyfikacji
Wydzielenie klas typologicznych (estymacja – szacowanie- podobieństwa badanych obiektów)
Procedurę klasyfikacyjną można odnieść do badań jedno- lub wielozmiennych
Często w badaniach jednocechowych nie chodzi o zmienną jednostkową lecz zmienną, która jest syntezą cech jednostkowych – reprezentuje zbiór cech jednostkowych, tzw. metacecha
Często ze względu na cel badania warto rozważyć i ocenić różne sposoby i układy tworzenia klas
Istotne jest aby każda wydzielona klasa typologiczna (każde zgrupowanie) odznaczał się:
Znacznym stopniem wewnętrznego podobieństwa pod względem wchodzących w jej skład obiektów
Możliwie dużym stopniem zróżnicowania w stosunku do innych wydzielonych klas
Wykład 14.12.2012
Taksonomiczne metody klasyfikacji (grupowania i porządkowania obiektów przestrzennych w klasy)
Jest niezwykle dużo algorytmów i procedur taksonomicznych (odnoszących się do wielowymiarowej przestrzeni, zmiennych cech – w związku z tym trudno dokonać pełnego przeglądu)
Wybór głównie ze względu na:
Stopień wykorzystania w badaniach empirycznych
Dostępność praktycznych zastosowań
Różne założenia metodologiczne – procedury grafowe, aglomeracyjne, nie hierarchiczne, obszarowe itp.
W taksonomicznych metodach klasyfikacji zakłada się, że przedmiotem porządkowania lub grupowania są obiekty analizowane w wielowymiarowej przestrzeni zmiennych.
Większość procedur grupowania ma wersje dualne (od góry i od dołu). Przedmiotem klasyfikacji są tu zmienne traktowane jako zbór punktów wielowymiarowej przestrzeni obiektów, bo nie zmienia zasad algorytmu postępowania.
Odległość w przestrzeni n - wymiarowej
Pojęcie taksonomii
Taksonomia to nauka o zasadach na podzbiory oraz efekt takiego postępowania
Pojęcie odległości
Odległość między dwoma punktami na prostej definiuje się jako
d = xb − xa
W układzie współrzędnych prostokątnych na płaszczyźnie
d = (xb−xa;yb−ya)
W przestrzeni
d = (xb−za;yb−za;zb−za)
Ogólnie w przestrzeni n-wymiarowej
d = (xb−xa;yb−ya;za−zb)
Pojęcie taksonomii
Taksonomię nazywamy numeryczną, jeśli właściwościom obiektów badania przyporządkowuje się wielkości liczbowe, a następnie przeprowadza podział zbioru na podstawie wybranego algorytmu.
Ze względu na cel prowadzonej analizy metody taksonomiczne dzielimy na trzy grupy:
Grupowania
Podziałowe
Wyboru reprezentantów grup
W taksonomicznych metodach grupowania cały zbiór jednostek przestrzennych bądź obiektów z macierzy geograficznej traktuje się jako zbiór n-jednoelementowych obiektów, które następnie za pomocą odpowiedniego algorytmu łączy się w grupy. Rezultatem prowadzonego postepowania może być uzyskanie uporządkowani liniowych obiektów na prostej (np. diagram Czekanowskiego) lub w postaci dendrytu na płaszczyźnie (np. taksonomia Wrocławska).
Metody podziałowe zakładają działanie odwrotne, tj. uznawanie zbioru jednostek przestrzennych lub obiektów za całość, a następnie podział za pomocą właściwych procedur numerycznych.
Różnica między stosowaniem metod grupowania i podziałowych polega na tym, że:
W pierwszym przypadku zmierza się od jednostek podstawowych do ogólnej struktury podobieństwa zbioru obiektów względem siebie przedstawionej w postaci diagramu lub dendrytu (klasyfikacja indukcyjna)
W drugim od całości zbioru możliwie dokładniejszego podziału na elementy składowe, będące członami klasyfikacji (klasyfikacja dedukcyjna)
Metody wyboru reprezentantów grup służą do wyróżnienia zmiennych taksonomicznych diagnostycznych jako tych, które w najistotniejszy sposób odzwierciedlają właściwości licznego zestawu potencjalnych zmiennych. Ma to znaczenie zwłaszcza wtedy, gdy dysponujemy niewielkimi możliwościami przetwarzania danych i chcemy wybrać te zmienne, które są reprezentantami poszczególnych kategorii cech.
Strata informacji w tym przypadku jest niewielka-ogólna struktura podobieństwa zaś pozostaje zachowana.
Odległość taksonomiczna to odległość euklidesowa w n-wymiarowej przestrzeni między dwoma dowolnymi obiektami badania.
Etapy badań przy wykorzystaniu metod taksonomicznych
Niezależnie od specyfiki rozpatrywania problemów w badaniach wykorzystujących metody taksonomiczne można wyróżnić następujące etapy:
Sformułowanie celu analizy oraz wstępnych hipotez badawczych.
Określenie zakresu merytorycznego, terytorialnego i czasowego badań, a w szczególności wyspecyfikowanie elementów zbioru obiektów oraz cech wyjściowych.
Zebranie kompletnych i adekwatnych danych statystycznych:
Ustalenie źródeł i zebranie danych
Doprowadzenie danych do porównywalności
Wyeliminowanie obserwacji nietypowych
Interpolacja brakujących informacji
Utworzenie maszynowych nośników informacji
Wyznaczenie zmiennych przetworzonych (udziałów %, współczynników dynamiki, wskaźników ekonomicznych itd.)
Analiza statystyczna danych wejściowych:
Wyznaczenie i analiza parametrów opisowych rozkładu (średnia arytmetyczna, odchylenie standardowe, współczynniki zmienności, asymetrii i koncentracji)
Ocena stopnia i kierunku współzależności między zmiennymi wyjściowymi
Empiryczna weryfikacja analitycznej postaci rozkładu poszczególnych zmiennych (jedno i wielowymiarowych)
Dobór optymalnego podzbioru zmiennych diagnostycznych:
Wyeliminowanie zmiennych quasi-stałych
Analiza struktury macierzy korelacji
Ustalenie wag zmiennych
Określenie finalnej liczby zmiennych
Porządkowanie i grupowanie obiektów w ramach analizowanych układów zmiennych:
Wybór algorytmów klasyfikacyjnych
Ustalenie metryk odległości
Określenie sposobu normalizacji i agregacji zmiennych
Realizacja obliczeń przy wykorzystaniu wybranego programu (np. excel)
Analiza i interpretacja wyników, sformułowanie wniosków.
Procedury taksonomiczne – określenie charakteru zmiennych:
Pierwszym problemem, który rozstrzygnąć przy posługiwaniu się procedurami taksonomicznymi jest określenie charakteru zmiennych
Zagadnienie to ma bardzo istotne znaczenie przyporządkowaniu obiektów, ale mniejsze przy ich grupowaniu
Różne kierunki oddziaływania zmiennych (cech) na badane zjawisko
Zbiór zmiennych można podzielić na trzy grupy:
Stymulanty
Destymulanty
Nominanty (zmienne neutralne)
Pojęcia te zostały wprowadzone przez Zbigniewa Hellwiga.
Procedury taksonomiczne – określenie charakteru zmiennych
Nominanty to zmienne, które z uwagi na obojętny (neutralny) charakter w stosunku do badanego zjawiska znajduje się w zbiorze cech diagnostycznych.
Ogólnie przez pojęcie stymulanty rozumie się taka zmienną, której wysokie wartości pożądane są z punktu widzenia badanego zjawisk, natomiast niskie są niepożądane (np. dla poziomu życia stymulantami są m.in. wskaźniki powierzchni sklepów, liczba lekarzy kin itp.), dla destymulant jest odwrotna(?)
Określenie charakteru zmiennych powinno się opierać w zasadzie na przesłankach merytorycznych (pozastatycznych). W tym przypadku najczęściej korzysta się z ocen rzeczoznawców, zespołów ekspertów lub innych metod niestatystycznych.
Drugim sposobem identyfikacji charakteru zmiennych jest wykorzystanie metod statystycznych, wśród których najczęściej stosowane są:
Analiza struktury macierzy korelacji
Analiza czynnikowa
Analiza współczynników korelacji między zmiennymi diagnostycznymi a zmienną syntetyczną
Punktem wyjścia (????)
Metody taksonomiczne – formy mierników odległości
Większość znanych algorytmów taksonomicznych opiera się na odpowiednio zdefiniowanych miernikach odległości między klasyfikowanymi punktami.
Wybór miernika, za pomocą którego określa się dystans punktów w przestrzeni wielowymiarowej ma istotne znaczenie dla delimitacji.
Jest problemem, który należy rozwiązać przed przystąpieniem do procesu grupowania lub klasyfikacji.
Jedna z najbardziej ogólnych formuł mierników odległości taksonomicznych określa wzór Minkowskiego. Formuły mierników odległości podaje się przy założeniu, że współczynniki wagowe zmiennych są stałe.
Wzór Minkowskiego
$$d_{\text{ij}} = \sqrt{\frac{1}{n}\sum_{k = 1}^{n}\left( x_{\text{ik}} - x_{\text{jk}} \right)^{2}}$$
Gdzie
n-liczba obiektów
m-liczba cech
znormalizowane w dowolny sposób wartości j-tej zmiennej dla r-tego i s-tego obiektu
Jeżeli współczynnik p=1 to odległość taksonomiczna nosi nazwę miejskiej (Haminga)
Przy p=2 odległość taksonomiczna nosi nazwę …………….
Poza miernikami Haminga (miejski) i Euklidesa w literaturze spotyka się również inne miary odległości:
Odległość Jeffreysa i Matusity
Odległość Braya i Curtisa
Odległość Canberra
$$d_{\text{ij}} = \sum_{i = 1}^{n}\frac{x_{i} - y_{i}}{x_{i} + y_{i}}$$
Odległość Clarka
$$d_{\text{ij}} = \sqrt{\frac{1}{n}\sum_{i = 1}^{n}\left( \frac{x_{\text{ik}} - x_{\text{jk}}}{x_{\text{ik}} + x_{\text{jk}}} \right)^{2}}$$
Odległość kątowa
Odległość Mahalanobisa
$$d_{m}\left( x,y \right) \sqrt{\left( x - y \right)C^{- 1}}{(x - y)}^{T}$$
Procedury porządkowania obiektów
Uporządkowanie liniowe obiektów
Wskaźnik syntetyczny J. Perkala
W analizie wieloimiennej są liczne narzędzia, które na podstawie zróżnicowania m-cech w n-obiektach(macierz geograficzna) pozwalają uporządkować jednostki przestrzenne względem siebie na osi liczbowej. Stąd wynika pojęcie uporządkowani liniowych.
W praktyce stosowanie miar taksonomicznych oznacza odpowiednie odejmowanie standaryzowanych wielkości poszczególnych wierszy od siebie (wyjątków wielkości bezwzględnych) wg przyjętej formuły. Im mniejsza wartość sumaryczna odległości, tym większe podobieństwo między elementami macierzy geograficznej.
Wśród procedur najczęściej używa się wskaźnika syntetycznego J. Perkala (rzadziej wskaźnika Z. Zioły). Wskaźnik syntetyczny Perkala w swojej konstrukcji odwołuje się do rzeczywistych wielkości cech, a nie do ich rang (np. tabela znaków, metoda punktowa).
W większości przypadków cechy w macierzy danych podawane są w różnych jednostkach pomiarowych, konieczna jest ich standaryzacja przed dokonaniem jakichkolwiek dalszych działań rachunkowych.
Następnym etapem jest obliczenie średniej arytmetycznej z wielkości znormalizowanych, które po uporządkowaniu najczęściej malejącym, interpretowane są w kategoriach wskaźnika syntetycznego.
Konstruowanie i wykorzystanie różnego typu wskaźników syntetycznych w polskich badaniach ekonomiczno-przestrzennych ma długa tradycję.
Cel analizy – próba zidentyfikowania skali różnic między powiatami w zakresie ogółu wybranych mierników w formie uporządkowania liniowego, ponieważ cechy sa wyrażone w jednostkach Miery, konieczna jest ich standaryzacja.