Metody klasyfikacji twardej bezwzorcowej wykonywane w programie IDRISI
Pos艂uguj膮c si臋 dostarczon膮 baz膮 dan膮, obrazuj膮c膮 kszta艂towanie si臋 nast臋puj膮cych wska藕nik贸w:
A01_2009. G臋sto艣膰 zaludnienia, (S)
A02_2009. G臋sto艣膰 sieci miejskiej, (S)
A03_2009. Przyrost naturalny,(S)
A04_2009. Saldo migracji og贸艂em,(S)
A05_2009. Udzia艂 kobiet w ludno艣ci og贸艂em, (S)
A06_2009. Udzia艂 os贸b w wieku produkcyjnym w ludno艣ci og贸艂em,(S)
A07_2009. Udzia艂 os贸b pozostaj膮cy na d艂ugotrwa艂ym bezrobociu w艣r贸d bezrobotnych
og贸艂em, (D)
A08_2009. Udzia艂 pracuj膮cych w sektorze rolniczym (S),
A09_2009. Jednostki w systemie REGON na 1000 mieszka艅c贸w (S),
A10_2009. Mieszkania oddane do u偶ytku na 1000 mieszka艅c贸w (S),
A11_2009. Dost臋pno艣膰 do Liceum Og贸lnokszta艂c膮cego (w km2 na miejscowo艣膰 z LO) (D)
A12_2009. Widownia w kinach (na 1000 mieszka艅c贸w) (S),
A13_2009. Przyrost sieci wodoci膮g贸w w latach 2000-2010 (S)
Na podstawie danych zunitaryzowanych wyznacz mapy obrazuj膮ce wyniki grupowania gmin. Do grupowania u偶yj metody k-艣rednich (KMEANS) - przetestuj wszystkie zasady wybierania centroidu.
Uwagi teoretyczne:
Produra KMEANS rozpoczyna si臋 od wylosowania centroid贸w K (艣rodk贸w ci臋偶ko艣ci), a nast臋pnie przypisuje ka偶dy piksel do klastra, kt贸rego 艣rodek ci臋偶ko艣ci znajduje si臋 najbli偶ej (na podstawie odleg艂o艣ci euklidesowej). Nast臋pnie aktualizacje warto艣膰 centroidu klastra i powtarza proces. Procedura ustaje gdy centroidy K nie mog膮 si臋 ju偶 zmieni膰. Jest to heurystyczny algorytm minimalizacji SSE (sumy kwadrat贸w b艂臋d贸w), kt贸rego wydajno艣膰 silnie zale偶y od wst臋pnie oszacowanej liczby grup (zaleca si臋 zwykle pozostawienie 16 klastr贸w).
Wydajno艣膰 KMEANS jest silnie uzale偶niona od lokalizacji centroid贸w.
Losowe zasady podzia艂u (random partition) polegaj膮 na losowym przypisaniu ka偶dego piksela do jednej z grup K, a nast臋pnie okre艣laj膮 pocz膮tkowy centroidy na podstawie tych pierwszych podzia艂贸w.
Losowe regu艂y nasion (random seed) polegaj膮 na losowym wybieraniu punkt贸w 艣rednich w zbiorze danych jako wst臋pnych centroid贸w, a nast臋pnie przypisuj膮 ka偶dy piksel do centroidu na zasadzie minimalnych odleg艂o艣ci.
Zasady diagonalnych osi (diagonal axis) polegj膮 na wyznaczeniu pocz膮tkowych centroid贸w K z n-wymiarowej przestrzeni warto艣膰 danych wej艣ciowych w spos贸b systematyczny, tzn. punkty K pobierane s膮 r贸wnomiernie na przek膮tnej linii, kt贸ra zaczyna si臋 od minimalnej warto艣ci wektora a ko艅czy na pukcie maksymalnej warto艣ci tego wektora (przy czym wektor ten jest wyprowadzony z serii danych wej艣ciowych).
Uwagi:
Dla poszczeg贸lnych wska藕nik贸w wygeneruj mapy rastrowe o rozdzielczo艣ci 1000x1000, ka偶dorazowo jako t艂o wpisz warto艣膰 0.
Dane wej艣ciowe poddaj unitaryzacji (w bazie danych), a nast臋pnie wygeneruj mapy rastrowe, kt贸re u偶yjesz w procedurze KMEANS
Wyniki: