| |
Implementace klasifikačních metod
v prostředí ESRI MapObjects
Libor Kuchejda, VŠB-TU
Ostrava
V této práci je řešen problém implementace klasifikačních metod v aplikacích založených na využití knihovny MapObjects.
Navržené řešení spočívá ve vytvoření knihovny pro výpočet základních statistických parametrů a návrh intervalů stupnice pomocí různých klasifikačních metod.
V další části byla tato knihovna využita k tvorbě formulářů pro zobrazení statistických parametrů vstupních dat, nastavení parametrů kartogramu a pro vytvoření průvodce k vhodnému zvolení klasifikační metody.
Dále je zváženo použití expertního systému pro řešení dané problematiky.
Velice důležitou součástí
GIS je prezentace prostorových dat. Při této prezentaci je nutné vycházet
ze znalosti základních kartografických zásad dobrého návrhu mapy tak, aby
mapa mohla co nejlépe plnit účel pro který byla vytvořena. Jakmile se těmito
zásadami, které vyjadřují zkušenosti získané za stovky let práce kartografů,
nebudou uživatelé GIS řídit, může špatná
prezentace zapříčinit značné znehodnocení prezentovaných informací.
Pro zobrazení prostorových
kvantitativních dat se velmi často používá kartogram. Tvorba kartogramů
je podporována ve většině programových aplikací, které jsou využívány v
GIS. Vytváření kartogramů je také podporováno knihovnou ESRI Inc. MapObjects™,
jenž slouží pro návrh nejrůznějších aplikací, v nichž je potřeba pracovat
s geografickými daty. Tato knihovna však už neobsahuje metody pro návrh
stupnice legendy kartogramu. V případě že je potřeba do programové aplikace
začlenit tvorbu kartogramu, musí se tyto metody dodatečně vytvořit.
Tato práce se snaží
zlepšit současný stav u programových aplikací založených na ESRI Inc. MapObjects™,
které nabízejí většinou jen minimum klasifikačních metod.
Na základě zadání a analýzy
implementace klasifikačních metod v různých programových aplikacích byly
stanoveny tyto cíle:
-
Vytvořit programovou knihovnu zajišťující
různé metody výpočtu intervalů stupnice. Knihovna musí umožňovat výpočet
různých statistických parametrů dat, metody pro vypuštění chybně navržených
intervalů a metody pro generování správného popisu intervalů stupnice.
Knihovna bude určena vývojářům programových aplikací využívajících knihovnu
MapObjects™.
-
Implementovat do prostředí programové aplikace
zobrazení histogramu, krabicového grafu a statistických parametrů dat.
-
Začlenit do programové aplikace tvorbu kartogramů
s využitím vytvořené knihovny. Tato aplikace by měla umožnit výběr různých
klasifikačních metod a nastavení jejích parametrů, nastavení počtu tříd
a provádění normalizace.
-
Vytvořit průvodce, který by pomohl uživateli
nalézt vhodnou klasifikační metodu a počet tříd.
-
Zvážit možné využití expertního systému pro
návrh vhodné klasifikační metody a barevného schématu.
Základní
pojmy
Kartogram
Kartogram je mapa s
dílčími územními celky, do kterých jsou plošným způsobem znázorněna statistická
data. Tyto data by měly být relativní
hodnoty vztažené k ploše.
Tvorba
stupnic
Pro tvorbu kartogramů
je nutné data kvantitativního charakteru rozdělit do jednotlivých intervalů,
tak získáme stupnici kartogramu. Tato klasifikace má za cíl zjednodušení
a zobecnění. Dojde sice ke ztrátě detailních informací, ale zvýší se čitelnost
mapy a umožní se snadnější pochopení a zapamatování jejího obsahu. Díky
klasifikaci můžeme také zviditelnit
sledovaný jev a tím umožnit jeho interpretaci.
Volba
počtu tříd
Volba vhodného počtu
tříd se provádí tak, aby bylo umožněno adekvátní sdělení kartografické
informace. Jestliže je počet tříd malý dochází k velkým ztrátám informací.
Při příliš velkém počtu tříd se stává mapa nepřehlednou, jelikož člověk
nedokáže snadno rozlišit více než 11 odstínů šedi. Proto je nutné volit
takový počet tříd, aby jejich hranice byly v mapě dobře rozlišitelné. Počet
tříd se volí buď na základězkušeností, kdy volíme počet v rozmezí 4 až
15 popř. 5 až 20, nebo pomocí vzorců.
Pro realizaci práce bylo
zvoleno programovací prostředí Borland Delphi 5.0 a knihovna ESRI Inc.
MapObjects™ 2.0. Vytvoření
průvodce, začlenění klasifikačních metod i zobrazování statistických parametrů
dat bylo po konzultaci s vedoucím práce zabudováno přímo do programové
aplikace Gisel 2.0 firmy Sirion.
Tvorba
programové knihovny
Prvním krokem realizace
bylo vytvoření knihovny usnadňující tvorbu kartogramů v ESRI MapObjects.Jádrem
knihovny jsou dvě třídy objektů, třída TStatistik
a třída TKlasifik.
Třída
TStatistik
Jejím úkolem je zajistit
výpočet statistických parametrů datového souboru. Tato třída vznikla z
toho důvodu, že veškeré statistiky potřebné pro pozdější výpočty nebyly
dostupné ani v knihovnách dodávaných k Borland Delphi, ani v knihovně MapObjects™.
Třída
TKlasifik
Jejím úkolem je zajistit
výpočet intervalů různými klasifikačními metodami, zajistit jejich správné
popisování a výpočet konzistentnosti navržených tříd pomocí koeficientu
GVF. Třída TKlasifik je odvozena
od třídy TStatistik. Implementovány
byly tyto klasifikační metody:
Klasifikační metoda
|
Rovnoměrné rozdělení variačního
rozpětí |
Dělení aritmetickou
řadou |
Dělení geometrickou
řadou |
Průměr a směrodatná
odchylka |
Průměr a průměrná
odchylka |
Kvantily |
Medián a kvartily |
Metoda maximálního rozdílu mezi sousedními
hodnotami |
Metoda minimálního úhlu mezi sousedními hodnotami |
Jenksova optimální metoda |
Zobrazení
statistických parametrů dat
Pro zobrazení statistických
parametrů vstupních dat byl do aplikace Gisel vložen
formulář, který zajišťuje zobrazení
histogramu, krabicového grafu a základních statistických údajů.Výběr databázové
položky pro výpočet statistik je umožněn pomocí nabídky Sloupec.
Použitý krabicový graf
je složen z krabičky (červené čáry), znázorňující dolní kvartil, medián
a horní kvartil. Dále jsou zobrazovány “vousy” (černé čáry), ty znázorňují
1% a 99% kvantil. Diamant zelené barvy znázorňuje průměr a směrodatnou
odchylku od průměru. Podél středové osy grafu jsou pomocí bodů zobrazeny
jednotlivé výskyty vstupních hodnot.
Body jsou náhodně rozmístěny podél osy y, aby nedocházelo k jejich překrývání.
Výška diamantu a krabičky se proporcionálně mění v závislosti na počtu
výskytu hodnot.
Formulář
pro nastavení parametrů kartogramu
Formulář umožňuje:
-
Nastavení parametrů klasifikačních metod
(tj.volbu položky pro klasifikaci, položky
pro normalizaci, oblasti hodnot zahrnované
do výpočtu, nastavení počtu tříd nebo zvolení přímo
zlomových hodnot ...)
-
Zobrazení histogramu s navrhovanými intervaly
-
Náhled před aktivováním změn.
-
Ruční editaci intervalů a jejich popisů.
Obr.:
Výběr a nastavení parametrů klasifikační metody.
Obr.: Zobrazení histogramu s navrženými
intervaly
stuponice.
Obr.:
Náhled na klasifikované téma před aktivací změn.
Úkoly navrženého průvodce:
-
Vést uživatele správným postupem návrhu kartogramu.
-
Doporučit nejvhodnější klasifikační metodu
pro vstupní data a volby uživatele.
-
Průvodce by neměl za uživatele v konečné fázi
volby klasifikační metody rozhodovat.
Postup při návrhu kartogramu
s využitím daného průvodce:
-
Volba klasifikační položky popř. položky pro
normalizaci.
-
Určení budoucího využití kartogramu. Toto
rozhodnutí je bráno jako první kritérium pro posouzení vhodnosti klasifikačních
metod.
-
Zvolení počtu tříd.
-
Určení typu rozdělení četností. (2.kritérium)
-
Výpočet konzistentnosti navržených intervalů
u jednotlivých metod. (3.kritérium)
-
Ohodnocení jednotlivých metod váženým součtem
jednotlivých kritérií a výběr nejvhodnější metody. Kritéria mohou
nabývat hodnot v rozmezí 0 až 1 a jsou
jim přiřazeny váhy na základě priorit.
-
Případné nastavení parametrů zvolené metody.
-
Výběr barev pro obarvení kartogramu.
-
Náhled před aktivací změn.
Možné
využití expertního systému
Expertní systémy jsou orientovány
k řešení úzké problematiky, o které mají hluboké znalosti a nacházejí řešení
srovnatelná s řešeními, které by přijal expert. Jejich nutnou součástí
je schopnost odůvodnění nalezeného řešení. Hledání řešení se provádí na
základě vstupních dat, získaných od uživatele, a báze znalostí, kde jsou
shrnuty znalosti expertů. Báze znalostí
je obecný model popisu oblasti řešené expertním systémem, obvykle je tvořena
pomocí pravidel popisující daný problém.
Využití expertních
systémů k volbě vhodné klasifikační metody a barevného schématu se zdá
být vhodné. Problém by mohl nastat při definování báze znalostí, jelikož
expert se může rozhodovat v iteracích a také na základě estetického působení
výsledné mapy a dalších těžko definovatelných kritériích. Do báze znalostí
expertního systému by se mohla vložit pravidla pro
volbu stupnice na základě rozdělení četností, budoucího využití mapy a
okruhu uživatelů. Bylo by vhodné podmínit rozhodování také druhem mapy
nebo tématu, které mapa vyjadřuje, jelikož u některých map jsou již zavedené
konvence dělení stupnice a také specifická barevná schémata. Jelikož se
znázorňování údajů pomocí map vyskytuje v řadě různých oborů lidské činnosti,
bylo by vybudování báze znalostí komplexního expertního systému velice
náročné. Vhodné by proto bylo zaměřit se při vývoji jen na nejčastější
oblasti využití a na nejpodstatnější kritéria rozhodování.
|