GISáček


Implementace klasifikačních metod v prostředí ESRI MapObjects


Libor Kuchejda, VŠB-TU Ostrava

    Abstrakt

    V této práci je řešen problém implementace klasifikačních metod v aplikacích založených na využití knihovny MapObjects. Navržené řešení spočívá ve vytvoření knihovny pro výpočet základních statistických parametrů a návrh intervalů stupnice pomocí různých klasifikačních metod. V další části byla tato knihovna využita k tvorbě formulářů pro zobrazení statistických parametrů vstupních dat, nastavení parametrů kartogramu a pro vytvoření průvodce k vhodnému zvolení klasifikační metody. Dále je zváženo použití expertního systému pro řešení dané problematiky.

    Úvod

    Velice důležitou součástí GIS je prezentace prostorových dat. Při této prezentaci je nutné vycházet ze znalosti základních kartografických zásad dobrého návrhu mapy tak, aby mapa mohla co nejlépe plnit účel pro který byla vytvořena. Jakmile se těmito zásadami, které vyjadřují zkušenosti získané za stovky let práce kartografů, nebudou uživatelé GIS řídit, může špatná prezentace zapříčinit značné znehodnocení prezentovaných informací.
    Pro zobrazení prostorových kvantitativních dat se velmi často používá kartogram. Tvorba kartogramů je podporována ve většině programových aplikací, které jsou využívány v GIS. Vytváření kartogramů je také podporováno knihovnou ESRI Inc. MapObjects, jenž slouží pro návrh nejrůznějších aplikací, v nichž je potřeba pracovat s geografickými daty. Tato knihovna však už neobsahuje metody pro návrh stupnice legendy kartogramu. V případě že je potřeba do programové aplikace začlenit tvorbu kartogramu, musí se tyto metody dodatečně vytvořit.
    Tato práce se snaží zlepšit současný stav u programových aplikací založených na ESRI Inc. MapObjects, které nabízejí většinou jen minimum klasifikačních metod.
 
 
 

    Cíle práce

    Na základě zadání a analýzy implementace klasifikačních metod v různých programových aplikacích byly stanoveny tyto cíle:
    • Vytvořit programovou knihovnu zajišťující různé metody výpočtu intervalů stupnice. Knihovna musí umožňovat výpočet různých statistických parametrů dat, metody pro vypuštění chybně navržených intervalů a metody pro generování správného popisu intervalů stupnice. Knihovna bude určena vývojářům programových aplikací využívajících knihovnu MapObjects.
    • Implementovat do prostředí programové aplikace zobrazení histogramu, krabicového grafu a statistických parametrů dat.
    • Začlenit do programové aplikace tvorbu kartogramů s využitím vytvořené knihovny. Tato aplikace by měla umožnit výběr různých klasifikačních metod a nastavení jejích parametrů, nastavení počtu tříd a provádění normalizace.
    • Vytvořit průvodce, který by pomohl uživateli nalézt vhodnou klasifikační metodu a počet tříd.
    • Zvážit možné využití expertního systému pro návrh vhodné klasifikační metody a barevného schématu.

 

    Základní pojmy

      Kartogram
          Kartogram je mapa s dílčími územními celky, do kterých jsou plošným způsobem znázorněna statistická data. Tyto data by měly být relativní hodnoty vztažené k ploše.
      Tvorba stupnic
          Pro tvorbu kartogramů je nutné data kvantitativního charakteru rozdělit do jednotlivých intervalů, tak získáme stupnici kartogramu. Tato klasifikace má za cíl zjednodušení a zobecnění. Dojde sice ke ztrátě detailních informací, ale zvýší se čitelnost mapy a umožní se snadnější pochopení a zapamatování jejího obsahu. Díky klasifikaci můžeme také zviditelnit sledovaný jev a tím umožnit jeho interpretaci.

      Volba počtu tříd
          Volba vhodného počtu tříd se provádí tak, aby bylo umožněno adekvátní sdělení kartografické informace. Jestliže je počet tříd malý dochází k velkým ztrátám informací. Při příliš velkém počtu tříd se stává mapa nepřehlednou, jelikož člověk nedokáže snadno rozlišit více než 11 odstínů šedi. Proto je nutné volit takový počet tříd, aby jejich hranice byly v mapě dobře rozlišitelné. Počet tříd se volí buď na základězkušeností, kdy volíme počet v rozmezí 4 až 15 popř. 5 až 20, nebo pomocí vzorců.
       
       
       

    Realizace

    Pro realizaci práce bylo zvoleno programovací prostředí Borland Delphi 5.0 a knihovna ESRI Inc. MapObjects 2.0. Vytvoření průvodce, začlenění klasifikačních metod i zobrazování statistických parametrů dat bylo po konzultaci s vedoucím práce zabudováno přímo do programové aplikace Gisel 2.0 firmy Sirion.
 
 
 

    Tvorba programové knihovny

    Prvním krokem realizace bylo vytvoření knihovny usnadňující tvorbu kartogramů v ESRI MapObjects.Jádrem knihovny jsou dvě třídy objektů, třída TStatistik a třída TKlasifik.
 
Třída TStatistik
    Jejím úkolem je zajistit výpočet statistických parametrů datového souboru. Tato třída vznikla z toho důvodu, že veškeré statistiky potřebné pro pozdější výpočty nebyly dostupné ani v knihovnách dodávaných k Borland Delphi, ani v knihovně MapObjects.
      Třída TKlasifik
          Jejím úkolem je zajistit výpočet intervalů různými klasifikačními metodami, zajistit jejich správné popisování a výpočet konzistentnosti navržených tříd pomocí koeficientu GVF. Třída TKlasifik je odvozena od třídy TStatistik. Implementovány byly tyto klasifikační metody:
Klasifikační metoda
Rovnoměrné rozdělení variačního rozpětí
Dělení aritmetickou řadou 
Dělení geometrickou řadou
Průměr a směrodatná odchylka
Průměr a průměrná odchylka
Kvantily
Medián a kvartily
Metoda maximálního rozdílu mezi sousedními hodnotami
Metoda minimálního úhlu mezi sousedními hodnotami
Jenksova optimální metoda

 
 
 

    Zobrazení statistických parametrů dat

    Pro zobrazení statistických parametrů vstupních dat byl do aplikace Gisel vložen formulář, který zajišťuje zobrazení histogramu, krabicového grafu a základních statistických údajů.Výběr databázové položky pro výpočet statistik je umožněn pomocí nabídky Sloupec.

    Použitý krabicový graf je složen z krabičky (červené čáry), znázorňující dolní kvartil, medián a horní kvartil. Dále jsou zobrazovány “vousy” (černé čáry), ty znázorňují 1% a 99% kvantil. Diamant zelené barvy znázorňuje průměr a směrodatnou odchylku od průměru. Podél středové osy grafu jsou pomocí bodů zobrazeny jednotlivé výskyty vstupních hodnot. Body jsou náhodně rozmístěny podél osy y, aby nedocházelo k jejich překrývání. Výška diamantu a krabičky se proporcionálně mění v závislosti na počtu výskytu hodnot.
 


 
 
 

    Formulář pro nastavení parametrů kartogramu

    Formulář umožňuje:
    • Nastavení parametrů klasifikačních metod (tj.volbu položky pro klasifikaci, položky pro normalizaci, oblasti hodnot zahrnované do výpočtu, nastavení počtu tříd nebo zvolení přímo zlomových hodnot ...)
    • Zobrazení histogramu s navrhovanými intervaly
    • Náhled před aktivováním změn.
    • Ruční editaci intervalů a jejich popisů.

     


    Obr.: Výběr a nastavení parametrů klasifikační metody.
 


    Obr.: Zobrazení histogramu s navrženými intervaly stuponice.
 


    Obr.: Náhled na klasifikované téma před aktivací změn.
 
 
 

    Formulář průvodce

    Úkoly navrženého průvodce:
    • Vést uživatele správným postupem návrhu kartogramu.
    • Doporučit nejvhodnější klasifikační metodu pro vstupní data a volby uživatele.
    • Průvodce by neměl za uživatele v konečné fázi volby klasifikační metody rozhodovat.
    Postup při návrhu kartogramu s využitím daného průvodce:
  • Volba klasifikační položky popř. položky pro normalizaci.
  • Určení budoucího využití kartogramu. Toto rozhodnutí je bráno jako první kritérium pro posouzení vhodnosti klasifikačních metod.
  • Zvolení počtu tříd.
  • Určení typu rozdělení četností. (2.kritérium)

  • Výpočet konzistentnosti navržených intervalů u jednotlivých metod. (3.kritérium)
  • Ohodnocení jednotlivých metod váženým součtem jednotlivých kritérií a výběr nejvhodnější metody. Kritéria mohou nabývat hodnot v rozmezí 0 1 a jsou jim přiřazeny váhy na základě priorit.

  • Případné nastavení parametrů zvolené metody.
  • Výběr barev pro obarvení kartogramu.
  • Náhled před aktivací změn.
     

    Možné využití expertního systému

    Expertní systémy jsou orientovány k řešení úzké problematiky, o které mají hluboké znalosti a nacházejí řešení srovnatelná s řešeními, které by přijal expert. Jejich nutnou součástí je schopnost odůvodnění nalezeného řešení. Hledání řešení se provádí na základě vstupních dat, získaných od uživatele, a báze znalostí, kde jsou shrnuty znalosti expertů. Báze znalostí je obecný model popisu oblasti řešené expertním systémem, obvykle je tvořena pomocí pravidel popisující daný problém.
    Využití expertních systémů k volbě vhodné klasifikační metody a barevného schématu se zdá být vhodné. Problém by mohl nastat při definování báze znalostí, jelikož expert se může rozhodovat v iteracích a také na základě estetického působení výsledné mapy a dalších těžko definovatelných kritériích. Do báze znalostí expertního systému by se mohla vložit pravidla pro volbu stupnice na základě rozdělení četností, budoucího využití mapy a okruhu uživatelů. Bylo by vhodné podmínit rozhodování také druhem mapy nebo tématu, které mapa vyjadřuje, jelikož u některých map jsou již zavedené konvence dělení stupnice a také specifická barevná schémata. Jelikož se znázorňování údajů pomocí map vyskytuje v řadě různých oborů lidské činnosti, bylo by vybudování báze znalostí komplexního expertního systému velice náročné. Vhodné by proto bylo zaměřit se při vývoji jen na nejčastější oblasti využití a na nejpodstatnější kritéria rozhodování.

Copyright (C) VŠB - TU Ostrava, Institut geoinformatiky, 2001-3. Všechna práva vyhrazena. 
V případě, dotazů, komentářů, připomínek kontaktujte www-gis.hgf@vsb.cz
Tato stránka byla naposledy aktualizována: 29.03.2006 16:16
Stránky jsou optimalizovány pro Microsoft Internet Explorer v. 5.0 a vyšší.
Jsou vytvářeny v programovém prostředí FrontPage 2003.

NAVRCHOLU.cz