|
|
Analýza vzdělávací nabídky středních a vyšších odborných škol ve Zlínském krajiTomáš HERMAN AbstractThe aim of this graduation theses was form and design conceptual procedure for needs regional office in Zlín. This imposition nesting includes creation structure database and her automatic linked by data in format CSV. Over those data then design analyses and subsequent designed appropriate manner for visualize analyses on map server. AbstraktCílem diplomové práce bylo vytvoření a provedení koncepčního postupu pro potřeby K.Ú. ve Zlíně. Tento úkol v sobě zahrnuje vytvoření struktury databáze a její automatické propojení s daty ve formátu CSV. Nad těmito daty pak provedení analýzy a následné navržení vhodného způsobu vizualizace analýz na mapovém serveru. ÚvodŠkolství je v podmínkách decentralizovaného systému výkonu státní správy jedním z klíčových aspektů funkční i ekonomické efektivnosti vzdělávacího systému. Charakter uplatnění zákonných pravomocí samosprávných orgánů kraje a obcí, zejména při řízení jimi zřízených škol a školských zařízení je prvkem, zajištujícím efektivní a zdravý vývoj školství. Úloha kraje v systému řízení a správy školství je nezastupitelná zejména v následujících okruzích činností:
Vedle všeobecných důvodů, jakými je především rostoucí zájem absolventů středních škol o studium na vysokých a vyšších odborných školách a přímá souvislost úrovně dosaženého vzdělání na zaměstnatelnost a životní úspěch jednotlivců i na prosperitu a konkurenceschopnost regionu a jeho ekonomiky jsou argumentem pro rozšiřování vzdělávacích příležitostí maturitního vzdělávání. Krajský úřad má k dispozici velké množství dat, která ovšem nejsou často vhodným způsobem zpracovávána. Je s nimi pracováno pouze v prostředí tabulkových procesorů, kde je možné provádět pouze jednoduché přehledy, úpravy a snazší analýzy. Využitím geoinformační technologie by bylo možné z těchto dat získat mnohem více cenných informací, než je tomu doposud. Tato diplomová práce má ukázat některé ze způsobů využití těchto dat, za přispění zmíněných technologií zpracování. Je to v podstatě pilotní řešení, které by mělo ukázat možnosti využití technologie GIS na krajském úřadě. Dalším úskalím bývá totální ignorace ze strany organizací, ohledně dodržování standardů, což se v této práci velmi projevilo. Cíle diplomové práceCílem diplomové práce je vytvoření "koncepčního postupu" pro potřeby krajského úřadu ve Zlíně. Krajský úřad má k dispozici data, která dostává od ÚIV. Tato data jsou jednou ročně aktualizována. Data jsou poskytována ve výměnném formátu CSV a úkolem tedy bylo tato data nějakým smysluplným způsobem zpracovat. Pod výše zmíněným pojmem "koncepční postup" si lze představit požadavek krajského úřadu, který byl vznesen na počátku projektu. Ten se týká toho, aby bylo možné zpracovávat data každoročně. V případě, že by byla navržena databáze naplněna pouze ručně, při další aktualizaci dat ÚIV by už byla tato databáze neaktuální, tedy nepoužitelná. Bylo tedy nutné navrhnout postup, který by umožnil každoroční aktualizaci (naplnění) databáze automatizovaným způsobem. Poté mají být nad daty v naplněné databázi provedeny analýzy dle zadání. Jedná se především o rozmístění škol (středních a vyšších odborných) podle daných kriterií - počet subjektů, typ součásti, zaměření, velikost (počet žáků) a zřizovatel. Dále rozmístění oborů, skupin oborů a počet žáků v těchto oborech respektive skupinách oborů. Na závěr diplomové práce má být navrhnut vhodný způsob vizualizace výsledků analýz. K tomuto účelu má posloužit mapový server, který má umožňovat některé funkčnosti, ve formě SQL dotazů na databázi. Datové zdrojeData, která byla využita při práci se dají rozdělit do následujících čtyř částí. Dále jsem chtěl ještě využít data z DMÚ 25, ale pro území Zlínského kraje nebyly k dispozici. Data ÚIVTato data jsem dostal k dispozici od K.Ú. Jedná se o soubory CSV, které K.Ú. dostává od ÚIV. V těchto souborech se nachází kompletní statistické údaje, nutné pro práci. K.Ú. mi umožnil přístup na www stránky, kde jsem si mohl příslušná data stáhnout, jak je vidět na obrázku č.1. Obr č. 1 : Ukázka přístupu ke zdrojům dat ÚIV Na stránkách ÚIV je možné si vybrat výkazy ke stažení. Tyto výkazy si vybírám podle ročníku sběru. Obvykle se nabízí aktuální a jeden rok stará data. Výkazy, se kterými jsem pracoval, uvádí tabulka č.1
Tabulka č. 1 Výčet a popis výkazů se kterými byla práce prováděna Kromě výkazů se dají ze stránek získat také tzv. sumáře, což jsou soubory ve formátu PDF, které obsahují popis jednotlivých atributů, vedených v CSV souborech. Tyto soubory jsem rovněž musel později využít, proto abych mohl určit významy jednotlivých atributů, se kterými jsem pracoval. Adresní vrstvaTuto vrstvu jsem dostal od K.Ú. - odboru kanceláře ředitele - oddělení informatiky. Vrstva je ve formátu tabulky Access. Obsahuje 150.605 záznamů. Jsou zde uvedeny adresy prakticky všech stavebních objektů ve Zlínském kraji, včetně jejich polohy v souřadnicovém systému S-JTSK. Tato tabulka vznikla spojením databáze UIR-ADR a dat ČSÚ. Při spojení těchto dat došlo k vypadnutí cca. 2-3% stavebních objektů. Adresy škol vedené K.Ú.Adresy škol jsem dostal jednak ve formě CSV souboru a také v XLS souboru od K.Ú. - odbor školství, mládeže a sportu. Avšak tyto zdroje nebyly k propojení s adresní vrstvou dostačující, proto jsem využil řadu dalších zdrojů, především internetových [13],[14]. ARCČR-500 a jinéArcČR-500 jsem využil pro vizualizaci na mapovém serveru a při provádění analýz. K.Ú. - oddělení informatiky mi ještě poskytl několik vrstev ve formátu SHP - zlin.shp (hranice kraje Zlín), obce.shp (hranice obcí kraje Zlín), ku.shp (hranice katastrálních území kraje Zlín). Standardy ISVSZ důvodů lokalizace škol v prostoru a práci s UIR-ADR jsem se musel blíže seznámit se standardem ISVS pro prostorovou identifikaci 008/04.02 a standardem pro jednoduché datové prvky 009/02.01, které jsem využil ve své práci.Seznámení se s činností ÚIVÚstav pro informace ve vzdělávání (ÚIV) je příspěvkovou organizací, přímo řízenou Ministerstvem školství, mládeže a tělovýchovy ČR, se sídlem v Praze.Charakteristika a vymezení činnosti1.statistická a statisticko-evidenční, kde zejména:
2. informační a knihovnickou, kde zejména:
3. výzkumná a analytická, kde zejména:
4. organizační a koordinační, kde zejména:
Statistické údaje z oblasti školstvíSběr dat začíná každoročně začátkem září. Prázdné formuláře jsou zpřístupňovány vždy dva týdny před datem, ke kterému začíná sběr dat. Škola obdrží prázdný formulář zaslaný z ÚIV. Prázdné formuláře je také možné získat stáhnutím z internetu ve formátu *.pdf. Poslední sběr dat je aktuální k 30. 09. 2003.
ČíselníkyJedná se o závazné číselníky používané při sběru dat v resortu školství. Autorem číselníku je ČSÚ nebo resort MŠMT. Aktualizace probíhá průběžně podle potřeby.Statistické výkazyJedná se o agregace dat pořízené ze statistických výkazů regionálního školství (data výkonová i práce a mzdy). Je zde možnost agregací podle různých hledisek (období, území, zřizovatel, typ). Aktualizace probíhá 1x za čtvrtletí.Časové řadyJedná se o agregace dat pořízené ze statistických výkazů regionálního školství (data výkonová i práce a mzdy). Je zde možnost agregací podle různých hledisek (období, území, zřizovatel, typ) v časových řadách od roku 1991. Aktualizace probíhá 1x za čtvrtletí.RočenkyStatistické ročenky vycházejí každoročně v tištěné podobě, od roku 1998/99 jsou dostupné i v elektronické podobě na CD-ROM. Publikační řada obsahuje každoročně tři tituly:
Výkazy o spec.Š, SŠ, OU, prakt.ŠMinisterstvo školství, mládeže a tělovýchovy shromažďuje tyto informace z dané oblasti. Rozdělení:
Popis formátu CSVFormát CSV se používá pro přenos údajů do tabulkových procesorů. První řádek udává záhlaví, kde jsou popsány položky jednotlivých sloupců. V podstatě se jedná o ASCII soubor, ve kterém jsou jednotlivé hodnoty oddělené středníkem. Na obrázku č.2. je vidět zobrazení tohoto ASCII formátu, v textovém editoru a poté v tabulkovém procesoru.Obr č. 2 Ukázka CSV souboru v textovém editoru Obr č. 3 Ukázka CSV souboru v tabulkovém procesoru Tvorba struktury databázeNávrh struktury databáze vycházel z požadavků Krajského úřadu, který mi ukládal zpracovat výkazy, které jsou uvedené v datových zdrojích. Databáze obsahuje 15 základních tabulek. Hlavní tabulkou je tabulka SKOLY, ve které jsou obsaženy jednotlivé údaje o součástech škol a také jejich identifikace k jednotlivým školám. Další významnou tabulkou je UIR, která obsahuje data z adresní vrstvy a slouží k prostorové identifikaci součásti školy. Dále je zde tabulka OBORY, která obsahuje obory a skupiny oborů, které jsou v nabídkách jednotlivých škol. Další tabulky jsou již pojmenovány podle názvů výkazů, jejichž data obsahují. Data, která jsou v databázi pochází ze souborů CSV a adresní vrstvy dodané K.Ú. Některé významné atributy, jako např. RED_IZO (identifikátor ředitelství školy) jsem musel doplnit do databáze z www stránek ÚIV, neboť řada CSV souborů je nekompletních, tzn. neobsahují údaje potřebné pro identifikaci školy a to i přesto, že se jedná o naprosto klíčový, nezbytný atribut. Propojení databáze s daty ÚIVDůležitým úkolem diplomové práce bylo propojení navrženého datového modelu a dat ve výměnném formátu CSV. Přesně se tedy jedná o naplnění databáze, přesně podle požadavků krajského úřadu. Tzn. pravidelné naplnění databáze aktuálními daty. K aktualizaci dat dochází jednou ročně. Pro tento úkol bylo možno využít několik cest. Jednou z možností byl import dat do databáze přímo z CSV souborů. Další možností bylo připojení CSV souborů přes rozhraní ODBC, nebo také vytvoření automatické aplikace.Import dat z CSVTabulku v prostředí Access je možné vytvořit zkopírováním dat z velkého množství různých formátů. Data je možné importovat nejen z jiných databází Access, ale také z databází dBASE, Paradox, FoxPro a pomocí ODBC z jakékoliv SQL databáze, která podporuje standard ODBC. Použití importu se doporučuje v případě splnění jedné z následujících podmínek:
Propojení pomocí ODBCODBC je standard pro formalizované rozhraní. ODBC je standardizovaná technologie API, která má za úkol poskytnout stejný přístup k různým druhům databází. ODBC zahrnuje čtyři hlavní části:
Vlastní řešeníMožnost propojení pomocí automatické aplikace nabízí určité výhody. Jednou z nich je možnost úpravy dat podle vlastních potřeb. Pro tuto možnost jsem se rozhodnul také pro velké množství chyb v datech ÚIV. Tyto chyby, nebo nedostatky popisuji v následující kapitole - Chyby v datech.Chyby v datechV datech, které jsem obdržel od K.Ú. ve Zlíně se vyskytovaly především špatné, nebo neúplné adresy škol.Dalším nedostatkem jsou některé chybějící údaje. Z nich stojí za zmínku hlavně atribut RED_IZO, což je atribut, který identifikuje školu. Tento atribut byl vyplněn pouze v jediném výkaze, ze čtyř hlavních výkazů, ve kterých se vede a které jsem zpracovával. Přestože se jedná o naprosto klíčový atribut, tak často vyplněn nebyl. Tyto údaje jsem byl tedy později nucen zjišťovat z www stránek organizace ÚIV. Popis aplikaceAplikace je navržena ve vývojovém prostředí Microsoft Visual Basic. Provádí naplnění databáze daty z kteréhokoliv roku, za předpokladu zachování stávající struktury dat.V prvním kroku při spuštění aplikace dochází k načtení prázdné databáze (její navržené struktury) a adresní vrstvy, která je uložená společně s pomocnou tabulkou ADRESY v další databázi s názvem UIR. Struktura této databáze a navržené databáze se nemění. Nakonec je ještě potřeba zadat umístění a název kam se má nová (naplněná) databáze uložit. Poté dochází k načtení dat (zpracovávaných výkazů) ze souborů CSV. Nejprve jsem načítání souborů navrhl tak, že probíhalo automaticky. Při získávání výkazů ze stránek ÚIV však dochází k dynamickému generování názvu tohoto výkazu, který se generuje podle datumu a času stažení. Proto jsem změnil načítání vrstev na ruční, aby se nemusely přepisovat názvy. V případě, že nedojde k nalezení objektu v podobě záznamu obsaženém v adresní vrstvě, vyskočí formulář pro ruční zadání správné adresy. Je možné měnit OBEC, ČÁST OBCE, ULICI, popř. DOMOVNÍ ČÍSLO. Po výběru a vyhledání správné adresy se tato musí potvrdit. Aplikace pak pokračuje v dalším přiřazování pomocí atributu OBJECTID. Po naplnění tabulky školy dochází k naplnění ostatních tabulek ze všech výkazů. Při vyplňování dochází rovněž k opravám výše popsaných chyb - především odstraňování atributů. V případě chybějícího atributu RED_IZO (identifikátor školy) se objeví formulářové okénko pro zadání této hodnoty s pomocí identifikátoru součásti školy - IZO. Obr č. 4 : Ukázka aplikace Analýza nad datyVeškeré výstupy pro potřeby analýzy nad daty byly vytvářeny v softwarovém produktu ArcMap.Rozmístění SŠ a VOŠ v krajiJako podkladové vrstvy jsem zvolil hranici kraje Zlín a obce kraje Zlín. Pro přehlednost jsem použil popisky pro název obce a to jen těch, ve kterých se nacházel sledovaný objekt. U vrstvy OBCE jsem použil k vykreslení jednotlivých obcí odstupňované barvy, podle atributu hustota_ob (hustota obyvatel), což se projevilo v přehlednosti zobrazení. Jednotlivá města pak mají výrazně odlišnou barvu, než je tomu u neobydlených částí, což zlepšuje názornost výstupů. Rozmístění SŠ a VOŠ je rovnoměrné po celé oblasti Zlínského kraje, dochází ke shlukování, především v místech větších obcí, (Zlín, Uherské Hradiště,...).Obr č. 5 Ukázka výstupu "Rozmístění SŠ a VOŠ ve Zlínském kraji" Podle počtu subjektůŠkolu identifikuje atribut RED_IZO, což je identifikátor školy. Ta se může skládat z několika součástí. Součást je identifikovaná atributem IZO. Nastíněná situace se dá popsat následným obecným vztahem.RED_IZO -> IZO1, IZO2, ..., IZOnUrčuji zde tedy počet těchto součástí, které daná škola má.Obr č. 6 Ukázka výstupu "Rozmístění SŠ a VOŠ ve Zlínském kraji podle součástí" Podle typu součástíTypem součásti se rozumí hodnoty, kterých nabývá atribut TYP. Hodnota atributu TYP mi pak definuje typ součásti. Ta může nabývat následujících hodnot:
Podle velikosti (počtu žáků)Co se týče počtu žáků, tak byly brány v úvahu všechny formy studia (denní, dálkové, rekvalifikační a ostatní).Podle zřizovateleKaždá škola se vyznačuje tím, že je někým zřízena. Zřizovatelem mohou být následující subjekty, které jsou označeny svou číselnou hodnotou (podle číselníku) a charakterizuje ho název:
Z tabulky č.2 vyplývá, že jsou zde zastoupeny pouze 2 typy zřizovatelů, přičemž nejčastějším zřizovatelem je kraj
Tabulka č. 2 Výčet jednotlivých zřizovatelů Obr č. 7 Ukázka výstupu "Rozmístění SŠ a VOŠ ve Zlínském kraji podle zřizovatele" Rozmístění oborůV databázi je obor, resp. skupina oborů definovaná pomocí následujícího kódového označení: 2343L506Celý kód identifikuje obor, přičemž první dvojčíslí zleva (23), označuje příslušnou skupinu, do níž obor patří. Celkový počet oborů, které jsou v rámci vzdělávací nabídky nabízeny je 235. Z důvodů rozsáhlosti tabulky, uvádějící všechny obory, počty škol, na kterých se učí a počty žáků, které daný obor studují, uvádím tuto v příloze diplomové práce společně s kartodiagramy. Ty jsem volil podle oboru, který je nejčetnější, nejméně četný a střední hodnotu (medián) z hlediska počtu škol vyučujících daný obor a z hlediska studentů, kteří obor studují.Rozmístění skupin oborůObory, které nabízí vzdělávací nabídka, jsou rozděleny přesně do 25 skupin podle zaměření jednotlivých oborů. Tabulka č.3 ukazuje výčet těchto skupin oborů a způsob jakým jsou rozděleny. Nejprve je zobrazené kódové číslo (číselník) dané skupiny a následuje její význam.
Tabulka č. 3 Výčet Výčet skupin oborů Mapový serverZávěrečnou částí diplomové práce bylo navržení vhodného způsobu vizualizace výsledků analýz pomocí mapového serveru. Protože v této době ještě nebyl na krajském úřadu k dispozici jejich mapový server - ArcIMS, rozhodl jsem se využít mapový server - Minessota. Před tvorbou mapového serveru muselo ještě dojít k úpravě vrstev, které jsem dostal od K.Ú. - oddělení informatiky. Potřeboval jsem vrstvu okresů a tu jsem si vytvořil pomocí extenze Arcmap - Geoprocessing, funkce Dissolve z vrstvy obcí pomocí atributu Kodnuts4, což je číselný prostorový identifikátor standardního prvku prostorové identifikace "kraj". Dále jsem potřeboval vrstvy silniční sítě, železniční sítě, vodních toků a lesů. Tyto jsem získal z datového zdroje ArcCR za pomocí funkce Clip extenze Geoprocessing, kde ohraničující vrstvou byla vrstva kraje. Výsledné vrstvy jsem pak využil v mapovém serveru jako podkladové vrstvy. Při definování x,y souřadnic jednotlivým bodům bylo použito zobrazení v pseudo-S-JTSK souřadnicovém systému, neboť v databázi jsou souřadnice uloženy v kartézském souřadnicovém systému. Pro korektní zobrazení v mapovém serveru a také v SW produktu ArcMap je nutné provést transformaci souřadnic. V této transformaci přiřadím "x-ové" souřadnici zápornou "y" a naopak.Funkce mapového serveruPo dohodě s K.Ú. byla navržena funkčnost mapového serveru. Ten nabízí standardní funkce jako jsou zvětšení, zmenšení, posunování vygenerované mapky a také zobrazení v plném měřítku.Obr č. 8 Ukázka mapového serveru ZhodnoceníNa diplomové práci, bylo předvedeno, jakým způsobem by se dalo pracovat s daty, v tomto případě poskytnutými ÚIV. Nezbytnou nutností je ovšem potřeba, aby tyto organizace dodržovaly standardy - což se projevilo především při lokalizaci škol. Dále se nabízí úvaha, proč krajské úřady nedostávají data ve vhodnější formě, než jakou představují výstupy ve formátu CSV, které navíc obsahují značné množství chyb a nedostatků, které je pak nutné velmi komplikovaně odstraňovat. V diplomové práci byly předloženy možností využití geoinformačních technologií a to především z důvodů zmíněných problémů a nedostatků v datech, které by při využití databází ÚIV vůbec nenastaly. Při poslední schůzce byl také projeven zájem na pokračování projektu. Krajskému úřadu se jedná především o rozšíření a vylepšení aplikace tak, aby zahrnovala nejen SŠ a VOŠ školy, ale aby bylo možné pracovat se všemi typy škol. To by znamenalo především přidání dalších výkazů do zpracování a také zobecnění aplikace. Data v této formě by bezesporu přispěla k lepšímu rozhodovacímu procesu v rámci K.Ú. při zřizování škol, oborů na těchto školách apod. Mohly by pomoci i budoucím uchazečům při rozhodování o studium na těchto školách. Literatura
|
Copyright (C) VŠB - TU Ostrava,
Institut geoinformatiky, 2001-3. Všechna práva vyhrazena. |