|
|
Využití registru sčítacích obvodů ČSÚ pro lokalizaci subjektů na úřadech prácePetr Chrobák AbstractThis dissertation focuses on the possibilities how to take advantage of the Register of Cenzus Districts for object localisation of job applicants in labour offices. The first part of this work suggests and evaluates the connection among The Territorial Identification Register of Objects, addresses, and The Register of Cenzus Districts. The second part concentrates on connecting The Register of Cenzus Districts with individual labour office databases. Another important phase of this work was the agregation of these data into cells for the reason of applicants´ personal data protection. This also includes the visualisation of the agregation results. AbstraktTato diplomová práce se zabývá možnostmi využití registru sčítacích obvodů pro prostorovou lokalizací uchazečů o zaměstnání na úřadech práce. Prvním úkolem práce bylo navrhnout a vyhodnotit propojení mezi Územně identifikačním registrem objektů a adres a Registrem sčítacích obvodů. Druhý úkol spočíval v propojení Registru sčítacích obvodů s daty exportovanými z evidencí jednotlivých úřadů práce. Důležitou fázi práce byla rovněž agregace těchto dat do buněk z důvodu ochrany osobních údajů o uchazečích. Součástí práce bylo také výsledky agregace vhodným způsobem vizualizovat. ÚvodSoučasná společnost se nachází v době, jejímž hlavním rysem je značný dynamický vývoj. Tento vývoj se nevyhnul ani trhu práce. Nezaměstnanost, jakožto jeden z ústředních problému trhu práce se rovněž vyvíjí. V ČR se ale vývoj začal ubírat neustálým postupným nárůstem nezaměstnanosti. Mimo tento nárůst se v rámci území ČR začala nezaměstnanost značně diferencovat. Nezaměstnanost a její diferenciace je odvislá od úrovně dosažené transformace a hospodářského rozvoje. Na základě diferenciace nezaměstnanosti se vytvořily oblasti s vysokou mírou nezaměstnanosti a naopak oblasti s touto mírou nízkou. Postupem času se z nezaměstnanosti stal jeden z nejvýznamnějších ekonomických a sociálních problémů naší společnosti. K předcházení těmto problémům slouží programy na předcházení nezaměstnanosti, respektive na její snižování. Aby tyto programy byly pokud možná co nejúčinnější, musí vycházet z pokud možno co nejvěrohodnějších údajů týkající se nezaměstnanosti a jejího vývoje. K tomu slouží charakteristiky trhu práce. Jednotlivé programy se opírají především o výsledky analýz trhu práce. Pokud se do analýz vloží prostorová složka, je možno provádět prostorové analýzy. Prostorové analýzy berou v úvahu prostorové umístění zjištěných hodnot či jevů a jejich prostorové vztahy. Výstupy takových analýz, zejména jejich grafická část, jsou názorné, se značnou vypovídací schopností. Začlenění zmiňované prostorové složky umožňují geografické informační systémy. Tyto systémy se zaměřují na ukládání, správu, analýzy a následnou prezentaci dat, především prostorových. Prostorová data představují data, která obsahují i údaje o poloze popisovaného objektu nebo jevu. Zpravidla tedy zahrnují grafickou reprezentaci dat, ke které jsou vztaženy statistické údaje. Pro zobrazování statistických, zvláště demografických dat a dat spojených s nezaměstnaností se používají kartogramy s administrativními hranicemi. Toto zobrazení je často zavádějící, protože osídlení v celé jednotce není konstantní. Naopak, v rámci osídlení administrativních jednotek dochází ke značným rozdílům v hustotě osídlení území. Přitom jednotlivé ÚP mají k dispozici lokalizaci zájmových subjektů na vyšší úrovni, mají k dispozici adresy jednotlivých subjektů. S daty typu adresa je ale nutno nakládat s ohledem na zákon O ochraně osobních dat. Adresa subjektu se dá použít k lokalizaci objektu pomocí souřadnic. Díky této přesné souřadnicové lokalizaci je možno provádět analýzy pro menší plošné jednotky než administrativní celky, ale především získat přesnější představu o rozložení sledovaného jevu v území. Pro praktické využití je potřebné nalézt a popsat postup vhodný pro praktickou aplikaci na jednotlivých ÚP. UIR-ADRÚzemně identifikační registr objektů a adres (UIR-ADR) byl vybudován v letech 1997-1999 za spolupráce obecních úřadů, Ministerstva práce a sociálních věcí, Ministerstva vnitra, Českého úřadu zeměměřického a katastrálního, Českého statistického úřadu a České pošty s.p. Analyticko-programové řešení a z velké části i vlastní zpracování dat provedla firma OKsystem s.r.o. Registr představuje centrální databázi celostátních číselníků oblastí, krajů, okresů, obvodů ORP (obcí s rozšířenou působností), obvodů POU (obcí s pověřeným obecním úřadem), obcí, pražských obvodů, správních obvodů, městských částí, částí obcí, ulic a veřejných prostranství, pošt, adres a stavebních objektů [ 13]. Jednotlivé záznamy vztahující se k evidovaným adresám neobsahují žádné údaje o osobách ani organizacích. Pro adresy jsou poskytována platná poštovní směrovací čísla, tyto poskytuje Česká pošta, s.p.. Registr byl původně vytvářen pro potřeby státní sociální podpory a úřadů práce, nyní je rozšířen i v nestátním sektoru. Využívání registru zajišťuje jednotné a správné používání názvů a umožňuje kontrolu existence adresy. Tímto umožňuje zefektivnit některé funkce závislé na přesné a platné adrese. Registr udržuje MPSV ve spolupráci s obecními úřady. Do registru jsou průběžně doplňovány chybějící adresy, zaznamenávány změny názvů, případně označeny zrušené stavební objekty. Dále se postupem času mění i verze dat databáze. Jednotlivé verze dat jsou číslovány pořadovými čísly od 1, resp. 0 výše. V registru UIR-ADR se tedy vedou dva typy evidencí, a to evidence reality a evidence změnových operací. RSORegistr sčítacích obvodů (RSO) je tvořen třemi relativně samostatnými databázemi. Tyto databáze tvoří soustavu prostorových identifikací a lokalizací v dané hierarchii, která podchycuje jejich vzájemné vazby a skladebnost [ 10]. Jedná se o popisně a graficky skladebnou soustavu všech prvků administrativního, technického, sídelního a statistického členění za celou ČR, a to od krajů, okresů, obcí, částí obcí, městských částí (městských obvodů), katastrálních území a územně technických jednotek, základních sídelních jednotek, sčítacích obvodů, objektů a parcel, ulic a veřejných prostranství až po adresní části bytů [ 11]. Jednotlivými databázemi, jimiž je registr tvořen, jsou databáze sčítacích obvodů, dále ulic a veřejných prostranství a třetí je databáze stavebních objektů a bytů. Registr byl původně vytvořen zejména pro potřeby státní statistické služby. Měl sloužit jako aktualizovaná podpora pro výběrová a plošná šetření v oblasti sociálních statistik [ 9]. Především byl určen pro využití při SLDB 2001. V současné době registr využívá mimo ČSÚ ještě řada dalších subjektů Propojení UIR-ADR a RSORealizace propojeníPro propojení bylo nutno vybrat z registru UIR-ADR záznamy o objektech, které ve skutečnosti v době rozhodného termínu pro SLDB 2001 existovaly. Tedy objekty, u nichž atribut STAV objektu v aktuální verzi nabývá hodnot 1 (existuje) nebo 2 (zanikl), a termín zániku je až po rozhodném datu pro SLDB 2001. Všechny takové objekty musejí splňovat ještě podmínku vzniku před tímto rozhodným datem.
Propojení jsem realizoval mezi tabulkami OKRES, OBEC, COBCE, OBJEKT, ULICE a ADRESA z UIR-ADR a tabulkou OBCZ z RSO.
Propojení obou registru jsem provedl ve dvou variantách: Vyhodnocení úspěšnosti propojeníPo provedeném propojení jsem porovnal počty propojených záznamů pro jednotlivé okresy v rámci Moravskoslezského kraje a pro tento kraj celkově. Výsledky, včetně procentuálního vyjádření propojení k jednotlivým registrům jsou uvedeny v Tab. 1.
Z tabulky Tab. 1 je patrné, že úspěšnost propojení pro okres Karviná není příliš velká, provedl jsem podrobnější zhodnocení pro jednotlivé obce, respektive části obcí v rámci tohoto okresu. Na základě tohoto podrobného vyhodnocení lze říci, že nejnižší úspěšnost propojení vztažená k UIR-ADR je v částech obcí Doly, Louky a Lázně Darkov. Úspěšnost propojení se pohybuje okolo 30 %. Tyto části obce podléhají dynamickým změnám v krajině zapříčiněné intenzivní těžbou černého uhlí a s tím spojenými negativními vlivy na krajinu. V těchto oblastech každoročně docházelo resp. dochází k řádově desítkám demolic objektů. Na takovou dynamiku změn v realitě zřejmě patřičně nereaguje evidence v UIR-ADR. Terenní rekognoskace
Na vzorku dat nacházejících se v části obce Dolní Suchá jsem provedl terénní rekognoskaci s následným ověřením na Stavebním úřadu.
Pro část obce Dolní Suchá je v RSO evidováno 230 objektů, v registru UIR-ADR 233 objektů. Úspěšně se propojilo 215 záznamů o objektech z této části obce. Nepropojilo se 15 objektů z RSO a 18 objektů z UIR-ADR.
Lokalizace uchazečů a jejich agregaceDruhou částí mé diplomové práce bylo propojení dat na ÚP Karviná a ÚP Frýdek - Místek s RSO. Propojením jsem získal lokalizaci uchazečů o zaměstnání pomocí souřadnic X a Y. Z důvodu ochrany osobních dat bylo nutno tuto operaci zpracovat na jednotlivých ÚP. Navíc z již zmiňovaného důvodu ochrany dat bylo nutno provést vhodnou agregaci dat o uchazečích. Byla zvolena agregace do pravidelných pravoúhlých sítí, které byly předem předpřipraveny. Doplňkově byly údaje agregovány i do administrativních celků jednotlivých obcí. Data na ÚPZ rozsáhlé struktury informačního systému OKpráce, který je využíván na úřadech práce v ČR jsem použil data uvedená v Tab. 2. Jedná se především o data týkající se adresy uchazečů, dále o data důležitá pro sledování situace na trhu práce. Data týkající se adresy byla důležitá pro lokalizaci jednotlivých uchazečů v území. Pro určení některých ukazatelů trhu práce byla vybrána data týkající se vzdělání a délky evidence uchazečů.
Pro export z evidence uchazečů byly vymezeny některé omezující kritéria: Příprava čtvercové sítěS ohledem na velikost zájmového území jsem navrhl sítě tří odlišných velikostí buněk, a to 1000 m, 500m a 200m. Příprava spočívala ve vlastním vytvoření polygonových vrstev představujících sítě, dále v připravě tabulky v databázi, v níž byly definovány parametry jednotlivých sítí. Realizace propojení a agregace na ÚPVstupními daty do této fáze jsou tabulky OBCZ, UCH_OKR, dále databáze obsahující tabulku s parametry sítí.
Nejprve jsem do databáze propojil tabulky OBCZ a UCH_OKR jako externí datové zdroje.
Z tabulky OBCZ se vyberou záznamy pro daný okres a vytvoří se nová tabulka CAST1. Tabulka UCH_OKR zůstává vně databáze a přistupuje se k ní, jako k vnějšímu datovému zdroji. Datové schéma je uvedeno na Obr. 1. Obě tabulky se vzájemně propojí pomocí atributů týkajících se adresy uchazečů o zaměstnání. Propojení se provede ve dvou variantách: Agregace dat pro vizualizaciTabulky s agregovanými daty z jednotlivých ÚP jsem importoval do jedné databáze. Shodné tabulky s daty pro jednotlivé okresy jsem odlišil označením na konci názvu tabulky o "_3803", nebo "_3802", podle toho, zda se jednalo o data z okresu Karviná či Frýdek Místek. Stručné schéma je uvedeno na Obr. 2. Dále jsem do databáze propojil tabulky sit1000, 500 a 200 představující jednotlivé sítě jako externí datové zdroje. Obr. 2 Schéma výsledné agregace dat Tabulky obsahující agregované údaje ve čtvercích pro jednotlivé okresy jsem spojil v jedinou. Před spojením jsem provedl agregaci (sumaci) v jednotlivých čtvercích. Tabulky obsahující agregovaná data pro oba okresy jsem spojil s tabulkami představujícími jednotlivé sítě. Propojení jsem provedl pomocí atributu identifikátoru buňky. Propojené údaje jsem vložil do nově vytvořených tabulek SIT1000_V, SIT500_V a SIT200_V. Tyto tabulky obsahuji všechny atributy z obou tabulek, především atribut POC_CE,L představující počet všech uchazečů z daného čtverce, atributy POC_A až POC_V počty uchazečů s daným dosaženým vzděláním a POC_6 a POC_12 představující počet dlouhodobě nezaměstnaných uchazečů z daných čtverců. Mimo údajů agregovaných do čtvercových buněk jsem měl i data agregovaná pro administrativní jednotky v rámci jednotlivých okresů. Tyto tabulky jsem sjednotil do jedné, která tudíž obsahovala data pro oba okresy. Vizualizace a interpretace získaných datK vizualizaci dat jsem použil kartogramy používající jak hranice administrativních jednotek, tak i kartogramy s hranicemi geometrickými, konkrétně obrysy čtverců.
Vizualizace se týkala dat z ÚP a ČSÚ, která byla propojená a agregována, dále vypočtených doplňkových údajů, tzn. ukazatelů vhodných pro částečný popis situace na trhu práce, a jako poslední, dat GŠ AČR, jakožto dat určených pro mapový podklad.
Vizualizaci jsem provedl nejprve pomocí kartogramů s geometrickými hranicemi, tyto hranice byly tvořeny stranami jednotlivých čtverců ve kterých byla data agregována.
Vizualizovaná data musí splňovat požadavek na ochranu osobních údajů. V menších obcích při použití velkého měřítka a podrobného mapového podkladu by byl tento požadavek narušen.
Vizualizoval jsem zejména počet uchazečů, dále ukazatel dlouhodobě nezaměstnaných a ukazatel nezaměstnaných s nízkou kvalifikací. Ukazatel podíl uchazečů s neúplným nebo základním vzděláním k celkovému počtu uchazečů zahrnuje uchazeče s kategoriemi vzdělání A, B a C. Jedna se o skupinu uchazečů, která má značně omezenou nabídku pracovních míst na trhu práce, právě z důvodu jejich nízké kvalifikace.
ZávěrPráce se zabývá možností využití RSO k lokalizaci uchazečů o zaměstnání na Úřadech práce. V první části práce bylo navrženo a realizováno propojení mezi RSO a UIR-ADR. Úspěšnost propojení byla vyhodnocena pro jednotlivé okresy v rámci Moravskoslezského kraje. Pro okres Karviná bylo provedeno detailnější vyhodnocení, z něhož vyplývá, že nejmenší úspěšnost propojení mezi oběma registry je na území intenzivně využívaném pro těžbu černého uhlí. Jedná se především o části obce Doly a Louky. V těchto částech obcí dosáhla úspěšnost propojení pouze necelých 35 %. Výsledky propojení byly pro část obce Dolní Suchá porovnány se skutečným stavem zjištěným jak v terénu, tak na stavebním úřadu v Havířově. Tato první část práce sloužila k navržení a následnému ověření metodiky propojení obou registrů. Tato metodika mohla být po určité úpravě následně aplikována na propojení RSO a dat z evidence uchazečů na ÚP. Evidence adres v IS Okprace na ÚP zcela odpovídá evidenci adres v UIR-ADR. Na data o uchazečích v evidenci na ÚP se vztahuje zákon č. 101/2000 Sb. O ochraně osobních dat. Proto bylo nutno zvolit vhodnou metodu zpracování těchto dat tak, aby nedošlo k porušení tohoto zákona. Ke zpracování údajů z Úřadů práce Karviná a Frýdek - Místek bylo použito metody evidence vybraných atributů v pravidelných buňkách čtvercového tvaru. Metody agregace údajů do buněk bylo použito z důvodu výše zmiňovaného zákona O ochraně osobních dat. Pro propojení datových zdrojů a následnou agregaci údajů o uchazečích byla vytvořena posloupnost SQL dotazů v programovém produktu MS Access. Jednotlivé dotazy vybíraly, propojovaly a agregovaly data o uchazečích na ÚP. Úspěšnost propojení dat z ÚP a RSO se jeví jako dostatečná. Tato úspěšnost byla např. na ÚP Karviná 99,4 %. Základním získaným údajem je počet uchazečů o zaměstnání v každé buňce sítě. Dále to byly počty uchazečů s jednotlivým dosaženým vzděláním a počty dlouhodobě nezaměstnaných. Z těchto údajů byly vypočteny některé ukazatele trhu práce. Bohužel nebylo možno vypočíst ukazatele trhu práce vztahující se na ekonomicky aktivní obyvatelstvo. Tyto ukazatele nebylo možno vypočíst a následně vizualizovat z důvodu nedostupnosti potřebných aktuálních demografických dat. Vizualizace agregovaných údajů i vypočtených ukazatelů trhu práce byla provedena pomocí metody kartogramů. A to jak s geometrickými, tak i administrativními hranicemi. Součástí řešení bylo rovněž srovnání obou způsobů vizualizace. Po srovnání obou metod lze říci, že pro potřeby vizualizace ukazatelů na úrovní jednotlivých obcí se jeví jako vhodnější metoda s geometrickými hranicemi tvořenými stranami čtvercových síti. Tato metoda daleko věrněji kopíruje skutečný stav než metoda s administrativními hranicemi obcí. Jednotlivé ukazatele jsou vizualizované v plošných areálech v místech, kde ve skutečnosti tito uchazeči jsou, nikoli konstantně pro celou administrativní jednotku. Nedochází k podvědomému vnímání větších a výraznějších ploch obcí s plošně větším vymezením před menšími. Jednotlivé čtverce jsou konstantní a to jak velikostí, tak i v čase. Umožňuje i zobrazení požadovaného ukazatele ve větším měřítku, pro což je vhodná posloupnost sítí s odlišnou velikostí buněk. Na výsledky vizualizace metodou kartogramů s geometrickými hranicemi nemá žádný vliv prostorová reorganizace území, např. sloučení či rozdělení obcí. Literatura
|
Copyright (C) VŠB - TU Ostrava,
Institut geoinformatiky, 2001-3. Všechna práva vyhrazena. |