Otevřená propojitelná data v oblasti veřejných rozpočtů

Název projektu Otevřená propojitelná data v oblasti veřejných rozpočtů
Číslo projektu TD020277
Řešitel Ing. Dušan Chlapek, Ph.D.
Doba trvání 01/2014 - 09/2015
Poskytovatel dotace Technologická agentura České republiky
Klíčová slova Veřejná správa, otevřená data, otevřená a propojitelná data, veřejné rozpočty

Popis projektu

Ideou projektu je navrhnout nový způsob zveřejňování dat veřejnou správou v ČR (VS) tak, aby je zájemci (soukromý i neziskový sektor, akademická sféra, atd.) mohli bez zbytečných technických i legislativních komplikací opakovaně využívat pro vlastní potřeby (analýzy, tvorba komerčních i nekomerčních softwarových aplikací umístěných na Internetu, atd.). V současné době VS zveřejňuje svá data způsobem, který přináší řadu takových komplikací. Je složité data převést do strojově zpracovatelné podoby nezbytné pro zpracování v softwarových aplikacích. Není navíc možné pohodlně dohledat, jaká další data s nalezenými daty souvisejí. Navíc nejsou jasná pravidla (licence) pro používání dat VS. Není tedy možné plně využít potenciál skrytý v datech VS a dochází k plýtvání s prostředky investovanými do jejich vytvoření.

V rámci projektu bude vyvinut nový způsob publikace dat VS založený na nových poznatcích informatického výzkumu v oblasti publikace dat na webu. Budou aplikovány principy a technologie otevřených dat (angl. Open Data) a propojitelných dat (angl. Linked Data), které umožňují odstranit výše zmíněné komplikace. Navržený způsob publikace dat bude aplikován na datech zveřejňovaných Ministerstvem financí ČR z Integrovaného informačního systému státní pokladny (IISSP) o rozpočtech jednotlivých složek VS zveřejněných na portálu Monitor a na souvislostech těchto dat s daty o veřejných zakázkách (MMR ČR) a demografických ukazatelích (ČSÚ). Součástí projektu bude návrh a realizace software pro publikaci dat s doprovodnou certifikovanou metodikou tak, aby bylo možné zkušenosti přenést do dalších oblastí VS. V rámci projektu bude také zkoumán (pozitivní) ekonomický dopad realizovaného řešení.

Novost projektu spočívá ve vytvoření obecného způsobu zveřejňování dat veřejné správy v podobě propojitelných dat. Zatímco základní postupy pro zajištění otevřenosti dat veřejné správy již byly formulovány, technologie propojitelných dat nebyly až na výjimky orgány VS v České republice využity a chybí tedy metodika a nástroje pro jejich nasazování a využití. Novost spočívá také v samotném propojení doposud izolovaných datových zdrojů, které jsou v gesci různých orgánů VS.

Projekt je řešen v období 01/2014 - 09/2015. Na řešení projektu se podílí Vysoká škola ekonomická v Praze a Univerzita Karlova v Praze.

Cíle projektu

Cíle projektu jsou:

  1. navrhnout postup pro publikaci dat z IISSP v otevřené a propojitelné podobě,
  2. vytvořit software pro takovou publikaci,
  3. publikovat vybraná data z IISSP a propojit je na další data VS ČR, tj. data o veřejných zakázkách (MMR ČR), data publikovaná ČSÚ, a (pokud budou k dispozici) data z Registru smluv (legislativa je ve schvalovacím procesu v PSP ČR),
  4. zobecnit získané zkušenosti v podobě certifikované metodiky,
  5. připravit školení pro VS a komerční subjekty.

Výstupy projektu

Název výstupu Popis výstupu
2014
Návrh směrnice ministra financí pro publikaci a katalogizaci otevřených dat Ministerstva financí Návrh směrnice, kterou Ministerstvo financí upravuje problematiku otevřených dat a jejich publikaci včetně vymezení rolí a odpovědností.
Navržená směrnice „Publikace a katalogizace otevřených dat Ministerstva financí“ byla přijata jako SMĚRNICE č. 6/2014 ministra financí.
Softwarové řešení pro transformaci a propojování dat Softwarové řešení umožňuje automatizovat kroky extrakce, transformace a nahrávání dat do zvolené cílové databáze a tudíž pomáhá snižovat pracnost a náklady spojené s přípravou dat k publikaci.

Dokument TD020277_SW_reseni_pro_transformaci_a_propojovani_dat.pdf obsahuje dokumentaci softwarového řešení pro transformaci a propojování dat a odkazy na stažení zdrojových kódů i jednotlivých částí transformovaných dat ve formátu RDF.
S datovými sadami převedenými v rámci projektu do podoby otevřených a propojitelných dat lze pracovat s pomocí dotazovacího jazyka SPARQL na URL: http://linked.opendata.cz/sparql

Vytvořená data včetně definice datových kostek a slovníku jsou poskytována pod licencí ODC Public Domain Dedication and Licence (PDDL). Při dalším šíření a vytvořených dat včetně definice datových kostek a slovníku uveďte následující poznámku:

Data finančních a účetních výkazů orgánů státní správy a samosprávy v podobě otevřených propojitelných dat jsou poskytována pod licencí ODC Public Domain Dedication and Licence (PDDL). Data vznikla transformací otevřených dat publikovaných na portálu Monitor Ministerstva financí České republiky. Jako původce datové sady uvádějte Vysokou školu ekonomickou v Praze a Univerzitu Karlovu v Praze.
2015
Webová aplikace pro vizualizaci otevřených a propojených dat z IISSP Prototypová webová aplikace umožňující uživatelům zobrazovat jak jednotlivé skupiny údajů z IISSP, tak i související údaje z dalších datových zdrojů na základě vytvořených propojení pro vybrané typy účetních jednotek (obce). Aplikace slouží jako demonstrace toho, že s vytvořenými otevřenými daty z IISSP propojenými na související data VS mohou 3. strany pracovat a budovat nad nimi vlastní aplikace.

Aplikace je dostupná zde.

Uživatelská a programátorská dokumentace aplikace je dostupná zde.
Metodika publikace otevřených a propojitelných dat Metodika publikace otevřených a propojitelných dat byla navržena a ověřována v průběhu celého řešení projektu. Metodika zohledňuje zkušenosti získané během řešení projektu a byla podstoupena oponentuře nezávislými odborníky.

Metodika publikace otevřených a propojitelných dat je dostupná zde.