Popis
Životný cyklus údajov vo verejnej správe nie je systematicky manažovaný
V súčasnosti každý orgán verejnej správy zbiera a spracováva svoje vlastné údaje. Údaje sú ukladané
v rôznych IS, databázach s rôznymi požiadavkami na kvalitu, dostupnosť, bezpečnosť. Dáta, veľa krát
redundantné, líšia sa formátom, štruktúrou, definíciou a kvalitou.
Neexistuje komplexný dátový model
verejnej správy, nie sú informácie, aké dáta, akým spôsobom a na aké účely sú využívané. Chýbajú
interaktívne katalógy číselníkov, tried prvkov(dátových prvkov) 3
, slovníkov 4
, metadát a paradát.
Výmena potrebných dát medzi jednotlivými orgánmi verejnej správy je vo veľkej miere riešená
spôsobom „peer to peer“, teda „každý s každým“. Výnimkou sú orgány verejnej moci (pilotný rozsah
12 orgánov verejnej moci) zapojené do dátovej časti ostatných úsekov Modulu úradnej komunikácie.
Pre účely manažmentu modelu údajov bol vytvorený metainformačný systém (ďalej aj MetaIS), ktorý
eviduje základné číselníky.
Dátové štandardy sú neúplné, nekonzistentné nepodporujúce Linked Data
Pre popis dát je dnes jedným s hlavných nástrojov KDP - Katalóg dátových prvkov.
KDP popisuje
základné dátové štruktúry ako Fyzická osoba, Právnická osoba ďalšie entity.
Problémom KDP je, že
jednak pokrýva len malú oblasť verejných dát, ale oveľa horšie je, že KDP je z hľadiska formálnej
reprezentácie znalostí predstavuje takzvanú slabú ontológiu, z čoho jednak vyplýva nízka výrazová sila
pre opis danej domény, no najmä strojové spracovanie takýchto dát s ohľadom na ich význam
(odvodzovanie nových znalostí, dokazovanie) je viac než obmedzené.
Dnešné možnosti integrácie údajov
Zdieľanie údajov medzi inštitúciami verejnej správy je v princípe realizované dvoma spôsobmi:
− „Každý s každým“ rôznymi technológiami od mailových príloh až po API. OPIS projekty sa riadili
metodikou usmernenia 14/2014. Programová kancelária (PgK) OPIS monitorovala maticu asi 50 x
50 integrácií. Vybrané rezorty majú nasadené integračné platformy (napríklad „ekosystém“ riadenia
verejných financií MF), ktoré manažujú integráciu a redukujú počet integračných väzieb ale
väčšinou len proxujú API, čiže na aplikačnej vrstve sa konzument musí prispôsobovať API každého
poskytovateľa údajov.
− Prostredníctvom MUK dátovej časti, ktorá ako spoločný modul zabezpečuje poskytovanie dát
jednotným spôsobom. Ako produkčný bol zatiaľ oficiálne vyhlásený MUK dátová časť ostatných
úsekov (november 2015). Poskytovanie dát jednotným spôsobom znamená, že konzument získava
údaje štandardizovanými službami a teda sa nemusí prispôsobovať API rôznych poskytovateľov.
Naopak MUK sa snaží maximálne prispôsobiť poskytovateľovi údajov a jeho možnostiam, prípadne
umožňuje využiť perzistentnú vrstvu použitím zápisovej služby. Súčasná legislatíva prikazuje
orgánom verejnej moci použiť MUK pri prístupe k referenčným údajom a oprávňuje použiť MUK
pri prístupe k iným dátam.
− Prostredníctvom výmeny správ cez MUK komunikačná časť.
Kvalita údajov nie je monitorovaná a vyhodnocovaná
Všeobecne platné závery o kvalite údajov vo verejnej správe nie je možné vyniesť. Bola pripravovaná
metodika pre dátovú kvalitu5
, jej používanie však nebolo oficiálne zavedené do praxe a navrhnuté
kritériá kvality údajov sa systematicky nevyhodnocujú. Podstata nekvality údajov pri osobách je izolovaný spôsob aktualizácie údajov v jednotlivých registroch.
Každý informačný systém má svoj jednoznačný interný a vlastný identifikátor pre subjekt evidencie.
Kvalita ostatných údajov je neznámou veličinou, pričom sa dá predpokladať, že vzhľadom na absenciu
systematického prístupu nebude vysoká.
Proces vyhlasovania referenčných údajov bol spustený
V priebehu rokov 2015 a 2016 boli ako referenčné údaje vyhlásené prvé údaje (ako napríklad IČ DPH,
dátum zaradenia uchádzača do evidencie uchádzačov o zamestnanie). Kľúčovou udalosťou bolo
vyhlásenie údajov z RPO, vďaka ktorému je možné stotožňovať údaje o právnických osobách.
Prechodné obdobie na stotožnenie je jeden rok od vyhlásenia referenčných údajov.
Dopyt po vyhlasovaní referenčných údajov je veľký a začínajú sa prejavovať platformové efekty.
V súčasnosti boli vyhlásené referenčné údaje z RFO (7.12.2016) a nasledovať budú údaje z RA. Je
dôležité uviesť, že všetky vyhlásené referenčné údaje sú vyhlásené spolu s ich URI, nakoľko sú súčasťou
už vytvorených zdrojových ontológií a tieto URI sú registrované v Metainfomačnom systéme.
Podrobnejšie informácie o referenčných údajoch sú k dispozícii v kapitole 4.3.1.1. Referenčné údaje
a jedenkrát a dosť.
„Jedenkrát a dosť“
Princíp „jedenkrát a dosť“ zatiaľ v praxi nefunguje úplne, napriek príprave legislatívnych a technických
predpokladov. Medzi základné limity patrí aj nesúlad medzi generickou legislatívou (v tomto prípade
Zákon o e-Governmente) a špecifickými zákonmi upravujúcimi fungovanie jednotlivých agend.
Jednotlivé subjekty verejnej správy preto však nepracujú s aktuálnymi a rovnakými údajmi, alebo
opakovane vyžadujú údaje už existujúce v inom systéme (princíp „jedenkrát a dosť“ sa porušuje),
prípadne riešia svoje potreby externých údajov pomocou dvojstranných neharmonizovaných dohôd o
poskytovaní údajov s realizáciou individuálnych technických riešeniach.
Osobné údaje a služba moje dáta
K referenčným údajom, ktoré sa týkajú konkrétnej fyzickej osoby bude možné pristúpiť cez službu
„Moje dáta“, ktorá má byť dostupná cez elektronickú schránku. Služba momentálne nemôže poskytovať
dostatočný rozsah údajov, nakoľko je potrebná úprava ISVS, ktorý bude cez predmetnú službu údaje
poskytovať.
Implementácia dôsledkov smernice GDPR nie je momentálne vo verejnej správe systematicky riešená.
Analytické spracovanie údajov vo verejnej správe
Analytické jednotky sú v súčasnosti zriadené len na niektorých ministerstvách a ich výkonnosť je až na
výnimky (IFP, čiastočne IVP) obmedzená, čo je dané hlavne personálnymi kapacitami a kvalitou
dostupných nástrojov a dát.
Metodika posudzovania vplyvov sa dodržuje formálne a analýzy nie sú
podrobované kontrole kvality. Vďaka iniciatívam reformy verejnej správy vyjadrených v Operačnom
programe Efektívna verejná správa dochádza postupne k zmene tohto stavu a plánuje sa posilnenie
agendy lepšej regulácie a vybudovanie analytických jednotiek.
Údaje vo verejnej správe sa väčšinou nezbierajú pravidelne a väčšinou nie sú konzistentné a kvalitné.
Zdieľanie dát je administratívne a technicky náročné (používa sa výmena dát na pevných nosičoch ako
DVD).
Neexistuje predstava o dátovom modeli verejnej správy: aké dáta majú jednotlivé inštitúcie
verejnej správy k dispozícii a na aké účely sa používajú. Nie sú tiež jasne vyjasnené pravidlá na o dátovom modeli verejnej správy: aké dáta majú jednotlivé inštitúcie
verejnej správy k dispozícii a na aké účely sa používajú. Nie sú tiež jasne vyjasnené pravidlá na ochranu
osobných údajov a zavedené spoľahlivé nástroje pre ich anonymizáciu a pseudonymizáciu.