Výrazne lepšie využívanie dát vo verejnej správe predstavuje kľúčový cieľ programového obdobia 2014
až 2020. K dátam sa bude pristupovať ako k vzácnemu zdroju. Dátovej vrstve bude preto v architektúre
venovaná výrazná pozornosť. Hlavným cieľom bude dátová integrácia medzi jednotlivými systémami verejnej správy a zabezpečenie pravidelnej replikácie kvalitných a konsolidovaných transakčných dát
do dátových skladov.
Nástup „Big data“ umožní verejnú správu fungujúcu na využívaní znalostí
V oblasti informačných technológií dochádza k nástupu „Big data“ – kapacity zbierať, spracovávať
a analyzovať obrovské množstvá údajov nielen dávkovo, ale aj v reálnom čase. Tento fenomén
transformoval mnohé oblasti ekonomiky a z revolúcie informačných technológií sa stáva revolúcia
v oblasti využívania dát. V súkromnej sfére sa považuje správne využívanie analytických nástrojov za
kľúčovú konkurenčnú výhodu.
Vo verejnej sfére vzniká výrazný potenciál zlepšiť kvalitu politík a
regulácií, ako i operatívneho rozhodovania, lepšie manažovať riziká a byť schopný flexibilnejšie
reagovať, napríklad na preferencie občanov.
Strategickým zámerom Slovenska je preto lepšie
využívanie analytických nástrojov na podporu rozhodovania: od sledovania výkonnosti jednotlivých
sektorov verejnej správy, cez vyhodnocovanie dopadov politík a regulácií, analýzu rizík po
vyhodnocovanie investícií. Jedna z najväčších výziev bude transformácia kultúry inštitúcií smerom k
rozhodovaniu na základe dát, dôkazov a faktov. Bude potrebné vybudovať potrebné kapacity,
transformovať procesy fungovania verejnej správy a zaviesť tak riadenie verejnej správy založené na
dôkazoch.
Kľúčovou otázkou je, ktoré dáta je potrebné zbierať a na základe akých výstupov sa má
verejná správa rozhodovať. Lepšie dáta znamenajú možnosť získavať kvalitné informácie, z nich
vyplývajúce „insights“, ktoré zas slúžia ako podklady pre tvorbu znalostí a lepšie rozhodovanie. Ak sa
bude vo verejnej správe lepšie rozhodovať, pozitívne sa to prejaví na výsledkoch vládnutia a stave
jednotlivých sektorov verejnej správy. Je preto potrebné podrobne rozumieť logike (ontológiám)
spravovaných dát, vytvárať a udržiavať dátové modely, katalogizovať metadáta a paradáta, chápať
prepojenia medzi jednotlivými systémami a podporovať zvyšovanie kvality dát ukladaných v
databázach.
Koncept predstavený v tejto strategickej priorite predstavuje aplikáciu myšlienky „
Data-driven state“ –
štáte, fungujúcom na základe využívania dát a presnom riadení celého životného cyklu dát. Podpora
využívania znalostí vo verejnej správe je základným opatrením Operačného programu Integrovaná
infraštruktúra pre špecifický cieľ „Umožnenie modernizácie a racionalizácie verejnej správy IKT
prostriedkami“.
Ďalším dôležitým aspektom problematiky manažmentu dát je sprístupniť všetky potrebné údaje
analytického alebo evidenčného charakteru, vďaka ktorým budú môcť zamestnanci poskytujúci verejné
služby vykonávať svoju prácu efektívne. Údaje evidenčného charakteru ako referenčné údaje
a transakčné údaje sú ukladané v agendových informačných systémoch a budú centrálne prístupné cez
platformu integrácie údajov. V informačnom prostredí verejnej správy tak uplatníme princípy pre
pohodlný a kontextovo-orientovaný prístup k dátam uloženým v iných systémoch, ako i definovať
pravidlá, na základe ktorých informačné systémy pristupujú k dátovým zdrojom iných systémov.
Riadenie dát bude tiež zabezpečovať integritu a kvalitu údajov.
Nárast používania dát zvyšuje tiež tlak na
zabezpečenie súkromia a ochranu osobných údajov občanov
a podnikateľských subjektov. Informačné prostredie verejnej správy musí občanom a podnikateľským
subjektom zabezpečiť transparentný pohľad na využívanie údajov o nich. Na jednom mieste bude pre
občana a podnikateľský subjekt a dostupný prehľad o všetkých dátových objektoch, ktoré verejná správa
vo svojich informačných systémoch eviduje. Zároveň bude môcť občan a podnikateľský subjekt vidieť,
kedy a kto údaje menil alebo k nim pristupoval (Pravidlá sa nastavia podľa klasifikácie). Ako pilot pre
vybrané prípady použitia sa tiež nasadí technológia pre Systémy na manažovanie osobných údajov
(„Personal Information Management Systems“), ktoré umožňujú ukladať osobné údaje podnikateľov a
občanov do takzvaných osobných dátových úložísk. Občan alebo podnikateľský subjekt získa tak ešte
väčšiu kontrolu nad svojim súkromím ako aj pohodlné nástroje na opravu alebo vymazanie údajov
a udelenie súhlasu so spracovaním údajov (v prípadoch, keď je to vhodné). Pre občanov a podnikateľov
sa v budúcnosti stanú ich osobné údaje ekonomickým aktívom.
Súvisiacou strategickou prioritou sú Otvorené údaje,
v ktorej sa navrhne, ako sa údaje, ktoré má verejná
správa k dispozícii, publikujú verejnosti vo formátoch vhodných na opakované použitie. Pre tému
otvorených údajov pripravený samostatný dokument, v rámci ktorého sa okrem iného bude riešiť i téma licenčných pravidiel, v súlade s ktorými budú údaje ako elementárne súčasti informačných zdrojov,
databáz prípadne iných diel) vytvárané a následne sprístupňované. Ambíciou je zadefinovať „štátnu
licenciu“1
alebo stanoviť licenčné pravidlá pre vytvárané údaje vo verejnej správe.
Prepojené údaje a sémantický web
Základom efektívneho zdieľania a využívania údajov je používanie princípov prepojených údajov
(takzvané Linked Data). Je to technológia takzvaného Sémantického webu (web dát, nie web
dokumentov), ktorý predstavuje nový generačný stupeň vývoja webu (označovaný ako Web 3.0).
V
Sémantickom webe predstavujú webové aplikácie regulárne znalostné systémy (podpora strojového
spracovania dát s ohľadom na význam, odvodzovanie, dokazovanie), no najmä, publikované dáta
predstavujú regulárny znalostný graf, čo umožňuje spájanie (linkovanie) dát naprieč rôznymi zdrojmi
ako napr. databázami, resp. webovými sídlami.
Základným stavebným kameňom je
jazyk RDF
(Resource Description Framework), ktorý poskytuje zmienenú grafovú formu reprezentácie dát, to je
množinu vrcholov a hrán spájajúcich tieto vrcholy. Vrcholy predstavujú ľubovoľné entity ako osoby,
organizácie, priestorové objekty, pričom hrany zas reprezentujú jednotlivé vzťahy medzi týmito
entitami, ako napríklad býva, vlastní a podobne.
Kľúčovým prvkom v Linked Data je
používanie
Jednotných referencovateľných identifikátorov (URI) na identifikovanie jednak uzlov, a súčasne i hrán.
Jednotným referencovateľným identifikátorom je množina znakov tvoriacich jednotným spôsobom
identifikátor ľubovoľných logických a fyzických objektov. Množina prvkov ktorá opisuje nejakú
doménu (napríklad organizácia má sídlo, názov a podobne) sa nazýva ontológia.
Používaním
štandardizovaných ontológií dochádza k takzvanej integrácii v dátach, pretože pokiaľ ktorýkoľvek
subjekt zverejní svoje dáta popísané štandardizovanou ontológiou, tak tieto dáta je možné okamžite
spracovať.
Vo všeobecnosti, grafovo reprezentované dáta majú nesporné výhody, a pri spojení so
strojovým spracovaním dát s ohľadom na ich význam už predstavujú mimoriadnu pridanú hodnotu pri
spracovávaní údajov. Napríklad prístup stotožňovania entít prostredníctvom sémantiky je veľmi
prínosný, nakoľko sémantické databázy implementujú stotožňovanie na matematickej úrovni presnosti,
pričom od okamihu prepojenia dvoch entít už databáza považuje uvedené entity ako jednu, a
stotožňovanie nie je nutné samostatne implementovať.
Ako už bolo spomenuté v predchádzajúcej kapitole, jedna z najväčších výziev bude transformácia
kultúry inštitúcií smerom k rozhodovaniu na základe údajov, dôkazov a faktov.
Pre splnenie tohto cieľa
je použitie prístupu Linked Data mimoriadne vhodné. Nielen že Linked Data je nová technológia
spracovávania dát na úrovni logického usudzovania, ale hlavne Linked Data ponúka efektívnu grafovú
formu reprezentácie dát, to je "všetko je poprepájané so všetkým", čo je kľúčové pri potrebe zmiešania
ľubovoľných dát z rôznych zdrojov a následným ľubovoľným medzi-doménovým komplexným
analýzam údajov.
Takéto riešenie ponúka priamu podporu rozhodovania inštitúcii na základe
relevantných (najrelevantnejších) faktov. Tieto aj iné skutočnosti sú dôvodom prečo existuje veľká
snaha používať princípy Sémantického webu aj vo verejných dátach, čo je označované ako Linked
Government Data.
V rámci Európskej únie ide o program ISA2 (Interoperability Solutions for European
Public Administrations), konkrétne o skupinu SEMIC (Semantic Interoperability Community), ktorá
napríklad odporúča použitie štandardizovaných ontológií (modelov) fyzickej osoby, organizácie,
lokácie a ďalšie.
V Slovenskej republike prebieha od roku 2013 takzvaná. Fáza 1 implementácie
sémantiky (Linked Data) do štátnych dátových štandardov v podobe viacerých predložených návrhov,
pričom medzi hlavné patrí:
− metodika tvorby
data.gov.sk URI identifikátorov,
− celkový jednotný model údajov verejnej správy:
data.gov.sk ontológie,
− metóda registrácie URI identifikátorov pre základnú sémantickú infraštruktúru údajov verejnej
správy (katalógy, číselníky, dátové prvky, referenčné údaje) v MetaIS,
− publikácia množiny otvorených dát obsahujúcich výlučne Linked Data, nazývaná LOD Slovakia
(Linked Open Data Cloud Slovakia).