Obrázok 5: Prehľad aplikačných funkcií a komponentov
Platforma integrácie údajov – centrálne služby
Je integračným prvkom na úrovni vrstvy údajov. Umožňuje automatizovanú komunikáciu a zdieľanie údajov medzi jednotlivými informačnými systémami verejnej správy. Ide o centrálny komponent povinne používaný na prístup k údajom. Za jeho prevádzku zodpovedá správca MUK dátová časť.
V rámci riešenia budú využívané centrálne funkcie:
− Servisná zbernica integrácie údajov – sprístupňuje funkcie API pre konzumentov údajov, vykonáva autorizáciu požiadavky, na základe typu objektu, identity producenta a konzumenta a identity údajov z komponentu správy prístupových oprávnení. Nijako nemanipuluje obsah ani formát požiadavky ani odpovede.
− Poskytovanie údajov - zabezpečenia smerovanie požiadaviek zo spoločnej zbernice (spoločného prístupového bodu) na správny systém, v ktorom sú údaje poskytované.
− Riadenie kvality údajov, sledovanie kvality údajov a sledovanie riešenie identifikovaných problémov, plánovanie, nasadenie, monitoring, tvorbu opatrení.
Podporné funkcie pre konzumentov údajov
− Konsolidácia údajov - umožňuje z dátových objektov dostupných prostredníctvom platformy zdieľania údajov „vyskladať“ dátové objekty špecifického formátu a štruktúry.
− Perzistencia údajov - zabezpečuje uchovanie údajov. Na strane konzumenta údajov je týmto spôsobom možné zabezpečiť uchovávanie údajov pre neskoršie použitie, čím sa aj zníži záťaž platformy zdieľania údajov.
Podporné funkcie pre poskytovateľov údajov
− Nástroje pre manipuláciu s údajmi a transformácie:
- ETL – Extract, Transform, Load - umožňuje pripojenie na existujúce aplikačné alebo databázové rozhrania producenta údajov vytvorí potrebné štruktúry údajov a API pre zapojenie poskytovateľa do platformy zdieľania údajov.
- Nástroje pre anonymizáciu a pseudoanonymizáciu.
− Perzistencia údajov - zabezpečuje uchovanie údajov. Na strane producenta údajov je týmto spôsobom možné zabezpečiť riešenie kapacitných nárokov na zdieľanie údajov alebo umožniť on-line prístup k údajom platných k určitému času v minulosti tam, kde sú aktuálne údaje dostupné iba asynchrónne.
− Profilovanie dát a stotožňovanie dát, nástroje MDM.
− Generický register - umožňuje poskytovateľovi údajov viesť určitú evidenciu/register pomocou centrálne poskytovanej služby prispôsobenej jeho požiadavkám. Obsah a funkcie generického registra presahujú oblasť zdieľania údajov, tento komponent je potrebné detailnejšie špecifikovať v príslušnej strategickej priorite (napr. spoločné moduly).
Centrálny model údajov verejnej správy (súčasť MetaIS)
Modul umožní automatizovane prideľovať referenčné URI pre všetky údaje, informačných systémov verejnej správy, vrátane nástrojov pre vyhľadávanie a lokalizovanie dát a dátových zdrojov. Obsahuje katalogizované údaje o poskytovateľovi, evidencii/registri a type poskytovaných údajov, vrátane definície dátového objektu vo forme prepojených údajov. Položky modelu sú schvaľované štandardizovaným procesom. V rámci modelu sú tiež definované číselníky, ontológie, datasety a aplikačné rozhrania služieb.
Pre jednu agendu môže existovať viacero typov poskytovaných objektov, či už delením záznamu na samostatné časti, alebo aj vzájomne sa typovo prekrývajúce objekty (napríklad v prípade odlíšenia autorizácie na prístup k údajom). Model tiež obsahuje informáciu o poskytovaných typoch notifikácií pre určitý typ objektu a prípustné kritériá (parametre volania funkcie) vyhľadávacích služieb.
Modul riadenia oprávnení
Modul riadenia oprávnení umožňuje nastavenie prístupov užívateľov podľa navrhnutej klasifikácie dát (na základe ich citlivosti) a používateľov (na základe ich zaradenia, role).
Báza záznamov o oprávneniach na prístup k údajom. Štandardne sa oprávnenia definujú pre určitého konzumenta a typ poskytovaných údajov, štandardizovaným procesom v gescii správcu MÚK, na základe súhlasu producenta údajov. Ak niektorý poskytovateľ údajov potrebuje použiť detailnejšie riadenie prístupu, môže si ho implementovať interne.
Unifikované aplikačné rozhranie
− Prístupové – na základe referencovateľného identifikátora objektu poskytne jeho obsah v štruktúre podľa katalógu zdieľaných objektov.
− Synchronizačné – poskytne zoznam identifikátorov zmenených objektov od zadaného timestamp.
− Vyhľadávacie – poskytne zoznam identifikátorov kandidátov spĺňajúcich zadané kritériá.
− Notifikačné – „push“ notifikácie o zmene v určenom type objektov.
Mechanizmus pre zdieľanie rozhodnutí
Mechanizmus pre zdieľanie rozhodnutí je modul, ktorý slúži na evidenciu meta-údajov, ktoré boli vykonané vo verejnej správe. Poskytuje služby na evidenciu rozhodnutia (zápis meta-údajov), vyhľadávanie rozhodnutí, rozhodnutia týkajúce sa subjektu (vrátane vyhľadania v zdrojovom systéme respektíve elektronickom spise).
Manažment osobných údajov
Modul umožňuje získať prístup k osobným údajom pre subjekt. Využíva pritom nástroje pre integráciu údajov. Modul implementuje službu „Moje dáta“ a pre svoju funkčnosť využíva funkcie:
− Manažment súhlasov – umožňuje nastaviť preferencie používateľa pre použitie, zdieľanie a publikáciu jednotlivých objektov.
− Úložisko osobných údajov – dočasné úložisko osobných údajov prístupne pre potreby používateľa.
Analytická vrstva
Analytická vrstva (ktorá pristupuje k dátam z agendových informačných systémov - umožňuje ukladanie, manipulovanie a riadenie dát a Big Data v rôznych typoch databáz: Relačné databázy (SQL), NoSQL databázy (dokumentovo-orientované, sklady s „key-value“, inšpirované veľkými tabuľkami alebo grafovo orientované), New SQL.
Riešenie umožní čítať údaje priamo zo zdrojových systémov. Analytická vrstva obsahuje ďalšie komponenty pre prácu s dátami napríklad ETL podobne.
Analytická vrstva poskytuje rôzne úrovne skladovania dát, ktoré možno poskytovať ako klasické data marty podľa doménových členení, v ktorých budú prebiehať analýzy dát špecifické pre jednotlivé domény. Údaje možno prehľadávať vďaka katalógom metadát a vyhľadávacím nástrojom. Analytická vrstva Bezpečnosť sa stará o súkromie údajov (vďaka anonymizácii a pseudonymizácii, kryptografii a úrovniam prístupu s rôznou granularitou), správu dát (transakčné logy, audity na najnižšej úrovni granularity, data provenance) a ich integritu vďaka monitoringu v reálnom čase, validácii koncového bodu a filtrovaniu.
Analytická vrstva bude tiež slúžiť pre spracovanie veľkého množstva neštruktúrovaných dát napríklad zo sociálnych sietí, alebo IoT zariadení.
Analytické nástroje
Analytické nástroje umožňujú vykonávať analýzy nad dávkovými údajmi aj nad dátovými tokmi pre operatívne analýzy. Poskytuje:
− tradičné BI nástroje, ktoré podporujú analytické funkcie nad klasickými štruktúrovanými dátovými zdrojmi (faktov),
− machine learning – sada nástrojov, ktoré podporujú spracovanie údajov metódami umelej inteligencie,
− štatistické nástroje, ktoré umožňujú tvorbu štatistických dátových modelov, testovanie hypotéz, faktorové analýzy, korelácie, regresie a podobne,
− nástroje pre simulácie, ktoré umožňujú simulovať historický aj budúci priebeh modelovaných udalostí nad vybranou množinou historických a aktuálnych údajov.
Kolaboračné nástroje (platforma pre posudzovanie vplyvov)
Kolaboračné nástroje zabezpečia najmä:
− služby zdieľania, na základe ktorých je možné zdieľať výsledky analýz alebo analytický model nad definovanou množinou dát z analytickej vrstvy.
− služby kolaborácie, pomocou ktorých môžu analytici spolupracovať nielen interne na tvorbe analytického modelu, ale aj s externými špecialistami.
− služby vizualizácie výsledkov, ktoré umožňujú vidieť výsledky analýz v interaktívnych grafoch vrátane ich interpretácie a publikácie,