Prepojené údaje a sémantický web
Základom efektívneho zdieľania a využívania údajov je používanie princípov prepojených údajov (takzvané Linked Data). Je to technológia takzvaného Sémantického webu (web dát, nie web dokumentov), ktorý predstavuje nový generačný stupeň vývoja webu (označovaný ako Web 3.0).
V Sémantickom webe predstavujú webové aplikácie regulárne znalostné systémy (podpora strojového spracovania dát s ohľadom na význam, odvodzovanie, dokazovanie), no najmä, publikované dáta predstavujú regulárny znalostný graf, čo umožňuje spájanie (linkovanie) dát naprieč rôznymi zdrojmi ako napr. databázami, resp. webovými sídlami.
Základným stavebným kameňom je
jazyk RDF (Resource Description Framework), ktorý poskytuje zmienenú grafovú formu reprezentácie dát, to je množinu vrcholov a hrán spájajúcich tieto vrcholy. Vrcholy predstavujú ľubovoľné entity ako osoby, organizácie, priestorové objekty, pričom hrany zas reprezentujú jednotlivé vzťahy medzi týmito entitami, ako napríklad býva, vlastní a podobne.
Kľúčovým prvkom v Linked Data je
používanie Jednotných referencovateľných identifikátorov (URI) na identifikovanie jednak uzlov, a súčasne i hrán. Jednotným referencovateľným identifikátorom je množina znakov tvoriacich jednotným spôsobom identifikátor ľubovoľných logických a fyzických objektov. Množina prvkov ktorá opisuje nejakú doménu (napríklad organizácia má sídlo, názov a podobne) sa nazýva ontológia.
Používaním štandardizovaných ontológií dochádza k takzvanej integrácii v dátach, pretože pokiaľ ktorýkoľvek subjekt zverejní svoje dáta popísané štandardizovanou ontológiou, tak tieto dáta je možné okamžite spracovať.
Vo všeobecnosti, grafovo reprezentované dáta majú nesporné výhody, a pri spojení so strojovým spracovaním dát s ohľadom na ich význam už predstavujú mimoriadnu pridanú hodnotu pri spracovávaní údajov. Napríklad prístup stotožňovania entít prostredníctvom sémantiky je veľmi prínosný, nakoľko sémantické databázy implementujú stotožňovanie na matematickej úrovni presnosti, pričom od okamihu prepojenia dvoch entít už databáza považuje uvedené entity ako jednu, a stotožňovanie nie je nutné samostatne implementovať.
Ako už bolo spomenuté v predchádzajúcej kapitole, jedna z najväčších výziev bude transformácia kultúry inštitúcií smerom k rozhodovaniu na základe údajov, dôkazov a faktov.
Pre splnenie tohto cieľa je použitie prístupu Linked Data mimoriadne vhodné. Nielen že Linked Data je nová technológia spracovávania dát na úrovni logického usudzovania, ale hlavne Linked Data ponúka efektívnu grafovú formu reprezentácie dát, to je "všetko je poprepájané so všetkým", čo je kľúčové pri potrebe zmiešania ľubovoľných dát z rôznych zdrojov a následným ľubovoľným medzi-doménovým komplexným analýzam údajov.
Takéto riešenie ponúka priamu podporu rozhodovania inštitúcii na základe relevantných (najrelevantnejších) faktov. Tieto aj iné skutočnosti sú dôvodom prečo existuje veľká snaha používať princípy Sémantického webu aj vo verejných dátach, čo je označované ako Linked Government Data.
V rámci Európskej únie ide o program ISA2 (Interoperability Solutions for European Public Administrations), konkrétne o skupinu SEMIC (Semantic Interoperability Community), ktorá napríklad odporúča použitie štandardizovaných ontológií (modelov) fyzickej osoby, organizácie, lokácie a ďalšie.
V Slovenskej republike prebieha od roku 2013 takzvaná. Fáza 1 implementácie sémantiky (Linked Data) do štátnych dátových štandardov v podobe viacerých predložených návrhov, pričom medzi hlavné patrí:
− metodika tvorby
data.gov.sk URI identifikátorov,
− celkový jednotný model údajov verejnej správy:
data.gov.sk ontológie,
− metóda registrácie URI identifikátorov pre základnú sémantickú infraštruktúru údajov verejnej správy (katalógy, číselníky, dátové prvky, referenčné údaje) v MetaIS,
− publikácia množiny otvorených dát obsahujúcich výlučne Linked Data, nazývaná LOD Slovakia (Linked Open Data Cloud Slovakia).