Anche in Italia gli Open Data sono Linked

Un'analisi comparativa delle risorse Linked Open Data rese disponibili dalle PA italiane.
di 6 Novembre 2012 0

Anche in Italia alcuni soggetti “virtuosi” hanno deciso di intraprendere il (non troppo) difficile cammino che porta alla completa trasparenza digitale ed alla condivisione “piena” delle proprie risorse attraverso i Linked Open Data.

I LOD sono ad oggi considerati la massima espressione degli sforzi che un ente può fare nel pubblicare le proprie risorse ed i propri contenuti digitali; non si tratta di una tendenza passeggera, il gran maestro di questa atipica setta transnazionale di LOD evangelists altri non è che Tim Berners Lee, la stessa persona che ha tempo addietro immaginato quella strana dimensione digitale che oggi chiamiamo World Wide Web.

I produttori di dati iniziano ad adottare lo standard RDF, promosso e mantenuto dal W3C, per la pubblicazione di quei contenuti che fino ad ora proponevano tipicamente in CSV ed XML. I dati aperti pubblicati nella loro declinazione Linked risultano:

  • altamente riusabili da sviluppatori di app: riducono drasticamente i costi relativi alle attività di riuso
  • altamente interoperabili con altri dati: consentono di acquisire informazioni aggiuntive pubblicate in altre sedi e da altri soggetti
  • estremamente comprensibili: le ontologie con essi pubblicate consentono a “macchine” ed esseri umani di comprendere il significato delle informazioni senza mediazioni

Linked Open Data ed EndPoint SPARQL delle PA italiane: dove trovarli, quali sono e cosa pubblicano.

Se poi questi dati sono forniti agli utenti attraverso un punto di pubblicazione (detto EndPoint), che utilizzi le specifiche del W3C relative al linguaggio di ricerca SPARQL, le possibilità di riuso e inter-connessione con altri dati vengono elevate al massimo.

Qualcuno si è mosso, thank goodness!

Possiamo contare le PA che hanno ad oggi online risorse Linked Open Data, e che forniscono metodi di accesso standard sotto forma di EndPoint secondo le specifiche del W3C, sulle punte delle dita di una mano:

L’ordine di presentazione sopra proposto non può che essere alfabetico: i soggetti interessati producono ed hanno pubblicato dati differenti, in quantità differenti e con risultati ed efficacia differenti. Tutti, nessuno escluso, possono migliorare ed estendere quanto già hanno prodotto, il mondo dei Linked Open Data è per sua natura dinamico ed offre infinite possibilità di ampliamento e riuso.

Vi sono infine altri soggetti come la Provincia Autonoma di Trento, l’INAIL e la Regione Piemonte che hanno iniziato a produrre dati in RDF, senza però offrire, per ora, un punto di accesso standard accessibile attraverso SPARQL.

Al di fuori del perimetro della PA bisogna segnalare alcuni progetti che pubblicano dati in RDF e forniscono un EndPoint di accesso:

  • Il progetto DBpedia Italiana – http://it.dbpedia.org/, realizzato da Spaziodati, in collaborazione con la Fondazione Bruno Kessler. Sorella di http://dbpedia.org pubblica la versione italiana delle innumerevoli voci di wikipedia
  • Linked Open Data italia – http://www.linkedopendata.it/. Pubblica differenti dataset relativi a scuole e musei, l’elenco fornitori e consulenti di Camera e Senato al 2010, i dati dell’Istat relativi ad immigrazione, le strutture ricettive turistiche di Piemonte e Toscana, i codici di avviamento postali nazionali.

In ambito di risorse culturali, infine, si può far riferimento al progetto Reload (http://labs.regesta.com/reload), promosso da Archivio centrale dello Stato, Istituto beni culturali dell’Emilia-Romagna e Regesta.exe, per la pubblicazione secondo gli standard LOD delle risorse archivistiche dei due istituti.

Ma cosa pubblicano?

Agenzia per l’Italia digitale (ex digitpa)
http://spcdata.digitpa.gov.it

Riferimenti generali delle pubbliche amministrazioni quali indirizzo civico, indirizzo email, responsabili, sito web, ecc.; riferimenti degli Uffici Protocollo (Aree Organizzative Omogenee) ed alle Unità Organizzative con relative caselle PEC; servizi offerti dalle Amministrazioni, dalle Aree Organizzative Omogenee e dalle Unità Organizzative.

numero di soggetti descritti: 193.060 [esegui query]
numero di informazioni (triple): 1.077.437 [esegui query]
numero di proprietà utilizzate: 126 [visualizza lista]
numero di riferimenti (owl:sameAs) ad altri dataset: 8.114 [visualizza lista]

Camera dei deputati
http://dati.camera.it

Le persone, i Deputati, i mandati alla Camera, i Gruppi parlamentari, gli organi parlamentari, gli uffici parlamentari, gli incarichi parlamentari, i Progetti di legge e le relazioni, le Leggi, i Documenti parlamentari, gli Atti di indirizzo e controllo, le sedute ed i resoconti stenografico, i bollettini delle Giunte e delle Commissioni, i Dibattiti, le Discussioni, le Legislature, l’Assemblea, le elezioni, i sistemi elettorali, i Presidenti della Repubblica del Consiglio dei Ministri e della Camera, i Governi, gli organi di Governo, gli incarichi governativi, i Senatori, i mandati al Senato. Il tutto dalla I Legislatura del Regno di Sardegna (1848) alla XV Legislatura della Repubblica (2008) più una consistente parte degli stessi dati relativi alla Legislatura corrente.

numero di soggetti descritti: 1.684.576 [esegui query]
numero di informazioni (triple): 14.664.476 [esegui query]
numero di proprietà utilizzate: 201 [visualizza lista]
numero di riferimenti (owl:sameAs) ad altri dataset: 1.239 [visualizza lista]

Comune di Firenze
http://opendata.comune.fi.it/linked_data.html

L’anagrafica dei musei con indirizzi e contatti, il numero di sinistri stradali dal 2009 al 2011, la toponomastica ed il viario cittadino.

numero di soggetti descritti: 8.653 [esegui query]
numero di informazioni (triple): 56.843 [esegui query]
numero di proprietà utilizzate20 [visualizza lista]
numero di riferimenti (owl:sameAs) ad altri datasetnessuno

Consiglio Nazionale delle Ricerche
http://data.cnr.it

Gli istituti, l’organizzazione, le persone, i brevetti, le pubblicazioni ed altre attività del Consiglio.

numero di soggetti descritti: 644.955 [esegui query]
numero di informazioni (triple): 4.418.542 [esegui query]
numero di proprietà utilizzate: 194 [visualizza lista]
numero di riferimenti (owl:sameAs) ad altri dataset: nessuno

Provincia di Carbonia-Iglesias
http://www.provincia.carboniaiglesias.it/sparql

Gli atti amministrativi della Provincia, i bandi, i concorsi, le delibere e le determine, gli assessori e consiglieri.

numero di soggetti descritti: 11.957 [esegui query]
numero di informazioni (triple): 11.856 [esegui query]
numero di proprietà utilizzate: 17 [visualizza lista]
numero di riferimenti (owl:sameAs) ad altri dataset: nessuno