A cosa servono gli open data?

di Giovanni Bruno e Silvia Mazzini 29 ottobre 2012 2

In vista dell’Open Data Day ripubblichiamo uno degli articoli più letti sull’argomento.

Le disposizioni in materia di Open Data costituiscono uno dei capitoli in cui è articolata l’Agenda digitale italiana, disegnata dal cosiddetto decreto “Crescita 2.0”, da poco emanato dal Governo Monti: come si legge nella “Relazione illustrativa” al decreto “la leva digitale” rappresenta un decisivo fattore di spinta e accelerazione per la “crescita sostenibile” del paese. In questa prospettiva il “mondo delle applicazioni digitali e delle tecnologie Smart applicate al paradigma del dato aperto ed accessibile diviene un terreno estremamente fertile per trasformare idee e competenze in attività d’impresa ad alto contenuto di innovazione e tecnologia”.

La disciplina sugli Open Data è raccolta nell’articolo 9 del decreto. La norma introduce l’obbligo per le pubbliche amministrazioni di rendere disponibili i dati pubblici in formato aperto, riserva all’Agenzia per l’Italia digitale compiti di indirizzo, gestione ed attuazione del processo di valorizzazione del patrimonio informativo pubblico nazionale, delinea una definizione esplicita di dato aperto. I “dati di tipo aperto” devono essere resi pubblici in un formato che sia “documentato esaustivamente e neutro rispetto agli strumenti tecnologici necessari per la fruizione”; devono essere “disponibili secondo i termini di una licenza che ne permetta l’utilizzo da parte di chiunque, anche per finalità commerciali”; “adatti all’utilizzo automatico da parte di programmi per elaboratori”; “provvisti dei relativi metadati”; “disponibili gratuitamente”.
Non vi è dubbio che l’innovazione normativa introdotta in questa occasione potrà contribuire ad assicurare uno stimolo forte e un sostegno adeguato al movimento Open Data, che ha visto nel corso dell’ultimo anno un significativo sviluppo anche nel nostro paese. Si tratta di un tassello importante, decisivo forse; anche se restano alcune perplessità legate ai tempi entro i quali diverrà realmente operativa la nuova Agenzia per l’Italia digitale. Ma per garantire stabilità e solidità a questa crescita è necessario che si consolidi un ambiente favorevole e ricettivo, un “ecosistema digitale” in grado di sostenere questo sviluppo e realizzare le potenzialità attese.

Perché si realizzino anche in Italia le condizioni per la creazione di un ambiente favorevole, la “qualità” dei dati pubblicati, la loro utilità e la loro utilizzabilità rappresentano fattori assolutamente strategici

L’esempio della Gran Bretagna individua un modello che coniuga trasparenza, innovazione e sviluppo, un circolo virtuoso che coinvolge il governo, i cittadini, le imprese e l’amministrazione pubblica. È il recente Open Data White Paper pubblicato sul portale data.gov.uk a riassumere i risultati raggiunti in tre anni dal progetto: attraverso gli Open Data è stata garantita la trasparenza dei procedimenti amministrativi e delle spese del governo, guadagnando in tal modo la fiducia dei cittadini verso questo modello; la comunità ha risposto con enorme entusiasmo al rilascio dei dati, producendo moltissime applicazioni socialmente utili e chiedendo al tempo stesso la liberazione di un numero sempre maggiore di dati. A completare questa costruzione è arrivata da pochi mesi la costituzione di un Open Data Institute, finanziato con 10 milioni di sterline in cinque anni e affidato alla guida di Tim Berners Lee e Nigel Shadbolt. L’ODI sarà il braccio operativo del governo britannico sulle politiche legate agli Open Data: dal monitoraggio, alle nuove tecnologie alla formazione, agli standards.
Perché si realizzino anche in Italia le condizioni per la creazione di un ambiente favorevole, la “qualità” dei dati pubblicati, la loro utilità e la loro utilizzabilità rappresentano fattori assolutamente strategici. A nostro avviso sono due gli aspetti cruciali a questo riguardo.
Il primo riguarda l’individuazione esplicita di politiche trasparenti di pubblicazione e di aggiornamento dei dataset: quali dati vengono pubblicati e quali no; quali sono le ragioni delle scelte operate dai diversi produttori di dataset; con quale frequenza vengono aggiornati; quali sono le strutture responsabili del mantenimento delle basi dati e della pubblicazioni di specifiche sezioni di questi in formato Open Data. L’impressione di una certa casualità nell’esposizione di Open Data da parte delle diverse amministrazioni che si sono avviate lungo questa strada può, naturalmente, essere spiegata dalla fase pioneristica del movimento. È necessario ora passare alla definizione di specifiche “agende dipartimentali”, all’individuazione di priorità e tempistiche, in modo da assicurare una guida ai gestori dei dati e garantire certezze agli utilizzatori.

Il secondo aspetto attiene invece ai formati dei dati resi pubblici. Probabilmente la definizione di machine readable, adottata anche nel decreto del nostro governo, è oggi già insufficiente a creare le condizioni di un pieno e tempestivo (timely) riutilizzo dei dati. Non è un caso che il già citato White Paper proponga un ampliamento di questa definizione, adottando quella di “re-usable machine-readable data” e specifichi il concetto di interoperabilità dei dati sulla base della classificazione five stars proposta da Tim Berners-Lee. Non più semplicemente Open Data ma Linked Open Data (LOD), che attraverso l’utilizzo degli strumenti del Semantic Web permettano di dare ai dati un’identità e di renderli collegati tra loro e interoperabili nel cosiddetto Web of Data.
Le tecnologie LOD e gli standard del W3C (RDF per la rappresentazione dei dati, OWL e SKOS per la definizione di vocabolari e ontologie, SPARQL per l’interrogazione di Linked Data) popolano la cassetta degli attrezzi della transizione dal Web dei documenti – che condivide attraverso la rete pagine, parole e link – ad un Web alimentato da dati e metadati strutturati, in grado di veicolare i contenuti con tutto il necessario corredo di informazioni di significato e di contesto. E delineano un quadro di opportunità e un nuovo paradigma di comunicazione, che si alimenta della concorrenza di fonti dati molteplici, di informazioni granulari variamente combinabili, di risorse distribuite, univocamente identificabili attraverso URI.

Le tecnologie LOD e gli standard del W3C popolano la cassetta degli attrezzi della transizione dal Web dei documenti al Web of Data

I vantaggi di un approccio del genere sono stati riaffermati anche dalla Commissione di coordinamento SPC (Sistema pubblico di Connettività e Cooperazione), che a luglio ha pubblicato le Linee Guida per l’interoperabilità semantica attraverso i Linked Open Data: “il gruppo di lavoro, all’unanimità, ha ritenuto che, per abilitare lo sviluppo di una concreta interoperabilità semantica tra Pubbliche Amministrazioni a livello nazionale e transfrontaliero sia necessario adottare il modello Linked Open Data”. Ma in Italia sono ancora pochi i soggetti o le amministrazioni che si sono per ora incamminati su questa strada. Sulla base delle informazioni fornite dal portale dati.gov.it gli esempi sono veramente sporadici: il CNR che espone i dati relativi alla propria organizzazione interna e ai progetti di ricerca, l’Indice della Pubblica Amministrazione disponibile sul portale SPC, la Camera dei deputati, che ha pubblicato l’intero patrimonio di informazioni sui deputati dal 1848 ad oggi, la provincia di Carbonia Iglesias, l’Università di Messina. Recentemente anche Regione Piemonte e Comune di Firenze hanno pubblicato alcuni dataset in formato RDF. Al di fuori del perimetro della PA è disponibile all’indirizzo it.dbpedia.org la versione italiana di Dbpedia accessibile attraverso Endpoint SPARQL.
L’ampliamento dell’offerta di dati coerenti con le specifiche del Semantic Web, affidabili, persistenti nel tempo e documentati potrebbe rappresentare la “miccia” in grado di innescare la nascita di un movimento diffuso di riuso, che sia in grado di realizzare servizi innovativi, basati sull’aumento del loro valore informativo attraverso la riaggregazione e la combinazione di informazioni distribuite. Il quadro normativo ha ormai recepito i principi di base. Ma la vitalità del movimento non è funzione della qualità delle norme o dell’efficienza di strutture di coordinamento centrali; risiede piuttosto nella capacità degli attori locali, delle istituzioni periferiche di muoversi in autonomia in questa direzione.


Riferimenti