La Camera dei deputati nel Web of Data

I Linked Open Data per la trasparenza ed efficienza nella gestione della documentazione della Camera
di 20 Settembre 2012 0


Il patrimonio documentale della Camera dei deputati in formato LOD
Nei giorni 13, 14 e 15 settembre si è tenuta a Roma organizzata dal Global Centre for ICT in Parliament l’annuale World e-Parliament Conference. Tutte le informazioni e i materiali disponibili sono accessibili sul sito web della Conferenza. In questa occasione la Camera dei deputati ha presentato, nella sessione” Benefits and values of open data for fostering greater transparency in legislatures”, il progetto Linked Open Data, avviato alla fine dello scorso anno con la pubblicazione del Portale storico e del sito dati.camera.
Ragioni, caratteristiche, risultati e sviluppi di questo progetto sono esposti nel video trasmesso alla Conferenza prima dell’intervento dell’on. Paolo Gentiloni e della dott. Elena Flavia Candia del Servizio Informatica della Camera.

All’intero progetto ha partecipato fin dalla sua ideazione regesta.exe, che ha realizzato per la Camera entrambi i portali, alimentati da un comune repository di Linked Open Data, attraverso il quale si è realizzata la normalizzazione e interoperabilità dei dati provenienti da diversi sistemi e relativi ad oltre 150 anni di storia parlamentare. Alla base del progetto è stata, quindi, posta un’ontologia generale, scritta in OWL relativa all’intero dominio Camera, che fosse in grado non solo di descriverne il funzionamento nel tempo, ma di garantire l’aggiornamento continuo con i dati prodotti nel corso della normale attività degli organismi parlamentari. Per sfruttare pienamente le potenzialità derivanti dalle tecnologie LOD e dai principi del semantic web, sulle risorse presenti nel repository Camera è stato realizzato un lavoro di allineamento semantico collegando i dati camera a DBPedia e a Geonames con la proprietà owl:sameAs, in modo da far partecipare i dati del dominio Camera alla LOD cloud.
Seguendo questa impostazione, con l’obiettivo di rendere le risorse informative della Camera dei deputati pienamente disponibili sono stati avviati nuovi progetti per l’estrazione di LOD dalle basi dati esistenti. La principale evoluzione del progetto attualmente in corso riguarda l’estensione dell’ontologia della Camera (OCD) alla descrizione dell’iter legislativo nella sua interezza: ai semplici metadati sui disegni di legge (data, firmatario, titolo) sono quindi state aggiunte le classi e le proprietà necessarie a descrivere tutti gli eventi legati all’iter: le assegnazioni, i dibatti in commissione e in aula, le modifiche ai testi, le votazioni e le navette. Questo progetto è finalizzato non solo a consentire una piena trasparenza dei lavori parlamentari, ma anche il tempestivo riuso di queste informazioni da parte di utilizzatori esterni (ad esempio, data journalism) si che da parte di altre applicazioni informative e gestionali interne alla Camera.

PAD: l’utilizzo dei LOD per l’efficienza dei servizi di documentazione
Fin dall’avvio il progetto ha investigato le potenzialità di questo approccio nella gestione dell’attività di documentazione interna. La normalizzazione dei dati provenienti da applicazioni differenti, organizzati secondo formati diversi e con finalità proprie ha consentito di perseguire due obiettivi: promuovere una migliore efficienza nei costi,e favorire la condivisione delle informazioni entro strutture complesse, come il Servizio Studi della Camera, senza la necessità di realizzare complicati sistemi di comunicazione tra software differenti.
Il progetto denominato PAD, Piattaforme aperte di documentazione, è stato presentato ufficialmente per la prima volta proprio in occasione della World eParliament Conference 2012.
PAD è finalizzato alla completa automazione delle attività di documentazione del Servizio Studi della Camera, dalla gestione degli archivi fino alla produzione dei documenti. Interamente sviluppato con tecnologie e componenti Open Source per la gestione di documenti digitali in formato RDF, PAD è articolato in tre aree funzionali: una relativa agli archivi, una per la gestione del semantic enrichment e la categorizzazione dei documenti, un’ultima, infine, per la produzione partecipata della documentazione.

PAD realizza una completa automazione delle attività di documentazione del Servizio Studi della Camera, dalla gestione degli archivi fino alla produzione dei documenti

Il sottosistema di gestione degli archivi di documentazione è alimentato da fonti diverse: (a) in modo automatico dai documenti Camera scaricati in RDF nel repository LOD; (b) attraverso una serie di agenti specializzati che provvedono a scaricare e ricevere documenti e riferimenti da fonti selezionate (Gazzetta ufficiale, European Court of Justice, Official Journal of European Union, ecc.); (c) attraverso la normale attività di reference da parte degli operatori. È possibile annotare, raccogliere, condividere e aggiungere commenti multipli ad ogni riferimento. Queste annotazioni possono restare private oppure essere condivise all’interno della struttura di appartenenza o di un gruppo di lavoro.
Il sottosistema di gestione semantica consente la completa gestione di una pluralità di sistemi di classificazione codificate in formato SKOS, attraverso le quali marcare i diversi contenuti presenti nel repository. Nella piattaforma sono disponibili le classificazioni definite dal Servizio Studi e il thesaurus Eurovoc. È possibile collegare in maniera puntuale le voci di diversi thesauri, in modo da arricchire il valore semantico attribuito ad ogni singola informazione e ampliare le capacità di ricerca e accesso nella base dati.
PAD integra un ambiente completo per la redazione di contenuti originali e documenti, offrendo servizi evoluti di web editing ed una piena integrazione con strumenti di word processing, per la la produzione di una pluralità di prodotti editoriali: note e Newsletter per le Commissioni, Dossier legislativi. PAD supporta la redazione condivisa di contenuti, consentendo l’attribuzione della responsabilità per ogni singola parte di ogni elaborato a singoli redattori e la produzione di documenti complessi attraverso il mush-up di singole parti prelevate dal repository. In ogni fase del processo di redazione sono disponibili tutte le informazioni archiviate, per referenziarle e linkarle all’interno del nuovo documento. Sono, infine, disponibili specifici strumenti per la preparazione della versione finale del documento prodotto. PAD offre infine una serie di canali di pubblicazione e distribuzione dei documenti in formato html, PDF, RDF, eBook.

Per l’intero sviluppo applicativo di PAD è stata utilizzata la nuova piattaforma di produzione, gestione e annotazione di documentazione completamente basata sui Linked Data realizzata da regesta exe: openDams – Open Data Management System. Frutto di un’attivita di ricerca e sviluppo che ha avuto inizio nel 2010, openDams mette a disposizione degli utenti un ambiente completo per la redazione, gestione e conservazione di basi dati complesse in formato RDF, l’interazione con un triplestore per la conservazione e l’accesso ai dati archiviati, il costante allineamento dei dati su un Endpoint SPARQL, per la condivisione e il riuso dei dati pubblicati, sia in ambienti Internet che Intranet.

La piattaforma openDams sara’ distribuita entro la fine dell’anno.