xDams verso il Web dei dati

Strumenti e tecnologie per le Digital Humanities
di 30 Ottobre 2018 0
Buenos Aires, Jimmy Baikovicius 2011, flickr.com

Buenos Aires, Jimmy Baikovicius 2011, flickr.com

Stiamo lavorando per rendere disponibile entro la fine dell’anno una nuova versione della nostra piattaforma xDams: un radicale rinnovamento, sia sul versante tecnologico che su quello funzionale, che affianca, alla versione finora utilizzata, una soluzione applicativa che gestisce l’intero ciclo di vita di risorse in formato Linked Data e permette la piena integrazione nel Web of Data di risorse descrittive e catalografiche relative al patrimonio culturale.

La progettazione della nuova piattaforma muove da due presupposti:

  • rendere disponibili strumenti per gestire l’intero ciclo di vita di risorse Linked Data: alimentare repository RDF da fonti eterogenee, fare interoperare quei bacini documentali con le risorse disponibili nella Linked Data Cloud grazie all’utilizzo di funzionalità e strumenti per l’interlinking, integrare il processo di produzione e pubblicazione dei dati;
  • favorire la piena integrazione nel Web of Data di risorse descrittive e catalografiche relative al patrimonio culturale, e in questo modo superare le separazioni disciplinari tra le diverse tipologie di beni trattati, garantendo al tempo stesso fin dalla fase di catalogazione la piena aderenza agli standard di settore nel nuovo contesto digitale.

Questa evoluzione scaturisce da un’intensa fase di ricerca e sperimentazione di strumenti e tecnologie emerse e consolidatesi nel corso degli ultimi anni nel panorama internazionale: come i database NoSql o i vari progetti Spring (Spring Framework, Spring Batch, Spring Data), e poi Bootstrap, AngularJS, JQuery, componenti via via integrate nelle nostre applicazioni, con l’obiettivo di rendere le soluzioni che realizziamo più solide e coerenti con l’ambiente di rete in cui esse sono calate, e di garantire un’armonica evoluzione dei processi produttivi interni e delle funzionalità del software.

Con il nuovo xDams operiamo un radicale rinnovamento che affianca, alla versione finora utilizzata, una soluzione applicativa che gestisce l’intero ciclo di vita di risorse in formato Linked Data

Il risultato scaturito da queste premesse è un’infrastruttura tecnologica in grado di gestire oltre l’XML altri standard e formati, come Json e, naturalmente, RDF in tutte le sue forme, di assicurare una completa indipendenza tra strato software applicativo e metodi di accesso ai dati, di consentire la migrazione della precedente applicazione e delle strutture dati esistenti nel nuovo ambiente nonché l’implementazione di funzionalità aggiuntive indipendentemente dai database utilizzati. Questa nuova infrastruttura si basa, nella sua prima release, su due componenti di ultima generazione, MongoDB (https://www.mongodb.com/it ) per la persistenza dei dati e Apache SolR (http://lucene.apache.org/solr/ ) per la gestione degli indici e la ricerca; mentre per la pubblicazione e l’accesso alla base informativa in formato Linked Data la piattaforma colloquia con un triplestore che espone un Endpoint SPARQL (Blazegraph o Virtuoso). L’architettura applicativa realizzata consente l’utilizzo anche di altri strumenti di storage, come i classici database SQL (MySql, Oracle, ecc.), e di ricerca, come Elastic Search.

Francoforte, Thomas Hassel 2016, flickr.com

Francoforte, Thomas Hassel 2016, flickr.com

Grazie all’adozione di questi strumenti, di largo utilizzo nella progettazione di applicazioni Web, e le Api standard di cui sono corredati, è possibile favorire l’utilizzo degli archivi xDams e dei dati prodotti in una pluralità di contesti e soluzioni specialistiche, anche gestite da terze parti, la loro immediata visibilità e ricercabilità in rete, la possibilità di incrementare e specializzare funzionalità e moduli applicativi in una logica di micro-servizi.

In questa prospettiva di cooperazione applicativa e condivisione dei dati, per la gestione delle immagini digitali è stato adottato lo standard IIIF – International Image Interoperability Framework (https://iiif.io/). IIIF offre metodi di accesso uniforme alle immagini e un set di Api che supportano l’interoperabilità tra diversi repository: per la gestione e la presentazione delle immagini, l’autenticazione e la ricerca. Nella configurazione di xDams abbiamo integrato un Image Server e un viewer pienamente compatibili con lo standard, nonché la generazione automatica dei singoli manifest.json, che includono tutte le informazioni necessarie a presentare le risorse e a condividerle sulla rete.

Sydney, Alistair Paterson 2012, flickr.com

Le motivazioni che ci hanno indotto ad un intervento così incisivo e profondo sono duplici. Innanzitutto, cambiare fa un po’ parte del nostro modo d’essere, dell’attitudine di tutti i membri del gruppo di lavoro raccolto negli anni intorno a Regesta.
Nel 2004 abbiamo scelto Internet come ambiente di lavoro e XML come formato aperto per la conservazione e la condivisione dei dati. Nel 2009 abbiamo iniziato a sperimentare l’utilizzo di RDF e delle tecnologie del Semantic Web per integrare basi dati complesse ed eterogenee in un unico ambiente di fruizione e gestione, per realizzare prima il portale storico della Camera dei deputati, poi la digital library del Cdec e, più recentemente, il portale storico della Presidenza della Repubblica. Nel 2012 abbiamo rilasciato l’intera soluzione applicativa xDams in modalità Open Source, per favorirne lo sviluppo, il riuso e l’integrazione con altre piattaforme dell’ecosistema del software libero in continua e rapida espansione. Nel 2016 è nata, infine, la piattaforma thearchivescloud.com, per offrire anche in forma totalmente gratuita, tutti i servizi di utilizzo di xDams per la realizzazione di specifici interventi di descrizione e pubblicazione.

La seconda ragione che ci ha spinto ad imboccare questa strada scaturisce, invece, dalla convinzione che le principali novità del panorama tecnologico internazionale emerse nel corso degli ultimi anni, dal cloud computing ai linked data, rappresentino un’opportunità per aprire spazi di intervento, far emergere inattese occasioni di applicazione, immaginare soluzioni per operare utilmente in un ambiente decentrato e interoperabile come la rete. Per la sua natura intrinsecamente interdisciplinare e polisemica, il settore dei beni culturali offre un punto di osservazione e sperimentazione privilegiato su questi sviluppi e tecnologie. E, allo stesso tempo, può maggiormente giovarsi dalla capacità di condividere in un unico ambiente informativo contenuti provenienti da ambiti disciplinari diversi e da diverse competenze.

Tokyo, Tokyoform 2007, flickr.com

Tokyo, Tokyoform 2007, flickr.com

L’integrazione di contesti differenti trova oggi concreta espressione nel concetto di patrimonio culturale o, in maniera più specifica, nel campo delle Digital Humanities, che protagoniste di una stagione di grande vitalità, creano un orizzonte operativo in forte espansione per quei soggetti – pubblici e privati – che nell’innovazione tecnologica applicata al patrimonio culturale hanno la loro ragione d’essere.  

La nuova versione di xDams vuole essere la risposta a questa sfida: uno strumento adeguato ad operare in questo scenario, grazie ad un’architettura informativa flessibile e facilmente modellabile, per inglobare contenuti, sintassi, “dialetti” molteplici (schemaless). Uno strumento che possa superare le barriere settoriali, ma non si limiti ad una semplice giustapposizione di strumenti specialistici (cataloghi, inventari) dentro un ambiente di trattamento comune, e favorisca una reale e continua circolarità, all’interno di singoli progetti come all’esterno di essi, di informazioni che seppur eterogenee restino coerenti con le strutture descrittive consolidate nei diversi campi di applicazione.

Le Digital Humanities, protagoniste di una stagione di grande vitalità, creano un orizzonte operativo in forte espansione per quei soggetti, pubblici e privati, che nell’innovazione tecnologica applicata al patrimonio culturale hanno la loro ragione d’essere

La sperimentazione di questo ambiente di lavoro – avviata da tempo – si è avvalsa recentemente della collaborazione con la Fondazione Cini che ha utilizzato xDams per la realizzazione del progetto LOD Essling, di cui si parla in un altro post di questo magazine.
Contestualmente stiamo operando per integrare questa piattaforma documentale all’interno dell’infrastruttura Time Machine Box, che supporta il progetto Time Machine FET Flagship, per l’integrazione di tecnologie e metodologie innovative a supporto della digitalizzazione dei beni culturali: al progetto, promosso dal Digital Humanities Laboratory del Politecnico di Losanna, partecipiamo con quasi altre 200 partner internazionali (https://timemachine.eu/).

Nell’immediato il nostro impegno principale è quello di garantire la piena trasportabilità degli archivi prodotti con le versioni precedenti e la disponibilità di tutte le caratteristiche e le funzionalità che hanno favorito la diffusione di xDams fino ad ora, confermando, naturalmente, la scelta di rilasciare la piattaforma in Open Source.