Quando (ad) avere i LOD è un MUST

Il Museo della Scienza di Milano riversa in rete informazione scientifica di qualità
di 17 Febbraio 2022 0

È il primo museo in Italia ad abbracciare la filosofia del Web Semantico e rendere disponibili e navigabili in Linked Open Data  le informazioni su circa 20.000 schede delle proprie collezioni.
Stiamo parlando del Museo della Scienza e della Tecnologia “Leonardo da Vinci” di Milano (MUST),  che, dal 14 febbraio scorso, ha inondato la rete di 1.317.681 triple, realizzate in conformità con le ontologie del Progetto ArCo, la rete di ontologie per la strutturazione della conoscenza per i beni culturali avviata da ICCD nel 2017.

Il lavoro di pubblicazione – a cura di regesta.exe – è stato presentato nell’ambito del Webinar promosso dal Museo dal titolo “Linked Open Data. Strumenti per la digitalizzazione del patrimonio culturale” [qui il programma]

Il caso del MUST è un esempio virtuoso di apertura e consapevolezza, cominciato nel 2019 con un lungo ed elaborato lavoro di importazione dati, riversati in un tracciato conforme alle normative ICCD (PST – Patrimonio scientifico e tecnologico, OA – Opere e oggetti d’arte e SM – Strumenti musicali), basato sullo schema EAD e resi accessibili attraverso la piattaforma xDams.

Una volta consolidato il tracciato e resi disponibili in formato XML, i dati sono stati trasformati in RDF e resi disponibili per l’interrogazione e il riuso attraverso un endpoint SPARQL di progetto.

I dati LOD del Museo soddisfano tutte le caratteristiche di apertura:

  • La disponibilità sul Web con una licenza aperta
  • La disponibilità in un formato strutturato leggibile dal computer
  • La disponibilità in un formato non proprietario
  • L’uso di standard w3C per identificare le cose di cui si parla, ricorrendo a identificativi basati sul protocollo http o https
  • Il collegamento dei dati a quelli esposti da altre persone e organizzazioni – ed è proprio questa la caratteristica con cui si ottiene la quinta stella.

Ad oggi sono state pubblicate 1.317.681 triple, in continuo aumento perché il lavoro di catalogazione procede. Nel dettaglio, sono state pubblicate 18398 schede PST, 962 OA e 128 SM. Sono state pubblicate come Linked Open Data anche le informazioni relative alle voci di authority e in 589 casi è stato possibile eseguire un allineamento, ossia è stato dichiarato che la voce presente nel dataset del museo, si trova anche in altri dataset.

Il Museo Leonardo ha deciso di aprire i propri dati nella consapevolezza dei diversi vantaggi che derivano dalla condivisione e dalla diffusione delle informazioni: se utilizzate con cognizione di causa, queste tecnologie infatti possono apportare numerosi benefici, in termini di arricchimento, visibilità e ricercabilità delle informazioni.

Gli sposini, dipinto di Silvestro Lega (1869), MUST
  • Riuso – Permette la riduzione della duplicazione di informazioni, con un conseguente risparmio di tempo e il vantaggio di disporre di dati sempre aggiornati, con conseguenti ripercussioni positive sulla qualità del dato.
  • Arricchimento e integrazione / Condivisione e interoperabilità – questi vantaggi meritano di essere analizzati insieme: pubblicare i dati come LOD significa pubblicare dati in un formato aperto e naturalmente predisposto all’interoperabilità, che consente di compiere “salti” tra dataset, attraverso collegamenti qualificati. Il Museo ha da un lato la possibilità di arricchire le proprie informazioni collegandosi ad altre istituzioni ed enti, e a sua volta diviene fonte autorevole di informazioni, condividendo i propri contenuti. Un esempio è costituito dalla risorsa riferita a Guglielmo Marconi, che è stata collegata ad altre risorse sullo scienziato detenute da altri istituti. Queste informazioni potranno arricchire ad esempio la pagina dedicata a Guglielmo Marconi sul Catalogo generale dei Beni Culturali e potranno essere recepite dalla pagina dedicata alla risorsa Guglielmo Marconi di Wikidata, che raccoglie già numerosi identificativi di altri dataset.
  • Decentramento – i LOD garantiscono una completa interoperabilità tra diversi repository sia da un punto di vista formale che concettuale: Ogni sistema può elaborare le informazioni in maniera indipendente e decentrata, senza dover dipendere da pesanti strutture centralizzate.
  • Accessibilità – è permessa dalla frammentazione delle informazioni e consente di esplorare il patrimonio informativo da più punti di accesso. Questo facilita gli utenti nella scoperta dei contenuti, mettendo in evidenza i dati prodotti dagli enti e aumentando il traffico verso i siti web degli istituti produttori.
  • Ricercabilità e visibilità – la frammentazione delle informazioni e l’esposizione dei dati come LOD innescano due meccanismi: da un lato, la visibilità delle singole pagine da altri repository documentali ai quali questi dati possono essere linkati attraverso infrastrutture come Wikidata, aumentano l’autorevolezza della fonte sulla base del numero di link in ingresso attivi; dall’altro lato, i dati, modellati secondo ontologie consolidate e riconosciute, offrono ai motori di ricerca informazioni qualificate, garantendo un posizionamento dei risultati nella prima pagina di ricerca.

Da questo primo lavoro inizia la vita sul web dei dati del Museo della Scienza e della Tecnologia, che aprirà a numerose possibilità di ricerca, di sviluppo e di dialogo tra istituzioni, promuovendo la creatività e la creazione di conoscenza.


L’immagine in evidenza ritrae il Cembalo Scrivano di Giuseppe Ravizza (sec. XIX) conservato al MUST