Le istituzioni culturali sposano il crowdsourcing

Crowdsourcing, una partnership collaborativa a vantaggio di tutti.
di 7 Ottobre 2015 2
this

What’s this gadget? (LOC)

Non parliamo dell’Italia, non illudiamoci. E’ il titolo di un interessantissimo ed esaustivo articolo –  apparso sul blog della Libray of Congress The Signal il 16 settembre scorso  – di Mike Ashenfelder, IT alla Library e animatore del blog, sui vantaggi delle pratiche collaborative promosse soprattutto negli Stati Uniti, in Gran Bretagna dalle istituzioni culturali.  Il post è lungo, è una rassegna ricca di esempi davvero preziosa. Lo pubblichiamo – quasi integralmente – sul nostro magazine sperando di contribuire alla sua diffusione (e alla diffusione del metodo descritto) nel nostro Paese.

Molte istituzioni culturali hanno accelerato lo sviluppo delle loro collezioni digitali e dei loro dataset, consentendo ai cittadini volontari di aiutare archivisti, bibliotecari, ricercatori, e curatori impegnati in milioni di compiti cruciali. Una delle strade percorse dalle istituzioni per rispondere a queste sfide è il crowdsourcing.
In questo post esaminerò alcuni esempi di crowdsourcing promossi da biblioteche e archivi negli Stati Uniti e in tutto il mondo. Si tratta di una panoramica generale. Per informazioni più dettagliate si seguano gli esempi “linkati” o si navighi alla ricerca di piattaforme, strumenti o infrastrutture di crowdsourcing.
In generale, i volontari aiutano:

  •     Analizzando le immagini, creando tag e metadati e sottotitolando i video
  •      Trascrivendo documenti e correggendo il testo OCR
  •      Identificando località geografiche, allineando / rettificando mappe storiche con le posizioni attuali, e aggiungendo coordinate geospaziali
  •      Classificando i dati, incrociandoli, ricercando il tempo storico, e monitorando e tracciando le attività dinamiche

 


TAGGING E METADATI

 

war

La Library of Congress utilizza il contributo del pubblico per il suo progetto di Flickr. I visitatori analizzano e commentano le immagini della collezione generale Flickr della Biblioteca di oltre 20.000 immagini e della raccolta Flickr “Civil War Faces” della Biblioteca. “Noi facciamo le correzioni al catalogo e i miglioramenti basati sui commenti che gli utenti forniscono,” ha dichiarato Phil Michel, coordinatore della conversione digitale presso la Library.

In un altro tipo di analisi delle immagini, il progetto Cellslider di Cancer Research UK invita i volontari ad analizzare e classificare i nuclei delle cellule di cancro. I volontari non sono tenuti ad avere un background in biologia o in medicina per questi compiti semplici. Viene spiegato loro quali elementi visivi cercare e sono istruiti su come classificare nella pagina web ciò che vedono. Cancer Research UK afferma sul suo sito web che dalla pubblicazione di questo appello, 2,571,751 immagini sono state analizzate.

Entrambi gli esempi usano metadati descrittivi o il “tagging”, che aiutano a rendere più ricercabili le immagini attraverso le specifiche parole chiave associate – e mappate con – le immagini

I National Archives inglesi gestiscono un progetto, “Operation War Diary“, in cui i volontari aiutano ad inserire “tag” e classificare i diari della prima guerra mondiale dei soldati britannici. I tag sono elencati in un vocabolario controllato, un menu da cui i volontari possono selezionare le parole chiave, un processo che aiuta ad evitare le variazioni tipografiche e gli errori che possono verificarsi quando una folla di individui digita e inserisce liberamente testi.

lion

Il progetto della New York Public Library’s “Community Oral History Project” rende i video di storia orale ricercabili attraverso marcatori di argomento contrassegnati nella barra di scorrimento da volontari; i tag sono associati ai “time code” nel video. Così, per esempio, invece di ascoltare fino in fondo un’ora di intervista per trovare un argomento specifico, è possibile fare clic sul tag – come si farebbe selezionando da un menu – e saltare a tale argomento contrassegnato nel video.

Il Nara (National Archives and Records Administration) offre una serie di progetti di crowdsourcing sul suo “Citizen Archivist Dashboard”. I volontari possono taggare documenti e sottotitolare video per i non udenti; possono anche tradurre e sottotitolare dei video non in lingua inglese in sottotitoli in inglese.

 


TRASCRIZIONI

 

ship

Un progetto NARA consente ai volontari di trascrivere i manoscritti dei diari di bordo delle navi che, tra l’altro, contengono informazioni meteoreologiche quotidinae. Tali dati storici sul tempo sono un inestimabile contributo all’insieme crescente di dati nella ricerca sui cambiamenti climatici.
La trascrizione è uno dei compiti più richiesti nel crowdsourcing. Nel Centro di Trascrizione dello Smithsonian, i volontari possono selezionare i progetti di trascrizione da almeno dieci dei 19 musei e archivi dello Smithsonian. Il materiale è costituito da campi note scritti a mano, diari, fogli di campioni botanici, disegni con annotazioni scritte a mano e altro ancora. I trascrittori leggono i testi scritti a mano e digitano nella pagina web ciò che ritengono la scrittura dica. Il personale Smithsonian testa quindi i dati attraverso un controllo di qualità prima di accettarli […]

Molte istituzioni culturali hanno accelerato lo sviluppo delle loro collezioni digitali e dei loro dataset, consentendo ai cittadini volontari di aiutare archivisti, bibliotecari, ricercatori, e curatori impegnati in milioni di compiti cruciali. Il crowdsourcing è una delle vie adottate, una partnership collaborativa a vantaggio di tutti

Altri importanti progetti di trascrizione di altre istituzioni sono: il Card Catalogue project della British Library, World War I documents di Europena,  “The Diaries of John Quincy Adams” del Massachusetts Historical Society,  le “Colored Conventions” della University of Delaware,  “DIY History,”  dell’University of Iowa e  Atlas of Living Australia, dell’Australian Museum.

[…] il processo Optical Character Recognition genera spesso testi incompleti o deformati. […] Le istituzioni chiedono aiuto per la comparazione tra il testo di origine e il risultato dell’OCR e la correzione manuale degli errori. I quotidiani costituiscono gran parte della fonte materiale. The Library of Virginia, The Cambridge Public Library, la collezione della California Digital Newspaper sono esempi di siti di correzione OCR. Tra gli esempi fuori dagli Stati Uniti la National Library of Australia e la National Library of Finland.

Della New York Public Library si parlò qualche anno fa per l’ingente numero di persone che si offrì di sostenere il progetto crowdsourcing di trascrizione “What’s on the Menu” , nel quale la NYPL  chiedeva ai volontari di rivedere una collezione di menu storici digitalizzati e di trascrivere – in un “form” sul web – i contenuti dei menu.

 


MAPPE

 

mappe1

 

YPL Labs è stato molto più creativvo con i progetti di mappa orientata. Con “Building Inspector” (il cui motto vivace è “Kill time. Make history”) aiuta i cittadini cartografi a rivedere le scansioni di vecchie mappe delle assicurazioni ed identificare ciascun edificio — lotto per lotto, blocco per blocco— attraverso la sua costruzione materiale, il suo indirizzo, la sua impronta spaziale; […]si chiede ai volontari di prender nota del nome delle attività economiche scritte sulle vecchie carte della città (. MacNeil’s Blacksmith, The Derby Emporium). Data la densità della popolazione di New York, la propensione della maggior parte dei suoi abitanti a passeggiare ovunque, si crea la potenzialità di milioni di occhi che cercano informazioni nel proprio ambiente quotidiano, tornano a casa e registrano le informazioni nei db della NYPL.

mappe2

I volontari possono anche usare la NYPL Map Warper per correggere le differenze di allineamento tra le mappe contemporanee e le mappe storiche digitalizzate. La British Library ha un simile progetto crowdsourcing di rettifica delle mappe, chiamato Georeferencer. I volontari sono invitati a correggere le mappe scansionate da libri europei del 17 °, 18 ° e 19 ° secolo. Nel corso del progetto, le mappe sono rese geospaziali e diventano accessibili e ricercabili attraverso Old Maps Online.

I progetti Citizen Science si estendono dal livello di cellula a quello astronomico. Il Audubon Society’s Christmas Bird Count chiede ai volontari di uscire e fare report su quali uccelli vedono. I dati mirano al monitoraggio dei flussi migratori delle specie di uccelli.

Geo-Wiki i è una piattaforma internazionale che monitora in modo collaborativo l’ambiente terrestre. I volontari danno “feedback” sulle informazioni spaziali coperte dalle immagini satellitari o possono contribuire con nuovi dati.

 


GAMIFICATION

 

brain

Gamification rende un compito potenzialmente noioso un gioco. Malariaspot, dell’Universidad Politécnica de Madrid, rende un gioco l’identificazione dei parassiti che trasmettono la malaria. Il loro sito afferma “L’analisi di tutti le performance durante il gioco ci permetterà di conoscere quanto veloce ed accurato sia il conteggio di un parassita da parte di giocatori non esperti e come comporre l’analisi dei diversi giocatori per ottenere risultati accurati come quelli forniti da esperti ricercatori al microscopio”

Dalla collaborazione di Carnegie Melon and Stanford è nato EteRNA, un gioco in cui gli utenti giocano con i puzzle per disegnare sequenze del RNA che ripiegano secondo forme specifiche e contribuiscono a creare una libreria su larga scala di progetti di sintesi di RNA. “Eyewire” del MIT usa la “gamification” per ottenere dai giocatori un aiuto per mappare il cervello, “NanoDoc” del MIT permette ai giocatori di progettare nuove stategie di nanoparticelle per il trattamento del cancro. Il Center for Game Science della University of Washington offre “Nanocrafter,” un gioco di biologia sintetica, che permette ai giocatori di usare parti di DNA per creare nuove invenzioni. “Purposeful Gaming,” dalla Biodiversity Heritage Library, è un metodo ludico per pulire gli OCR. Harvard usa i dati dal suo gioco “Test My Brain” per testare le teorie scienfiche sul modo in cui il cervello lavora.

In presenza di una mole scoraggiante di dati grezzi e di una limitata disponibilità di risorse interne, il “crowdsourcing” consente alle istituzioni di fare ricorso all’aiuto di personale volontario per raccogliere ed elaborare le informazioni il più velocemente possibile. A volte il lavoro dei volontari alimenta direttamente un database relazionale che descrive specifiche risorse digitali, a volta il lavoro è sospeso fin quando non interviene una revisione manuale del lavoro. Il processo di “crowdsourcing” richiede che le istituzioni si fidino/affidano ad “outsider” – utente generico, utente amatoriale , cittadino archivista, storico. Se un progetto è ben strutturato e le istruzioni per l’uso sono chiare e semplici, le istituzioni possono chiedere aiuto al pubblico senza riserve. Si tratta di una partnership di collaborazione a vantaggio di tutti..

 

 

Traduzione a cura di Antonella Pagliarulo