Extraway
una piattaforma XML nativa per l'archiviazione e la ricerca di documenti digitali
La tecnologia XML, formalizzata come standard dal Consorzio W3C, permette di definire nuovi formati di scambio informazioni e comunicazione (come il WML per i cellulari) e di rappresentare oggetti in un formato aperto, non proprietario, indipendente da uno specifico strumento di software di interpretazione proprietario soggetto alle evoluzioni dell’azienda produttrice e del mercato.
Le caratteristiche del motore
Prodotta dalla 3D Informatica Extraway® XML Engine è una tecnologia innovativa, che muove dai seguenti obiettivi principali:
- tutti gli oggetti gestiti dal motore documentale, indipendentemente dall’interfaccia con cui sono stati prodotti sono fisicamente file o parti di file XML;
- il sistema è in grado di catalogare e trattare nel tempo file XML prodotti e aggiornati da altri applicativi;
- il sistema è dotato di una libreria di filtri, atti a trasformare file da vari formati nativi al formato XML
Extraway® XML Engine è una piattaforma XML nativa, in grado di memorizzare, indicizzare e rendere disponibili i documenti per la ricerca. I dati non sono conservati in un formato proprietario, ma sono mantenuti nella forma nativa (XML) sul file system.
Extraway® consente di gestire direttamente e produrre prioritariamente una ‘Information Unit’ XML garantendo i seguenti ed importanti benefici:
- Intelligibilità nel tempo – comunque possa evolversi il formato XML gli oggetti descritti dalla prima versione in poi saranno sempre decifrabili nella loro struttura, contesto, gerarchia e presentazione.
- Efficienza – non è necessario effettuare conversioni in ingresso ed uscita per scambiare informazioni strutturate in XML con altre applicazioni; inoltre la tecnologia ad oggetti supporta l’utilizzo di puntatori e collezioni che consentono di ottenere prestazioni elevate sia in ricerca sia nel controllo dell’accesso concorrente.
- Flessibilità – mediante la catalogazione dei modelli di definizione (DTD e Schema) e delle relative versioni, il modello della base dati può evolvere nel tempo senza dover ristrutturare il formato fisico dei dati già inseriti, è possibile cioè generare nuove DTD e Schema senza ritoccare le informazioni già archiviate.
- Integrazione con la logica applicativa – La tecnologia a oggetti permette di dichiarare nell’oggetto stesso i metodi con cui essi vengono utilizzati, quindi la logica applicativa risulta definita e associata in modo diretto ai dati che gestisce.
Il motore realizza la sua missione esponendo un comando di Salvataggio Record atomico, cioè non frazionabile, automaticamente corredato da metadati sia in codice che in chiaro, relativi all’utente, la data e l’orario, l’organizzazione corrente del produttore, del piano di classificazione, del sistema software e sigillati con un codice di integrità.
Il Record è quindi l’unione indivisibile e dimostrabile di dati, file di contenuto e metadati. Ogni cambio di stato viene salvato da un sistema di tracking persistente, che permette la ricostruzione dello stato del record a seguito di ogni azione, dalla creazione fino alla versione corrente. Le operazioni di lettura sono invece memorizzate in file di log la cui persistenza e riversamento su supporti rimovibili può seguire una politica proporzionata al traffico di consultazione, diversa da quella di aggiornamento, mentre gli eventi amministrativi e straordinari (spegnimento, riavvio, aggiornamento software, comandi di console, aggiornamento della struttura organizzativa e del piano di classificazione) sono memorizzati in un altro file specifico.
Metadati
Ogni record è internamente corredato dai seguenti metadati:
- Data e ora di creazione
- Utente di creazione
- Data e ora di ultima modifica
- Utente di ultima modifica
- Identificativo e versione del motore Extraway®
- Identificativo e versione della struttura organizzativa
- Identificativo e versione del regolamento di accesso o manuale di gestione
- Identificativo e versione del piano di classificazione
- Codice di integrità
Inoltre con il modulo File Conversion Service, il motore aggiunge i seguenti ulteriori metadati per ogni file di contenuto:
- impronta del file
- numero di pagine
- dimensione
- dettagli tecnologici (formato, compressione, risoluzione, durata, testo, sottotitoli, ecc.)
Supporto nativo del linguaggio XML
Extraway® memorizza tutti i dati e metadati di ogni record in un’unica porzione indivisibile di un opportuno file XML. L’allocazione del file e la sua posizione in sottodirettori è lasciata ad una politica di gestione scelta dall’amministratore dell’archivio, non dal programmatore.
Ogni porzione XML, a parte i casi in cui viene cifrata perché contenenti dati sensibili, è intellegibile a chi possa accedere fisicamente al file, tipicamente l’amministratore del server o i conservatori delle copie di backup. Il motore di Extraway® riconosce la struttura XML del record creando uno specifico indice per ogni diverso percorso dalla radice del record ai suoi elementi ed attributi. Durante il salvataggio del record, Extraway® verifica che sia ben formato e la sua validità rispetto ad un modello dichiarato (DTD o schema).
Funzionalità di ricerca
Extraway® è predisposto per supportare le funzionalità necessarie alla ricerca di informazioni, quindi la sua architettura privilegia la ricerca ed il recupero di record sulla base di criteri approssimati e progressivi in presenza di molti accessi concorrenti su grandi archivi. Oltre alle classiche funzioni di Information Retrieval (vector space, ricerche per somiglianza, wild-card, operatori booleani e di prossimità) Extraway® supporta estensione dei termini mediante thesauri, compresenza di termini in un un dato bacino o ancestor XML, nonché la produzione dei termini più significativi di un sottinsieme di record.
Vengono inoltre gestiti a livello di motore i comandi più utili dell’interfaccia uomo-macchina:
- Creazione di sottoinsiemi temporanei di record
- Inclusione ed esclusione manuale di record
- Combinazione booleana tra sottoinsiemi (intersezione, unione, differenza)
- Definizione di ricerche ricorrenti
- Copia e aggiornamento di collezioni di record per consultazione pubblica
Con Extraway® vengono garantiti quei requisiti funzionali e tecnologici necessari alla realizzazione dei sistemi documentali, attraverso il rispetto dei principi di conformità alle norme, che a livello nazionale, stabiliscono i requisiti di validità giuridica dei documenti in forma elettronica e le loro modalità di autenticazione.
L’accesso alle informazioni memorizzate nelle Information Unit XML di Extraway® può avvenire sia attraverso nuovi linguaggi quali XPath e XQuery (concepiti appositamente per leggere informazioni stratificate), che mediante una interfaccia relazionale ad oggetti familiare alla maggior parte dei programmatori, che avranno a disposizione infatti sia un driver ODBC ed un driver JDBC sia una libreria Java per l’accesso e la manipolazione dei dati e delle informazioni.
L’insieme degli strumenti è utilizzabile sulle più diffuse piattaforme server (Solaris, AIX, Linux, Windows NT/2000 ), con thin-client web.