Lucene

una libreria open source per motori di ricerca full-text

Lucene è un progetto open source della Apache Software Foundation. E’ una libreria  per motori di ricerca full-text.  Altamente scalabile e personalizzabile,  è un utile strumento per le applicazioni di gestione dei  database poiché  consente di aggiungere ed integrare nei software nuove funzionalità di ricerca ed indicizzazione.
Totalmente scritta in Java è “portabile” verso applicazioni scritte con altri linguaggi (to Perl, Python, C++.NET)

Lucene  può  indicizzare e rendere ricercabile qualsiasi dato possa essere convertito in un formato testuale: pagine web su server,  documenti conservati in sistemi di file locali, testi semplici, messaggi di email, archivi di mailing-list, pagine wiki, documenti word, file HTML, Pdf,  XML;  tutti i formati dai quali sia possibile estrarre informazioni testuali (metadati su fotografie, filmati).