Taula de continguts:
Definició: què significa Apache Lucene?
Apache Lucene és un projecte de codi obert per a una biblioteca de cercadors de text d’alt rendiment i funcions completes que s’escriu completament mitjançant Java.
És capaç de cercar text complet als documents, per la qual cosa és una tecnologia adequada per a qualsevol aplicació que requereixi aquesta funció, especialment si és multiplataforma.
El primer va ser desenvolupat per Doug Cutting el 1999 i va passar a formar part oficialment de la família Jakarta de la Fundació Apache de projectes de codi obert al setembre de 2001. Es va actualitzar a un projecte Apache de primer nivell el febrer de 2005.
Techopedia explica Apache Lucene
Apache Lucene és un motor de cerca d’alt rendiment amb el concepte de “un document que conté camps de text” en la seva arquitectura lògica fonamental. Això ofereix una gran flexibilitat i permet que l’API de Lucene s’independitzi de qualsevol format de fitxer.
Qualsevol text de formats com MS Word, HTML, XML, PDF i OpenDocument es pot indexar sempre que es pugui extreure la informació textual, cosa que significa que no pot fer res amb imatges.
Lucene és adequat per a qualsevol aplicació que necessiti una indexació de text i una capacitat de cerca completa, però es reconeix àmpliament com una gran utilitat per a la implementació de motors de cerca d'Internet i per a la cerca local, d'un sol lloc.
Les característiques inclouen:
- Índex escalable i d’alt rendiment: pot processar més de 150 Gb per hora amb maquinari modern i només requereix 1 Mb per quantitat de memòria necessària.
- Algoritmes de cerca potents, precisos i eficients: ofereix molts tipus de consultes potents, com ara consultes de frases, comodins, proximitat i rang. També ha inclòs la cerca i ordenació per qualsevol camp.
- Plataforma transversal: implementació de Java pura i també disponible en altres llenguatges de programació.