Question

J'ai mis en place une solution de recherche Lucene il y a quelque temps, ce qui m'a intéressée aux index de fichiers compressés pouvant faire l'objet d'une recherche. À l'époque, je ne pouvais pas trouver de bonnes informations sur la manière de créer un index de recherche personnalisé. Je me demande donc si quelqu'un peut me diriger dans la bonne direction?

Mon intérêt principal est le formatage, la compression et quelque chose de similaire au concept des documents et des champs de Lucene. Cela ne devrait pas nécessairement être spécifique à une langue, mais si vous pouvez m'indiquer des ressources en ligne dont les implémentations sont spécifiques à une langue et qui présentent une description complète du processus, vous pouvez également vous connecter.

Était-ce utile?

La solution

Gestion des gigaoctets par Alistair Moffat, Timothy C. Bell

Gestion de la couverture de gigaoctets

Autres conseils

Vous pouvez également essayer de rechercher dans le code source de l'excellent Sphinx .

Il s'agit d'un moteur de recherche open source moderne en texte intégral utilisant des index optimisés de manière intelligente.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top