Y a-t-il un pur Python Lucene?

https://stackoverflow.com/questions/438315

22-07-2019
|

Question

Les Ruby ont Furet . Quelqu'un connaît-il une initiative similaire pour Python? Nous utilisons PyLucene à l'heure actuelle, mais j'aimerais étudier la possibilité de passer à la recherche en Python.

La solution

Whoosh est un nouveau projet similaire à lucene, mais en pur python.

Autres conseils

La seule solution de recherche pure-python (ne comportant pas l'extension C) que je connaisse est Nucular . C'est lent (beaucoup plus lent que PyLucene) et encore instable.

Nous sommes passés de la recherche et de l'indexation à la maison basées sur PyLucene à Solr mais YMMV.

J'ai récemment trouvé pyndexter . Il fournit une interface abstraite à différents moteurs / indexeurs de recherche en texte intégral. Et il est livré avec une implémentation pure-python par défaut.

Ces choses peuvent être terriblement lentes en Python.

Pour certaines applications, Python pur est surchargé. Jetez un coup d’œil à Xapian.

lupy était un port lucène en python pur. Les personnes lupiques vous suggèrent d'utiliser PyLucene . Pardon. Vous pouvez peut-être utiliser les sources Java en combinaison avec Jython .

+1 aux réponses Xapian et Pyndexter.

Ferret est écrit en C avec Ruby sur le dessus. Un moteur de recherche pur Ruby serait encore plus lent qu'un moteur Python pur. J'aimerais beaucoup voir " quelqu'un d'autre " écrivez une couche Cython / Pyrex pour l'interface Python dans Ferret, mais ne le ferez pas moi-même, car pourquoi s'embarrasser lorsqu'il existe des liaisons Python pour Xapian.

Pour le Python non pur, la recherche Sphinx avec l'API Python fonctionne le plus rapidement. Parmi les tests de plusieurs blogs, Sphinx Search est bien plus rapide que Lucene, utilise beaucoup moins de mémoire et est en C.

Je développe un moteur de recherche multi-documents basé sur celui-ci, utilisant python et web2py comme framework.

Après des semaines de recherche, j’ai trouvé une solution intéressante pour Python: repoze.catalog . Ce n'est pas strictement Python uniquement parce qu'il utilise ZODB pour le stockage, mais cela me semble une meilleure dépendance que quelque chose comme SOLR.

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow