Frage

Die rubin Leute haben Ferret . Jemand weiß, von einer ähnlichen Initiative für Python? Wir verwenden PyLucene aktuell, aber ich möchte reine Python Suche zu untersuchen, zu bewegen.

War es hilfreich?

Lösung

Whoosh ist ein neues Projekt, das zu lucene ähnlich ist, aber ist reiner Python.

Andere Tipps

Der einzige reine Python-Suchlösung (nicht einmal C-Erweiterung beteiligt) Ich weiß von Nucular . Es ist langsam (viel langsamer als PyLucene) und instabil noch.

Wir zogen von PyLucene-basierte Home gebacken Suche und Indizierung Solr aber YMMV.

Vor kurzem fand ich pyndexter . Es bietet abstrakte Schnittstelle zu verschiedenen Backend-Volltext-Suchmaschinen / Indexer. Und es wird mit einer Standard reinen Python-Implementierung.

können diese Dinge katastrophal werden langsam obwohl in Python.

Für einige Anwendungen reiner Python ist überbewertet. Werfen Sie einen Blick auf Xapian.

lupy war ein lucene Port reine Python. Die lupy Leute schlagen vor, dass Sie PyLucene verwenden. Es tut uns leid. Vielleicht können Sie die Java-Sourcen in Kombination verwenden, um mit Jython .

1 auf die Xapian und Pyndexter Antworten.

Frettchen ist eigentlich in C mit Ruby-Bindungen auf geschrieben. Eine reine Ruby-Suchmaschine wäre noch langsamer als eine reine Python ein. Ich würde gerne „jemand anderes“, schreibt eine Cython / Pyrex Schicht für Python-Schnittstelle Frettchen, um zu sehen, aber es werde mich nicht, weil warum die Mühe, wenn es Python-Bindungen sind für Xapian.

Für nicht reinen Python, Sphinx Search mit Python API arbeitet am schnellsten. Von den Benchmarks aus mehreren Blogs, Sphinx Search ist viel schneller als Lucene verwendet viel weniger Speicher und es ist in C.

Ich bin eine Multi-Dokument Suchmaschine darauf basierende Entwicklung mit Python und web2py als Rahmen.

Nach Wochen der für diese Suche, fand ich eine schöne Python Lösung: repoze.catalog . Es ist nicht streng Python-nur, weil es ZODB für die Lagerung verwendet, aber es scheint eine bessere Abhängigkeit mir als so etwas wie SOLR.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top