質問

Rubyのあい Ferret.誰か知らの取り組みのためのPython?まだPyLuceneで流してしまいましたが、まず私が調査への移動の純粋なPythonを示すことが知られています。

役に立ちましたか?

解決

Whoosh はluceneに似ていますが、純粋なpythonです。

他のヒント

私が知っている唯一のpure-python(C拡張でさえも含まない)検索ソリューションは Nucular です。遅い(PyLuceneよりずっと遅い)が、まだ不安定だ。

PyLuceneベースの自家製検索とインデックス作成から Solr に移行しましたが、YMMVです。

最近 pyndexter を見つけました。さまざまなバックエンド全文検索エンジン/インデクサーへの抽象的なインターフェースを提供します。また、デフォルトのpure-python実装が同梱されています。

これらのことは、Pythonでは悲惨なほど遅くなります。

一部のアプリケーションでは、純粋なPythonが過大評価されています。 Xapianをご覧ください。

lupy た可能港への純粋なエラーになります。のlupy人のことをお使PyLucene.います。も利用できるJava源と組み合わせ Jython.

XapianとPyndexterの回答に対して

+1。

フェレットは実際にはCで書かれており、Rubyバインディングが上にあります。純粋なRuby検索エンジンは、純粋なPython検索エンジンよりもさらに低速です。 「誰か他の人」を見たいです。 FerretへのPythonインターフェース用のCython / Pyrexレイヤーを作成しますが、XapianにPythonバインディングがあるのに気にするので、自分でやりません。

非純粋なPythonの場合、Python APIを使用した Sphinx Search が最も高速に動作します。複数のブログのベンチマークから、Sphinx SearchはLuceneよりもはるかに高速であり、メモリの使用量がはるかに少なく、C言語で動作します。

フレームワークとしてpythonと web2py を使用して、それに基づいてマルチドキュメント検索エンジンを開発しています。

これを数週間検索した後、素晴らしいPythonソリューションを見つけました: repoze.catalog 。 ZODBをストレージに使用しているため、厳密にはPython専用ではありませんが、SOLRのようなものよりも、私にとってはより良い依存関係のようです。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top