ドキュメント検索の実装に使用した言語、フレームワーク、テクノロジーは何ですか?

StackOverflow https://stackoverflow.com/questions/2765922

質問

私は新しい会社にいますが、私たちの目標の1つは、チームとクライアントのためにドキュメント検索ポータルを実装することです。 Salesforceなどの外部サービスプロバイダーやクラウド内の他のECMを使用すると、将来的には多くの統合作業が行われることが少し心配です。クライアントの観点から見ると、これらのドキュメントは、構造化されたコンテンツと同じバケツにも存在します(MS Word DocではなくDBに保存されています)。

ドキュメント検索を実装した場合、どの言語、フレームワーク、テクノロジーを使用しましたか?失敗した話はありますか?箱から出して何かを使用するのに問題はありませんが、ドキュメントとAPIにアクセスすることを制御できることが重要だと思います。私たちが完全にカスタムするならば、私はレールを使用したいと思います。

役に立ちましたか?

解決

ライセンスのニーズに応じて ルーセン (LGPL)および XAPIAN (gpl)はどちらも、多くの言語用にバインディングを備えた、成熟した高速検索エンジンAPIです。私はそれらの両方を大成功で使用しました。

他のヒント

ルーセン それは広く使用されており、非常に良いので、おそらく最も安全な選択です。

ルーセンから利益を得る最も簡単な方法はおそらく 屋外, 、インストールするのは簡単で、デフォルトではルーセンがいます。これは、Alfrescoをインストールし、ドキュメントをリポジトリに入れるだけで、強力なWeb検索インターフェイスを使用してドキュメントを検索できることを意味します。

プログラムで検索する必要がある場合は、私の推奨事項はAlfrescoを使用することです。 CMIS インターフェイスを使用すると、休憩方法で検索できます。 JCR APIも利用できます。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top