質問

いくつかのPDFドキュメントのインデックスを作成し、検索UIを作成しようとしています。

この質問はやや関連しています

solr index pdfドキュメントとそれらをリモートサーバーに投稿します

1)PDFドキュメントのインデックス作成 - > Tika Jarを使用してPDFをテキストファイルに変換し、Curlコマンドを使用してインデックスを付けます。

2)UI-> I Mを検索します solritas 機能とその組み込みのUIを参照します。

目的 :

インデックス付きドキュメントのリストで「Lucene」と言う単語を検索すると、指定されたクエリの結果セットが表示されたら、返されたドキュメントごとにリンクを表示し、開くことができるドキュメントをクリックすると表示します。その文書。

私の現在の考え:

ステップ1を双方向のステップから直接インデックス作成の単一のステップに変更する必要があると思います。これらのPDFドキュメントの場所について説明するSchema.xmlには、追加のフィールドがあるべきだと思います。

いくつかの提案を教えてください

役に立ちましたか?

解決

これは役立つかもしれません:

http://wiki.apache.org/solr/extractingRequestHandler

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top