Solrの索引付けとODTファイルへのアクセス
質問
Solr_homeディレクトリに保存されているODTファイル内のコンテンツを投稿、インデックスを投稿、索引付けし、検索する方法は?
私は以下のページを理解し適用し、スキーマにボディフィールドを含めました:
解決
Apache Tikaを使用してコンテンツを抽出し、SOLR
に送信するTika tika = new Tika();
InputStream fileInputStream = new FileInputStream("d:\\fileName.odt");
Metadata metadata = new Metadata();
metadata.set(Metadata.RESOURCE_NAME_KEY, "fileName.odt");
String content = tika.parseToString(fileInputStream, metadata);
.
代替として、 extrackrequesthandler
を使用することもできます。他のヒント
Apache Tikaが必要でした。それを見つけた Apache Tikaダウンロード
所属していません StackOverflow