リモートから文書(.pdf .doc)をインデックスまたは抽出しない

StackOverflow https://stackoverflow.com/questions/5896410

  •  29-10-2019
  •  | 
  •  

質問

Solr 3.1、Apache Tika 0.9、Solrnet0.3.1を使用してインデックスを作成しています .docおよび.pdfファイルのようなドキュメント。

これを使用して、ローカルでドキュメントのインデックス作成と抽出に成功しました コード ジェネラコディセタグプレ

しかし、同じコードを使用してリモートからドキュメントを抽出またはインデックス付けするという問題に直面しているため、エラーが発生しました: ジェネラコディセタグプレ

メッセージ ジェネラコディセタグプレ

メッセージ ジェネラコディセタグプレ

説明 ジェネラコディセタグプレ

役に立ちましたか?

解決

リモートサーバーには、クラスパスにApache Poiの2つの異なるバージョンがあります。

古いバージョンのPOIを削除し、Solr / Tikaに付属の新しいjarを残します。見つけることができない場合は、 POI FAQ が見つかりません。

他のヒント

ローカルのSolrインスタンスに対しては機能するが、別のインスタンスに対しては機能しない場合は、他のインスタンスが正しく構成されていない可能性があります。

スタックトレースから判断すると、POIライブラリが正しくないようです(バージョンが間違っている可能性があります)。Solr3.1.0ディストリビューションからすべてのTikaJARをコピーしてください。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top