リモートガラス魚の(Tikaを使用)解析します
-
29-10-2019 - |
質問
Tika Parserを使用して、ファイルをSolRにインデックス化しています。独自のパーサー(XmlParserを拡張)を作成しました。それは私自身のマイメタイプを使用します。内部が次のようになるjarファイルを作成しました:
src
|-main
|-some_packages
|-MyParser.java
|resources
|-META-INF
|-services
|-org.apache.tika.parser.Parser (which contains a line:some_packages.MyParser.java)
|_org
|-apache
|-tika
|-mime
|-custom-mimetypes.xml
カスタムマイメティプでは、XMLファイルにいくつかの特別なタグがあるため、新しいMimetypeの定義を配置します。
ここで問題はどこにありますか:私は地元のマシンにインストールされているGlassfish上のsolrを使用して解析とインデックスをテストしています。うまくいきました。その後、リモートサーバーにインストールしたかったのです。同じバージョンのGlassfishがインストールされています(3.1.1)。 solrアプリケーションをコピーしました。これは、すべてのライブラリ(ティカジャーと瓶を含むカスタムパーサーを含む)を含むホームディレクトリです。残念ながら、うまくいきません。 SOLRにファイルを投稿した後、コンテンツタイプのフィールドでカスタムMIMEタイプが検出されたことがわかります。しかし、MyParserクラスが実行されなかったように、そこにいると思われるフィールドはありません。私が得る唯一のフィールドは、ダブリンコアからのフィールドです。 TikaがXmlParserのみを使用していることを(単にプリントラインを追加するだけで)確認しました。誰かが同様の問題を抱えていましたか?これを処理する方法は?
正しい解決策はありません
所属していません StackOverflow