質問

Tika Parserを使用して、ファイルをSolRにインデックス化しています。独自のパーサー(XmlParserを拡張)を作成しました。それは私自身のマイメタイプを使用します。内部が次のようになるjarファイルを作成しました:

src
|-main
    |-some_packages
        |-MyParser.java
    |resources
        |-META-INF
            |-services
                |-org.apache.tika.parser.Parser (which contains a line:some_packages.MyParser.java)
        |_org
            |-apache
                |-tika
                    |-mime
                        |-custom-mimetypes.xml 

カスタムマイメティプでは、XMLファイルにいくつかの特別なタグがあるため、新しいMimetypeの定義を配置します。

ここで問題はどこにありますか:私は地元のマシンにインストールされているGlassfish上のsolrを使用して解析とインデックスをテストしています。うまくいきました。その後、リモートサーバーにインストールしたかったのです。同じバージョンのGlassfishがインストールされています(3.1.1)。 solrアプリケーションをコピーしました。これは、すべてのライブラリ(ティカジャーと瓶を含むカスタムパーサーを含む)を含むホームディレクトリです。残念ながら、うまくいきません。 SOLRにファイルを投稿した後、コンテンツタイプのフィールドでカスタムMIMEタイプが検出されたことがわかります。しかし、MyParserクラスが実行されなかったように、そこにいると思われるフィールドはありません。私が得る唯一のフィールドは、ダブリンコアからのフィールドです。 TikaがXmlParserのみを使用していることを(単にプリントラインを追加するだけで)確認しました。誰かが同様の問題を抱えていましたか?これを処理する方法は?

正しい解決策はありません

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top