Java でさまざまなカスタム XML ドキュメントを解析するための最良の方法

https://stackoverflow.com/questions/23106

xml
java

09-06-2019
|

質問

Java を使用して複数の個別のカスタム XML ドキュメントを解析する最適な方法は何ですか?

解決

私は使うだろうスタックス XML を解析するのは高速で使いやすいです。私は最後のプロジェクトでこれを使用して、最大 24MB の XML ファイルを解析しました。素敵な紹介があります java.net, 、開始するために知っておく必要があるすべてのことが説明されています。

他のヒント

基本的に、Java には 2 つの主な XML 解析メソッドがあります。

サックス, を使用する場合、ハンドラ XML 内で必要なものだけを取得し、残りを無視する
ドム, 、ファイルをずっと解析し、よりツリーのような方法ですべての要素を取得できるようにします。

もう 1 つの非常に便利な XML 解析メソッドは、これらよりも少し新しいものではありますが、Java6 以降のみ JRE に含まれています。 StAX. 。StAX は、DOM のツリーベースのアプローチと SAX のイベントベースのアプローチの間の中間メソッドとして考案されました。非常に大きなドキュメントの解析が簡単であるという点で SAX とよく似ていますが、この場合、アプリケーションはイベントを解析してアプリケーションに「プッシュ」するのではなく、パーサーから情報を「プル」します。この件に関してさらに詳しい説明を見つけることができますここ.

したがって、達成したいことに応じて、これらのアプローチのいずれかを使用できます。

使いたくなるでしょう org.xml.sax.XMLReader (http://docs.oracle.com/javase/7/docs/api/org/xml/sax/XMLReader.html).

解析だけが必要な場合は、XPath ライブラリを使用することをお勧めします。ここに素晴らしい参考文献があります: http://www.ibm.com/developerworks/library/x-javaxpathapi.html

ただし、XML をオブジェクトに変換することを検討しても、限界はありません。そのために、次を使用できます Xストリーム, 、これは私がよく使っている素晴らしいライブラリです

使用 dom4j 図書館

まずドキュメントを読んでください

import java.net.URL;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;

public class Foo {

    public Document parse(URL url) throws DocumentException {
        SAXReader reader = new SAXReader();
        Document document = reader.read(url);
        return document;
    }
}

次に、XPATH を使用して必要な値を取得します

public void get_author(Document document) {
    Node node = document.selectSingleNode( "//AppealRequestProcessRequest/author" );
    String author = node.getText();
    return author;
}

以下は、を使用して値の値を抽出するコードです。 vtd-xml.

import com.ximpleware.*;

public class extractValue{
    public static void  main(String s[]) throws VTDException, IOException{
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("input.xml", false));
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/aa/bb[name='k1']/value");
        int i=0;
        while ((i=ap.evalXPath())!=-1){
            System.out.println(" value ===>"+vn.toString(i));
        }   
    }
}

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow