Java でさまざまなカスタム XML ドキュメントを解析するための最良の方法

StackOverflow https://stackoverflow.com/questions/23106

  •  09-06-2019
  •  | 
  •  

質問

Java を使用して複数の個別のカスタム XML ドキュメントを解析する最適な方法は何ですか?

役に立ちましたか?

解決

私は使うだろう スタックス XML を解析するのは高速で使いやすいです。私は最後のプロジェクトでこれを使用して、最大 24MB の XML ファイルを解析しました。素敵な紹介があります java.net, 、開始するために知っておく必要があるすべてのことが説明されています。

他のヒント

基本的に、Java には 2 つの主な XML 解析メソッドがあります。

  • サックス, を使用する場合、 ハンドラ XML 内で必要なものだけを取得し、残りを無視する
  • ドム, 、ファイルをずっと解析し、よりツリーのような方法ですべての要素を取得できるようにします。

もう 1 つの非常に便利な XML 解析メソッドは、これらよりも少し新しいものではありますが、Java6 以降のみ JRE に含まれています。 StAX. 。StAX は、DOM のツリーベースのアプローチと SAX のイベ​​ントベースのアプローチの間の中間メソッドとして考案されました。非常に大きなドキュメントの解析が簡単であるという点で SAX とよく似ていますが、この場合、アプリケーションはイベントを解析してアプリケーションに「プッシュ」するのではなく、パーサーから情報を「プル」します。この件に関してさらに詳しい説明を見つけることができます ここ.

したがって、達成したいことに応じて、これらのアプローチのいずれかを使用できます。

使いたくなるでしょう org.xml.sax.XMLReader (http://docs.oracle.com/javase/7/docs/api/org/xml/sax/XMLReader.html).

解析だけが必要な場合は、XPath ライブラリを使用することをお勧めします。ここに素晴らしい参考文献があります: http://www.ibm.com/developerworks/library/x-javaxpathapi.html

ただし、XML をオブジェクトに変換することを検討しても、限界はありません。そのために、次を使用できます Xストリーム, 、これは私がよく使っている素晴らしいライブラリです

使用 dom4j 図書館

まずドキュメントを読んでください

import java.net.URL;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;

public class Foo {

    public Document parse(URL url) throws DocumentException {
        SAXReader reader = new SAXReader();
        Document document = reader.read(url);
        return document;
    }
}

次に、XPATH を使用して必要な値を取得します

public void get_author(Document document) {
    Node node = document.selectSingleNode( "//AppealRequestProcessRequest/author" );
    String author = node.getText();
    return author;
}

以下は、を使用して値の値を抽出するコードです。 vtd-xml.

import com.ximpleware.*;

public class extractValue{
    public static void  main(String s[]) throws VTDException, IOException{
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("input.xml", false));
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/aa/bb[name='k1']/value");
        int i=0;
        while ((i=ap.evalXPath())!=-1){
            System.out.println(" value ===>"+vn.toString(i));
        }   
    }
}
ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top