在Java中解析各种自定义XML文档的最佳方法

https://stackoverflow.com/questions/23106

xml
java

09-06-2019
|

题

使用 Java 解析多个离散的自定义 XML 文档的最佳方法是什么？

解决方案

我会用斯塔克斯解析 XML，它快速且易于使用。我在上一个项目中一直使用它来解析最大 24MB 的 XML 文件。有一个很好的介绍 java.net, ，它告诉您开始时需要了解的一切。

其他提示

基本上，Java 中有两种主要的 XML 解析方法：

萨克斯, ，您使用的地方处理程序只获取 XML 中您想要的内容，而放弃其余内容
DOM, ，它会一直解析您的文件，并允许您以更像树的方式获取所有元素。

另一种非常有用的 XML 解析方法是：斯塔克斯. 。StAX 被认为是一种介于基于树的 DOM 和基于事件的 SAX 方法之间的中间方法。它与 SAX 非常相似，因为解析非常大的文档很容易，但在这种情况下，应用程序从解析器“拉”信息，而不是解析“推送”事件到应用程序。您可以找到有关此主题的更多解释这里.

因此，根据您想要实现的目标，您可以使用其中一种方法。

你会想要使用 org.xml.sax.XMLReader (http://docs.oracle.com/javase/7/docs/api/org/xml/sax/XMLReader.html).

如果您只需要解析那么我建议使用 XPath 库。这是一个很好的参考： http://www.ibm.com/developerworks/library/x-javaxpathapi.html

但您可能需要考虑将 XML 转换为对象，然后就没有限制了。为此，您可以使用流媒体, ，这是一个很棒的库，我经常使用它

使用 dom4j 图书馆

首先阅读文档

import java.net.URL;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;

public class Foo {

    public Document parse(URL url) throws DocumentException {
        SAXReader reader = new SAXReader();
        Document document = reader.read(url);
        return document;
    }
}

然后使用 XPATH 获取您需要的值

public void get_author(Document document) {
    Node node = document.selectSingleNode( "//AppealRequestProcessRequest/author" );
    String author = node.getText();
    return author;
}

下面是使用提取一些值值的代码 vtd-xml.

import com.ximpleware.*;

public class extractValue{
    public static void  main(String s[]) throws VTDException, IOException{
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("input.xml", false));
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/aa/bb[name='k1']/value");
        int i=0;
        while ((i=ap.evalXPath())!=-1){
            System.out.println(" value ===>"+vn.toString(i));
        }   
    }
}

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow