Лучший метод для анализа различных пользовательских XML-документов на Java

https://stackoverflow.com/questions/23106

xml
java

09-06-2019
|

Вопрос

Каков наилучший метод для анализа нескольких отдельных пользовательских XML-документов с помощью Java?

Решение

Я бы использовал Штакс для синтаксического анализа XML он быстр и прост в использовании.Я использовал его в своем последнем проекте для анализа XML-файлов размером до 24 МБ.Там есть приятное введение в java.net, который расскажет вам все, что вам нужно знать, чтобы начать работу.

Другие советы

По сути, у вас есть два основных метода синтаксического анализа XML в Java :

САКСОФОН, где вы используете обработчик чтобы захватить только то, что вы хотите в своем XML, а остальное выбросить
ДОМ, который анализирует ваш файл с самого начала и позволяет вам захватывать все элементы более древовидным способом.

Другим очень полезным методом синтаксического анализа XML, хотя и немного более новым, чем эти, и включенным в JRE только начиная с Java6, является Штакс.StAX был задуман как промежуточный метод между древовидным подходом DOM и подходом SAX, основанным на событиях.Это очень похоже на SAX в том, что синтаксический анализ очень больших документов прост, но в этом случае приложение "извлекает" информацию из анализатора, вместо того, чтобы синтаксический анализ "подталкивал" события к приложению.Вы можете найти более подробное объяснение по этому вопросу здесь.

Итак, в зависимости от того, чего вы хотите достичь, вы можете использовать один из этих подходов.

Вы захотите использовать org.xml.sax.XMLReader (http://docs.oracle.com/javase/7/docs/api/org/xml/sax/XMLReader.html).

Если вам нужно только выполнить синтаксический анализ, я бы рекомендовал использовать библиотеку XPath.Вот хорошая ссылка: http://www.ibm.com/developerworks/library/x-javaxpathapi.html

Но вы можете захотеть рассмотреть возможность преобразования XML-файлов в объекты, и тогда небо - это предел.Для этого вы можете использовать XStream - поток, это отличная библиотека, которой я часто пользуюсь

Используйте dom4j библиотека

Сначала прочтите документ

import java.net.URL;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;

public class Foo {

    public Document parse(URL url) throws DocumentException {
        SAXReader reader = new SAXReader();
        Document document = reader.read(url);
        return document;
    }
}

Затем используйте XPATH, чтобы получить нужные вам значения

public void get_author(Document document) {
    Node node = document.selectSingleNode( "//AppealRequestProcessRequest/author" );
    String author = node.getText();
    return author;
}

Ниже приведен код извлечения некоторого значения value с помощью vtd-xml.

import com.ximpleware.*;

public class extractValue{
    public static void  main(String s[]) throws VTDException, IOException{
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("input.xml", false));
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/aa/bb[name='k1']/value");
        int i=0;
        while ((i=ap.evalXPath())!=-1){
            System.out.println(" value ===>"+vn.toString(i));
        }   
    }
}

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow