Лучший метод для анализа различных пользовательских XML-документов на Java
Вопрос
Каков наилучший метод для анализа нескольких отдельных пользовательских XML-документов с помощью Java?
Другие советы
По сути, у вас есть два основных метода синтаксического анализа XML в Java :
- САКСОФОН, где вы используете обработчик чтобы захватить только то, что вы хотите в своем XML, а остальное выбросить
- ДОМ, который анализирует ваш файл с самого начала и позволяет вам захватывать все элементы более древовидным способом.
Другим очень полезным методом синтаксического анализа XML, хотя и немного более новым, чем эти, и включенным в JRE только начиная с Java6, является Штакс.StAX был задуман как промежуточный метод между древовидным подходом DOM и подходом SAX, основанным на событиях.Это очень похоже на SAX в том, что синтаксический анализ очень больших документов прост, но в этом случае приложение "извлекает" информацию из анализатора, вместо того, чтобы синтаксический анализ "подталкивал" события к приложению.Вы можете найти более подробное объяснение по этому вопросу здесь.
Итак, в зависимости от того, чего вы хотите достичь, вы можете использовать один из этих подходов.
Вы захотите использовать org.xml.sax.XMLReader
(http://docs.oracle.com/javase/7/docs/api/org/xml/sax/XMLReader.html).
Если вам нужно только выполнить синтаксический анализ, я бы рекомендовал использовать библиотеку XPath.Вот хорошая ссылка: http://www.ibm.com/developerworks/library/x-javaxpathapi.html
Но вы можете захотеть рассмотреть возможность преобразования XML-файлов в объекты, и тогда небо - это предел.Для этого вы можете использовать XStream - поток, это отличная библиотека, которой я часто пользуюсь
Используйте dom4j библиотека
Сначала прочтите документ
import java.net.URL;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;
public class Foo {
public Document parse(URL url) throws DocumentException {
SAXReader reader = new SAXReader();
Document document = reader.read(url);
return document;
}
}
Затем используйте XPATH, чтобы получить нужные вам значения
public void get_author(Document document) {
Node node = document.selectSingleNode( "//AppealRequestProcessRequest/author" );
String author = node.getText();
return author;
}
Ниже приведен код извлечения некоторого значения value с помощью vtd-xml.
import com.ximpleware.*;
public class extractValue{
public static void main(String s[]) throws VTDException, IOException{
VTDGen vg = new VTDGen();
if (!vg.parseFile("input.xml", false));
VTDNav vn = vg.getNav();
AutoPilot ap = new AutoPilot(vn);
ap.selectXPath("/aa/bb[name='k1']/value");
int i=0;
while ((i=ap.evalXPath())!=-1){
System.out.println(" value ===>"+vn.toString(i));
}
}
}