Как каникулизировать объект STAX XML
-
03-10-2019 - |
Вопрос
Я хочу каницировать объект Stax, программа это делает его с DOM, но DOM не может управлять большими документами XML (например, 1 ГБ), поэтому STAX это решение.
Код, который у меня есть:
File file=new File("big-1gb.xml");
org.apache.xml.security.Init.init();
DocumentBuilderFactory dfactory = DocumentBuilderFactory.newInstance();
DocumentBuilder documentBuilder = dfactory.newDocumentBuilder();
Document doc = documentBuilder.parse(file);
Canonicalizer c14n = Canonicalizer.getInstance("http://www.w3.org/TR/2001/REC-xml-c14n-20010315");
outputBytes = c14n.canonicalizeSubtree(doc.getElementsByTagName("SomeTag").item(0));
Идея, что это делает код ниже со Stax ...
Спасибо :)
Решение
Я решаю эту проблему с библиотекой xom, вот эквивалентный код.
ByteArrayOutputStream bytestream = new ByteArrayOutputStream();
ObjectOutputStream outputstream = new ObjectOutputStream(bytestream);
nu.xom.Builder builder = new nu.xom.Builder(false, new nu.xom.samples.MinimalNodeFactory()); //The false parameter is for avoid a ValidationException that trows XOM
try {
nu.xom.canonical.Canonicalizer outputter = new nu.xom.canonical.Canonicalizer(outputstream);
nu.xom.Document input = builder.build(file);
outputter.write(input);
}
catch (Exception ex) {
System.err.println(ex);
ex.printStackTrace();
}
outputstream.close();
MessageDigest sha1 = MessageDigest.getInstance("SHA1");
sha1.reset();
sha1.update(java.nio.ByteBuffer.wrap(bytestream.toByteArray()));
salidasha1=sha1.digest();
String tagDigestValue=new String(Base64.encodeBase64(salidasha1));
Этот код может управлять файлами 200 МБ и занять 7 минут, чтобы выполнить канонизацию, если у вас есть сомнения, см. Документацию XOM, это довольно ясно и много примеров.
Thx для всех для ваших комментариев :)
Не связан с StackOverflow