XSLT: obtenção ou correspondência hashes para dados codificados Base64
-
18-09-2019 - |
Pergunta
Preciso encontrar uma maneira de encontrar uma maneira de encontrar o hash para os dados codificados base64 no nó xml // Note/Resource/Data, ou de alguma forma, corresponde ao valor do hash no nó // note/content/en-note // en-media@hash
Veja abaixo o arquivo XML completo
Por favor, sugira uma maneira de {obter | corresponder} Usando XSLT
4aaafc3e14314027bb1d89cf7d59a06c
{de | com}
R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==
Este arquivo XML de amostra foi obviamente aparado por brevidade/simplicidade. O real pode conter> 1 imagem por nota, portanto, a necessidade de obter/corresponder a hashes.
O arquivo XML:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE en-export SYSTEM "http://xml.evernote.com/pub/evernote-export.dtd">
<en-export export-date="20091029T063411Z" application="Evernote/Windows" version="3.0">
<note>
<title>A title here</title>
<content><![CDATA[
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE en-note SYSTEM "http://xml.evernote.com/pub/enml.dtd">
<en-note bgcolor="#FFFFFF">
<p>Some text here (followed by the picture)
<p><en-media hash="4aaafc3e14314027bb1d89cf7d59a06c" type="image/gif" border="0" width="16" height="16" alt="A picture"/></p>
<p>Some more text here (preceded by the picture)
</en-note>
]]></content>
<created>20090925T063154Z</created>
<note-attributes>
<author/>
</note-attributes>
<resource>
<data encoding="base64">
R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==
</data>
<mime>image/gif</mime>
<resource-attributes>
<file-name>clip_image001.gif</file-name>
</resource-attributes>
</resource>
</note>
</en-export>
Solução implementada
Usando o conceito de solução sugerida por Jackem. A principal diferença é que evito criar minha própria classe Java (e criar uma dependência extra). Eu faço o processamento dentro do XSLT, já que é direto o suficiente, apenas referência Dependências externas que acompanham as bibliotecas Java básicas.
A solução de Jackem é mais correto Porque não perde o zero principal em alguns hashes, no entanto, achei que era muito mais fácil cuidar disso em outros lugares usando hackery básico.
<xsl:stylesheet version="2.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
...
xmlns:md5="java.security.MessageDigest"
xmlns:bigint="java.math.BigInteger"
exclude-result-prefixes="md5 bigint">
...
<xsl:for-each select="resource">
<xsl:variable name="md5inst" select="md5:getInstance('MD5')" />
<xsl:value-of select="md5:update($md5inst, $b64bin)" />
<xsl:variable name="imgmd5bytes" select="md5:digest($md5inst)" />
<xsl:variable name="imgmd5bigint" select="bigint:new(1, $imgmd5bytes)" />
<xsl:variable name="imgmd5str" select="bigint:toString($imgmd5bigint, 16)" />
<!-- NOTE: $imgmd5str loses the leading zero from imgmd5bytes (if there is one) -->
</xsl:for-each>
...
Ps veja Pergunta entre irmãos para minha implementação do base64-->image file
conversão
Esta questão é uma subquestão de Outra pergunta que fiz anteriormente.
Solução
Para sua pergunta relacionada sobre fazer a decodificação base64 em xst, você tem aceitou uma resposta que usa extensões de saxão e java. Então, suponho que você esteja bem em usá -los.
Nesse caso, você pode criar uma extensão em Java para calcular a soma do MD5:
package com.stackoverflow.q1684963;
import java.math.BigInteger;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
public class MD5Sum {
public static String calc(byte[] data) throws NoSuchAlgorithmException {
MessageDigest md5 = MessageDigest.getInstance("MD5");
byte[] digest = md5.digest(data);
BigInteger digestValue = new BigInteger(1, digest);
return String.format("%032x", digestValue);
}
}
Na sua folha de estilo XSLT 2.0, que você executa com o Saxon, você pode chamar essa extensão. Supondo que você já tenha os dados decodificados base64 (por exemplo, da função de extensão saxon:base64Binary-to-octets
como na resposta vinculada) na variável data
:
<xsl:value-of xmlns:md5sum="com.stackoverflow.q1684963.MD5Sum"
select="md5sum:calc($data)"/>
Outras dicas
- Baixe algum decodificador Freeware Base64 como Este ou use algum código -fonte da web para isso
- O arquivo de saída é algum_file.gif, 268 bytes, um ícone de pasta
- Gerar a soma de verificação do MD5 desse arquivo usando md5sum ou novamente algum código -fonte da web
Saída para mim:
4aaafc3e14314027bb1d89cf7d59a06c
Isso é o que você queria, não é? Será complicado (se não for impossível, e se você me pedir, definitivamente não vale o esforço) para fazer tudo isso no XSLT, mas pelo menos agora você tem as informações de que esse hash foi criado usando o MD5 no arquivo GIF.
o 4aaaf...
é o MD5 dos dados binários que você obtém quando decodifica os dados codificados por Base64. Eu não acho que você tem escolha a não ser decodificar o conteúdo de <data>
elemento e execute -o através de uma implementação do MD5, que obviamente está fora do escopo de uma transformação XSL. Presumivelmente, o resultado do XSLT será processado por algum outro código, que pode extrair e verificar as imagens.
Que tal isso (adicione Commons-Codec para o seu caminho de classe):
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns:digest="org.apache.commons.codec.digest.DigestUtils">
[...]
<xsl:value-of select="digest:md5Hex('hello, world!')"/>
</xsl:stylesheet>