Domanda

Devo trovare un modo per trovare l'hash per i dati codificati base64 nel nodo XML //nota/risorsa/dati, o in qualche modo abbinarlo al valore hash nel nodo //note/content/en-note//en-media@hash

Vedi sotto per il file XML completo

Per favore suggerisci un modo per {ottenere|abbinare} utilizzando XSLT

4aaafc3e14314027bb1d89cf7d59a06c

{da|con}

R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==

Questo file XML di esempio è stato ovviamente ridotto per brevità/semplicità.L'attuale può contenere > 1 immagine per nota, quindi la necessità di ottenere/abbinare gli hash.

Il file XML:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE en-export SYSTEM "http://xml.evernote.com/pub/evernote-export.dtd">
<en-export export-date="20091029T063411Z" application="Evernote/Windows" version="3.0">

<note>
    <title>A title here</title>
    <content><![CDATA[
        <?xml version="1.0" encoding="UTF-8"?>
        <!DOCTYPE en-note SYSTEM "http://xml.evernote.com/pub/enml.dtd">
        <en-note bgcolor="#FFFFFF">
            <p>Some text here (followed by the picture)
            <p><en-media hash="4aaafc3e14314027bb1d89cf7d59a06c" type="image/gif" border="0" width="16" height="16" alt="A picture"/></p>
            <p>Some more text here (preceded by the picture)
        </en-note>
    ]]></content>
    <created>20090925T063154Z</created>
    <note-attributes>
        <author/>
    </note-attributes>
    <resource>
        <data encoding="base64">
R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==
        </data>
        <mime>image/gif</mime>
        <resource-attributes>
            <file-name>clip_image001.gif</file-name>
        </resource-attributes>
    </resource>
</note>

</en-export>

Soluzione implementata

Utilizzando il concetto della soluzione suggerita da Jackem.La differenza principale è che evito di creare la mia classe Java (e di creare una dipendenza extra).Eseguo l'elaborazione all'interno di XSLT, poiché è abbastanza semplice, solo riferimento dipendenze esterne fornite con le librerie Java di base.
La soluzione di Jackem è più corretto perché non perde lo zero iniziale in alcuni hash, tuttavia ho scoperto che era molto più semplice occuparsene altrove utilizzando un po' di hacking di base.

<xsl:stylesheet version="2.0" 
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    ...
    xmlns:md5="java.security.MessageDigest"
    xmlns:bigint="java.math.BigInteger"
    exclude-result-prefixes="md5 bigint">
...
<xsl:for-each select="resource">
    <xsl:variable name="md5inst" select="md5:getInstance('MD5')" />
    <xsl:value-of select="md5:update($md5inst, $b64bin)" />
    <xsl:variable name="imgmd5bytes" select="md5:digest($md5inst)" />
    <xsl:variable name="imgmd5bigint" select="bigint:new(1, $imgmd5bytes)" />
    <xsl:variable name="imgmd5str" select="bigint:toString($imgmd5bigint, 16)" />
    <!-- NOTE: $imgmd5str loses the leading zero from imgmd5bytes (if there is one) -->
</xsl:for-each>
...

PSVedere domanda tra fratelli per la mia implementazione del base64-->image file conversione


Questa domanda è una sottodomanda di un'altra domanda che ho fatto in precedenza.

È stato utile?

Soluzione

Per la tua domanda correlata sulla decodifica base64 in XSLT, hai accettato una risposta che utilizza estensioni Saxon e Java.Quindi presumo che tu sia d'accordo con l'utilizzo di quelli.

In tal caso, puoi creare un'estensione in Java per calcolare la somma MD5:

package com.stackoverflow.q1684963;

import java.math.BigInteger;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;

public class MD5Sum {
    public static String calc(byte[] data) throws NoSuchAlgorithmException {
        MessageDigest md5 = MessageDigest.getInstance("MD5");
        byte[] digest = md5.digest(data);
        BigInteger digestValue = new BigInteger(1, digest);
        return String.format("%032x", digestValue);
    } 
}

Dal tuo foglio di stile XSLT 2.0 che esegui con Saxon, puoi semplicemente chiamare quell'estensione.Supponendo che tu abbia già i dati decodificati base64 (ad esempio dall'estensione function saxon:base64Binary-to-octets come nella risposta collegata) in variabile data:

<xsl:value-of xmlns:md5sum="com.stackoverflow.q1684963.MD5Sum"
              select="md5sum:calc($data)"/>

Altri suggerimenti

  • Scarica alcuni decoder Base64 gratuiti come Questo oppure utilizza del codice sorgente dal Web per questo
  • Il file di output è some_file.gif, 268 byte, un'icona di cartella
  • Genera il checksum MD5 di quel file utilizzando md5sum o ancora qualche codice sorgente dal web

Uscita per me:

4aaafc3e14314027bb1d89cf7d59a06c

E' quello che volevi, vero?Sarà complicato (se non impossibile, e secondo me, sicuramente non ne vale la pena) fare tutto questo in XSLT, ma almeno ora hai l'informazione che questo hash è stato creato utilizzando MD5 sul file GIF.

IL 4aaaf... è l'MD5 dei dati binari che ottieni quando decodifichi i dati con codifica base64.Non penso che tu abbia altra scelta che decodificare il contenuto di <data> element ed eseguirlo tramite un'implementazione MD5, che ovviamente non rientra nell'ambito di una trasformazione XSL.Presumibilmente, il risultato dell'XSLT verrà elaborato da qualche altro codice, che può estrarre e verificare le immagini.

Che ne dici di questo (aggiungi commons-codec al tuo percorso di classe):

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
  xmlns:digest="org.apache.commons.codec.digest.DigestUtils">
  [...]
  <xsl:value-of select="digest:md5Hex('hello, world!')"/>
</xsl:stylesheet>
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top