XSLT: получение или сопоставление хэшей для кодированных данных BASE64

StackOverflow https://stackoverflow.com/questions/1684963

Вопрос

Мне нужно найти способ найти способ найти хэш для кодируемых данных Base64 в узле XML // Примечание/Ресурс/Данные, или каким -то образом иным образом сопоставить его со значением хэша в узле // note/content/en-note // en-media@hash

См. Ниже для полного XML -файла

Пожалуйста, предложите способ {получить | Match} Используя XSLT

4aaafc3e14314027bb1d89cf7d59a06c

{от | с}

R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==

Этот образец XML -файла, очевидно, был обрезан для краткости/простоты. Фактическое может содержать> 1 изображение на примечание, поэтому необходимость получить/сопоставить хэши.

XML -файл:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE en-export SYSTEM "http://xml.evernote.com/pub/evernote-export.dtd">
<en-export export-date="20091029T063411Z" application="Evernote/Windows" version="3.0">

<note>
    <title>A title here</title>
    <content><![CDATA[
        <?xml version="1.0" encoding="UTF-8"?>
        <!DOCTYPE en-note SYSTEM "http://xml.evernote.com/pub/enml.dtd">
        <en-note bgcolor="#FFFFFF">
            <p>Some text here (followed by the picture)
            <p><en-media hash="4aaafc3e14314027bb1d89cf7d59a06c" type="image/gif" border="0" width="16" height="16" alt="A picture"/></p>
            <p>Some more text here (preceded by the picture)
        </en-note>
    ]]></content>
    <created>20090925T063154Z</created>
    <note-attributes>
        <author/>
    </note-attributes>
    <resource>
        <data encoding="base64">
R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==
        </data>
        <mime>image/gif</mime>
        <resource-attributes>
            <file-name>clip_image001.gif</file-name>
        </resource-attributes>
    </resource>
</note>

</en-export>

Реализованное решение

Используя концепцию решения, предложенного Джекем. Анкет Основное отличие заключается в том, что я избегаю создания собственного класса Java (и создания дополнительной зависимости). Я делаю обработку в XSLT, так как она достаточно прямолинейна, только ссылки Внешние зависимости, которые поставляются с основными библиотеками Java.
Решение Джека Правильнее Поскольку он не теряет ведущего ноля в некоторых хэше, однако я обнаружил, что об этом было гораздо легче позаботиться об этом в другом месте, используя Li'l Basic Hackery.

<xsl:stylesheet version="2.0" 
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    ...
    xmlns:md5="java.security.MessageDigest"
    xmlns:bigint="java.math.BigInteger"
    exclude-result-prefixes="md5 bigint">
...
<xsl:for-each select="resource">
    <xsl:variable name="md5inst" select="md5:getInstance('MD5')" />
    <xsl:value-of select="md5:update($md5inst, $b64bin)" />
    <xsl:variable name="imgmd5bytes" select="md5:digest($md5inst)" />
    <xsl:variable name="imgmd5bigint" select="bigint:new(1, $imgmd5bytes)" />
    <xsl:variable name="imgmd5str" select="bigint:toString($imgmd5bigint, 16)" />
    <!-- NOTE: $imgmd5str loses the leading zero from imgmd5bytes (if there is one) -->
</xsl:for-each>
...

PS См Вопрос брата для моей реализации base64-->image file обращение


Этот вопрос является подводом Еще один вопрос, который я задал ранее.

Это было полезно?

Решение

Для вашего связанного вопроса о декодировании BASE64 в XSLT у вас есть принял ответ который использует саксонские и Java расширения. Поэтому я предполагаю, что вы в порядке с использованием их.

В этом случае вы можете создать расширение в Java для вычисления суммы MD5:

package com.stackoverflow.q1684963;

import java.math.BigInteger;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;

public class MD5Sum {
    public static String calc(byte[] data) throws NoSuchAlgorithmException {
        MessageDigest md5 = MessageDigest.getInstance("MD5");
        byte[] digest = md5.digest(data);
        BigInteger digestValue = new BigInteger(1, digest);
        return String.format("%032x", digestValue);
    } 
}

Из вашей таблицы стилей XSLT 2.0, которую вы запускаете с саксоном, вы можете просто назвать это расширение. Предполагая, что у вас уже есть данные по декорации Base64 (например, из функции расширения saxon:base64Binary-to-octets как в связанном ответе) в переменной data:

<xsl:value-of xmlns:md5sum="com.stackoverflow.q1684963.MD5Sum"
              select="md5sum:calc($data)"/>

Другие советы

  • Загрузите бесплатный Decoder Base64 Like Вот этот или используйте какой -то исходный код из Интернета для этого
  • Выходной файл some_file.gif, 268 байт, значок папки
  • Генерировать контрольную сумму MD5 этого файла, используя MD5Sum или снова какой -то исходный код из Интернета

Вывод для меня:

4aaafc3e14314027bb1d89cf7d59a06c

Это то, что ты хотел, не так ли? Это будет сложно (если не невозможно, и если вы спросите меня, определенно не стоит усилий) делать все это в XSLT, но, по крайней мере, теперь у вас есть информация, что этот хэш был создан с использованием MD5 в файле GIF.

А 4aaaf... Является ли MD5 двоичных данных, которые вы получаете, когда декодируете данные, кодируемые BASE64. Я не думаю, что у вас есть выбор, кроме как декодировать содержимое <data> Элемент и запустите его через реализацию MD5, которая, очевидно, выходит за рамки преобразования XSL. Предположительно, результат XSLT будет обработан некоторым другим кодом, который может извлекать и проверять изображения.

Как насчет этого (добавить Commons-Codec к вашему классу):

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
  xmlns:digest="org.apache.commons.codec.digest.DigestUtils">
  [...]
  <xsl:value-of select="digest:md5Hex('hello, world!')"/>
</xsl:stylesheet>
Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top