XSLT:获取或匹配哈希base64编码数据

https://stackoverflow.com/questions/1684963

18-09-2019
|

题

我需要找到一种方式找到一种方法，以找到哈希base64编码数据在XML节点 //note/resource/数据, ，或以某种方式以其他方式与之相匹配的散列值的节点 //note/content/en-note//en-媒体@哈希

看看下面的完整XML文件

请提出一种方法{获得|匹配} 使用XSLT

4aaafc3e14314027bb1d89cf7d59a06c

{从与}

R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==

这样XML文件具有明显的被整理为简洁起见/简单。实际可能包含>1图像每注意，因此需要获取/匹配的散列。

在XML文件：

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE en-export SYSTEM "http://xml.evernote.com/pub/evernote-export.dtd">
<en-export export-date="20091029T063411Z" application="Evernote/Windows" version="3.0">

<note>
    <title>A title here</title>
    <content><![CDATA[
        <?xml version="1.0" encoding="UTF-8"?>
        <!DOCTYPE en-note SYSTEM "http://xml.evernote.com/pub/enml.dtd">
        <en-note bgcolor="#FFFFFF">
            <p>Some text here (followed by the picture)
            <p><en-media hash="4aaafc3e14314027bb1d89cf7d59a06c" type="image/gif" border="0" width="16" height="16" alt="A picture"/></p>
            <p>Some more text here (preceded by the picture)
        </en-note>
    ]]></content>
    <created>20090925T063154Z</created>
    <note-attributes>
        <author/>
    </note-attributes>
    <resource>
        <data encoding="base64">
R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==
        </data>
        <mime>image/gif</mime>
        <resource-attributes>
            <file-name>clip_image001.gif</file-name>
        </resource-attributes>
    </resource>
</note>

</en-export>

实现解决方案

使用的概念的解决方案的建议 Jackem.主要差别是，我避免创造我自己的Java class(和创建一个额外的依赖).我不处理内XSLT，因为它直接向前足够的， 只有引用 外部依赖带来的基本Java库。
Jackem的解决方案是 更正确的 因为它不会失去领先在一些零散列，但是我发现它很容易采取这在其他地方使用li际基本的车呀.

<xsl:stylesheet version="2.0" 
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    ...
    xmlns:md5="java.security.MessageDigest"
    xmlns:bigint="java.math.BigInteger"
    exclude-result-prefixes="md5 bigint">
...
<xsl:for-each select="resource">
    <xsl:variable name="md5inst" select="md5:getInstance('MD5')" />
    <xsl:value-of select="md5:update($md5inst, $b64bin)" />
    <xsl:variable name="imgmd5bytes" select="md5:digest($md5inst)" />
    <xsl:variable name="imgmd5bigint" select="bigint:new(1, $imgmd5bytes)" />
    <xsl:variable name="imgmd5str" select="bigint:toString($imgmd5bigint, 16)" />
    <!-- NOTE: $imgmd5str loses the leading zero from imgmd5bytes (if there is one) -->
</xsl:for-each>
...

P.S.看看兄弟姐妹的问题对于我的执行情况的 base64-->image file 转换

这个问题是一个subquestion的另一个问题，我已要求以前.

解决方案

有关在XSLT做的base64解码您的相关问题，您可以的接受它使用撒克逊和Java扩展答案。所以，我认为你是使用那些确定。

在这种情况下，可以用于计算MD5和Java创建的扩展：

package com.stackoverflow.q1684963;

import java.math.BigInteger;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;

public class MD5Sum {
    public static String calc(byte[] data) throws NoSuchAlgorithmException {
        MessageDigest md5 = MessageDigest.getInstance("MD5");
        byte[] digest = md5.digest(data);
        BigInteger digestValue = new BigInteger(1, digest);
        return String.format("%032x", digestValue);
    } 
}

这是你与撒克逊运行XSLT 2.0样式表，然后你可以只呼叫该分机。假设已经具备的base64译码数据（例如，从扩展函数saxon:base64Binary-to-octets如在链接的回答）在可变data：

<xsl:value-of xmlns:md5sum="com.stackoverflow.q1684963.MD5Sum"
              select="md5sum:calc($data)"/>

其他提示

下载的一些免费Base64解码器喜欢这一个或者使用一些源码网络为这个
输出的文件some_file.gif,268字节，图标文件夹
产生MD5校验和该文件的使用 md5sum 再或者一些源码网

输对我来说：

4aaafc3e14314027bb1d89cf7d59a06c

这就是你想要的，不是吗？这将是棘手的(如果不是不可能的，而且如果你问我的话，绝对不值得的努力)的做所有这一切都在XSLT，但是至少你现在已经得到的信息，这一散列的创建使用MD5在GIF文件。

在4aaaf...是二进制数据时，解码base64编码数据你得到的MD5。我不认为你有什么选择，只能<data>元素的内容进行解码，并通过MD5实现，这显然是一个XSL转换的范围之外运行。据推测，XSLT的结果将通过一些其他的代码，其可以提取和验证的图像被处理。

这个如何（添加公地编解码器到classpath中）：

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
  xmlns:digest="org.apache.commons.codec.digest.DigestUtils">
  [...]
  <xsl:value-of select="digest:md5Hex('hello, world!')"/>
</xsl:stylesheet>

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow