
¿Cuál es la mejor manera de ir sobre hash un documento XML en C #? Me gustaría para discutir un documento XML para que pueda saber si se ha cambiado manualmente desde el momento en que se generó. No estoy usando esto para la seguridad -. Que está bien si alguien cambia el XML, y cambia el hash para que coincida

Por ejemplo, me gustaría hash los nodos secundarios de la raíz y almacenar el hash como un atributo de la raíz:

<RootNode Hash="abc123">
    <!-- Content to hash here -->
que implementan la XML digital de la firma de especificaciones . La firma puede ser añadido dentro del documento XML original (es decir, una "firma envuelto") o almacena / transferido por separado.

Puede ser un poco exagerado, ya que no es necesario la seguridad, pero tiene la ventaja de estar ya en marcha, y al ser un estándar que no depende de un lenguaje o plataforma.

Otros consejos

Puede utilizar el espacio de nombres de la criptografía:

System.Security.Cryptography.MACTripleDES hash = new System.Security.Cryptography.MACTripleDES(Encoding.Default.GetBytes("mykey"));
string hashString = Convert.ToBase64String(hash.ComputeHash(Encoding.Default.GetBytes(myXMLString)));

Sólo tiene que utilizar una clave para crear el criptógrafo hash y luego crear un hash con la reqpresentation cadena de código XML.

Agregue una referencia a System.Security .NET, y utilizar XmlDsigC14NTransform. He aquí un ejemplo ...


    Of course is cannot detect these are the same...

       <color>black</color>    vs.   <color>rgb(0,0,0)</color>

    ...because that's dependent on app logic's interpretation of XML data.

    But otherwise it gets the following right...
    •Normalization of whitespace in start and end tags
    •Lexicographic ordering of namespace and attribute
    •Empty element conversion to start-end tag pair 
    •Retain all whitespace between tags

    And more.
public static string XmlHash(XmlDocument myDoc)
    var t = new System.Security.Cryptography.Xml.XmlDsigC14NTransform();
    var s = (Stream)t.GetOutput(typeof(Stream));
    var sha1 = SHA1.Create();

    var hash = sha1.ComputeHash(s);
    var base64String = Convert.ToBase64String(hash);
    return base64String;

Recientemente tuve que aplicar un hash "suma de comprobación" para documentos XML parciales en el trabajo (usamos XElement). pruebas de rendimiento rudimentarios mostraron ~ 3 veces más veloz tiempo de ejecución en mi máquina cuando se utiliza una tabla de consulta para crear el hash cadena hexadecimal, en comparación con el exterior.

Aquí está mi aplicación:

using System.Xml.Linq;
using System.Security.Cryptography;
using System.Text;
using System.Linq;

/// <summary>
/// Provides a way to easily compute SHA256 hash strings for XML objects.
/// </summary>
public static class XMLHashUtils
    /// <summary>
    /// Precompute a hexadecimal lookup table for runtime performance gain, at the cost of memory and startup performance loss.
    /// SOURCE:
    /// </summary>
    static readonly string[] hexLookupTable = Enumerable.Range(0, 256).Select(integer => integer.ToString("x2")).ToArray();

    static readonly SHA256Managed sha256 = new SHA256Managed();

    /// <summary>
    /// Computes a SHA256 hash string from an XElement and its children.
    /// </summary>
    public static string Hash(XElement xml)
        string xmlString = xml.ToString(SaveOptions.DisableFormatting); // Outputs XML as single line
        return Hash(xmlString);

    /// <summary>
    /// Computes a SHA256 hash string from a string.
    /// </summary>
    static string Hash(string stringValue)
        byte[] hashBytes = sha256.ComputeHash(Encoding.UTF8.GetBytes(stringValue));
        return BytesToHexString(hashBytes);

    /// <summary>
    /// Converts a byte array to a hexadecimal string using a lookup table.
    /// </summary>
    static string BytesToHexString(byte[] bytes)
        int length = bytes.Length;
        StringBuilder sb = new StringBuilder(length * 2); // Capacity fits hash string length
        for (var i = 0; i < length; i++)
            sb.Append(hexLookupTable[bytes[i]]); // Using lookup table for faster runtime conversion
        return sb.ToString();

Y aquí hay un par de pruebas unitarias para él (utilizando el marco NUnit):

using NUnit.Framework;
using System.Linq;
using System.Xml.Linq;

public class XMLHashUtilsTest
    /// <summary>
    /// Outputs XML: <root><child attribute="value" /></root>
    /// where <child /> node repeats according to childCount
    /// </summary>
    XElement CreateXML(int childCount)
        return new XElement("root", Enumerable.Repeat(new XElement("child", new XAttribute("attribute", "value")), childCount));

    public void HashIsDeterministic([Values(0,1,10)] int childCount)
        var xml = CreateXML(childCount);
        Assert.AreEqual(XMLHashUtils.Hash(xml), XMLHashUtils.Hash(xml));

    public void HashChanges_WhenChildrenAreDifferent([Values(0,1,10)] int childCount)
        var xml1 = CreateXML(childCount);
        var xml2 = CreateXML(childCount + 1);
        Assert.AreNotEqual(XMLHashUtils.Hash(xml1), XMLHashUtils.Hash(xml2));

    public void HashChanges_WhenRootNameIsDifferent([Values("A","B","C")]string nameSuffix)
        var xml1 = CreateXML(1);
        var xml2 = CreateXML(1);
        xml2.Name = xml2.Name + nameSuffix;
        Assert.AreNotEqual(XMLHashUtils.Hash(xml1), XMLHashUtils.Hash(xml2));

    public void HashChanges_WhenRootAttributesAreDifferent([Values("A","B","C")]string attributeName)
        var xml1 = CreateXML(1);
        var xml2 = CreateXML(1);
        xml2.Add(new XAttribute(attributeName, "value"));
        Assert.AreNotEqual(XMLHashUtils.Hash(xml1), XMLHashUtils.Hash(xml2));
