.NET XmlDocument: Perché DOCTYPE cambia dopo il salvataggio?
-
08-07-2019 - |
Domanda
Sto aprendo un file XML usando .NET XmlReader e salvando il file in un altro nome file e sembra che la dichiarazione DOCTYPE cambi tra i due file. Mentre il file appena salvato è ancora XML valido, mi chiedevo perché insistesse nel cambiare i tag originali.
Dim oXmlSettings As Xml.XmlReaderSettings = New Xml.XmlReaderSettings()
oXmlSettings.XmlResolver = Nothing
oXmlSettings.CheckCharacters = False
oXmlSettings.ProhibitDtd = False
oXmlSettings.IgnoreWhitespace = True
Dim oXmlDoc As XmlReader = XmlReader.Create(pathToOriginalXml, oXmlSettings)
Dim oDoc As XmlDocument = New XmlDocument()
oDoc.Load(oXmlDoc)
oDoc.Save(pathToNewXml)
Quanto segue (nel documento originale):
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd">
diventa (nota i caratteri [] alla fine):
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd"[]>
Soluzione
Probabilmente la libreria analizza l'elemento DOCTYPE in una struttura interna e quindi converte la struttura in testo. Non memorizza il modulo stringa originale.
Altri suggerimenti
C'è un bug in System.Xml quando si imposta XmlDocument.XmlResolver = null. La soluzione alternativa è creare un XmlTextWriter personalizzato:
private class NullSubsetXmlTextWriter : XmlTextWriter
{
public NullSubsetXmlTextWriter(String inputFileName, Encoding encoding)
: base(inputFileName, encoding)
{
}
public override void WriteDocType(string name, string pubid, string sysid, string subset)
{
if (subset == String.Empty)
{
subset = null;
}
base.WriteDocType(name, pubid, sysid, subset);
}
}
Nel tuo codice, crea un nuovo NullSubsetXmlTextWriter (pathToNewXml, Encoding.UTF8) e passa quell'oggetto al metodo oDoc.Save ().
Ecco il Microsoft caso di supporto dove puoi leggere la soluzione (descrive la soluzione ma non fornisce il codice).