我正在使用.NET XmlReader打开XML文件并将文件保存在另一个文件名中,似乎DOCTYPE声明在两个文件之间发生了变化。虽然新保存的文件仍然是有效的XML,但我想知道为什么它坚持要更改原始标签。

Dim oXmlSettings As Xml.XmlReaderSettings = New Xml.XmlReaderSettings()
oXmlSettings.XmlResolver = Nothing
oXmlSettings.CheckCharacters = False
oXmlSettings.ProhibitDtd = False
oXmlSettings.IgnoreWhitespace = True

Dim oXmlDoc As XmlReader = XmlReader.Create(pathToOriginalXml, oXmlSettings)
Dim oDoc As XmlDocument = New XmlDocument()
oDoc.Load(oXmlDoc)
oDoc.Save(pathToNewXml)

以下(原始文件中):

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd">

成为(注意结尾处的[]字符):

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd"[]>
有帮助吗?

解决方案

该库可能会将DOCTYPE元素解析为内部结构,然后将结构转换回文本。它不存储原始字符串形式。

其他提示

设置XmlDocument.XmlResolver = null时,System.Xml中存在错误。解决方法是创建自定义XmlTextWriter:

    private class NullSubsetXmlTextWriter : XmlTextWriter
    {
        public NullSubsetXmlTextWriter(String inputFileName, Encoding encoding)
            : base(inputFileName, encoding)
        {
        }
        public override void WriteDocType(string name, string pubid, string sysid, string subset)
        {
            if (subset == String.Empty)
            {
                subset = null;
            }
            base.WriteDocType(name, pubid, sysid, subset);
        }
    }

在您的代码中,创建一个新的NullSubsetXmlTextWriter(pathToNewXml,Encoding.UTF8)并将该对象传递给oDoc.Save()方法。

以下是 Microsoft支持案例,您可以在其中阅读有关解决方法的信息(它描述了解决方法,但未提供代码)。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top