.NET XmlDocument:저장 후 DOCTYPE이 변경되는 이유는 무엇입니까?
-
08-07-2019 - |
문제
.NET XmlReader를 사용하여 XML 파일을 열고 파일을 다른 파일 이름으로 저장하고 있는데 두 파일 간에 DOCTYPE 선언이 변경되는 것 같습니다.새로 저장된 파일은 여전히 유효한 XML인데 왜 원본 태그 변경을 고집하는지 궁금했습니다.
Dim oXmlSettings As Xml.XmlReaderSettings = New Xml.XmlReaderSettings()
oXmlSettings.XmlResolver = Nothing
oXmlSettings.CheckCharacters = False
oXmlSettings.ProhibitDtd = False
oXmlSettings.IgnoreWhitespace = True
Dim oXmlDoc As XmlReader = XmlReader.Create(pathToOriginalXml, oXmlSettings)
Dim oDoc As XmlDocument = New XmlDocument()
oDoc.Load(oXmlDoc)
oDoc.Save(pathToNewXml)
다음(원본 문서):
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd">
(끝에 [ ] 문자가 있음):
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd"[]>
해결책
아마도 라이브러리는 DOCTYPE 요소를 내부 구조로 구문 분석한 다음 구조를 다시 텍스트로 변환합니다.원래 문자열 형식을 저장하지 않습니다.
다른 팁
XmlDocument.XmlResolver = null을 설정하면 System.Xml에 버그가 있습니다.해결 방법은 사용자 지정 XmlTextWriter를 만드는 것입니다.
private class NullSubsetXmlTextWriter : XmlTextWriter
{
public NullSubsetXmlTextWriter(String inputFileName, Encoding encoding)
: base(inputFileName, encoding)
{
}
public override void WriteDocType(string name, string pubid, string sysid, string subset)
{
if (subset == String.Empty)
{
subset = null;
}
base.WriteDocType(name, pubid, sysid, subset);
}
}
코드에서 새 NullSubsetXmlTextWriter(pathToNewXml, Encoding.UTF8)를 만들고 해당 개체를 oDoc.Save() 메서드에 전달합니다.
여기는 Microsoft 지원 사례 해결 방법에 대해 읽을 수 있는 곳입니다(해결 방법을 설명하지만 코드는 제공하지 않음).
제휴하지 않습니다 StackOverflow