如何在 C# 3.5 中流式读取大型 XML 文件
题
如何对根元素下方包含 xs:sequence 的大型 XML 文件进行流式读取,而不将整个文件加载到内存中的 XDocument 实例中?
解决方案
使用 SAX 风格的元素解析器和 Xml文本阅读器 创建的类 XmlReader.Create 是个好主意,是的。这是一个稍微修改过的代码示例 代码大师:
void ParseURL(string strUrl)
{
try
{
using (var reader = XmlReader.Create(strUrl))
{
while (reader.Read())
{
switch (reader.NodeType)
{
case XmlNodeType.Element:
var attributes = new Hashtable();
var strURI = reader.NamespaceURI;
var strName = reader.Name;
if (reader.HasAttributes)
{
for (int i = 0; i < reader.AttributeCount; i++)
{
reader.MoveToAttribute(i);
attributes.Add(reader.Name,reader.Value);
}
}
StartElement(strURI,strName,strName,attributes);
break;
//
//you can handle other cases here
//
//case XmlNodeType.EndElement:
// Todo
//case XmlNodeType.Text:
// Todo
default:
break;
}
}
}
catch (XmlException e)
{
Console.WriteLine("error occured: " + e.Message);
}
}
}
}
其他提示
我无法添加评论,因为我刚刚注册,但 Hirvox 发布的代码示例(当前选择作为答案)中有一个错误。它不应该有 new
使用静态时的声明 Create
方法。
当前的:
using (var reader = new XmlReader.Create(strUrl))
固定的:
using (var reader = XmlReader.Create(strUrl))
我认为如果你想使用对象模型(即XElement\XDocument) 来查询 XML。显然,如果没有读取足够的数据,就无法构建 XML 对象树。不过你可以使用 Xml阅读器 班级。
XMLReader类从流或文件读取XML数据。它提供对XML数据的非疫苗,仅读书,仅读取的访问。
这是一个操作方法: http://support.microsoft.com/kb/301228/en-us 请记住,您不应使用 XmlTextReader,而应将 XmlReader 与 XmlReader.Create 结合使用
我对“xs:sequence”的提及感到困惑——这是一个 XML 架构元素。
您是否正在尝试打开大型 XML 架构文件?您是否打开了一个基于该架构的大型 XML 文件?或者您是否正在尝试打开一个大型 XML 文件并同时验证它?
这些情况都不会给您使用标准 XmlReader(或 XmlValidatingReader)带来问题。
使用 XMLReader 读取 XML: http://msdn.microsoft.com/en-us/library/9d83k261(VS.80).aspx
该代码示例尝试将 XmlReader 样式代码转换为 SAX 样式代码 - 如果您从头开始编写代码,我只会按预期使用 XmlReader - 拉而不是推送。