像XML文件一样编辑HTML文件
题
我需要将HTML文件转换为IXBRL格式。 IXBRL格式基本上是HTML,具有一些嵌入式节点或包裹在IXBRL标签下的HTML文件的一些信息。为此,我需要从HTML文件中搜索和删除一些节点,并在IXBRL标签下包含一些节点。
我无法使用XML DOM,因为它在内容类型上拍摄了例外。 .NET htmldocument类不支持删除节点并替换它们,我都看不到保存选项。
我尝试使用HTML敏捷包,但是由于节点名称中的名称空间,它找不到节点,并且没有任何选项可以指定名称空间(.NET中的Line namespace Manager)。
我可以在XPath表达式中指定名称空间吗?如何?
任何人都可以帮助我使用.NET或任何免费库来编辑HTML(或XHTML)文件。
解决方案
如果要将XPATH与名称空间一起使用,则只需将节点带有正确的名称空间即可。
如果您的名称空间看起来像这样:
xmlns:xbrli="http://www.xbrl.org/2003/instance"
您的元素就是这样:
<root>
<xbrli:elementname></xbrli:elementname>
<root>
然后,您可以在XPath中选择它们,例如:
//xbrli:elementname
不隶属于 StackOverflow