编辑像xml文件这样的html文件

时间:2010-08-26 04:48:27

标签: xslt xhtml xpath c#-3.0 xbrl

我需要将HTML文件转换为iXBRL格式。 iXBRL格式基本上是带有一些嵌入式节点的html或者包含在ixbrl标签下的html文件的一些信息。为此,我需要从HTML文件中搜索和删除一些节点,并在iXBRL标签下WRAP一些节点。

我无法使用XML DOM,因为它会在内容类型上发布异常。 .Net htmldocument类不支持删除节点并替换它们,我也看不到保存选项。

我尝试使用HTML Agility Pack但由于节点名称中的命名空间而无法找到节点,并且它没有任何选项来指定命名空间(.net中的行命名空间管理器)。

我可以在XPATH表达式中指定命名空间吗?怎么样?

任何人都可以帮助我使用.net或任何免费库编辑HTML(或XHTML)文件。

1 个答案:

答案 0 :(得分:0)

如果要将XPATH与命名空间一起使用,则只需要在节点前添加正确的命名空间。

如果您的命名空间如下所示:

xmlns:xbrli="http://www.xbrl.org/2003/instance"

你的元素是这样的:

<root>
<xbrli:elementname></xbrli:elementname>
<root>

然后你可以在XPATH中选择它们,如:

//xbrli:elementname