使用HTMLAgilityPack.dll读取XHTML文件

时间:2012-06-04 14:27:25

标签: c# html-agility-pack

我正在研究C#(基于Windows窗体)项目。它需要从XHTML文件中读取内容.XHTML文件存储在本地驱动器上而不是Web上。是否可以使用'HTMLAgilityPack.dll'读取XHTML页面的内容(没有标签)?如果没有,还有其他解决方案吗?

感谢; Mayuresh。

2 个答案:

答案 0 :(得分:0)

是的,你可以。我正在使用该库,它工作正常。它公开了一个类似于.NET的System.Xml.XmlDocument类的API,显然除了所有内容都以Html为前缀。可以使用XPath查询HTML文档树,就像XML文档一样。

答案 1 :(得分:0)

如果文件保证是有效的XHTML(XML),那么我只使用System.Xml.XmlDocument

我似乎记得HtmlAgilityPack读取HTML文档并尽力使其成为XHTML。然后,您可以使用DOM处理文档,并使用XPath选择元素。