应用错误收集

使用HTMLAgilityPack.dll读取XHTML文件

时间：2012-06-04 14:27:25

标签： c# html-agility-pack

我正在研究C＃（基于Windows窗体）项目。它需要从XHTML文件中读取内容.XHTML文件存储在本地驱动器上而不是Web上。是否可以使用'HTMLAgilityPack.dll'读取XHTML页面的内容（没有标签）？如果没有，还有其他解决方案吗？

感谢; Mayuresh。

2 个答案:

答案 0 :(得分：0)

是的，你可以。我正在使用该库，它工作正常。它公开了一个类似于.NET的System.Xml.XmlDocument类的API，显然除了所有内容都以Html为前缀。可以使用XPath查询HTML文档树，就像XML文档一样。

答案 1 :(得分：0)

如果文件保证是有效的XHTML（XML），那么我只使用System.Xml.XmlDocument。

我似乎记得HtmlAgilityPack读取HTML文档并尽力使其成为XHTML。然后，您可以使用DOM处理文档，并使用XPath选择元素。