我正在研究C#(基于Windows窗体)项目。它需要从XHTML文件中读取内容.XHTML文件存储在本地驱动器上而不是Web上。是否可以使用'HTMLAgilityPack.dll'读取XHTML页面的内容(没有标签)?如果没有,还有其他解决方案吗?
感谢; Mayuresh。
答案 0 :(得分:0)
是的,你可以。我正在使用该库,它工作正常。它公开了一个类似于.NET的System.Xml.XmlDocument类的API,显然除了所有内容都以Html为前缀。可以使用XPath查询HTML文档树,就像XML文档一样。
答案 1 :(得分:0)
如果文件保证是有效的XHTML(XML),那么我只使用System.Xml.XmlDocument
。
我似乎记得HtmlAgilityPack读取HTML文档并尽力使其成为XHTML。然后,您可以使用DOM处理文档,并使用XPath选择元素。