c#使用XPathDocument解析html

时间:2010-10-15 07:18:52

标签: c# xpath html-parsing

我正在尝试用XPathDocument解析一个html页面,但是给出了错误'因为html不是一个xml ... 有没有办法做到这一点?

2 个答案:

答案 0 :(得分:7)

应该使用HtmlAgilityPack。仍然是最好的!

答案 1 :(得分:2)

使用类似Html Agility Pack的东西,它可以将你的html加载到一个DOM对象中,可以通过xpath查询遍历它。

除非你的html实际上是xhtml,否则它通常不是一个有正确的开放和结束节点标签的有效xml结构。