如何使用C#访问特定的HTML元素?

时间:2011-02-19 04:52:37

标签: c# html dom

我有一个包含HTML的字符串,我需要能够访问特定元素以从中获取文本(该元素没有id或类或名称,因此正则表达式是不可能的。)

例如,假设我需要访问:“/ html / body / div / div [3] / div / table [0] / div / ul / li [12] / a /”。

我怎么能这样做?

1 个答案:

答案 0 :(得分:1)

如果HTML格式正确,您可以使用XmlDocument

解析HTML

正如Maxim提到的那样,HTML Agility Pack可能会做你需要的。

Here's a recent article from 4guysfromrolla使用HTML Agility Pack解析HTML