我有一个包含HTML的字符串,我需要能够访问特定元素以从中获取文本(该元素没有id或类或名称,因此正则表达式是不可能的。)
例如,假设我需要访问:“/ html / body / div / div [3] / div / table [0] / div / ul / li [12] / a /”。
我怎么能这样做?
答案 0 :(得分:1)
如果HTML格式正确,您可以使用XmlDocument
解析HTML正如Maxim提到的那样,HTML Agility Pack可能会做你需要的。
Here's a recent article from 4guysfromrolla使用HTML Agility Pack解析HTML