我想从简单的网站上删除一系列事实。每个事实都包含在<li>
标记中。我如何使用Html Agility Pack执行此操作?有更好的方法吗?
<li>
标签中包含的唯一内容是事实而非其他内容。
答案 0 :(得分:6)
类似的东西:
List<string> facts = new List<string>();
foreach (HtmlNode li in doc.DocumentNode.SelectNodes("//li")) {
facts.Add(li.InnerText);
}