HtmlAgilityPack Div类包含String

时间:2012-07-10 11:30:53

标签: html-agility-pack

我正在尝试从网页中删除文章文字。我发现文章总是被div标签包围。不幸的是,这些div标签的类别对于每个网页略有不同。我研究了使用XPath,但由于不同的类名,我认为它不会起作用。有没有办法可以获得所有div标签,然后获得课程?

实施例

<div class="entry_single">
  <p>I recently traveled without my notebook for the first time in ages.</p>
</div>

<div class="entry-content-pagination">
  <p>Ward 9 Ald. Steven Dove</p>
</div>

1 个答案:

答案 0 :(得分:0)

使用Linq会更容易。

foreach(HtmlNode div in doc.DocumentNode.Descendants("div"))
{
    string className = div.GetAttributeValue("class", string.Empty);
    // do something with class name
}