C#分析html文档

时间:2014-10-13 13:20:07

标签: c# html

我正在使用C#进行编程,我需要分析一个html页面并在<div class="weak-block full"></div>之间返回文本,但是在这两个&#34;键之间&#34;还有更多&#34; </div>&#34;。在这种情况下,我无法设置它以获得&#34; <div class="weak-block full">&#34;之间的代码。和&#34; </div>&#34;因为它会在第一个</div>出现时停止阅读。

如何在这两者之间获取文字?

1 个答案:

答案 0 :(得分:3)

尝试HtmlAgilityPack

HtmlDocument html = new HtmlDocument();
html.LoadHtml(yourHtml);

HtmlNode node = doc.DocumentNode.SelectSingleNode("//div[@class='weak-block full']");

//use node.InnerHtml to get what you need