如何使用htmlAgilitypack从段落中抓取特定数据?

时间:2014-05-28 09:46:22

标签: c# html asp.net html-agility-pack

我使用htmlAgilityPack抓取数据并且工作正常。现在我必须从段落p标签中删除描述。和段落p标签包含如下所述的描述

<p>
 <small><i class="icon-user"></i>&nbsp;
  created by: created by: Roxy
 </small><br><br>
 its a very nice thing<br>
 it is very useful<br>
 you can get it very easily.                    
</p>

现在从这一段我只想要描述,但不想从小标签中获取包含,我也想避免空格和描述中的其他单词。 目前我用代码来获取它

string Description = pagecontent.SelectSingleNode("p").InnerText.Replace("\n", "").Replace("  ", "") and i got description like

&#34; &#34;&amp; nbsp&#34 ;;创建者:创建者:Roxy它非常好用,非常有用,你可以很容易地得到它。&#34;

但我只想要 &#34;这是一件非常好的事情。它非常有用。你可以很容易地得到它。&#34;

1 个答案:

答案 0 :(得分:0)

您可以尝试以下方法:

string Description =
    string.Join(
        "",
        pagecontent
            .SelectNodes("//p/text()")
            .Select(n => n.InnerText.Trim())
    );