从asp c#中获取<p>段的内容

时间:2018-01-27 15:51:07

标签: c# asp.net html-agility-pack

我想用以下代码从网页段落加载多行文本框:

// load page source 
var cli = new WebClient();
string rawdata = cli.DownloadString(urltxt.Text.Trim());

// get paragraph content and load in textbox
HtmlDocument document = new HtmlDocument();
document.LoadHtml(rawdata);

foreach (HtmlNode paragraph in document.DocumentNode.SelectNodes("//p"))
{
    string content = paragraph.InnerText;
    valuetxt.Text = "";
    valuetxt.Text = content;
}

我遇到的问题:此代码仅返回网页的最后一段,但我想要所有段落。谁能帮我?提前致谢。抱歉我的英语不好。

2 个答案:

答案 0 :(得分:4)

您应该在此使用StringBuilder以获得更好的效果。

HtmlDocument document = new HtmlDocument();
document.LoadHtml(rawdata);

StringBuilder sb = new StringBuilder();

foreach (HtmlNode paragraph in document.DocumentNode.SelectNodes("//p"))
{
    sb.Append(paragraph.InnerText);
}

valuetxt.Text = sb.ToString();

参考和解释:String Vs StringBuilder C#

这不只是让事情变得有效,而是完美地完成它!

答案 1 :(得分:2)

在循环中,您每次都会覆盖Text值。您需要在循环中构建内容,然后在其外部设置Text属性:

string content = "";

foreach (HtmlNode paragraph in document.DocumentNode.SelectNodes("//p"))
{
    content += paragraph.InnerText;
}

valuetxt.Text = content;