如何从网页中提取数据?

时间:2014-01-01 10:37:51

标签: c# html-agility-pack

我想从网页上获取文字和数据。当页面加载在Web浏览器控件内完成时,我只想按页面元素ID从页面中提取文本? 请帮助我如何实现这一点,如html-agility& C#。 抱歉我的英语很差。

1 个答案:

答案 0 :(得分:2)

您可以在GetElementbyId上使用HtmlDocument方法,它允许您通过其标识符检索某些特定的DOM元素:

string html = ... Read the HTML here

var htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.OptionFixNestedTags = true;
htmlDoc.LoadHtml(html);

var element = htmlDoc.GetElementbyId("someId");
if (element != null)
{
    string data = element.InnerText;
}