我想从网页上获取文字和数据。当页面加载在Web浏览器控件内完成时,我只想按页面元素ID从页面中提取文本? 请帮助我如何实现这一点,如html-agility& C#。 抱歉我的英语很差。
答案 0 :(得分:2)
您可以在GetElementbyId
上使用HtmlDocument
方法,它允许您通过其标识符检索某些特定的DOM元素:
string html = ... Read the HTML here
var htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.OptionFixNestedTags = true;
htmlDoc.LoadHtml(html);
var element = htmlDoc.GetElementbyId("someId");
if (element != null)
{
string data = element.InnerText;
}