访问网站#document中的内容

时间:2017-05-09 06:54:01

标签: c# html wpf dom

我想使用C#访问网页的内容。内容位于网站正文的i-Frame内,位于#document对象的基础之上。我用这个来阅读页面:

WebClient wbClient = new WebClient();
wbClient.UseDefaultCredentials = true;
byte[] raw = wbClient.DownloadData(stWebPage);
stWebPageContent = System.Text.Encoding.UTF8.GetString(raw);

但是,#document内的相关信息将被忽略。

有人可以解释我必须做什么来获取所需的信息吗?它嵌套在body/div/iframe/#document/html/body/div/.....谢谢!

1 个答案:

答案 0 :(得分:0)

注意:我假设stWebPage指向一个http网址。

iFrame内容不会直接在这一个电话中下载。您需要使用stWebPageContentRegex中查找iFrame并在' src'中提取值。属性,再次调用src url下载内容。有关详细信息,请参阅此link