我想使用C#访问网页的内容。内容位于网站正文的i-Frame内,位于#document
对象的基础之上。我用这个来阅读页面:
WebClient wbClient = new WebClient();
wbClient.UseDefaultCredentials = true;
byte[] raw = wbClient.DownloadData(stWebPage);
stWebPageContent = System.Text.Encoding.UTF8.GetString(raw);
但是,#document
内的相关信息将被忽略。
有人可以解释我必须做什么来获取所需的信息吗?它嵌套在body/div/iframe/#document/html/body/div/.....
谢谢!
答案 0 :(得分:0)
注意:我假设stWebPage
指向一个http网址。
iFrame内容不会直接在这一个电话中下载。您需要使用stWebPageContent
在Regex
中查找iFrame并在' src'中提取值。属性,再次调用src url下载内容。有关详细信息,请参阅此link。