我正在尝试获取网页的最终来源。我正在使用webclient openRead方法,但此方法仅返回初始页面源。在源下载之后,有一个javascript运行并以不同的格式收集我需要的数据,我的方法将寻找完全改变的东西。 我所说的与以下区别完全相同:
查看此网站以了解我在说什么:http://www.augsburg.edu/history/fac_listing.html并观看使用每个选项如何显示任何电子邮件。我认为发生的事情是第一个会显示页面的初始加载。第二个将显示最终页面html。 webclient只允许我选择#1。
这里是只返回选项#1的代码。哦,我需要从控制台应用程序执行此操作。谢谢!
private static string GetReader(string site)
{
WebClient client = new WebClient();
try
{
data = client.OpenRead(site);
reader = new StreamReader(data);
}
catch
{
return "";
}
return reader.ReadToEnd();
}
答案 0 :(得分:0)
我找到了解决问题的方法。 我最终使用了Selenium-WebDriver PageSource属性。它运作得很漂亮!
了解Selenium和Webdriver。这是一件容易学习的事情。它有助于测试和实现这一点!