asp.net C#获取网页的最终页面源

时间:2012-02-21 17:30:43

标签: c# webclient

我正在尝试获取网页的最终来源。我正在使用webclient openRead方法,但此方法仅返回初始页面源。在源下载之后,有一个javascript运行并以不同的格式收集我需要的数据,我的方法将寻找完全改变的东西。 我所说的与以下区别完全相同:

  1. 右键点击网页 - >选择查看源
  2. 访问开发者工具
  3. 查看此网站以了解我在说什么:http://www.augsburg.edu/history/fac_listing.html并观看使用每个选项如何显示任何电子邮件。我认为发生的事情是第一个会显示页面的初始加载。第二个将显示最终页面html。 webclient只允许我选择#1。

    这里是只返回选项#1的代码。哦,我需要从控制台应用程序执行此操作。谢谢!

    private static string GetReader(string site)
    {
        WebClient client = new WebClient();
        try
        {
            data = client.OpenRead(site);
            reader = new StreamReader(data);
        }
        catch
        {
            return "";
        }
        return reader.ReadToEnd();
    }
    

1 个答案:

答案 0 :(得分:0)

我找到了解决问题的方法。 我最终使用了Selenium-WebDriver PageSource属性。它运作得很漂亮!

了解Selenium和Webdriver。这是一件容易学习的事情。它有助于测试和实现这一点!