有没有办法获取网页查看源内容?

时间:2014-09-04 11:14:12

标签: c# .net winforms

我无法下载页面内容并将其另存为文件名或字符串变量。 但我可以在Chrome中看到页面来源。

无论如何你是下载还是以某种方式得到了综合浏览源?

例如,这是网站的来源:view-source:http://www.one.co.il/ 但它始于view-source

如果我正在做其中一个即时异常(403)禁止

using (var webClient = new WebClient())
            {
                data = webClient.DownloadString("httP://www.one.co.il");
                //webClient.DownloadFile("http://www.one.co.il", @"c:\temp\tempppp.html");
            }

所以我尝试了类似的东西:

data = webClient.DownloadString(“view-source:http://www.one.co.il”);

但是这给了我一个例外我觉得view-source不如参数好。

无论如何,每隔X分钟获取一次视图源内容(比如刷新并每X分钟获取一次)?

1 个答案:

答案 0 :(得分:0)

是的,它可能被称为浏览器自动化。

有几种非常好的方法可以做到这一点。我个人更喜欢Selenium。

var defaultamount = 10;
var url = "http://www.one.co.il";
string Result;
using (var driver = new FirefoxDriver())
{
    driver.Manage().Timeouts().ImplicitlyWait(defaultamount);
    _wait = new WebDriverWait(driver, defaultamount);
    driver.Navigate().GoToUrl(url);
    Result = driver.PageSource;
}

这意味着您将加载内容,但最多等待10秒。或者,您可以等待加载Javascript DOM或者您基本上想要的东西。由于启用了Ajax的Web内容,因此不容易确定是否加载了您想要的内容。

请注意,如果您不想将其关闭,也可以直观地打开Web浏览器。