Question

我无法下载页面内容并将其另存为文件名或字符串变量。但我可以在Chrome中看到页面来源。

无论如何你是下载还是以某种方式得到了综合浏览源？

例如，这是网站的来源：view-source：http://www.one.co.il/ 但它始于view-source

如果我正在做其中一个即时异常（403）禁止

using (var webClient = new WebClient())
            {
                data = webClient.DownloadString("httP://www.one.co.il");
                //webClient.DownloadFile("http://www.one.co.il", @"c:\temp\tempppp.html");
            }

所以我尝试了类似的东西：

data = webClient.DownloadString（“view-source：http://www.one.co.il”）;

但是这给了我一个例外我觉得view-source不如参数好。

无论如何，每隔X分钟获取一次视图源内容（比如刷新并每X分钟获取一次）？

Answer 1

是的，它可能被称为浏览器自动化。

有几种非常好的方法可以做到这一点。我个人更喜欢Selenium。

var defaultamount = 10;
var url = "http://www.one.co.il";
string Result;
using (var driver = new FirefoxDriver())
{
    driver.Manage().Timeouts().ImplicitlyWait(defaultamount);
    _wait = new WebDriverWait(driver, defaultamount);
    driver.Navigate().GoToUrl(url);
    Result = driver.PageSource;
}

这意味着您将加载内容，但最多等待10秒。或者，您可以等待加载Javascript DOM或者您基本上想要的东西。由于启用了Ajax的Web内容，因此不容易确定是否加载了您想要的内容。

请注意，如果您不想将其关闭，也可以直观地打开Web浏览器。

有没有办法获取网页查看源内容？

1 个答案: