无法获取URL的确切来源

时间:2015-05-22 20:10:45

标签: c# html webpage

我正在尝试使用C#应用程序提取给定URL的源页面。现在我正在使用课程HttpWebRequest

奇怪的是,与使用Google Chrome浏览器(Ctrl + u)获得的页面相比,从此课程获得的结果页面完全不同。

有人可以告诉我如何获取确切的源页面。或者期望两个页面都相同是错误的吗?

非常感谢

1 个答案:

答案 0 :(得分:1)

虽然可以从互联网上正确检索html,但使用Web浏览器可能很简单。代码将要求您调用另一个void或将代码放在事件中。

WebBrowser wb = new WebBrowser();
private void button1_Click(object sender, EventArgs e) {
    wb.Navigate("http://kissanime.com/Anime/One-Piece");
    wb.ScriptSupress = true;
    wb.DocumentCompleted += pageLoaded;
}

private void pageLoaded(object sender, WebBrowserDocumentCompletedEventArgs e) {
    string src = wb.DocumentText;
}

通过使用该方法,您可以直接从Web浏览器中获取html,但加载时间可能取决于页面大小,图像和依赖项(外部文件,如JS,CSS和图片/视频)。 / p>