Question

目标是获取页面的原始源，我的意思是不运行脚本或让浏览器格式化页面。例如：假设响应后源为<table><tr></table>，我不想获取<table><tbody><tr></tr></tbody></table>，如何通过c＃代码执行此操作？

更多信息：例如，在浏览器的地址栏中输入“view-source：http：//feeds.gawker.com/kotaku/full”会给出ua xml文件，但是如果你只是调用“http：// feeds.gawker.com/kotaku/full“它将呈现一个html页面，我想要的是xml文件。希望这很清楚。

Answer 1

这是一种方式，但是你真正想要的并不是很清楚。

using(var wc = new WebClient())
{
    var source = wc.DownloadString("http://google.com");
}

Answer 2

如果您的意思是在渲染自己的页面时。您可以使用ResponseFilter或覆盖页面呈现来访问原始页面内容。我会质疑你这样做的动机。

脚本运行客户端，因此它与任何c＃代码无关。

Answer 3

您可以使用Fiddler之类的工具查看通过网络实际发送的内容。

免责声明：我认为Fiddler很棒

如何从c＃获取原始页面源（不是生成的源）

3 个答案: