如何从c#获取原始页面源(不是生成的源)

时间:2011-09-23 09:00:07

标签: c# html

目标是获取页面的原始源,我的意思是不运行脚本或让浏览器格式化页面。例如:假设响应后源为<table><tr></table>,我不想获取<table><tbody><tr></tr></tbody></table>,如何通过c#代码执行此操作?

更多信息:例如,在浏览器的地址栏中输入“view-source:http://feeds.gawker.com/kotaku/full”会给出ua xml文件,但是如果你只是调用“http:// feeds.gawker.com/kotaku/full“它将呈现一个html页面,我想要的是xml文件。希望这很清楚。

3 个答案:

答案 0 :(得分:1)

这是一种方式,但是你真正想要的并不是很清楚。

using(var wc = new WebClient())
{
    var source = wc.DownloadString("http://google.com");
}

答案 1 :(得分:0)

如果您的意思是在渲染自己的页面时。您可以使用ResponseFilter或覆盖页面呈现来访问原始页面内容。我会质疑你这样做的动机。

脚本运行客户端,因此它与任何c#代码无关。

答案 2 :(得分:0)

您可以使用Fiddler之类的工具查看通过网络实际发送的内容。

免责声明:我认为Fiddler很棒