目标是获取页面的原始源,我的意思是不运行脚本或让浏览器格式化页面。例如:假设响应后源为<table><tr></table>
,我不想获取<table><tbody><tr></tr></tbody></table>
,如何通过c#代码执行此操作?
更多信息:例如,在浏览器的地址栏中输入“view-source:http://feeds.gawker.com/kotaku/full”会给出ua xml文件,但是如果你只是调用“http:// feeds.gawker.com/kotaku/full“它将呈现一个html页面,我想要的是xml文件。希望这很清楚。
答案 0 :(得分:1)
这是一种方式,但是你真正想要的并不是很清楚。
using(var wc = new WebClient())
{
var source = wc.DownloadString("http://google.com");
}
答案 1 :(得分:0)
如果您的意思是在渲染自己的页面时。您可以使用ResponseFilter
或覆盖页面呈现来访问原始页面内容。我会质疑你这样做的动机。
脚本运行客户端,因此它与任何c#代码无关。
答案 2 :(得分:0)
您可以使用Fiddler之类的工具查看通过网络实际发送的内容。
免责声明:我认为Fiddler很棒