应用错误收集

从网址获取HTML

时间：2013-10-29 17:55:18

标签： c# html asp.net httprequest

我正在尝试使用C＃的HttpWebRequest来获取基于url的页面源。

在浏览器中，我这样做：

我转到http://brokercheck.finra.org/Search/Search.aspx
插入一个邮政编码，例如00501.并进行搜索。

然后我被重定向到 http://brokercheck.finra.org/Search/SearchResults.aspx?SearchGroup=Individual&IndlText=&FirmText=&ZipCode=00544&ZipRadius=5&PageNumber=1 这个页面的html就是我想要的。

使用HttpWebRequest的get方法的简单方法不起作用。它只会获取搜索页面的HTML。

然后我尝试发送帖子并获取Cookie并发送带有Cookie的获取请求。但是，响应html仍然是搜索页面的html。

1 个答案:

答案 0 :(得分：3)

使用http嗅探器工具（WireShark或HttpWatch）通过Web浏览器捕获http请求和响应。

search.aspx页面使用：onclick =“javascript：WebForm_DoPostBackWithOptions（new WebForm_PostBackOptions（”ctl00 $ phContent $ ucUnifiedSearch $ lbtnFreeFormSearch“，”“，true，”“，”“，”false，false））“提交请求。

SearchResults.aspx页面可能会使用某些请求标头信息（例如previos页面）来确定它是否是直接访问。

您需要在SearchResults.aspx的请求中找到确切的数据。