我建立了一个需要废弃一些网页内容的剪贴板。我遇到一个问题,我需要抓取的页面有大量的java脚本,似乎java脚本调用正在为下一个请求设置一些cookie和一些查询字符串参数。
我可以通过向js文件发送请求来设置cookie,但似乎查询字符串params是由某些编码的javascript调用生成的。
我无法破译它们,我尝试使用谷歌搜索工具将JS编译为C#但是徒劳无功。如果有人早些时候解决了类似问题,请详细说明我如何编译像浏览器这样的javascript文件并直接从我的C#代码生成html。
任何帮助都将深表感谢。
答案 0 :(得分:4)
为什么不使用像fiddler这样的网络代理来找出设置的标头和Cookie,并直接在C#中使用这些数据?
这样你就不需要执行JS只是为了找出标题和cookie。
<强>更新强>
您还可以使用WatiN等网络自动化套件来抓取网站 - 我相信它已经支持JS,所以您不需要做更多工作。
<强> UPDATE2:强>
由于WatiN不符合您的要求,也许可以使用javascript到.NET编译器直接编译它 - 请参阅JScript.NET,但我怀疑是否会导致任何DOM操作。
答案 1 :(得分:1)