屏幕抓取,表单身份验证

时间:2011-10-16 22:11:50

标签: oracle forms-authentication screen-scraping web-scraping oracleforms

我正在尝试对访问经过表单身份验证的网站进行一些屏幕抓取。我正在对我构建的asp.net表单认证站点进行一些测试,并且它工作得很好。当我尝试真正的网站时,我意识到它正在使用某种Oracle表单身份验证(一个提琴手显示调用dll而不是html文件。我想这个dll提供了html结果)。我在小提琴手中看到的是:

https://{domain}/access/oblix/apps/webgate/bin/webgate.dll 

其余的调用看起来类似,cookie,用户名和密码,就像在常规表单身份验证中一样。 关于如何破解这种类型的请求(到dll而不是html)的任何想法? (顺便说一句,我得到的结果是某种Oracle错误)。

2 个答案:

答案 0 :(得分:1)

使用表单身份验证,Web服务器向客户端发出一个cookie,用于在将来的后续请求中验证客户端(HTTP Basic和Digest身份验证要求客户端在每个请求上发布“WWW-Authorization”标头)。您是否在请求之间保留Cookie?

答案 1 :(得分:1)

网址的文件扩展名对您提出请求的方式并不重要。 听起来您的脚本需要发出与浏览器发出的ajax请求相同的请求(并显示在fiddler中)。