使用Mechanize时如何调试Net :: HTTPInternalServerError错误?

时间:2010-04-02 10:12:26

标签: ruby-on-rails ruby nokogiri mechanize

c:/ruby/lib/ruby/gems/1.8/gems/mechanize-1.0.0/lib/mechanize.rb:259:in `get': 500 => Net::HTTPInternalServerError (Mechanize::ResponseCodeError)

当我尝试导航到以下网页时出现上述错误

http://fakewebsite.com//admin/edit_building.cfm?page=buildings&updateMode=yes&id=1251

将链接复制并粘贴到浏览器中时,我可以正常导航。

注意:本网站需要登录,我使用以下代码处理

$agent = Mechanize.new
$agent.get('http://fakewebsite//admin/login.cfm?res=-5')
form = $agent.page.forms.first
form.EMail = "admin"
form.Password = "password"
form.submit

此登录工作正常,因为我访问了受登录保护的其他网页。

我不确定从哪里开始,有什么建议吗?


我在下面的帮助下解决了这个问题。在我成功登录网站后结果显示,它将我转到主页。这个主页上有几个指向其他网页的iframe。 Mechanize不会自动检索这些页面。当我手动检索它们时,我发现这些页面设置了访问网站上其他页面所必需的cookie。我错误地认为所有的cookie都会在登录过程完成后但在我到达主页之前设置好。

1 个答案:

答案 0 :(得分:9)

我首先启用日志记录:

agent.log = Logger.new(STDOUT)

这将为您提供所有标题,传入和传出,您可以使用它们来理解问题。另外,我会使用像Scoop这样的http嗅探器,它会告诉我在浏览器中手动输入此URL时会发生什么。然后,您将能够比较浏览器正在做什么以及机械化正在做什么并找到问题。

另外,尝试设置用户代理,因为如果机械化诚实地介绍自己,某些网站会终止连接。

agent.user_agent_alias = 'Mac Safari'