我试图用Ruby的机械工具来抓一个评级网站,并且遇到了麻烦。我的代码非常简单:
require "mechanize"
@client.get("http://cape.ucsd.edu/responses/Results.aspx")
此时,您将看到404错误。
我尝试了一些方法,包括HTTParty搜索重定向;禁用SSL检查;甚至在本地保存html文件(以获取正确的查询表单),然后尝试直接从连接到主站点的代理发出它。所有这些导致了同样的错误。
我是一个相当陌生的人,我希望自己能做些傻事。任何帮助,将不胜感激。
答案 0 :(得分:0)
是的,它是用户代理。要设置用户代理,请执行以下操作:
@client = Mechanize.new
@client.user_agent = 'Mozilla'