我正在尝试使用ruby mechanize刮取我的大学网站。这是我的红宝石脚本;
require 'mechanize'
agent = Mechanize.new
agent.get('https://kampus.izu.edu.tr')
此脚本不会返回响应。我需要查看登录页面,但响应不同。我也像这样用cURL尝试过它;
curl https://kampus.izu.edu.tr
这可以工作并返回登录页面。我错过了什么?
答案 0 :(得分:0)
确保要存储agent.get()的输出。从您的示例中,我看不到您将如何使用/打印此请求的响应。
尝试一下:
require 'mechanize'
agent = Mechanize.new
page = agent.get("https://kampus.izu.edu.tr")
puts page.body
.get()方法返回一个Mechanize :: Page对象,您可以在该对象上调用其他方法,例如.css(),以通过CSS选择器选择元素。查看文档here