有没有办法在ruby中获取给定网址的默认网页?
我正在寻找像
这样的功能get_indexpage_for("www.example.com")
结果等于
'index.html' or 'index.php' or 'index.htm' or ...
即使HTTP-header也不包含这些信息,我也查看了Net :: HTTP类,但我找不到解决方案。 有人可以帮忙吗?
答案 0 :(得分:0)
如果确实存在可以识别的网址,则会执行此操作。它的作用就像某些页面上的魅力而不是其他页面上的魅力。
它应该适用于我在我的示例中使用的URL ...
require 'mechanize'
require 'pp'
agent = Mechanize.new
login_url = 'http://www.reports.rtui.com'
page = agent.get(login_url)
puts page.uri
index.html是标准默认设置,但如果您访问google.com,则它们似乎没有索引页面。相反,它更像是一个应用程序,提供内容作为其请求。
我无论如何都不是专业人士,但根据我的研究,似乎没有一个神奇的子弹可以做你想要的。至少,没有一个是显而易见的。这实际上取决于页面本身。