Question

有没有办法在ruby中获取给定网址的默认网页？

我正在寻找像

这样的功能

get_indexpage_for("www.example.com")

结果等于

'index.html' or 'index.php' or 'index.htm' or ...

即使HTTP-header也不包含这些信息，我也查看了Net :: HTTP类，但我找不到解决方案。有人可以帮忙吗？

Answer 1

如果确实存在可以识别的网址，则会执行此操作。它的作用就像某些页面上的魅力而不是其他页面上的魅力。

它应该适用于我在我的示例中使用的URL ...

require 'mechanize'
require 'pp'

agent = Mechanize.new

login_url = 'http://www.reports.rtui.com'

page = agent.get(login_url)
puts page.uri

index.html是标准默认设置，但如果您访问google.com，则它们似乎没有索引页面。相反，它更像是一个应用程序，提供内容作为其请求。

我无论如何都不是专业人士，但根据我的研究，似乎没有一个神奇的子弹可以做你想要的。至少，没有一个是显而易见的。这实际上取决于页面本身。