获取默认网页文件名

时间:2015-12-15 22:17:08

标签: ruby http-headers xmlhttprequest

有没有办法在ruby中获取给定网址的默认网页?

我正在寻找像

这样的功能
get_indexpage_for("www.example.com")

结果等于

'index.html' or 'index.php' or 'index.htm' or ...

即使HTTP-header也不包含这些信息,我也查看了Net :: HTTP类,但我找不到解决方案。 有人可以帮忙吗?

1 个答案:

答案 0 :(得分:0)

如果确实存在可以识别的网址,则会执行此操作。它的作用就像某些页面上的魅力而不是其他页面上的魅力。

它应该适用于我在我的示例中使用的URL ...

require 'mechanize'
require 'pp'

agent = Mechanize.new

login_url = 'http://www.reports.rtui.com'

page = agent.get(login_url)
puts page.uri

index.html是标准默认设置,但如果您访问google.com,则它们似乎没有索引页面。相反,它更像是一个应用程序,提供内容作为其请求。

我无论如何都不是专业人士,但根据我的研究,似乎没有一个神奇的子弹可以做你想要的。至少,没有一个是显而易见的。这实际上取决于页面本身。