如何在使用Ruby的OpenUri下载之前获取HTTP头

时间:2013-07-03 17:52:02

标签: ruby http-headers open-uri

我目前正在使用OpenURI在Ruby中下载文件。不幸的是,在没有下载完整文件的情况下似乎无法获取HTTP标头:

open(base_url,
  :content_length_proc => lambda {|t|
    if t && 0 < t
      pbar = ProgressBar.create(:total => t)
  end
  },
  :progress_proc => lambda {|s|
    pbar.progress = s if pbar
  }) {|io|
    puts io.size
    puts io.meta['content-disposition']
  }

运行上面的代码表明它首先下载了整个文件,然后才打印出我需要的标题。

有没有办法在下载完整文件之前获取标题,所以如果标题不是我期望的标题,我可以取消下载吗?

3 个答案:

答案 0 :(得分:11)

您可以使用Net :: HTTP来解决此问题,例如:

require 'net/http'

http = Net::HTTP.start('stackoverflow.com')

resp = http.head('/')
resp.each { |k, v| puts "#{k}: #{v}" }
http.finish

另一个例子,这次是获得精彩书籍的标题,使用ANSI-C进行面向对象

require 'net/http'

http = Net::HTTP.start('www.planetpdf.com')

resp = http.head('/codecuts/pdfs/ooc.pdf')
resp.each { |k, v| puts "#{k}: #{v}" }
http.finish

答案 1 :(得分:5)

似乎我想要的是不可能使用OpenURI,至少不是,正如我所说的,不首先加载整个文件。

我能够使用Net :: HTTP的request_get

做我想做的事

这是一个例子:

http.request_get('/largefile.jpg') {|response|
  if (response['content-length'] < max_length)
    response.read_body do |str|   # read body now
      # save to file
    end
  end
}

请注意,这仅在使用块时有效,如下所示:

response = http.request_get('/largefile.jpg')

身体已经被阅读了。

答案 2 :(得分:2)

而不是使用Net :: HTTP,这可能就像使用沙铲在海滩上挖掘池一样,您可以使用许多HTTP客户端来处理Ruby并清理代码。

以下是使用HTTParty的示例:

require 'httparty'

resp = HTTParty.head('http://example.org')
resp.headers
# => {"accept-ranges"=>["bytes"], "cache-control"=>["max-age=604800"], "content-type"=>["text/html"], "date"=>["Thu, 02 Mar 2017 18:52:42 GMT"], "etag"=>["\"359670651\""], "expires"=>["Thu, 09 Mar 2017 18:52:42 GMT"], "last-modified"=>["Fri, 09 Aug 2013 23:54:35 GMT"], "server"=>["ECS (oxr/83AB)"], "x-cache"=>["HIT"], "content-length"=>["1270"], "connection"=>["close"]}

此时,检查文档的大小很容易:

resp.headers['content-length'] # => "1270"

不幸的是,您正在与之交谈的HTTPd可能不知道内容会有多大;为了快速响应服务器,不必计算动态生成的输出的大小,这将花费几乎与实际发送的CPU一样长,因此依赖于&#34;内容长度&#34 ;价值可能是错误的。

Net :: HTTP的问题是它不会自动处理重定向,因此您必须添加其他代码。当然,该代码在文档中提供,但代码随着您需要做更多事情而不断增长,直到您最终编写了另一个http客户端(YAHC)。所以,避免这种情况并使用现有的车轮。