Ruby下载在网页上

时间:2013-09-07 14:21:27

标签: ruby curl

我想使用ruby脚本下载网页中的所有链接。我的想法是提取href链接,如果我可以获取源代码,使用命令提示符设置下载位置。有办法吗?

1 个答案:

答案 0 :(得分:1)

#!/usr/bin/env ruby
#
require "net/http"
require "uri"

#past your link
gets = STDIN.gets rescue nil

url = URI.parse gets

http = Net::HTTP.start(url.host, url.port) do |resp|
  puts resp.get(url.request_uri).body
end

#your regular for href

或使用http://nokogiri.org/