在给定页面的URL的情况下,是否有Rails gem或插件来获取页面上的图像URL列表?
答案 0 :(得分:5)
使用Nokogiri gem来解析页面,然后获取文档中显示的所有src
标记的img
属性:
$ irb
irb(main):001:0> require 'rubygems'
irb(main):002:0> require 'nokogiri'
irb(main):003:0> require 'open-uri'
irb(main):004:0> doc = Nokogiri::HTML(open("http://stackoverflow.com/questions/4741550"))
irb(main):006:0> doc.css('img').collect {|elem| elem[:src] }
=> ["http://www.gravatar.com/avatar/0543907746be29497b873de97957d3ab?s=32&d=identicon&r=PG",
"/posts/4741550/ivc/9291",
"http://pixel.quantserve.com/pixel/p-c1rF4kxgLUzNc.gif"]