通过页面nokogiri迭代获取链接地址

时间:2013-03-20 15:51:41

标签: ruby web-scraping nokogiri

我正在尝试从以下网站获取图片或图片地址。它适用于我在下面提到的一个网站:“http://www.1stsourceservall.com/Category/Accessories”。但是 - 一旦它完成了页面 - 我希望它然后点击下一页链接并循环浏览所有20多页。我该怎么做?

require 'rubygems'
require 'nokogiri'
require 'open-uri'

url = "http://www.1stsourceservall.com/Category/Accessories"
while (url) do
  doc = Nokogiri::HTML(open(url))
    puts doc.css(".productImageMed")
  end

  link = doc.css('.pagination a')
  url = link && link[0]['href'] #=> url is nil if no link is found on the page
end

0 个答案:

没有答案