Nokogiri循环只返回前三十个左右的结果

时间:2013-08-08 20:05:24

标签: ruby web-scraping nokogiri

我写了一些代码循环遍历results table 并打印每个条目的href。循环工作正常,直到它击中tr 26.有没有人知道为什么?这就是我的代码现在的样子:

require 'rubygems'
require 'mechanize'
require 'nokogiri'
require 'open-uri'

#Setup

listings_page = Nokogiri::HTML(open('http://servico-informatica.vivanuncios.com/computador+rio-de-janeiro-capital/'))
listings_page.css( "#classified_table tr.classified").each do |listing|
  puts listing.css(".summary .classified-link")[0]["href"]
end

我检查了CSS,看起来似乎没有任何改变标记明智的TR。我知道有不同类型的TR(分类与广告),但这很好,因为我不想提取广告。

1 个答案:

答案 0 :(得分:1)

该网址上的文档只有一个table元素,idclassified_table

该表只有一个tr个元素(没有class属性),有两列。第一个元素是另一个包含39个tr元素的表。其中35个有class,其中包含classified,而其他四个有vs-advertisement类。

您获得了正确的结果。