我写了一些代码循环遍历results table 并打印每个条目的href。循环工作正常,直到它击中tr 26.有没有人知道为什么?这就是我的代码现在的样子:
require 'rubygems'
require 'mechanize'
require 'nokogiri'
require 'open-uri'
#Setup
listings_page = Nokogiri::HTML(open('http://servico-informatica.vivanuncios.com/computador+rio-de-janeiro-capital/'))
listings_page.css( "#classified_table tr.classified").each do |listing|
puts listing.css(".summary .classified-link")[0]["href"]
end
我检查了CSS,看起来似乎没有任何改变标记明智的TR。我知道有不同类型的TR(分类与广告),但这很好,因为我不想提取广告。
答案 0 :(得分:1)
该网址上的文档只有一个table
元素,id
为classified_table
。
该表只有一个tr
个元素(没有class
属性),有两列。第一个元素是另一个包含39个tr
元素的表。其中35个有class
,其中包含classified
,而其他四个有vs-advertisement
类。
您获得了正确的结果。