如何用Nokogiri废弃一个特定的ul?

时间:2016-09-09 01:44:06

标签: html ruby-on-rails ruby web-scraping nokogiri

我正在尝试只获取https://en.wikipedia.org/wiki/September_8的第二个ul元素,这是所有事件列表。

这就是我现在所拥有的:

require 'nokogiri'
require 'open-uri'

doc = Nokogiri::HTML(open('https://en.wikipedia.org/wiki/September_8', {ssl_verify_mode: 0}))

doc.css('ul').each do |link|
  puts link.content
end

我需要的UL是整个HTML文档中的第二个。我怎样才能只选择那个?

1 个答案:

答案 0 :(得分:0)

试试这个

doc.css('ul')[1]

或者如果您只想使用CSS选择器

doc.css('ul:nth-of-type(2)')