为什么这个Nokogiri XPath有一个null返回?

时间:2012-02-06 07:02:23

标签: ruby xpath nokogiri

我正在使用NOKOGIRI浏览网页。我熟悉XPath,但我无法弄清楚为什么我的XPath无法获取特定行。请参阅ruby代码。

我使用FireBug XML来验证我的XPath,所以我99%确定我的XPath是正确的。

require 'nokogiri'
require 'open-uri'

@searchURL = 'http://www.umn.edu/lookup?UID=smit4562'
@xpath = '//html/body/p/table/tbody/tr/td[2]/table/tbody/tr[2]'

doc = Nokogiri::HTML(open(@searchURL))

puts 'row should be = Email Address: smit4562@umn.edu'
puts '=> ' + doc.xpath(@xpath).to_s

puts 'is row emppty?'
puts '=> ' + doc.xpath(@xpath).empty?().to_s

1 个答案:

答案 0 :(得分:5)

<tbody>标记是可选标记,如果省略则隐含。这意味着浏览器会在不存在时自动插入<tbody>标记。它们不在您示例中的源代码中,因此nokogiri不了解它们。

Firebug使用生成的DOM,它包含tbody元素,因此语句在浏览器中匹配。

删除tbody个选择器,你应该没问题。