Question

我正在使用NOKOGIRI浏览网页。我熟悉XPath，但我无法弄清楚为什么我的XPath无法获取特定行。请参阅ruby代码。

我使用FireBug XML来验证我的XPath，所以我99％确定我的XPath是正确的。

require 'nokogiri'
require 'open-uri'

@searchURL = 'http://www.umn.edu/lookup?UID=smit4562'
@xpath = '//html/body/p/table/tbody/tr/td[2]/table/tbody/tr[2]'

doc = Nokogiri::HTML(open(@searchURL))

puts 'row should be = Email Address: smit4562@umn.edu'
puts '=> ' + doc.xpath(@xpath).to_s

puts 'is row emppty?'
puts '=> ' + doc.xpath(@xpath).empty?().to_s

Answer 1

<tbody>标记是可选标记，如果省略则隐含。这意味着浏览器会在不存在时自动插入<tbody>标记。它们不在您示例中的源代码中，因此nokogiri不了解它们。

Firebug使用生成的DOM，它包含tbody元素，因此语句在浏览器中匹配。

删除tbody个选择器，你应该没问题。

为什么这个Nokogiri XPath有一个null返回？

1 个答案: