在Nokogiri中,如何找到文档中某个节点之前的所有节点?

时间:2017-04-04 22:04:17

标签: ruby parsing nokogiri ruby-on-rails-5

使用Rails 5,Ruby 2.4。如果我使用Nokogiri解析找到了一个节点,我怎样才能找到在找到的节点之前发生的所有节点,这些节点还没有包含找到的节点?也就是说,让我说我的文件是

<outer>
    <p>Hello</p>
    <inner>
        <most_inner class="abc">Howdy</most_inner>
        <most_inner class="def">Next</most_inner>
    </inner>
</outer>

我运行像

这样的查询
node = doc.search('//*[contains(@class, "def")]').first

如何找到所有前面的节点(不包括我刚刚确定的节点)?我期望的节点是

<p>Hello</p>
<most_inner>Howdy</most_inner>

1 个答案:

答案 0 :(得分:4)

您只需迭代叶节点,直到到达目标节点。

# Node to exclude
node = doc.search('//*[contains(@class, "def")]').first
preceding_nodes = []

# Find all leaf nodes
leaf_nodes = doc.xpath("//*[not(child::*)]")

leaf_nodes.each do |leaf|
  if leaf == node
    break
  else
    preceding_nodes.push(leaf)
  end
end

preceding_nodes # => Contains all preceding leaf nodes