使用Hpricot查找其父节点中节点的字符索引

时间:2009-09-06 17:40:58

标签: html ruby-on-rails parsing hpricot

假设我有以下HTML:

html = Four score and seven <b>years ago</b>

我想用Hpricot解析这个:

doc = Hpricot(html)

找到<b>节点:

node = doc.at('b')

然后在其父级中获取<b>节点的字符索引:

node.character_index
=> 22

我该怎么做(即,我刚刚编写的character_index()函数的真实版本是什么)?

1 个答案:

答案 0 :(得分:1)

我不认为Hpricot是这样的。这是我根据你的例子做的“node.inspect”

node.inspect
"{elem <b> \"years\" </b>}"

因此,您要求的整体文本中的位置不存在。

但是,您可能希望使用该索引的内容数量有限,您可以通过standard Hpricot methods

执行这些操作。