假设我有以下HTML:
html = Four score and seven <b>years ago</b>
我想用Hpricot解析这个:
doc = Hpricot(html)
找到<b>
节点:
node = doc.at('b')
然后在其父级中获取<b>
节点的字符索引:
node.character_index
=> 22
我该怎么做(即,我刚刚编写的character_index()
函数的真实版本是什么)?
答案 0 :(得分:1)
我不认为Hpricot是这样的。这是我根据你的例子做的“node.inspect”
node.inspect
"{elem <b> \"years\" </b>}"
因此,您要求的整体文本中的位置不存在。
但是,您可能希望使用该索引的内容数量有限,您可以通过standard Hpricot methods
执行这些操作。