假设我的HTML看起来像这样:
html = '<HTML><BODY><a id="id1">test</a><a id="id2">test2</a></BODY></HTML>'
我提取第二个链接:node = doc.css("a#id2")[0]
如何在HTML源代码中获取此节点HTML的起始索引?哪个是32?
html.slice(32, SOMETHING) = '<a id="id2">...'
注意:我知道这是一个简单的例子,但解决方案应该解决我提取的节点在HTML中不是唯一的情况。