我正在使用python的lxml.html。我有一个xpath表达式,它抓取节点的文本,但我需要的是所有文本,包括子标签及其内容的标签。我如何实现这一目标?
答案 0 :(得分:1)
Element
的{{3}}方法返回元素的文本,包括没有标记的子文本的文本内容。
答案 1 :(得分:0)
我不确定你使用的是什么标签;因此,我弥补了......
您可以尝试:
result = lxml.html.parse(url).xpath("//tr/td/a/text()")
// tr表示从当前节点中选择与选择匹配的文档中的节点,无论它们在何处。
您可以使用此('//')表达式来绘制子标签的标签。