在lxml.html中,我如何获取节点的子项的文本,子项和内容?

时间:2011-08-26 18:49:27

标签: python lxml

我正在使用python的lxml.html。我有一个xpath表达式,它抓取节点的文本,但我需要的是所有文本,包括子标签及其内容的标签。我如何实现这一目标?

2 个答案:

答案 0 :(得分:1)

Element的{​​{3}}方法返回元素的文本,包括没有标记的子文本的文本内容。

答案 1 :(得分:0)

我不确定你使用的是什么标签;因此,我弥补了......

您可以尝试:

result = lxml.html.parse(url).xpath("//tr/td/a/text()")

// tr表示从当前节点中选择与选择匹配的文档中的节点,无论它们在何处。

您可以使用此('//')表达式来绘制子标签的标签。