如何使用XPath查询获取某些元素下的文本但不在任何元素中?

时间:2011-06-01 09:14:04

标签: xpath html-parsing

不确定这个标题是否有意义。 这段HTML是这样的:

<div id="A">
  <span class="B"> XXXX </span>
  MMM
  <span class="B"> ZZZZ </span>
  NNN
  <div class="C">
    <span class="B">
      OOO
    </span>
  </div>
</div>

如何使用XPath查询模式获取文本“MMM”和“NNN”?

谢谢。

2 个答案:

答案 0 :(得分:2)

如果您想要具有特定id的节点的文本,请使用以下表达式:

//div[@id='A']/text()

答案 1 :(得分:1)

在这种情况下,您可以使用/div/text()获取初始div根目录下的任何文本节点。如果您执行//text()

,则只能获得所有文本节点