标签内的XPath提取文本

时间:2013-03-26 15:20:16

标签: xpath html-parsing

HTML结构如下所示:

<div class="Parent"> 
  <div id="A">more tags and text</div>  
  <div id="B">more tags and text</div> 
  more tags
  <p> and text </p>
</div>

我想从父母和除A和B孩子之外的标签中提取文本。 我试过了 的 /格[@类= '父'] //文本()

从所有后代节点中提取文本,因此创建了一个约束,如 / div [@ class ='Parent'] // text()[not(self :: div)] < / p>

但它没有改变一件事。

感谢您的任何建议

1 个答案:

答案 0 :(得分:1)

/div[@class='Parent']/*[not(self::div and (@id='A' or @id='B'))]//text() | /div[@class='Parent']/text()