xpath html获取特定的标记元素

时间:2017-10-06 21:22:05

标签: html xpath

我搜索并尝试了几个解决这个问题的方法,但没有一个能够解决,

这是我的情况html:

<div class="entry">

<p align="center"><span ><b>CAT-1</b></span></p>

<p align="center">car-1 <a href="" target="_blank" >link</a> </p> //need this
<p align="center">car-2 <a href="" target="_blank" >link</a> </p> //need this
<p align="center">car-3 <a href="" target="_blank" >link</a> </p> //need this


<p align="center"><span><b>CAT-2</b></span></p>

<p align="center">car-1 <a href="" target="_blank">link</a> </p>
<p align="center">car-2 <a href="" target="_blank">link</a> </p>
<p align="center">car-3 <a href="" target="_blank">link</a> </p>

</div>

我想仅使用a href

提取//need this提及的内容

我已经在使用:

$xpath->query( "//p[@align='center']//a[@target='_blank']/text()" );

但其摘录全部为a href

有没有办法得到它?即使包括span cat-1没有问题,jsut也需要h href里面

1 个答案:

答案 0 :(得分:0)

尝试使用以下XPath来获取所需的文本内容:

//p[@align='center']//a[@target='_blank']/text()[following::b[.='CAT-2']]

这样可以排除使用"CAT-2"文本

的段落后面的链接