在包含特定文本的元素之后提取整个同级元素

时间:2018-11-06 20:35:26

标签: xpath text extract siblings

<a href="/geo/query/acc.cgi?acc=GPL17021" onmouseout="onLinkOut('HelpMessage' , geo_empty_help)" onmouseover="onLinkOver('HelpMessage' , geoaxema_recenter)">GPL17021</a></td>
    <td valign="top">Illumina HiSeq 2500 (Mus musculus)</td>

我想提取“ Illumina HiSeq 2500(Mus Musculus)”。我使用了以下XPath代码:

//a[contains(., "GPL")]/following-sibling::td[1]/text()

文本后面的数字始终包含“ GPL”。我可以选择“ GPL17021”,但是当我寻找它后面的第一个td时,什么也没有显示。

1 个答案:

答案 0 :(得分:1)

您的HTML示例不完整,但似乎链接实际上是td的子元素,因此紧随td之后的不是兄弟

尝试以下操作选择所需的节点:

//td[contains(a, "GPL")]/following-sibling::td[1]/text()