Question

<a href="/geo/query/acc.cgi?acc=GPL17021" onmouseout="onLinkOut('HelpMessage' , geo_empty_help)" onmouseover="onLinkOver('HelpMessage' , geoaxema_recenter)">GPL17021</a></td>
    <td valign="top">Illumina HiSeq 2500 (Mus musculus)</td>

我想提取“ Illumina HiSeq 2500（Mus Musculus）”。我使用了以下XPath代码：

//a[contains(., "GPL")]/following-sibling::td[1]/text()

文本后面的数字始终包含“ GPL”。我可以选择“ GPL17021”，但是当我寻找它后面的第一个td时，什么也没有显示。

Answer 1

您的HTML示例不完整，但似乎链接实际上是td的子元素，因此紧随td之后的不是兄弟。

尝试以下操作选择所需的节点：

//td[contains(a, "GPL")]/following-sibling::td[1]/text()

在包含特定文本的元素之后提取整个同级元素

1 个答案: