<a href="/geo/query/acc.cgi?acc=GPL17021" onmouseout="onLinkOut('HelpMessage' , geo_empty_help)" onmouseover="onLinkOver('HelpMessage' , geoaxema_recenter)">GPL17021</a></td>
<td valign="top">Illumina HiSeq 2500 (Mus musculus)</td>
我想提取“ Illumina HiSeq 2500(Mus Musculus)”。我使用了以下XPath代码:
//a[contains(., "GPL")]/following-sibling::td[1]/text()
文本后面的数字始终包含“ GPL”。我可以选择“ GPL17021”,但是当我寻找它后面的第一个td时,什么也没有显示。
答案 0 :(得分:1)
您的HTML示例不完整,但似乎链接实际上是td
的子元素,因此紧随td
之后的不是兄弟。
尝试以下操作选择所需的节点:
//td[contains(a, "GPL")]/following-sibling::td[1]/text()