所以我在一个html树中查询一个结构如下的表:
...
<table>
<tr>
<td> Some text </td>
<td> Some more text </td>
<td><a> Link text </a></td>
</tr>
</table>
我当前的XPath查询类似于:'//table/tr/td/text()'
,这将返回['Some text', 'Some more text', '', '']
是否有一些查询只返回td
个节点而没有链接,甚至更好,是否有可以返回链接文本的查询?我想从查询中获取['Some text', 'Some more text', 'Link text']
。
答案 0 :(得分:2)
这个XPath,
//td//text()
将选择文档中所有td
元素的所有文本节点后代。
答案 1 :(得分:0)
//table/tr/td//text()
返回td节点的所有后代文本节点