目前,我正在使用Scrapy和XPath解决一些问题,我需要抓取嵌套标记。假设这样的条件
<table>
<tbody>
<tr>
<td>
<table>
<tbody>
<tr><td></td><td></td></tr>
<tr><td></td><td></td></tr>
<tr><td></td><td></td></tr>
</tbody>
</table>
</td>
</tr>
<tr>
<td>
<table>
<tbody>
<tr><td></td><td></td></tr>
<tr><td></td><td></td></tr>
<tr><td></td><td></td></tr>
</tbody>
</table>
</td>
</tr>
</tbody>
</table>
我只想抓取或选择嵌套的tr(<tr><td></td><td></td></tr>
)。我应该如何为此编写XPath。
答案 0 :(得分:0)
要获取tr
个孩子但没有td
个孙子的所有table
个元素,请使用XPath表达式//tr[td][not(td/table)]
。
答案 1 :(得分:0)
//tr/td[2]/..
我们在td
中选择第二个tr
,然后升级以选择我们的tr
元素。