我想在Scrapy中使用XPath获取嵌套标记

时间:2014-11-10 09:09:05

标签: xpath

目前,我正在使用Scrapy和XPath解决一些问题,我需要抓取嵌套标记。假设这样的条件

<table>
<tbody>
<tr>
 <td>
  <table>
   <tbody>
    <tr><td></td><td></td></tr>
     <tr><td></td><td></td></tr>
     <tr><td></td><td></td></tr>
   </tbody>
  </table>
 </td>
</tr>
<tr>
 <td>
  <table>
   <tbody>
    <tr><td></td><td></td></tr>
     <tr><td></td><td></td></tr>
     <tr><td></td><td></td></tr>
   </tbody>
  </table>
 </td>
</tr>
</tbody>
</table>

我只想抓取或选择嵌套的tr(<tr><td></td><td></td></tr>)。我应该如何为此编写XPath。

2 个答案:

答案 0 :(得分:0)

要获取tr个孩子但没有td个孙子的所有table个元素,请使用XPath表达式//tr[td][not(td/table)]

答案 1 :(得分:0)

//tr/td[2]/..

我们在td中选择第二个tr,然后升级以选择我们的tr元素。