使用Xpath停止分页循环

时间:2018-04-06 09:10:33

标签: html xml xslt xpath web-scraping

我成功使用下面代码中显示的xpath选择浏览器屏幕上显示的网页。

如何修改xpath以便在页码等于50或50页后停止分页循环?

//a[@class='active_page']/following::a[1]

<div id="pagination">
   <ul class="zPagination">
      <li><a href="http://example.com/page/1">«</a></li>
      <li><a class="active_page" href="http://example.com/page/1">1</a></li>
      <li><a href="http://example.com/page/2">2</a></li>
      <li><a href="http://example.com/page/3">3</a></li>
      <li><a href="http://example.com/page/XX">XX</a></li>
      <li><a href="http://example.com/page/60">»</a></li>
   </ul>
</div>

1 个答案:

答案 0 :(得分:2)

您可以尝试使用以下XPath来匹配前50页的链接:

//a[@class='active_page']/following::a[position()=1 and number(text())<51]

对于50之后的页面

//a[@class='active_page']/following::a[position()=1 and number(text())>50]