我试图通过抓取来获取以下链接中所有产品的标题和价格。 https://homeshopping.pk/categories/Mobile-Phones-Price-Pakistan
我能够获得产品的标题和价格,但问题是当我们向下滚动页面并且页面的URL未更改时添加了新产品。所以我无法清除之后加载的产品的信息页面向下滚动。
答案 0 :(得分:1)
检查加载新数据部分时调用的ajax请求。
他们使用分页(page=2
):
https://homeshopping.pk/categories/Mobile-Phones-Price-Pakistan?page=2&AjaxRequest=1&undefined
通过递增page
param来迭代分页。