如何使用Scrapy复选页面

时间:2016-05-17 17:42:30

标签: python-2.7 web-scraping scrapy

我试图抓一个网站,选择每个类别,我需要选中一个复选框

<ul class="mvSrcLk">
   <li>
      <label class="mvNavSel mvNavLvl1">
      Marché frais
      <input type="checkbox" value="f/1/1p" name="selectedNavigationCategoryPath">
</label>
</li>
<li>
<label class="mvNavSel mvNavLvl1">
Épicerie sucrée
<input type="checkbox" value="f/1/1o" name="selectedNavigationCategoryPath">
</label>

如何通过Scrapy做到这一点,我读了this,但它并没有帮助我

1 个答案:

答案 0 :(得分:2)

代码是<form>的一部分吗?如果是这样,那么您可能需要选中&#34;复选框&#34;以及表单提交所需的任何其他内容,然后从该请求中获取所需内容。

但是,如果复选框执行某种动态更改HTML内容的Javascript,那么您需要将其他工具与Scrapy结合使用。有些项目结合了Scrapy和Selenium或Splash,它们应该执行Javascript并返回响应。

参考