在scrapy中从隐藏的div中提取/提取数据

时间:2017-10-19 17:41:28

标签: javascript html scrapy

您好我正在尝试抓一个有输入文字的网站。每当我点击输入文本时,都会有输入文本值的下拉建议。它不在select标签上。

这些建议的值在div标签元素中。它有近200个div /建议。

我所做的是使用xpath / css选择器使用scrapy从中掠夺。当我使用"查看页面源"查看代码时,我发现这200个div实际上是隐藏的。而不是"检查元素"。

请帮忙。谢谢

1 个答案:

答案 0 :(得分:0)

这些元素是由一些下拉库动态生成的,因此您必须调查网站源代码和/或它发出的HTTP请求。您正在寻找的所有数据都应该存在(很可能是JSON格式),而不是HTML本身。

例如,如果您使用Chrome:

  1. 当您访问网站时,按F12打开devtools
  2. F5重新加载页面
  3. 导航至NetworkSource标签
  4. 尝试找到数据(CTRL+F在这里真的很有帮助)