我在这里搜索过但无法找到答案。 import.io api的某些列未返回任何数据。这些数据在javascript后面,但是,在训练期间它返回数据,但是,在批量提取或爬行期间,列是空的。我邮寄了import.io的支持,他们让我在这里发帖子。任何人都可以帮助我吗?
答案 0 :(得分:4)
如果您查看页面的HTML,您可以看到html附近的属性,即使没有JS,也会显示“将要去的日子”。
e.g:
data-hours-remaining="532.6704760581918"
和
data-end_time="2016-04-13T16:00:00-04:00"
我认为这与“将要去的日子”相对应。
使用自定义xpath例如:.//*[@id='project_duration_data']/@data-hours-remaining
从这些属性中获取所需的数据。然后,您可以将它们后处理为您想要的任何格式;几天,几周等..