Import.io为启用了javascript的api返回空列

时间:2016-03-22 13:25:21

标签: import.io

我在这里搜索过但无法找到答案。 import.io api的某些列未返回任何数据。这些数据在javascript后面,但是,在训练期间它返回数据,但是,在批量提取或爬行期间,列是空的。我邮寄了import.io的支持,他们让我在这里发帖子。任何人都可以帮助我吗?

1 个答案:

答案 0 :(得分:4)

如果您查看页面的HTML,您可以看到html附近的属性,即使没有JS,也会显示“将要去的日子”。

e.g:

data-hours-remaining="532.6704760581918"

data-end_time="2016-04-13T16:00:00-04:00"

我认为这与“将要去的日子”相对应。

使用自定义xpath例如:.//*[@id='project_duration_data']/@data-hours-remaining从这些属性中获取所需的数据。然后,您可以将它们后处理为您想要的任何格式;几天,几周等..