我试图使用import.io抓第一个website。由于某种原因,它会正确加载页面,直到我开始记录身份验证。事实上它的挂起方式与在禁用javascript的页面上运行的方式相同。即使在点击了“不工作”之后也会发生同样的事情。 (那应该激活js)。任何解决方案?
答案 0 :(得分:0)
您可以尝试我们(我在那里工作)免费支持support@import.io,我很快进入,因为import.io很快就会杀掉经过身份验证的提取器。这就是原因。
我不知道是否有任何其他服务可能适合你,但有很多服务; outwit,diffbot,scraperwiki等。祝你好运。
我们构建了Authenticated API功能,因为很多人 要求它,但事实证明只有不到5%的用户能够 建立一个。因此,我们决定删除创建选项 新的Authenticated API于2015年11月9日发布。
我们为什么删除它?说实话,Authenticated API从未像我们希望的那样运行良好。他们太复杂了 构建,其中近80%从未发布。这可能就是为什么 你们中很少有人试过用它们。
维持这种笨重且使用不多的功能会妨碍我们的使用 能够专注于其他要求很高的功能 让更多用户受益。
因为我们的首要任务是提供最佳的数据提取 为尽可能多的人的经验,我们认为删除 创建新的Authenticated API的能力是正确的。
我现有的Authenticated API会发生什么?他们会继续工作。您将能够编辑和维护它们,但您不会成功 能够创造新的。
我们计划在明年年中完全退出该功能。我们 我们有一个确定的日期会发送更多信息。
经过身份验证的API会回来吗?也许吧。我们不打算按原样重建此功能,但我们欢迎您的想法和功能 建议。
这最终是为您做更多事情的策略。我们想要保持 对话开放:如果您有任何疑虑,意见或问题,请 直接回复此电子邮件。
谢谢,
import.io团队