网站数据检索

时间:2009-07-04 11:29:49

标签: api data-retrieval

最近article促使我选择了我已经工作了一段时间的项目。我想为许多站点创建一个Web服务前端,以允许从结果和站点的其他区域自动完成表单和数据检索。我使用Selenium和自定义代码取得了一定程度的成功,但是我希望将其扩展到一个阶段,即添加其他网站是一项微不足道的任务(也许甚至不需要开发人员)。

Kapow web data server看起来实现了很多这个但是我被告知它非常昂贵(目前正在等待报价)。有没有人有这方面的经验,或者可以建议任何替代方案(理想情况下是开放源代码)?

免责声明:我意识到自动从第三方网站检索数据的潜在合法性问题 - 此工具旨在用于价格比较系统,所有与之集成的网站都将完成经业主明确许可。如果网站提供API,这显然是受欢迎的方法。

由于

1 个答案:

答案 0 :(得分:0)

我意识到这已经有一段时间了,但是如果有人遇到它,我在使用WSO2框架(特别是mashup服务器)方面取得了很大的成功。对于数据挖掘任务,我还使用了一个包装的Java库 - webharvest - 它已经实现了我需要的一切