最近article促使我选择了我已经工作了一段时间的项目。我想为许多站点创建一个Web服务前端,以允许从结果和站点的其他区域自动完成表单和数据检索。我使用Selenium和自定义代码取得了一定程度的成功,但是我希望将其扩展到一个阶段,即添加其他网站是一项微不足道的任务(也许甚至不需要开发人员)。
Kapow web data server看起来实现了很多这个但是我被告知它非常昂贵(目前正在等待报价)。有没有人有这方面的经验,或者可以建议任何替代方案(理想情况下是开放源代码)?
免责声明:我意识到自动从第三方网站检索数据的潜在合法性问题 - 此工具旨在用于价格比较系统,所有与之集成的网站都将完成经业主明确许可。如果网站提供API,这显然是受欢迎的方法。
由于
答案 0 :(得分:0)
我意识到这已经有一段时间了,但是如果有人遇到它,我在使用WSO2框架(特别是mashup服务器)方面取得了很大的成功。对于数据挖掘任务,我还使用了一个包装的Java库 - webharvest - 它已经实现了我需要的一切