开源ETL框架

时间:2012-01-18 03:29:05

标签: java python ruby perl etl

我被要求对两个ETL框架进行原型设计。要求如下:

  • 开源
  • 适用于Linux
  • 维护
  • 可以在网络浏览器上查看日志(很高兴)
  • 用Perl,Python,Ruby或Java编写

原始文件可以是任何内容(excel,csv,html page等..) 目标数据库是MySQL。

请勿删除姓名,请根据您的经验说明优缺点。

谢谢!

3 个答案:

答案 0 :(得分:6)

最流行的基于Java的ETL之一是Talend

Jaspersoft ETL是另一个从Talend扩展而来的,它有一个很好的基于eclipse的UI。

答案 1 :(得分:3)

我使用过Kettle。它有自己的GUI,但如果您更喜欢使用API​​自己进行ETL,它也会受到支持。它已被证明对我非常有用,并且已经有一些插件已经可用。

答案 2 :(得分:2)

另一个选项是CloverETL。它是用Java编写的,有一个开源的LGPL版本的Engine。它还有一个名为CloverETL Community的免费GUI版。

它可以处理任何指定的源并连接到许多数据库,包括MySQL。