将pentaho社区与hadoop整合在一起

时间:2011-08-10 03:26:16

标签: hadoop pentaho

我想将hadoop集成到pentaho数据集成,我在pentaho网站上找到,在那个网站上有hadoop的pentaho,但它是商业的。我想让我的数据集成社区版本与hadoop集成。 我怎么解决这个问题?

韩国社交协会

3 个答案:

答案 0 :(得分:2)

在新版本(PDI 4.2.0)中,您可以在PDI中看到hadoop组件。

访问:http://sourceforge.net/projects/pentaho/files/Data%20Integration/

答案 1 :(得分:1)

实际上,自PDI 4.3.0(昨天发布)以来,所有hadoop内容现已包含在开源版本中!所以,直接进入sourceforge并下载!所有文档都在infocenter.pentaho.com

答案 2 :(得分:1)

可以在Pentaho Big Data Plugin中找到将Kettle(ETL)与Hadoop和其他各种NoSQL数据存储集成的最新工作。这是一个Kettle插件,提供连接到许多Pentaho产品的HDFS,MapReduce,HBase,Cassandra,MongoDB,CouchDB:Pentaho数据集成,Pentaho报告和Pentaho BA服务器。代码托管在Github上:https://github.com/pentaho/big-data-plugin

有一个社区登陆页面,其中包含有关Pentaho Wiki的更多信息。您可以在此处找到Java Developer的操作指南,配置选项和文档:http://community.pentaho.com/bigdata