我想将hadoop集成到pentaho数据集成,我在pentaho网站上找到,在那个网站上有hadoop的pentaho,但它是商业的。我想让我的数据集成社区版本与hadoop集成。 我怎么解决这个问题?
韩国社交协会
答案 0 :(得分:2)
在新版本(PDI 4.2.0)中,您可以在PDI中看到hadoop组件。
访问:http://sourceforge.net/projects/pentaho/files/Data%20Integration/
答案 1 :(得分:1)
实际上,自PDI 4.3.0(昨天发布)以来,所有hadoop内容现已包含在开源版本中!所以,直接进入sourceforge并下载!所有文档都在infocenter.pentaho.com
答案 2 :(得分:1)
可以在Pentaho Big Data Plugin中找到将Kettle(ETL)与Hadoop和其他各种NoSQL数据存储集成的最新工作。这是一个Kettle插件,提供连接到许多Pentaho产品的HDFS,MapReduce,HBase,Cassandra,MongoDB,CouchDB:Pentaho数据集成,Pentaho报告和Pentaho BA服务器。代码托管在Github上:https://github.com/pentaho/big-data-plugin。
有一个社区登陆页面,其中包含有关Pentaho Wiki的更多信息。您可以在此处找到Java Developer的操作指南,配置选项和文档:http://community.pentaho.com/bigdata