扫描Pentaho中Hbase的所有列

时间:2015-08-12 07:00:01

标签: hbase pentaho pdi

我是Pentaho和HBase的新手。我想从Hbase表中读取所有列,并使用Pentaho将其加载到平面文件中。

一个主要的问题是,我的Hbase表中的列不是静态的。有些日子我会得到30多列,有些日子可能会变成50+。

我尝试使用' Hbase Input'在PDI中。但我无法定义列数。有没有办法在Pentaho中定义动态变化列?

1 个答案:

答案 0 :(得分:0)

不要提及任何列名。如果没有提到列名,则需要考虑所有必填列。

步骤1:在HBase输入步骤中,在"下创建/编辑映射"选项卡,调用所需的Hbase表名称并为该表创建新的映射名称 第2步:然后点击'创建一个元组模板'。将生成5列 第3步:点击“保存映射”#39;并移动上一个标签'配置查询' 第4步:点击“获取映射表名称'并选择您在其下调用的相同表格"创建/编辑映射"标签。与通过单击“获取指定表格的映射”相同的调用映射nams一样 第5步:点击“获取密钥/字段信息”'。你会得到5列 第6步:现在只保留三个必需列(键,列,值)。

现在你的Pentaho工作已准备就绪,可以获得所需操作的列。