如何从Pentaho中的多个不同表创建事实表

时间:2019-05-05 03:07:01

标签: kettle pentaho-data-integration

我一直在遵循有关使用Pentaho Data Integration / Kettle创建数据仓库的教程。

本教程基于CSV文件,但是我正在使用northwinds数据库和PostgreSQL进行练习,试图找出如何从多个表中选择值,然后将其输出到单个表中。

我的ETL过程如下:每个表都有多个阶段,从每个表中选择值,并将其存储在数据库中每个表的阶段表中,从那里我设置了维度表,但是我正在尝试找出阶段和维度之间的步骤,这是我尝试选择值以更新维度表的地方。

目前,我为每个表都设置了几个阶段,我不确定是为每个表创建单独的值表还是为单个值表创建。任何帮助将不胜感激。谢谢

当我尝试从多个表中选择值时,出现一个错误,提示“我们检测到具有不同数量字段的行”,看来我需要使用创建单独的表

1 个答案:

答案 0 :(得分:0)

在kette中,数据流的元数据结构无法更改。这样,例如,如果第1行有3列,一个整数和两个字符串,则所有行都必须具有相同的结构。

如果要合并来自不同来源的行,则必须确保结构相同。该错误告诉您某些传入的数据流具有不同数量的字段。