在pentaho数据集成中连接DISTINCT字符串值

时间:2014-08-12 23:26:35

标签: mysql pentaho etl

我是pentaho数据集成的新手。我如何连接不同的字符串值?

bse_id values
100     A1
100     A1
100     A2
150     A1
150     B1
150     C1
150     C1

putput应该是

bse_id values
100    A1,A2
150    A1,B1,C1

在Mysql中,我可以使用     从表组中选择bse_id,group_concat(不同的值)1;

在SPOON中,我尝试了group_by步和内存group_by 两者都导致重复的值。 我输出

 bse_id values
    100    A1,A1,A2
    150    A1,B1,C1,C1

请帮我删除重复项。

2 个答案:

答案 0 :(得分:1)

您需要有2个分组步骤:

输入后尝试以下三个步骤:

  1. 步骤:按BOTH排序 - 'bsi_id'和'值'
  2. 步骤:按BOTH分组 - 'bsi_id'和'值'(此处不汇总)
  3. 步骤:按'bsi_id'分组;聚合'values'与类型“连接字符串分隔符”,
  4. 输出是:

    bse_id; values
    100; A1, A2
    150; A1, B1, C1
    

    这应该可以正常工作。 再见

答案 1 :(得分:0)

您可以使用Group by步骤轻松完成此操作。确保步骤的输入在bse_id字段上排序,然后选择values作为聚合字段的主题,并将类型设置为'连接字符串分隔符,' 。这应该给你你想要的。