Pentaho:根据另一列添加另一列

时间:2018-01-04 08:08:34

标签: pentaho etl kettle pentaho-data-integration

我有这种情况,我有关于年龄的数据,我想添加另一个年龄范围

  • 范围1(0-18岁)=儿童;
  • 范围2(19-50)=成年人;
  • 范围3(50+)老年人

我怎样才能在Pentaho这样做?我已经尝试过滤镜等等,但我没有成功。所以我想在下面的图片中显示一个输出(大约100k行,所以我不能手动完成)。

目标数据[添加了AgeRang列]:

enter image description here

2 个答案:

答案 0 :(得分:1)

您要查找的步骤名为Number range

enter image description here

答案 1 :(得分:0)

我会使用名为User Defined Java Expression的步骤,使用Java expression过滤数据,并添加新列age_range以记录流的行。

Java expression字段中使用此语句:

  • (age <= 18) ? 1 : (age <= 50) ? 2 : 3

检查执行中的下图: enter image description here