水壶过滤输入CSV的方法

时间:2018-08-22 14:15:54

标签: csv filter pentaho kettle

我是水壶的新手,我正在尝试使用它提供的工具。我尝试使用“ Csv文件输入工具”制作一个csv文件作为输入,并使用“文本文件输出”工具制作一个csv输出文件,并过滤掉了第一个文件不需要的一些字段。我想更进一步,因此我将为您举例说明我的csv:

Id|Col1    |Col2
1 | test1  | 1
2 | test1  | 1
3 | test2  | 1
3 | test2  | 2

我想以某种方式过滤我的csv,以便在输出时获得col1的值,而在col2中获得多个值。在我的示例中,它只会是“ test2”。 我可能无法获得该解决方案,可能是因为我不熟悉该工具。.你们能给我一个提示并指导我解决该问题吗?我可以走什么路?

1 个答案:

答案 0 :(得分:1)

我认为我找到了适合我问题的解决方案。 我添加了一个“分组依据工具”,在其中我将Col1用于groupBy,并将“计数不同”用作Col2上的函数。然后使用“筛选器行数”工具获取具有不同的> 1 :)!

的行。