SSIS - 执行分组并依靠平面文件

时间:2015-11-13 15:51:39

标签: ssis flat-file

我在平面.CSV文件上进行一些转换和验证以导入数据。 我想添加一个列,其中包含员工在平面文件中出现的时间,例如:

输入数据流:

Input sample

输出数据流:

Output sample

我不知道如何转换我的数据流...有想法吗?

1 个答案:

答案 0 :(得分:1)

我就是这样做的:

  1. 如果您的数据尚未排序,请在Employee_Id上对其进行排序。
  2. 使用多播将数据流拆分为两个流。
  3. 在其中一个流中,添加一个Aggleeate转换,按Employee_Id分组,并为每个Employee_Id添加一个包含COUNT(*)的新计数列。时间将被忽略并在此流中丢弃。
  4. 合并在Employee_Id上将两个流重新加入,只保留聚合流中的Count列。
  5. 这应该为源数据中的每一行留下一行所需的输出,但每行上的每个Employee_Id计数。