我目前正在使用Pentaho,我遇到以下问题:
我希望得到一个" rooling非常重视一个值,忽略"组"由Business Analytics执行。例如:
Date Field
2013-01-01 A
2013-02-05 B
2013-02-06 A
2013-02-07 A
2013-03-02 C
2013-04-03 B
当我使用经典"独特的计数"我的架构中的聚合器,总结它,然后添加"月"到列,我得到:
Month Count Sum
2013-01 1 1
2013-02 2 3
2013-03 1 4
2013-04 1 5
我想得到的是:
Month Sum
2013-01 1
2013-02 2
2013-03 3
2013-04 3
这是到目前为止所有字段的独特计数。有没有人对这个话题有任何想法?
我的数据库位于Postgre,我正在寻找PDI,PSW,PBA或PME下的任何解决方案。
谢谢!
答案 0 :(得分:1)
PDI中的一种天真的方法如下:
这些前3个有效地标记第一次看到值(无论日期)。
这3个汇总了每月的不同值,然后保留累计金额。在PDI中,这可能类似于:
我发布了此转型的要点here。
更有效的解决方案是并行化两种类型,然后在最新点加入。我发布了这个,因为它更容易解释,但是进行这种转换并使其更加平行应该不会太难。