pentaho明显超过日期

时间:2015-01-14 10:19:09

标签: postgresql count distinct pentaho

我目前正在使用Pentaho,我遇到以下问题:

我希望得到一个" rooling非常重视一个值,忽略"组"由Business Analytics执行。例如:

Date          Field

2013-01-01    A
2013-02-05    B
2013-02-06    A
2013-02-07    A
2013-03-02    C
2013-04-03    B

当我使用经典"独特的计数"我的架构中的聚合器,总结它,然后添加"月"到列,我得到:

Month          Count    Sum

2013-01        1        1
2013-02        2        3
2013-03        1        4
2013-04        1        5

我想得到的是:

Month          Sum

2013-01        1
2013-02        2
2013-03        3
2013-04        3

这是到目前为止所有字段的独特计数。有没有人对这个话题有任何想法?

我的数据库位于Postgre,我正在寻找PDI,PSW,PBA或PME下的任何解决方案。

谢谢!

1 个答案:

答案 0 :(得分:1)

PDI中的一种天真的方法如下:

  1. 按字段列
  2. 对行进行排序
  3. 在“字段”列中添加用于更改值的序列
  4. 映射所有序列值> 1到零
  5. 这些前3个有效地标记第一次看到值(无论日期)。

    1. 按年/月对行进行排序
    2. 按年/月汇总映射的序列值
    3. 获取以前所有金额的累计总和
    4. 这3个汇总了每月的不同值,然后保留累计金额。在PDI中,这可能类似于:

      enter image description here

      我发布了此转型的要点here

      更有效的解决方案是并行化两种类型,然后在最新点加入。我发布了这个,因为它更容易解释,但是进行这种转换并使其更加平行应该不会太难。