熊猫数据透视表聚集条件

时间:2019-04-24 18:20:34

标签: python-3.x pandas pivot-table

我正在尝试制作数据集Docs的数据透视表,该数据表计算'DocuNum'的数目,并仅在'DaysBetween'列小于30时进行计数。我的数据透视表应具有两列。 “ DocNum”计数和“之间的天数”计数少于30。

DocsPivot = pd.pivot_table(Docs, index = ['Study'], values = ['DocNum', 
            'DaysBetween'],  
            aggfunc ={'DocNum':len, 'DaysBetween':lambda x: x<30})

预期结果

TEST    DocNum  DaysBetween 
101 4158    365
203 1958    325
105 1019    243
201 11922   1045
204 1067    56
301 2690    265

1 个答案:

答案 0 :(得分:0)

我认为您可以将x<30更改为(x<30).sum()

DocsPivot = pd.pivot_table(Docs, index = ['Test'], values = ['DocNum', 
            'DaysBetween'],  
            aggfunc ={'DocNum':len, 'DaysBetween':lambda x: (x<30).sum()})