我正在尝试制作数据集Docs的数据透视表,该数据表计算'DocuNum'的数目,并仅在'DaysBetween'列小于30时进行计数。我的数据透视表应具有两列。 “ DocNum”计数和“之间的天数”计数少于30。
DocsPivot = pd.pivot_table(Docs, index = ['Study'], values = ['DocNum',
'DaysBetween'],
aggfunc ={'DocNum':len, 'DaysBetween':lambda x: x<30})
预期结果
TEST DocNum DaysBetween
101 4158 365
203 1958 325
105 1019 243
201 11922 1045
204 1067 56
301 2690 265
答案 0 :(得分:0)
我认为您可以将x<30
更改为(x<30).sum()
DocsPivot = pd.pivot_table(Docs, index = ['Test'], values = ['DocNum',
'DaysBetween'],
aggfunc ={'DocNum':len, 'DaysBetween':lambda x: (x<30).sum()})