谁会知道为什么熊猫会抛出ValueError以及如何解决它?我只想在按“ CurveName”和“ Tenor”分组时计算“ Value”列中的差异
答案 0 :(得分:0)
您需要向groupby对象添加带参数的.agg()方法,以便能够对它应用diff和其他功能。否则,您不清楚要如何精确地汇总数据。请参阅有关groupby / agg方法的帮助和示例。
这是一个简单的示例:
df = pd.DataFrame()
df['a'] = np.random.randint(0, 4, 100)
df['b'] = np.random.randint(10, 99, 100)
df2 = df.groupby('a').agg('mean')
df2['d'] = df2.b.diff(-1)
df2
b d
a
0 56.000000 22.500000
1 33.500000 -25.900000
2 59.400000 9.288889
3 50.111111 NaN
“平均值”是聚合函数。可能是其他类似“ max”,“ std”甚至是自定义函数的名称。开始here