我只是想知道如果他们对一列有相同的值,我是否可以对多行进行求和。例如,假设我有一个数据框A:
[batch_size, 7, 7, 64]
最终结果应为:
A:
col1, col2, col3, col4
A 0.1 0.2 0.3
B 0.4 0.5 0.6
A 0.7 0.8 0.9
C 1.0 1.1 1.2
这是因为数据帧的第一行和第三行对于col1具有相同的值(A)...我应该如何实现它?
答案 0 :(得分:3)
In [83]: A.set_index('col1').sum(level=0)
Out[83]:
col2 col3 col4
col1
A 0.8 1.0 1.2
B 0.4 0.5 0.6
C 1.0 1.1 1.2
或
In [152]: A.set_index('col1').sum(level=0).reset_index()
Out[152]:
col1 col2 col3 col4
0 A 0.8 1.0 1.2
1 B 0.4 0.5 0.6
2 C 1.0 1.1 1.2
答案 1 :(得分:2)
将groupby
与聚合sum
一起使用:
df1 = df.groupby('col1', as_index=False).sum()
print (df1)
col1 col2 col3 col4
0 A 0.8 1.0 1.2
1 B 0.4 0.5 0.6
2 C 1.0 1.1 1.2
df1 = df.groupby('col1').sum().reset_index()
print (df1)
col1 col2 col3 col4
0 A 0.8 1.0 1.2
1 B 0.4 0.5 0.6
2 C 1.0 1.1 1.2