我有一个日期和值的数据框。即
index | date | points
0 | 9-15-17 | 10.2
1 | 9-15-17 | 5.0
2 | 9-15-17 | -3.0
3 | 9-15-17 | -1.6
4 | 9-15-17 | 3.8
5 | 9-15-17 | 7.0
6 | 9-15-17 | 4.6
有没有一种方法可以在熊猫中利用groupby将数据框折叠为
index | date | points
0 | 9-15-17 | 15.2
1 | 9-15-17 | -4.6
2 | 9-15-17 | 15.4
我当前正在发送日期列,并指向列表并使用多个循环来检查值(数据框为C_list)
net_score = 0
rolling_score = []
print(type(int(C_list[0])))
for i in range(0,len(C_list)):
if C_list[i] > 0:
if(net_score + C_list[i] > net_score):
net_score += C_list[i]
else:
rolling_score.append(net_score)
net_score = 0
net_score += C_list[i]
if C_list[i] < 0:
if(net_score + C_list[i] < net_score):
net_score += C_list[i]
else:
rolling_inv.append(net_inv)
net_inv = 0
net_inv += C_list[i]
由于某种原因,我得到了这样的列表:[15.2,-3.0],因此当出于某种原因到达负值时,它停止添加值。我意识到在数据框中可以有一种更简单的方法来执行此操作,但是我很难理解如何正确利用熊猫来执行此操作。与其说是寻找完整的代码,不如说是在寻找一些关于是否甚至可以在数据框中轻松实现以及建议使用的功能的见识。
答案 0 :(得分:2)
m=df['points'].lt(0).ne(df['points'].lt(0).shift()).cumsum()
df1= df.groupby([m,'date']).sum().drop(columns=['index'])
df1.index = df1.index.droplevel(0)
df1.reset_index(inplace=True)
print(df1)
输出
date points
0 9-15-17 15.2
1 9-15-17 -4.6
2 9-15-17 15.4