我正在遍历数据框,并尝试存储每个ID的“总计”列表。
数据框如下所示:
id total difference
1 29 3
1 21 2
2 39 0
2 22 9
到目前为止,我已经尝试过:
total_list=[]
for i, row in df.iterrows():
total_list.extend(df.total.loc[df.id==row.id].tolist())
print(total_list) # this never gets print
total_list应该看起来像[[29,21],[39,22]]
答案 0 :(得分:1)
只要我理解正确,就可以不循环而完成此操作。 我假设您的输出中的31应该是21。
设置
Notice: Undefined index: jobsector_id
解决方案
>>> df = pd.DataFrame([[1,29,3],[1,21,2],[2,39,0],[2,22,9]], columns=['id', 'total','difference'])
>>>
>>> df
id total difference
0 1 29 3
1 1 21 2
2 2 39 0
3 2 22 9