我有一个数据框。
Dataframe1:
desc id result
A 1 Yes
A 2 No
A 3 Yes
A 4 No
B 1 No
B 2 Yes
C 1 Yes
输出:
Dataframe2:
id result
1 A_Yes, B_No, C_Yes
2 A_No, B_Yes
3 A_Yes
4 A_No
5
它只是concat desc和result,然后进行分组。
我应该怎么做?
答案 0 :(得分:3)
(df.desc+'_'+df.result).groupby(df['id']).apply(','.join).reset_index(name='result')
Out[207]:
id result
0 1 A_Yes,B_No,C_Yes
1 2 A_No,B_Yes
2 3 A_Yes
3 4 A_No
答案 1 :(得分:1)
您可以合并desc
和result
列,然后使用pandas.groupby.DataFrame.agg
df['result'] = df['desc'] + '_' + df['result']
df = df.groupby('id').agg({'result': ', '.join})
print(df)
result
id
1 A_Yes, B_No, C_Yes
2 A_No, B_Yes
3 A_Yes
4 A_No