我认为这很简单,但我今天无法解决这个问题,需要一些帮助。
我有一个pandas数据帧:
df = pd.DataFrame({
'id': [0, 0, 1, 1, 2],
'q.name':['A'] * 3 + ['B'] * 2,
'q.value':['A1','A2','A3','B1','B2'],
'w.name':['Q', 'W', 'E', 'R', 'Q'],
'w.value':['B1','B2','C3','C1','D2']
})
看起来像这样
id q.name q.value w.name w.value
0 0 A A1 Q B1
1 0 A A2 W B2
2 1 A A3 E C3
3 1 B B1 R C1
4 2 B B2 Q D2
我希望将其转换为
id q.name q.value w.name w.value
0 0 A A A1 A2 Q W B1 B2
1 1 A B A3 B1 E R C3 C1
2 2 B B2 Q D2
我试过了pd.DataFrame(df.apply(lambda s: s.str.cat(sep=" ")))
,但那并没有给我我想要的结果。我以前做过这个,但是我很难回想起或找到任何关于SO的帖子来帮助我。
更新: 我之前应该提到过:有没有办法在不指定哪一列的情况下这样做? DataFrame会根据上下文进行更改。
我还更新了数据框并显示了id
字段,因为我才意识到这是可能的。我想现在id
字段上的groupby应该解决这个问题。
答案 0 :(得分:2)
<强>更新强>
In [117]: df.groupby('id', as_index=False).agg(' '.join)
Out[117]:
id q.name q.value w.name w.value
0 0 A A A1 A2 Q W B1 B2
1 1 A B A3 B1 E R C3 C1
2 2 B B2 Q D2
旧回答:
In [106]: df.groupby('category', as_index=False).agg(' '.join)
Out[106]:
category name
0 A A1 A2 A3
1 B B1 B2