将数据帧的行与字符串列组合在一起

时间:2017-08-09 12:24:21

标签: python pandas dataframe

我认为这很简单,但我今天无法解决这个问题,需要一些帮助。

我有一个pandas数据帧:

df = pd.DataFrame({
    'id': [0, 0, 1, 1, 2],
    'q.name':['A'] * 3 + ['B'] * 2,
    'q.value':['A1','A2','A3','B1','B2'],
    'w.name':['Q', 'W', 'E', 'R', 'Q'],
    'w.value':['B1','B2','C3','C1','D2']
})

看起来像这样

    id  q.name  q.value w.name  w.value
0   0   A   A1  Q   B1
1   0   A   A2  W   B2
2   1   A   A3  E   C3
3   1   B   B1  R   C1
4   2   B   B2  Q   D2

我希望将其转换为

    id  q.name  q.value w.name  w.value
0   0   A A     A1 A2   Q W     B1 B2
1   1   A B     A3 B1   E R     C3 C1
2   2   B       B2      Q       D2

我试过了pd.DataFrame(df.apply(lambda s: s.str.cat(sep=" "))),但那并没有给我我想要的结果。我以前做过这个,但是我很难回想起或找到任何关于SO的帖子来帮助我。

更新: 我之前应该提到过:有没有办法在不指定哪一列的情况下这样做? DataFrame会根据上下文进行更改。

我还更新了数据框并显示了id字段,因为我才意识到这是可能的。我想现在id字段上的groupby应该解决这个问题。

1 个答案:

答案 0 :(得分:2)

<强>更新

In [117]: df.groupby('id', as_index=False).agg(' '.join)
Out[117]:
   id q.name q.value w.name w.value
0   0    A A   A1 A2    Q W   B1 B2
1   1    A B   A3 B1    E R   C3 C1
2   2      B      B2      Q      D2

旧回答:

In [106]: df.groupby('category', as_index=False).agg(' '.join)
Out[106]:
  category      name
0        A  A1 A2 A3
1        B     B1 B2