如何合并具有重复值和其他值不同的数据框列值?

时间:2019-02-28 05:22:33

标签: python regex python-3.x pandas dataframe

具有包含值的df

    0     |   1
15sdttb   |  sun 
wnx526y   |  earth
15sdttb   |  mercury
wnx526y   |  moon
15sdttb   |  mars
15sdttb   |  jupyter

如何通过与1中的所有不同值合并来合并df中的两个相同值

第二个输出应该说的是前两个首选项

  1. 输出应为

         0     |   1
     15sdttb   |  sun/mercury/mars/jupyter
     wnx526y   |  earth/moon
    
  2. 输出(采用前两个首选项)

         0     |   1
     15sdttb   |  sun/mercury
     wnx526y   |  earth/moon
    

1 个答案:

答案 0 :(得分:1)

df = df.groupby('A')['B'].apply(lambda x: '/'.join(x))
df.reset_index()

输出

            A                                  B
0  15sdttb       sun /  mercury/  mars/  jupyter
1  wnx526y                          earth/  moon

对于前两个首选项

df = df.groupby('A')['B'].apply(lambda x: '/'.join(x[:2]))
df.reset_index()

输出

            A                 B
0  15sdttb       sun /  mercury
1  wnx526y         earth/  moon