Pandas - 如何合并两个DataFrame

时间:2017-04-23 11:58:10

标签: python pandas

我改回了我的问题。我正在寻找解决方案以解决以下问题:

我有一个DataFrame,如:

 Sp   Mt   Value  count
4  MM2  S4   bg     10
5  MM2  S4   dgd    1
6  MM4  S2   rd     2
7  MM4  S2   cb     8
8  MM4  S2   uyi    8

另一个DataFrame,如:

  Sp   Mt   Value  count
4  MM2  S4   bg     9
5  MM2  S4   dgd    10
6  MM4  S2   rd     21
7  MM4  S2   cb     8
8  MM4  S2   uyi    8

我想合并两者:

 Sp   Mt   Value  count
4  MM2  S4   bg    [10,9]
5  MM2  S4   dgd   [1,10]
6  MM4  S2   rd    [2,21]
7  MM4  S2   cb    [8,8]
8  MM4  S2   uyi   [8,8]

3 个答案:

答案 0 :(得分:2)

使用merge(默认inner join)或concat(默认outer join)首先加入一个。然后创建新列,最后按drop删除不必要的列:

df = pd.merge(df1, df2, on = ['Sp','Mt','Value'])
df['count'] = df.filter(like='count').values.tolist()
df = df.drop(['count_x','count_y'], axis=1)
print (df)
    Sp  Mt Value    count
0  MM2  S4    bg  [10, 9]
1  MM2  S4   dgd  [1, 10]
2  MM4  S2    rd  [2, 21]
3  MM4  S2    cb   [8, 8]
4  MM4  S2   uyi   [8, 8]
cols = ['Sp','Mt','Value']
df = pd.concat([df1.set_index(cols)['count'], 
                df2.set_index(cols)['count']],axis=1, keys=('count','a'))
df['count'] = df[['count','a']].values.tolist()
df = df.drop('a', axis=1).reset_index()
print (df)
    Sp  Mt Value    count
0  MM2  S4    bg  [10, 9]
1  MM2  S4   dgd  [1, 10]
2  MM4  S2    rd  [2, 21]
3  MM4  S2    cb   [8, 8]
4  MM4  S2   uyi   [8, 8]

答案 1 :(得分:0)

frames=[df1,df2]
df3=pd.concat(frames)

df_merged_agg=df3.groupby(['Sp','Mt','Value']).agg({'count': lambda x: ','.join(x)}).reset_index()

结果将是:

 Sp  Mt Value count
0  MM2  S4    bg  10,9
1  MM2  S4   dgb  1,10
2  MM4  S2    cb   8,8
3  MM4  S2    rd  2,21
4  MM4  S2   uyi   8,8

获取元组聚合字段:

df_merged_agg=df3.groupby(['Sp','Mt','Value']).agg(lambda x: tuple(x)).reset_index()

答案 2 :(得分:0)

npm install history --save 上使用pd.Series.add

list