我改回了我的问题。我正在寻找解决方案以解决以下问题:
我有一个DataFrame,如:
Sp Mt Value count
4 MM2 S4 bg 10
5 MM2 S4 dgd 1
6 MM4 S2 rd 2
7 MM4 S2 cb 8
8 MM4 S2 uyi 8
另一个DataFrame,如:
Sp Mt Value count
4 MM2 S4 bg 9
5 MM2 S4 dgd 10
6 MM4 S2 rd 21
7 MM4 S2 cb 8
8 MM4 S2 uyi 8
我想合并两者:
Sp Mt Value count
4 MM2 S4 bg [10,9]
5 MM2 S4 dgd [1,10]
6 MM4 S2 rd [2,21]
7 MM4 S2 cb [8,8]
8 MM4 S2 uyi [8,8]
答案 0 :(得分:2)
使用merge
(默认inner join
)或concat
(默认outer join
)首先加入一个。然后创建新列,最后按drop
删除不必要的列:
df = pd.merge(df1, df2, on = ['Sp','Mt','Value'])
df['count'] = df.filter(like='count').values.tolist()
df = df.drop(['count_x','count_y'], axis=1)
print (df)
Sp Mt Value count
0 MM2 S4 bg [10, 9]
1 MM2 S4 dgd [1, 10]
2 MM4 S2 rd [2, 21]
3 MM4 S2 cb [8, 8]
4 MM4 S2 uyi [8, 8]
cols = ['Sp','Mt','Value']
df = pd.concat([df1.set_index(cols)['count'],
df2.set_index(cols)['count']],axis=1, keys=('count','a'))
df['count'] = df[['count','a']].values.tolist()
df = df.drop('a', axis=1).reset_index()
print (df)
Sp Mt Value count
0 MM2 S4 bg [10, 9]
1 MM2 S4 dgd [1, 10]
2 MM4 S2 rd [2, 21]
3 MM4 S2 cb [8, 8]
4 MM4 S2 uyi [8, 8]
答案 1 :(得分:0)
frames=[df1,df2]
df3=pd.concat(frames)
df_merged_agg=df3.groupby(['Sp','Mt','Value']).agg({'count': lambda x: ','.join(x)}).reset_index()
结果将是:
Sp Mt Value count
0 MM2 S4 bg 10,9
1 MM2 S4 dgb 1,10
2 MM4 S2 cb 8,8
3 MM4 S2 rd 2,21
4 MM4 S2 uyi 8,8
获取元组聚合字段:
df_merged_agg=df3.groupby(['Sp','Mt','Value']).agg(lambda x: tuple(x)).reset_index()
答案 2 :(得分:0)
在npm install history --save
上使用pd.Series.add
list