我有两个带有唯一和非唯一单词的熊猫数据框:
DataFrame 1:
Word Frequency Pos
Dance 10 INFN
Listen 5 INFN
和DataFrame 2:
Word Frequency Pos
Dance 15 INFN
Hear 5 INFN
因此,我需要一些如何合并这些数据帧的方法,使像“ dance”之类的行会计算两个数据帧的频率,因此输出如下所示:
Word Frequency Pos
Dance 25 INFN
Hear 5 INFN
Listen 5 INFN
答案 0 :(得分:1)
尝试使用concat
,然后尝试groupby
并使用sum
out = pd.concat([df1, df2]).groupby(['Word','Pos'])['Frequency'].sum().reset_index()
答案 1 :(得分:0)
您还可以使用append
和groupby
:
df = df1.append(df2).groupby(['Word', 'Pos'], as_index=False).sum()
print(df)
Word Pos Frequency
0 Dance INFN 25
1 Hear INFN 5
2 Listen INFN 5