基于pandas中的两列优化合并python

时间:2018-04-24 15:28:53

标签: python pandas dataframe

我有2个数据框:

df1 = pd.DataFrame({ 'message' : (["hi","hi","hello?","bye","are you there?","how are you?"]),
                     'serial' : ([14,12,13,13,14,14]),
                     'messageOrder': (1,1,1,2,3,2)})

df2 = pd.DataFrame({ 'message' : (["hi","hi","hello?","bye","are you there?","how are you?"]),
                    'B' : pd.Timestamp('20130102'),
                    'D' : np.array([3] * 6,dtype='int32'),
                    'serial' : ([14,12,13,13,14,14])})

我正在寻找将messageOrder列从df1合并到df2的最佳方法(df2有更多列,我没有在示例中包含)。我想过遍历所有行并且:

  • 验证" serial"在df1和df2
  • 中的两行之间是相同的
  • 匹配"消息"列根据其内容。

有优雅的方法吗?

数据帧长14,000行,每个"串行"有1-20个值。

0 个答案:

没有答案