Pandas数据框左合并具有不同的数据框大小

时间:2017-05-30 15:21:18

标签: python pandas dataframe

我有玩具库存预测器,并且不时使用数据框保存结果。在第一个结果集之后,我想追加我的第一个数据帧。这是我的工作:

  1. 使用预测结果创建第一个数据框
  2. 降序预测绩效
  3. 保存到csv,没有索引

  4. 使用新数据,读出结果csv并尝试左合并,目标是将新的预测性能附加到正确的股票代码

  5. df=pd.merge(df, df_new[['ticker', 'avgrd_app']], on='ticker', how='left')

    这两个数据帧具有不同的列数。最后,它只将数据帧附加到另一个:

    avgrd,avgrd_app,prediction1,prediction2,ticker
    
    -0.533520756811,,110.64654541,110.37853241,KIO
    -0.533520756811,,110.64654541,110.37853241,MMM
    -0.604610694122,,110.64654541,110.37853241,SRI  
    [...]
    ,-0.212600450514,,,G5DN
    ,0.96378750992,,,G5N
    ,2.92757501984,,,DAL3
    ,2.27297945023,,,WHF4
    

    那么 - 我怎样才能正确合并?

1 个答案:

答案 0 :(得分:0)

从示例结果中,它按预期工作,新数据没有所有代码的数字,因此缺少某些预测。那么你想要实现什么目标呢?如果您只需要包含所有预测的股票,请使用内部联接。