我有两个数据框,每个数据框都有一系列日期作为索引。不重叠的日期(换句话说,一个日期范围,例如,2013-01-01至2016-06-15按月和第二个DataFrame将于2016-06-15开始,并按季度运行至2035-06-15 。
大多数列名称重叠(即相同),并且连接正常。但是,每个DataFrame中都有一列我希望将其保留为原始DataFrame的“所属”,以便我可以将它们都用于将来使用。我给了每个人一个不同的名字。例如,DF1
有一个名为opselapsed_time的列,DF2
有一个名为constructionelapsed_time的列。
当我尝试使用命令DF1
将DF2
和DF1.combine_first(DF2)
组合在一起时,反之亦然,我收到此错误:ValueError: Cannot convert NA to integer.
有人可以就如何最好地解决问题给我建议吗?
我是否需要坚持使用合并/连接类型解决方案而不是combine_first?
答案 0 :(得分:0)
找到最佳解决方案:
pd.tools.merge.concat([test.construction,test.ops],加入='外&#39)
连接日期索引并保留不同的列。如果列名相同,它将加入内部'或者'外部'如指定的那样。