我有两个pandas
DataFrame
,我希望将它们连接在一起,这样我就可以删除重复项的外连接。我的问题是.drop_duplicates()
在查找重复项时忽略索引。如果索引不同,那么它不应该是重复的。如果行索引和列是重复的,如何删除重复项?我唯一能想到的是使用df.to_dict()
,然后创建一个新的DataFrame(非常低效)。
更新
这里要求的是我的数据示例:
from pandas import *
index1 = ['2012-05-2' + str(i) for i in range(0,6)]
data1 = {'rate': range(0,6)}
a = DataFrame(data1, index1)
index2 = ['2012-05-2' + str(i) for i in range(3,9)]
data2 = {'rate': range(3,9)}
b = DataFrame(data2, index2)
格伦
答案 0 :(得分:1)
<强>解决方案:强>
a.combine_first(b)
谢谢Wes。