在 2 个熊猫数据框中找到差异

时间:2021-03-02 04:00:39

标签: python pandas dataframe

嗨,我正在尝试检查数据帧是否存在任何差异。我使用和测试的代码如下

df1[~df1.apply(tuple,1).isin(df2.apply(tuple,1))]

#check the length
len(df1[~df1.apply(tuple,1).isin(df2.apply(tuple,1))])

因此,如果 len 为 0,则表示数据没有变化。所以我使用我自己的数据测试代码,我将其命名为“result_old”和“result_old_1”,两者都来自同一个来源,但是为什么我得到的 len 大于 0 而它实际上是相同的数据。我原以为结果是 0,下面是我的代码

#import existing data in path
path_file= (os.getcwd() + "/test")
result_old=pd.read_csv(path_file +'/dms.csv')
result_old_1=pd.read_csv(path_file +'/dms.csv')

print(len(result_old_1[~result_old_1.apply(tuple,1).isin(result_old.apply(tuple,1))]))

输出

723

有大佬解释一下吗?或指导我更正代码。谢谢。

0 个答案:

没有答案