嗨,我正在尝试检查数据帧是否存在任何差异。我使用和测试的代码如下
df1[~df1.apply(tuple,1).isin(df2.apply(tuple,1))]
#check the length
len(df1[~df1.apply(tuple,1).isin(df2.apply(tuple,1))])
因此,如果 len 为 0,则表示数据没有变化。所以我使用我自己的数据测试代码,我将其命名为“result_old”和“result_old_1”,两者都来自同一个来源,但是为什么我得到的 len 大于 0 而它实际上是相同的数据。我原以为结果是 0,下面是我的代码
#import existing data in path
path_file= (os.getcwd() + "/test")
result_old=pd.read_csv(path_file +'/dms.csv')
result_old_1=pd.read_csv(path_file +'/dms.csv')
print(len(result_old_1[~result_old_1.apply(tuple,1).isin(result_old.apply(tuple,1))]))
输出
723
有大佬解释一下吗?或指导我更正代码。谢谢。