要求是比较两个具有不同头的数据帧(数据集)。基本上,我正在查询数据库(HANA)表,并将其输出与SQL代码的输出进行比较,以进行数据测试
Ex
df1:
customerNo City Amount
C1 ABC 100
C2 XYZ 50
df2:
customer Place Amount
C1 ABC 100
C2 PQR 40
尽管列名不同,但是顺序正确。有没有一种方法可以仅基于列顺序比较数据集?
我尝试了datacompy.Compare(df1,df2, on_index=True)
,但是没有用。
答案 0 :(得分:0)
尝试重命名列,然后运行比较测试。 重命名列的示例:
df2 = df2.rename(columns = {'customer':'customerNo','Place':'city','Amount':'Amount'})