在python中比较两个数据集(Excelsheets)

时间:2019-11-17 18:31:58

标签: python excel pandas

import pandas as pd 

sheets= pd.read_excel(r"C:\Users\raunak_pandey\Documents\Collateral Comp\Analysis\Source1.xlsx", sheet_name = 'Sheet1')
sheet2= pd.read_excel(r"C:\Users\raunak_pandey\Documents\Collateral Comp\Analysis\Source2.xlsx", sheet_name = 'Sheet1')
sheet3= sheets.where(sheets.values==sheet2.values).np.nan()
output= len(sheet3)- sheet3.sum()
sheet3.to_excel(r"C:\Users\raunak_pandey\Downloads\extract.xlsx",sheet_name= 'Sheet1')
output.to_excel(r"C:\Users\raunak_pandey\Downloads\extract_final.xlsx", sheet_name= 'Sheet1')

您好,有两个Excel文件,其中包含相同的列数(16),但行数不同。在source1中,总行数:2806,在source2中,总行数:3409 每行代表客户数据,当我使用上述代码比较两个文件时,它会显示以下消息: C:\ ProgramData \ Anaconda3 \ lib \ site-packages \ ipykernel_launcher.py:7:DeprecationWarning:逐元素比较失败;将来会出现错误。   导入系统

ValueError:条件数组必须与self的形状相同 python的新手, 感谢您的提前帮助

0 个答案:

没有答案