import pandas as pd
sheets= pd.read_excel(r"C:\Users\raunak_pandey\Documents\Collateral Comp\Analysis\Source1.xlsx", sheet_name = 'Sheet1')
sheet2= pd.read_excel(r"C:\Users\raunak_pandey\Documents\Collateral Comp\Analysis\Source2.xlsx", sheet_name = 'Sheet1')
sheet3= sheets.where(sheets.values==sheet2.values).np.nan()
output= len(sheet3)- sheet3.sum()
sheet3.to_excel(r"C:\Users\raunak_pandey\Downloads\extract.xlsx",sheet_name= 'Sheet1')
output.to_excel(r"C:\Users\raunak_pandey\Downloads\extract_final.xlsx", sheet_name= 'Sheet1')
您好,有两个Excel文件,其中包含相同的列数(16),但行数不同。在source1中,总行数:2806,在source2中,总行数:3409 每行代表客户数据,当我使用上述代码比较两个文件时,它会显示以下消息: C:\ ProgramData \ Anaconda3 \ lib \ site-packages \ ipykernel_launcher.py:7:DeprecationWarning:逐元素比较失败;将来会出现错误。 导入系统
ValueError:条件数组必须与self的形状相同 python的新手, 感谢您的提前帮助