Question

import pandas as pd 

sheets= pd.read_excel(r"C:\Users\raunak_pandey\Documents\Collateral Comp\Analysis\Source1.xlsx", sheet_name = 'Sheet1')
sheet2= pd.read_excel(r"C:\Users\raunak_pandey\Documents\Collateral Comp\Analysis\Source2.xlsx", sheet_name = 'Sheet1')
sheet3= sheets.where(sheets.values==sheet2.values).np.nan()
output= len(sheet3)- sheet3.sum()
sheet3.to_excel(r"C:\Users\raunak_pandey\Downloads\extract.xlsx",sheet_name= 'Sheet1')
output.to_excel(r"C:\Users\raunak_pandey\Downloads\extract_final.xlsx", sheet_name= 'Sheet1')

您好，有两个Excel文件，其中包含相同的列数（16），但行数不同。在source1中，总行数：2806，在source2中，总行数：3409 每行代表客户数据，当我使用上述代码比较两个文件时，它会显示以下消息： C：\ ProgramData \ Anaconda3 \ lib \ site-packages \ ipykernel_launcher.py：7：DeprecationWarning：逐元素比较失败；将来会出现错误。导入系统

ValueError：条件数组必须与self的形状相同 python的新手，感谢您的提前帮助

在python中比较两个数据集（Excelsheets）

0 个答案: