我的问题如下。使用pd.ExcelFile方法我已经找到了如何阅读和解析我想要比较的相关Excel文件和表格。但是,虽然两者在可比较的列中都有类似的数据,但其中一列还有其他我不想分析的列。
所以这里存在核心问题:如何在Pandas中选择特定列来相互比较。理想情况下,我想选择一系列列,即:(列1-5 +列7到15),然后分析这些列的差异,并将差异打印到另一个excel文件。
到目前为止我的代码是:
import pandas as pd
#open excel files and parse (read) the relevant sheets
df0 = pd.ExcelFile(r"excel path")
df1 = pd.ExcelFile(r"excel path")
df0.parse("Sheet1")
df1.parse("Sheet2")
#skip the first row, which contains only column names and no data
df0.skiprows(0)
df1.skiprows(0)
尝试了几种方法来选择单个列并进行比较后,我失败了。帮助
谢谢!