我有30多个Excel工作表,其中包含许多列。我只想从每个文件中提取相关列,然后合并所有这些文件以构成一个组合的数据框。我计划加载每个excel文件,获取相关数据,保存并合并所有文件。我正在尝试使用pickle模块,但如何实现它有点困惑。
我有两个数据帧,如下所示:
cdd = pd.read_excel('C:/Users/omer qureshi/Desktop/acess/new_data_Call1Q07.xlsx')
acd = pd.read_excel('C:/Users/omer qureshi/Desktop/acess/new_data_Call1Q08.xlsx')
我想要许多列,但出于示例目的,我刚才提到了两列:'RSSD9999','RCFD0010'
cdd = cdd[['RSSD9999','RCFD0010']]
file = 'mycdd.pkl'
fileobj = open(file,'wb')
pickle.dump(cdd,fileobj)
fileobj.close()
我知道需要对以下提到的代码进行一些修改,但不确定如何实现。当我提取了cdd数据帧中的相关列时,我想对acd做同样的事情
file = 'mycdd.pkl'
fileobj = open(file,'rb')
mycar = pickle.load(fileobj)
print(mycar)