我有几个数据帧df1,df2,... dfn保存在我想使用n滚动窗口连接的同一文件夹中。因此对于n = 2,我将df1放在单独的文件夹中,并编写了以下循环,将d1 + d2,df2 + df3,df3 + 4等连接起来。
df1 = pd.read_excel(r'C:\myinputfilepath\startingfile\df1.xlsx')
inputfilepath = r'C:\myinputfilepath\*.xlsx'
for file in glob.iglob(inputfilepath):
df2 = pd.read_excel(file)
dfcombined = pd.concat([df,df2])
df = df2
这很完美,并且可以类似的方式同时连接三个数据帧,以便使用此代码获得df1 + df2 + df3,df2 + df3 + d4等:
df1 = pd.read_excel(r'C:\myinputfilepath\startingfile\df1.xlsx')
df2 = pd.read_excel(r'C:\myinputfilepath\startingfile\df2.xlsx')
for file in glob.iglob(inputfilepath):
df3 = pd.read_excel(file)
dfcombined = pd.concat([d1,df2,df3])
df1 = df2
df2 = df3
我现在的问题是:最有效的自动化方法是什么,以便可以将循环放入函数中并给出n(窗口的大小)作为参数之一,理想情况下,我不希望编辑文件夹,然后每次都手动移动起始文件。
非常欢迎各种建议。