我正在尝试连接xlsx文件列表。这是我的代码:
import pandas as pd
from glob import glob
files = glob('DS*.xlsx')
files_combined = pd.concat((pd.read_excel(x).assign(filename = x) for x in files))
我明白了
IndexError: list index out of range
我做了很多研究,似乎人们怀疑的问题是glob返回一个空白列表。但是,当我将代码更改为
import pandas as pd
from glob import glob
files = glob('RC*.xlsx')
print(files)
我得到了要连接的文件列表。我尝试将代码更改为
import pandas as pd
from glob import glob
import os
DIR = 'Y:\\files\'
files = glob(os.path.join(DIR, 'DS*.xlsx'))
files_combined = pd.concat((pd.read_excel(x).assign(filename = x)
for x in files))
但是我遇到同样的错误。
答案 0 :(得分:0)
我成功运行了此代码(基本上是您的原始代码):
import os
import pandas as pd
from glob import glob
os.chdir('C:/users/xxxx/')
files = glob('*.xlsx')
files_combined = pd.concat((pd.read_excel(x).assign(filename = x) for x in files))
没有错误,因此我添加了此内容并重新运行:
print(files_combined)
结果是我目录中的5个xlsx文件的串联。
然后我想测试“无文件”选项,所以我更改了glob语句:
import os
import pandas as pd
from glob import glob
os.chdir('C:/users/xxxx/')
files = glob('*.xlsx1234')
files_combined = pd.concat((pd.read_excel(x).assign(filename = x) for x in files))
现在,我收到错误“无对象可连接”。因此,空白列表也不会返回“列表索引超出范围”错误。