自动在文件夹中搜索特定的excel文件并将其导入熊猫

时间:2019-10-02 00:32:40

标签: python excel pandas import directory

到目前为止,我还没有看到我要问的问题。

我在说C盘的文件夹中有2个excel文件,这些文件名为say RedRose。 文件的开头是日期09-30-2019_rest_of_name1,... name2。 _rest_of_name1,... name2是静态的,只有每天更新日期,因为每天都会将新文件添加到RedRose文件夹中。

使用“运行时使用Python”命令,我想自动查找该文件夹,搜索每个文件名,然后将每个文件导入其自己的pandas数据框中。

这样的想法,可以用Python完成吗?

不确定从哪里开始

1 个答案:

答案 0 :(得分:0)

您可以使用glob模块获取当前目录中的文件列表。

import glob
files = glob.glob('C:\RedRose\*.xls*')

它返回扩展名为.xls的文件列表,并使用正则表达式检查正确的名称。另外,Windows路径格式可能不同

使用Pandas库中的read_excel函数将Excel文件读入DataFrames。您可以循环浏览files中的所有文件名,并将每个DataFrame存储为列表或字典的元素。

import pandas as pd

dataframes = []
for filename in files:
    dataframes.append(pd.read_excel(filename))

要阅读字典,您需要为每个DataFrame指定一个键。我建议使用文件名作为密钥,因为它是唯一的。