到目前为止,我还没有看到我要问的问题。
我在说C盘的文件夹中有2个excel文件,这些文件名为say RedRose。 文件的开头是日期09-30-2019_rest_of_name1,... name2。 _rest_of_name1,... name2是静态的,只有每天更新日期,因为每天都会将新文件添加到RedRose文件夹中。
使用“运行时使用Python”命令,我想自动查找该文件夹,搜索每个文件名,然后将每个文件导入其自己的pandas数据框中。
这样的想法,可以用Python完成吗?
不确定从哪里开始
答案 0 :(得分:0)
您可以使用glob
模块获取当前目录中的文件列表。
import glob
files = glob.glob('C:\RedRose\*.xls*')
它返回扩展名为.xls
的文件列表,并使用正则表达式检查正确的名称。另外,Windows路径格式可能不同
使用Pandas库中的read_excel
函数将Excel文件读入DataFrames。您可以循环浏览files
中的所有文件名,并将每个DataFrame存储为列表或字典的元素。
import pandas as pd
dataframes = []
for filename in files:
dataframes.append(pd.read_excel(filename))
要阅读字典,您需要为每个DataFrame指定一个键。我建议使用文件名作为密钥,因为它是唯一的。