当我们处理重复性任务时,例如你有一个每周进程,以相同的格式,但不同的数字获得一个excel文件。我们如何要求Python只读取文件夹中最近添加或修改的文件(假设该文件夹用于保存所有历史文件)?
当然我们可以分配一个excel文件名并使用pandas或其他库来读取它。但由于我不需要导入以前的文件,并且我不想打开.py文件来更新excel文件名,我希望找到一种方法来自动化该过程。
答案 0 :(得分:0)
使用os.path.getmtime读取文件的修改时间。
import os
import glob
excel_folder = 'C:/Users/ThisOne/ExcelStuff/'
# glob.glob returns all paths matching the pattern.
excel_files = list(glob.glob(os.path.join(excel_folder, '*.xls*')))
mod_dates = [os.path.getmtime(f) for f in excel_files]
# sort by mod_dates.
file_date = zip(excel_files, mod_dates).sort(key=lambda d: d[1])
newest_file_path = file_date[0][1]
对类似问题here的良好回应。
答案 1 :(得分:0)
import os
import glob
os.chdir(r"H:\file_input_data_excel")
def read_folder():
while True:
print("------Đang quét file-----")
for file in glob.glob("*.xls*"):
print(file)
time.sleep(10)