通过循环从目录中提取文件

时间:2019-07-03 22:50:22

标签: python

我正在运行一个循环,该循环需要访问目录中的大约200个文件。

在文件夹中-文件的格式范围如下:

Excel_YYYYMMDD.txt
Excel_YYYYMMDD_V2.txt
Excel_YYYYMMDD_orig.txt

我只需要提取第一个-YYYYMMDD.txt,就没有其他

我正在使用glob.glob来访问我按如下方式指定路径名的目录:

path = "Z:\T\Al8787\Box\EAST\OT\\ABB files/2019/*[0-9].txt"

但是代码也提取了.Excel_YYYYMMDD_orig.txt文件

在如何修改代码以仅提取所需文件方面提供了帮助。

2 个答案:

答案 0 :(得分:2)

一个简单的解决方案是遍历glob.glob(path)返回的文件。例如,如果

files = glob.glob("Z:\T\Al8787\Box\EAST\OT\\ABB files/2019/*[0-9].txt")

您可以拥有

cleaned_files = [file for file in files if "orig" not in files]

这将删除文件中包含子字符串orig

的所有项目

答案 1 :(得分:0)

也许您应该将拆分功能合并到代码中

var=path.split('whatever letter separates them')

然后打印出该变量。