我正在扫描文件夹及其子文件夹,查找具有以下特定格式的文件:saving_0.0000000.gz
。有包含数百个此类文件的文件夹,我想提取名称中数值最大的文件。例如,如果在一个文件夹中我有saving_0.0000000.gz
,saving_100.00000.gz
和saving_250.00000.gz
,那么我希望程序仅复制saving_250.00000.gz
文件。
我编写的程序似乎可以正确地移动到父文件夹(使用os.walk
),并且可以找到正确的文件(我使用调试器进行了检查)。因此,我将感兴趣的文件名(即saving_123456.78.gz
)存储在fichier
变量中,但是当我执行程序时,它会复制比我需要的文件更多的文件。我尝试将shutil.copy
从最后一个for循环中移出(这样它不会复制每个文件),但是我收到一条错误消息:
FileNotFoundError: [Errno 2] No such file or directory: '/path/to/saving_0.0000000.gz'
#! /usr/bin/python3.4
import re, os, shutil, gzip
sauvegarde = '/mnt/desto/Sauvegardes_archivees'
dossier = '/mnt/desto/EPS2_900_V5/'
matrices = ['subfolder_1', 'subfolder_2', 'subfolder_3']
for mat in matrices:
for folders, subfolders, files in os.walk(dossier + mat):
fichier = 'saving_0.0000000.gz'
for file in files:
f = fichier.split('_')[1].split('.')[0]
if not file.startswith('saving_') or not file.endswith('.gz') or not len(file) == 19:
continue
hgz_sauv = file.split('_')[1]
h_sauv = hgz_sauv.split('.')[0]
if len(h_sauv) >= len(f) and int(h_sauv) >= int(f):
fichier = file
shutil.copy(os.path.join(dossier,mat,folders,fichier),sauvegarde)