我正在构建一个python脚本,它将从我的库中删除重复项作为python中的练习。我们的想法是为库中文件夹中的每个文件构建一个包含dict(包含文件/文件夹上的数据和统计信息)的dict。它目前适用于一定数量的子文件夹。这是它给出的一个例子。
>>> Files
{'/root/dupclean/working/test': {'FilenameEncoding': {'confidence': 1.0, 'encoding': 'ascii'}, 'File': False, 'T\xc3\xa9l\xc3\xa9phone': {'FilenameEncoding': {'confidence': 0.75249999999999995, 'encoding': 'utf-8'}, 'File': False, 'Extension': 'Folder', 'LastModified': 1284064857, 'FullPath': '/root/dupclean/working/test/T\xc3\xa9l\xc3\xa9phone', 'CreationTime': 1284064857, 'LastAccessed': 1284064857, 'Best Of': {'FilenameEncoding': {'confidence': 0.75249999999999995, 'encoding': 'utf-8'}, 'File': False, 'Extension': 'Folder', 'LastModified': 1284064965, 'FullPath': '/root/dupclean/working/test/T\xc3\xa9l\xc3\xa9phone/Best Of', '10 New York Avec Toi.mp3': {'FilenameEncoding': {'confidence': 0.75249999999999995, 'encoding': 'utf-8'}, 'File': True, 'Extension': 'mp3', 'LastModified': 1284064858, 'FullPath': '/root/dupclean/working/test/T\xc3\xa9l\xc3\xa9phone/Best Of/10 New York Avec Toi.mp3', 'CreationTime': 1284064858, 'LastAccessed': 1284064858, 'Size': 2314368L}, 'CreationTime': 1284064965, 'LastAccessed': 1284064857}}}}
这就是我现在制作它的方式:
ROOT = Settings['path']
Files = {ROOT: {'File': False, 'FilenameEncoding': chardet.detect(ROOT)},}
for fileName in os.listdir ( ROOT ):
fileStats = ROOT + '/' + fileName
if os.path.isdir ( fileStats ):
Files[ROOT][fileName] = Analyse(fileStats)
for fileName2 in os.listdir ( ROOT + '/' + fileName):
dbg(70, "Scanning " + ROOT + '/' + fileName + '/' + fileName2)
fileStats2 = ROOT + '/' + fileName + '/' + fileName2
#third level
if os.path.isdir ( fileStats2 ):
Files[ROOT][fileName][fileName2] = Analyse(fileStats2)
for fileName3 in os.listdir ( ROOT + '/' + fileName + '/' + fileName2):
dbg(70, "Scanning " + ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3)
fileStats3 = ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3
#Fourth level
if os.path.isdir ( fileStats3 ):
Files[ROOT][fileName][fileName2][fileName3] = Analyse(fileStats3)
for fileName4 in os.listdir ( ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3):
dbg(70, "Scanning " + ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4)
fileStats4 = ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4
#Fifth level
if os.path.isdir ( fileStats4 ):
Files[ROOT][fileName][fileName2][fileName3][fileName4] = Analyse(fileStats4)
for fileName5 in os.listdir ( ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4):
dbg(70, "Scanning " + ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4 + '/' + fileName5)
fileStats5 = ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4 + '/' + fileName5
#Sicth level
if os.path.isdir ( fileStats5 ):
Files[ROOT][fileName][fileName2][fileName3][fileName4][fileName5] = Analyse(fileStats5)
dbg(10, "There was still a folder left in "+ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4)
else:
Files[ROOT][fileName][fileName2][fileName3][fileName4][fileName5] = Analyse(fileStats5)
else:
Files[ROOT][fileName][fileName2][fileName3][fileName4] = Analyse(fileStats4)
else:
Files[ROOT][fileName][fileName2][fileName3] = Analyse(fileStats3)
else:
Files[ROOT][fileName][fileName2] = Analyse(fileStats2)
else:
Files[ROOT][fileName] = Analyse(fileStats)
这显然是错的,但对于我的生活,我只是无法想办法递归地做到这一点!
任何帮助或指针都会被大大贬低。
答案 0 :(得分:13)
使用os.walk
。
import os
for dirpath,dirs,files in os.walk(ROOT):
for f in dirs + files:
fn = os.path.join(dirpath, f)
FILES[fn] = Analyse(fn)