Python - 如何以递归方式在dict中添加文件夹的内容

时间:2010-09-09 20:48:17

标签: python

我正在构建一个python脚本,它将从我的库中删除重复项作为python中的练习。我们的想法是为库中文件夹中的每个文件构建一个包含dict(包含文件/文件夹上的数据和统计信息)的dict。它目前适用于一定数量的子文件夹。这是它给出的一个例子。

>>> Files
{'/root/dupclean/working/test': {'FilenameEncoding': {'confidence': 1.0, 'encoding': 'ascii'}, 'File': False, 'T\xc3\xa9l\xc3\xa9phone': {'FilenameEncoding': {'confidence': 0.75249999999999995, 'encoding': 'utf-8'}, 'File': False, 'Extension': 'Folder', 'LastModified': 1284064857, 'FullPath': '/root/dupclean/working/test/T\xc3\xa9l\xc3\xa9phone', 'CreationTime': 1284064857, 'LastAccessed': 1284064857, 'Best Of': {'FilenameEncoding': {'confidence': 0.75249999999999995, 'encoding': 'utf-8'}, 'File': False, 'Extension': 'Folder', 'LastModified': 1284064965, 'FullPath': '/root/dupclean/working/test/T\xc3\xa9l\xc3\xa9phone/Best Of', '10 New York Avec Toi.mp3': {'FilenameEncoding': {'confidence': 0.75249999999999995, 'encoding': 'utf-8'}, 'File': True, 'Extension': 'mp3', 'LastModified': 1284064858, 'FullPath': '/root/dupclean/working/test/T\xc3\xa9l\xc3\xa9phone/Best Of/10 New York Avec Toi.mp3', 'CreationTime': 1284064858, 'LastAccessed': 1284064858, 'Size': 2314368L}, 'CreationTime': 1284064965, 'LastAccessed': 1284064857}}}}

这就是我现在制作它的方式:

ROOT = Settings['path']
Files = {ROOT: {'File': False, 'FilenameEncoding': chardet.detect(ROOT)},}
for fileName in os.listdir ( ROOT ):
fileStats = ROOT + '/' + fileName
    if os.path.isdir ( fileStats ):
        Files[ROOT][fileName] = Analyse(fileStats)
        for fileName2 in os.listdir ( ROOT + '/' + fileName): 
            dbg(70, "Scanning " + ROOT + '/' + fileName + '/' + fileName2)
            fileStats2 = ROOT + '/' + fileName + '/' + fileName2
            #third level
            if os.path.isdir ( fileStats2 ):
                Files[ROOT][fileName][fileName2] = Analyse(fileStats2)
                for fileName3 in os.listdir ( ROOT + '/' + fileName + '/' + fileName2): 
                    dbg(70, "Scanning " + ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3)
                    fileStats3 = ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3
                    #Fourth level
                    if os.path.isdir ( fileStats3 ):
                        Files[ROOT][fileName][fileName2][fileName3] = Analyse(fileStats3)
                        for fileName4 in os.listdir ( ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3): 
                            dbg(70, "Scanning " + ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4)
                            fileStats4 = ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4
                            #Fifth level
                            if os.path.isdir ( fileStats4 ):
                                Files[ROOT][fileName][fileName2][fileName3][fileName4] = Analyse(fileStats4)
                                for fileName5 in os.listdir ( ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4): 
                                    dbg(70, "Scanning " + ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4 + '/' + fileName5)
                                    fileStats5 = ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4 + '/' + fileName5
                                    #Sicth level
                                    if os.path.isdir ( fileStats5 ):
                                        Files[ROOT][fileName][fileName2][fileName3][fileName4][fileName5] = Analyse(fileStats5)
                                        dbg(10, "There was still a folder left in "+ROOT + '/' + fileName + '/' + fileName2 + '/' + fileName3 + '/' + fileName4)
                                    else:
                                        Files[ROOT][fileName][fileName2][fileName3][fileName4][fileName5] = Analyse(fileStats5)
                            else:
                                Files[ROOT][fileName][fileName2][fileName3][fileName4] = Analyse(fileStats4)
                    else:
                        Files[ROOT][fileName][fileName2][fileName3] = Analyse(fileStats3)
            else:
                Files[ROOT][fileName][fileName2] = Analyse(fileStats2)
    else:
        Files[ROOT][fileName] = Analyse(fileStats)

这显然是错的,但对于我的生活,我只是无法想办法递归地做到这一点!
任何帮助或指针都会被大大贬低。

1 个答案:

答案 0 :(得分:13)

使用os.walk

import os
for dirpath,dirs,files in os.walk(ROOT):
    for f in dirs + files:
        fn = os.path.join(dirpath, f)
        FILES[fn] = Analyse(fn)