如何将目录结构解析为字典?

时间:2012-03-08 14:05:45

标签: python

我有目录结构列表,例如:

['/a/b', '/a/b/c', '/a/b/c/d', '/a/b/c/e', '/a/b/c/f/g', '/a/b/c/f/h', '/a/b/c/f/i']

我想将它转换为像树结构一样的dict。

{'/': {'a': {'b': {'c': 
                       [{'d':None}, 
                        {'e':None}, 
                        {'f':[{'g':None, {'h':None}, {'i':None}]}
                       ]
                  }
             }
      }
}

我被困在什么地方?哪种数据结构合适?

感谢。

3 个答案:

答案 0 :(得分:4)

基本上

lst = ['/a/b', '/a/b/c', '/a/b/c/d', '/a/b/c/e', '/a/b/c/f/g', '/a/b/c/f/h', '/a/b/c/f/i']
dct = {}

for item in lst:
    p = dct
    for x in item.split('/'):
        p = p.setdefault(x, {})

print dct

产生

 {'': {'a': {'b': {'c': {'e': {}, 'd': {}, 'f': {'i': {}, 'h': {}, 'g': {}}}}}}}

这不完全是你的结构,但应该给你一个基本的想法。

答案 1 :(得分:3)

作为Sven Marnach said,输出数据结构应该更加一致,例如只有嵌套字典,其中文件夹与dict和文件关联到None。

这是一个使用os.walk的脚本。它不会将列表作为输入,但如果要解析文件,则应该最终执行所需的操作。

import os 
from pprint import pprint

def set_leaf(tree, branches, leaf):
    """ Set a terminal element to *leaf* within nested dictionaries.              
    *branches* defines the path through dictionnaries.                            

    Example:                                                                      
    >>> t = {}                                                                    
    >>> set_leaf(t, ['b1','b2','b3'], 'new_leaf')                                 
    >>> print t                                                                   
    {'b1': {'b2': {'b3': 'new_leaf'}}}                                             
    """
    if len(branches) == 1:
        tree[branches[0]] = leaf
        return
    if not tree.has_key(branches[0]):
        tree[branches[0]] = {}
    set_leaf(tree[branches[0]], branches[1:], leaf)

startpath = '.'
tree = {}
for root, dirs, files in os.walk(startpath):
    branches = [startpath]
    if root != startpath:
        branches.extend(os.path.relpath(root, startpath).split('/'))

    set_leaf(tree, branches, dict([(d,{}) for d in dirs]+ \
                                  [(f,None) for f in files]))

print 'tree:'
pprint(tree)

答案 2 :(得分:1)

首先查看os.listdiros.walk。它们将允许您递归遍历目录。自动(os.walk)或半自动(使用os.listdir)。然后,您可以将您在字典中找到的内容存储起来。