如何将os.walk编入数据帧?

时间:2015-07-16 17:14:16

标签: python pandas

我正在尝试将我的目录映射到pandas数据帧中,但自动索引始终为0.最后,我想创建一个MD5文件路径的列。我知道有其他选择,但我想在熊猫中做到这一点。 这是我的代码:

for path, subFolders, files in os.walk(targetdir):
        for file in files:
            nm, ext = os.path.splitext(file)
            if ext.lower().endswith(('.xlsx','.m4v','mov')): #this is so i filter only what I want
                filepaths = os.path.join(os.path.abspath(path),file)


                df1 = pd.DataFrame({'filename': pd.Series(file), 
                                    'fullpath': pd.Series(filepaths,)
                                    })
                print df1

谢谢!

1 个答案:

答案 0 :(得分:1)

收集列表中的数据,然后在循环完成后创建一个DataFrame:

data = list()
for root, dirs, files in os.walk(targetdir):
    for filename in files:
        nm, ext = os.path.splitext(filename)
        if ext.lower().endswith(('.xlsx', '.m4v', 'mov')):
            fullpath = os.path.join(os.path.abspath(root), filename)
            data.append((filename, fullpath))
df1 = pd.DataFrame(data, columns=['filename', 'fullpath'])
print(df1)