Python:将目录和文件名存储为dataframe列

时间:2017-05-22 11:58:02

标签: python file pandas directory subdirectory

我想读取每个目录中包含多个文件夹和文件的目录的内容,并将文件夹和文件名指定为dataframe.E.g的列的值。目录是' home'并在其中的每个文件夹中的几个文件夹和文件。 '文件夹'对于该特定文件夹中存在的任意数量的文件,将重复该列。输出数据框将是这样的:

Folder  File
a_folder a_file
a_folder b_file
a_folder c_file
b_folder aa_file
b_folder bb_File
b_folder cc_File
etc...

到目前为止我在尝试:

import os
import pandas as pd

folders = []
files = []
df = pd.DataFrame(columns=['Folder', 'File'])

for folder in sorted(os.listdir('home')):
    folders.append(folder)  
    for file in sorted(os.listdir('home/'+folder)):
        files.append(file)

df['Folder']=folders
df['File']=files

但显然我的想法中存在错误,因为我在值和索引长度之间出现不匹配错误。我在这里缺少什么?提前谢谢!

1 个答案:

答案 0 :(得分:2)

我认为您需要创建对tuples的{​​{1}},然后创建folder-file

DataFrame