我正在尝试将我的目录映射到pandas数据帧中,但自动索引始终为0.最后,我想创建一个MD5文件路径的列。我知道有其他选择,但我想在熊猫中做到这一点。 这是我的代码:
for path, subFolders, files in os.walk(targetdir):
for file in files:
nm, ext = os.path.splitext(file)
if ext.lower().endswith(('.xlsx','.m4v','mov')): #this is so i filter only what I want
filepaths = os.path.join(os.path.abspath(path),file)
df1 = pd.DataFrame({'filename': pd.Series(file),
'fullpath': pd.Series(filepaths,)
})
print df1
谢谢!
答案 0 :(得分:1)
收集列表中的数据,然后在循环完成后创建一个DataFrame:
data = list()
for root, dirs, files in os.walk(targetdir):
for filename in files:
nm, ext = os.path.splitext(filename)
if ext.lower().endswith(('.xlsx', '.m4v', 'mov')):
fullpath = os.path.join(os.path.abspath(root), filename)
data.append((filename, fullpath))
df1 = pd.DataFrame(data, columns=['filename', 'fullpath'])
print(df1)