我有一个包含csvs的目录,其文件名代表数据库行的ID。
我想在此目录中读取Pandas数据框,并将其加入现有数据框。
Python中是否有任何方法可以将“ ls”命令的结果读入熊猫数据框?
我尝试使用下面的代码获取文件名字符串,但是在弄清楚如何将其添加到数据帧后遇到麻烦。
import os
files = ''
for root, dirs, files in os.walk("."):
for filename in files:
files += filename
答案 0 :(得分:4)
您可以遍历文件,现在只需要读取csv并将其连接到数据框即可。
import os
import pandas as pd
df = None
for root, dirs, files in os.walk('.'):
for filename in files:
if not df:
df = pd.read_csv(filename)
df['filename'] = filename
continue
tmp = pd.read_csv(filename)
tmp['filename'] = filename
df = pd.concat(df, tmp)