我想以高效,简洁的方式将磁盘上的多个* .csv文件读入一个大数据框中,包括一个新的路径列作为字符串。 除了for循环还有其他方法吗?
数据以相同的形式存储以用于不同的实现。设置是相同的,除了实现具有不同的参数值(因此是结果),但始终通过pd.to_csv()
存储在相同的列中。
通过for循环的当前解决方案:
dfs = []
for path in paths:
df = pd.read_csv(path)
df['PATH'] = path
dfs.append(df)
concated_dfs = pd.concat(dfs)
列出理解但缺少文件路径列
concated_dfs = pd.concat([pd.read_csv(path) for path in paths])
所需结果:一个精简的数据框,其中包含描述路径或实现的列。