有没有一种更干净的方法来读取mulipt * .csv文件并添加一列,然后再添加for循环?

时间:2019-05-02 09:00:10

标签: python pandas

我想以高效,简洁的方式将磁盘上的多个* .csv文件读入一个大数据框中,包括一个新的路径列作为字符串。 除了for循环还有其他方法吗?

数据以相同的形式存储以用于不同的实现。设置是相同的,除了实现具有不同的参数值(因此是结果),但始终通过pd.to_csv()存储在相同的列中。

通过for循环的当前解决方案:

dfs = []

for path in paths:
    df = pd.read_csv(path)
    df['PATH'] = path
    dfs.append(df)

concated_dfs = pd.concat(dfs)

列出理解但缺少文件路径列

concated_dfs = pd.concat([pd.read_csv(path) for path in paths])

所需结果:一个精简的数据框,其中包含描述路径或实现的列。

0 个答案:

没有答案