Question

我正在尝试读取目录中的所有csv个文件，并将所有文件中的特定列合并为新的DataFrame。基本上，文件格式如下： file_name.csv

MainColumn A B C

由于所有文件中的行顺序都是常量，因此我尝试在file1中提取第一列。然后我只想要所有文件中的列B。因此，结果DataFrame必须是：

MainColumn B B B B...

Bs是来自B的各个file1, file2, etc.列的位置这是我目前的代码：

data = pandas.read_csv('file_1.csv')

import glob

df2 = data[['MainColumn']]

for files in glob.glob("*.csv"):

    data1 = pandas.read_csv(files)
    df = data1[['ColumnB']]
    df2 = df2.append(df)

结果df2不是预期的（它来自file1的所有行，然后在file1的行之后添加columnB等）

Answer 1

尝试连续：指定连接轴是这里的关键，df.append（）

中没有我可用的东西。

df2 = pd.concat([df2,df],axis=1)

Python - 从目录中的所有csv文件中挑选DataFrame列并合并为一个

1 个答案: