Python - 从目录中的所有csv文件中挑选DataFrame列并合并为一个

时间:2015-07-08 17:42:29

标签: python csv pandas dataframe

我正在尝试读取目录中的所有csv个文件,并将所有文件中的特定列合并为新的DataFrame。基本上,文件格式如下: file_name.csv

MainColumn A B C

由于所有文件中的行顺序都是常量,因此我尝试在file1中提取第一列。然后我只想要所有文件中的列B。因此,结果DataFrame必须是:

MainColumn B B B B...

Bs是来自B的各个file1, file2, etc.列的位置这是我目前的代码:

data = pandas.read_csv('file_1.csv')

import glob

df2 = data[['MainColumn']]

for files in glob.glob("*.csv"):

    data1 = pandas.read_csv(files)
    df = data1[['ColumnB']]
    df2 = df2.append(df)

结果df2不是预期的(它来自file1的所有行,然后在file1的行之后添加columnB等)

1 个答案:

答案 0 :(得分:2)

尝试连续: 指定连接轴是这里的关键,df.append()

中没有我可用的东西。
df2 = pd.concat([df2,df],axis=1)