我正在尝试读取目录中的所有csv
个文件,并将所有文件中的特定列合并为新的DataFrame
。基本上,文件格式如下:
file_name.csv
MainColumn A B C
由于所有文件中的行顺序都是常量,因此我尝试在file1
中提取第一列。然后我只想要所有文件中的列B
。因此,结果DataFrame
必须是:
MainColumn B B B B...
Bs
是来自B
的各个file1, file2, etc.
列的位置这是我目前的代码:
data = pandas.read_csv('file_1.csv')
import glob
df2 = data[['MainColumn']]
for files in glob.glob("*.csv"):
data1 = pandas.read_csv(files)
df = data1[['ColumnB']]
df2 = df2.append(df)
结果df2
不是预期的(它来自file1的所有行,然后在file1的行之后添加columnB等)
答案 0 :(得分:2)
尝试连续: 指定连接轴是这里的关键,df.append()
中没有我可用的东西。df2 = pd.concat([df2,df],axis=1)