在python系统中导入多个csv文件的问题

时间:2019-05-11 19:14:30

标签: python pandas

我对导入多个csv文件有疑问,以使它们垂直堆叠到列数组中。

[这里是一个样本;所有文件看起来都一样]:

yyyymm count_neg count_pos count_all score 
200301 114 67 7470 0.006291834 
200303 106 51 3643 0.015097447 
200305 102 62 3925 0.010191083 
200306 129 71 4964 0.011684126 
200308 53 50 3819 0.000785546 
200309 59 58 3926 0.000254712 
200310 50 63 3734 -0.003481521 
200312 75 55 4256 0.004699248

这组特殊的数据来自一个称为2003.csv的excel工作表 我在2004年,2005年和2006年也有类似的文件名

所以我再次想知道如何将它们放入python中,以便:我将这些csv垂直堆叠到列数组中

现在,我所知道的是这样的:

yr2003 = pandas.read_csv('2003.csv', header=0,parse_dates=True)

虽然df = pd.concat([yr2003,yr2004,yr2005])确实结合了很多东西,但我只希望结合yyyymm和count_all得分列。

1 个答案:

答案 0 :(得分:1)

这应该有效

df = pd.concat([yr2003,yr2004,yr2005])