我对导入多个csv文件有疑问,以使它们垂直堆叠到列数组中。
[这里是一个样本;所有文件看起来都一样]:
yyyymm count_neg count_pos count_all score
200301 114 67 7470 0.006291834
200303 106 51 3643 0.015097447
200305 102 62 3925 0.010191083
200306 129 71 4964 0.011684126
200308 53 50 3819 0.000785546
200309 59 58 3926 0.000254712
200310 50 63 3734 -0.003481521
200312 75 55 4256 0.004699248
这组特殊的数据来自一个称为2003.csv的excel工作表 我在2004年,2005年和2006年也有类似的文件名
所以我再次想知道如何将它们放入python中,以便:我将这些csv垂直堆叠到列数组中
现在,我所知道的是这样的:
yr2003 = pandas.read_csv('2003.csv', header=0,parse_dates=True)
虽然df = pd.concat([yr2003,yr2004,yr2005])确实结合了很多东西,但我只希望结合yyyymm和count_all得分列。
答案 0 :(得分:1)
这应该有效
df = pd.concat([yr2003,yr2004,yr2005])