如何使用Python在大型csv文件上打印特定年份

时间:2016-10-20 06:34:29

标签: python csv pandas

import pandas

fileref = open('chart.csv')
f = pandas.read_csv(fileref)

f_set = f[f.year >= 2005]
print(f_set.groupby('y').namefromchart.nunique())

所以我知道f_set将打印出我的y细胞与2005年的相应年份。如果我想打印出2002年至2009年的内容怎么办?

2 个答案:

答案 0 :(得分:2)

您似乎需要向boolean indexing添加第二个条件:

import pandas as pd

f = pd.read_csv('chart.csv')
f_set = f[(f.year >= 2002) & (f.year < 2010)]
print (f_set.groupby('y').namefromchart.nunique())

between的另一个解决方案默认为包含

f_set = f[f.year.between(2002,2009)]

答案 1 :(得分:1)

考虑pd.DataFrame f

f = pd.DataFrame(dict(year=range(2000, 2011), A=np.random.rand(11)))

你可以设置索引并切片你喜欢的方式

f.set_index('year').ix[2002:2009]

enter image description here