我有一个巨大的1 GB的csv文件,其中包含每天的记录。例如下面的
Date orderquantity
2015-06-19 23
2015-06-19 30
2015-06-20 33
2015-06-20 40
因此,每个日常记录都存在,在Python Pandas数据框架中是否有一种有效的方法,我可以根据日期对数据进行分组,然后将其存储为每个日期的单独csv。
以上示例的输出结果为
CSV 1
Date orderquantity
2015-06-19 23
2015-06-19 30
CSV 2
Date orderquantity
2015-06-20 33
2015-06-20 40
我是否必须在数据框中按日期排序/分组,然后进行for循环并遍历整个数据框?
答案 0 :(得分:2)
试试这个:
for name, group in df.groupby('Date'):
group.to_csv('{}.csv'.format(name), index=False)