我使用以下语句创建了单独的数据组:
df = pd.read_csv(file_path)
grouped = df.groupby(df.some_parameter)
我想做什么(在伪代码中):
for name, group in grouped:
'Some Text' + name = group
write to csv
最终结果是原始数据集的每个块的单独的.csv文件。
答案 0 :(得分:12)
你几乎就在那里
for name, group in grouped:
group.to_csv(path_to_disk)
答案 1 :(得分:3)
这个答案对我很有帮助 - 谢谢@mkln。
我只是想添加一些特定于我自己的用例的内容,这与关于文件命名的原始观点有关('Some Text'+ name = group)。
您可以为每个csv文件名添加名称和附加文本,例如当前日期,因此我将创建一个函数来返回当前日期,然后将其用作文件名。
因此:
from datetime import datetime
def cur_date():
return datetime.now().strftime("%Y-%m-%d")
for name, group in grouped:
group.to_csv('{}_{}.csv'.format(name, cur_date()))