我正在尝试使用条件拆分大型csv数据。为了使此过程自动化,我从数据集中的一列中提取了一个唯一条件列表,并希望在循环中使用此列表来指定条件并重命名导出文件。
我已将值数组转换为列表,并尝试将函数拟合为循环,但是,我认为语法是主要错误。
# df1718 is my df
# znlist is my list of values (e.g. 0 1 2 3 4)
# serial is specified at the top e.g. '4'
for x in znlist:
dftemps = df1718[(df1718.varname == 'RoomTemperature') & (df1718.zone == x)]
dftemps.to_csv('E:\\path\\test%d_zone(x).csv', serial)
因此,从理论上讲,我希望每次迭代都导出与列表中下一个区域相关的数据,并将导出文件命名为test33_zone0.csv(例如)。感谢您的帮助!
编辑:
我得到的错误是:“定界符”必须是字符串,而不是整数
答案 0 :(得分:1)
因此,如果错误在于保存文件,请尝试
dftemps.to_csv('E:\\path\\test{}_zone{}.csv'.format(str(serial),str(x)))