我有一个大的Dataframe(5天,每秒一个值,几列),我想在csv文件中使用python pandas df.to_csv模块保存2列。
我尝试了不同的方法,但始终收到错误消息:
'系列'对象是可变的,因此它们不能被散列
我找到了与groupby有关的解决方案,但没有找到文件。 有人对我有想法吗?
这是我的Dataframe的一部分:
DateTime
2015-07-14 00:00:00 414.37
2015-07-14 00:00:00 414.37
2015-07-14 00:00:01 414.29
2015-07-14 00:00:02 414.14
2015-07-14 00:00:03 414.21
2015-07-14 00:00:04 414.05
2015-07-14 00:00:05 414.05
2015-07-14 00:00:06 414.2
2015-07-14 00:00:07 414.54
2015-07-14 00:00:08 414.39
Name: CO2abs, dtype: object DateTime
编辑: 对不起 - 忘了代码......
df.to_csv('alldatcorr.csv',sep='\t',cols=(df.CO2abs,df.CO2corr))
答案 0 :(得分:3)
你的错误是因为你传递了一个Series的元组而不是一个列名/字符串的元组:
df.to_csv('alldatcorr.csv',sep='\t',cols=(df.CO2abs,df.CO2corr))
所以你发现这有效:
df.to_csv('corr2.csv',sep='\t',cols=('CO2abs','CO2corr'))
你可以通过传递一个列表并使用子脚本操作符从df中进行子选择来避免歧义:
df[['CO2abs','CO2corr']].to_csv('corr2.csv',sep='\t')
传递字符串列表而不是元组
可能更具可读性