我遇到了一点麻烦,也许有人可以指引我在这里朝着正确的方向前进。
假设我有一个如下所示的数据框(实际数据集中有更多条目和标识):
open ident
2011-01-01 00:00:00 -1.252090 df1
2011-01-01 01:00:00 -1.427444 df1
2011-01-01 02:00:00 -0.415251 df1
2011-01-01 03:00:00 -0.797411 df1
2011-01-01 04:00:00 -0.515046 df1
2011-01-01 00:00:00 1.107162 df2
2011-01-01 01:00:00 0.073243 df2
2011-01-01 02:00:00 0.224991 df2
2011-01-01 03:00:00 -1.269277 df2
2011-01-01 04:00:00 0.468960 df2
有没有快速的方法来重新格式化数据框看起来像这样?
df1 df2
2011-01-01 00:00:00 -1.252090 1.107162
2011-01-01 01:00:00 -1.427444 0.073243
2011-01-01 02:00:00 -0.415251 0.224991
2011-01-01 03:00:00 -0.797411 -1.269277
2011-01-01 04:00:00 -0.515046 0.468960
我玩过groupby并且转置无效,任何提示都会非常感激。
答案 0 :(得分:12)
您可以使用pivot
功能:
df.pivot(index='date', columns='variable', values='value')
有关详细信息,请参阅:http://pandas.pydata.org/pandas-docs/stable/reshaping.html