我想将我的数据框从长格式更改为宽格式。
以下是我要实现的示例:
输入:
ID Group Month Stage Value
1 X July A 5
1 X July B 6
2 Y July B 7
输出:
ID Group Month A B
1 X July 5 0
1 X July 0 6
2 Y July 0 7
我尝试了以下代码:
df.pivot(index='ID', columns='Stage', values='Value')
这显然不起作用,因为ID变量中存在重复项,并且ID并不是唯一应用于轮换的索引(它也应按组和月份进行轮换)。
我的一个想法是通过将ID,Group和Month串联来创建一个新变量,然后旋转表,然后尝试重新创建原始变量。但是也许有更简单的事情。
我将非常感谢您的帮助。