我获得了一个大型数据集,其数据排列如下:
location cost year
1 23.15 1986
1 23.91 1988
1 23.31 1989
1 23.91 1993
1 22.98 1994
1 23.99 1995
1 23.71 1997
1 23.01 1999
2 23.21 2000
2 24.28 2004
2 24.4 2005
我想重新安排这个,所以它的形式是:
location 1985 1986 1987 1988
1 20.00 20.00 20.0 20.0
2 20.00 20.00 20.0 20.0
3 20.00 20.00 20.0 20.0
4 20.00 20.00 20.0 20.0
5 20.00 20.00 20.0 20.0
(注意:请忽略新费用均为20.0。我的目标是将year
列中的值转换为标题,以便每个location
仅列出一次cost
1}}表示该列中的特定年份。)
有直接的方法吗?我调查了groupy
和transpose
,但未能提供任何接近我想要的内容。
提前感谢您提供的任何指示。
答案 0 :(得分:2)
您需要使用pivot_table
:
pd.pivot_table(df, index='location', columns='year', values='cost', fill_value=0)
使用您的样本:
#Out[11]:
#year 1986 1988 1989 1993 1994 1995 1997 1999 2000 \
#location
#1 23.15 23.91 23.31 23.91 22.98 23.99 23.71 23.01 0.00
#2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 23.21
#year 2004 2005
#location
#1 0.00 0.0
#2 24.28 24.4