重新排列Python / Pandas中的数据:将特定列值转换为标题

时间:2015-12-21 17:15:15

标签: python pandas

我获得了一个大型数据集,其数据排列如下:

location  cost    year
1         23.15    1986
1         23.91    1988
1         23.31    1989
1         23.91    1993
1         22.98    1994
1         23.99    1995
1         23.71    1997
1         23.01    1999
2         23.21    2000
2         24.28    2004
2         24.4     2005

我想重新安排这个,所以它的形式是:

location    1985    1986    1987   1988
1           20.00   20.00   20.0    20.0
2           20.00   20.00   20.0    20.0
3           20.00   20.00   20.0    20.0
4           20.00   20.00   20.0    20.0
5           20.00   20.00   20.0    20.0

(注意:请忽略新费用均为20.0。我的目标是将year列中的值转换为标题,以便每个location仅列出一次cost 1}}表示该列中的特定年份。)

有直接的方法吗?我调查了groupytranspose,但未能提供任何接近我想要的内容。

提前感谢您提供的任何指示。

1 个答案:

答案 0 :(得分:2)

您需要使用pivot_table

pd.pivot_table(df, index='location', columns='year', values='cost', fill_value=0)

使用您的样本:

#Out[11]: 
#year       1986   1988   1989   1993   1994   1995   1997   1999   2000  \
#location                                                                  
#1         23.15  23.91  23.31  23.91  22.98  23.99  23.71  23.01   0.00   
#2          0.00   0.00   0.00   0.00   0.00   0.00   0.00   0.00  23.21   

#year       2004  2005  
#location               
#1          0.00   0.0  
#2         24.28  24.4