Question

我获得了一个大型数据集，其数据排列如下：

location  cost    year
1         23.15    1986
1         23.91    1988
1         23.31    1989
1         23.91    1993
1         22.98    1994
1         23.99    1995
1         23.71    1997
1         23.01    1999
2         23.21    2000
2         24.28    2004
2         24.4     2005

我想重新安排这个，所以它的形式是：

location    1985    1986    1987   1988
1           20.00   20.00   20.0    20.0
2           20.00   20.00   20.0    20.0
3           20.00   20.00   20.0    20.0
4           20.00   20.00   20.0    20.0
5           20.00   20.00   20.0    20.0

（注意：请忽略新费用均为20.0。我的目标是将year列中的值转换为标题，以便每个location仅列出一次cost 1}}表示该列中的特定年份。）

有直接的方法吗？我调查了groupy和transpose，但未能提供任何接近我想要的内容。

提前感谢您提供的任何指示。

Answer 1

您需要使用pivot_table：

pd.pivot_table(df, index='location', columns='year', values='cost', fill_value=0)

使用您的样本：

#Out[11]: 
#year       1986   1988   1989   1993   1994   1995   1997   1999   2000  \
#location                                                                  
#1         23.15  23.91  23.31  23.91  22.98  23.99  23.71  23.01   0.00   
#2          0.00   0.00   0.00   0.00   0.00   0.00   0.00   0.00  23.21   

#year       2004  2005  
#location               
#1          0.00   0.0  
#2         24.28  24.4

重新排列Python / Pandas中的数据：将特定列值转换为标题

1 个答案: