将列转换为标题行

时间:2018-08-29 17:11:08

标签: python pandas

所以我有这个dataframe / csv文件:

,stock,adj_close
0,GERN,3.59
1,GERN,3.3
2,GERN,3.34
...
4530,CMCSA,35.78
4531,CMCSA,35.46
4532,CMCSA,35.08
...
9060,AAPL,189.63
9061,AAPL,189.25
9062,AAPL,190.31

还有更多库存和数据点。每只股票有相等的行数,每一行都是一天。我想要实现的是,标题行由所有股票名称组成,其下方的行是adj_close中的值。因此结果将如下所示:

,  GERN, CMCSA, AAPL, ............
0, 3.59, 35.78, 189.63 .. .. .. ..
1, 3.3,  35.46, 189.25 .. .. .. ..
2, 3.34, 35.08, 190.31 .. .. .. ..

这可能吗?

我研究了数据透视方法和一些for循环,但无法使其正常工作。

1 个答案:

答案 0 :(得分:1)

使用set_indexunstack

In [37]: (df.set_index(['stock', df.groupby('stock').cumcount()])['adj_close']
            .unstack('stock'))
Out[37]:
stock    AAPL  CMCSA  GERN
0      189.63  35.78  3.59
1      189.25  35.46  3.30
2      190.31  35.08  3.34

或者,使用pivot

In [47]: df.assign(cc=df.groupby('stock').cumcount()
           ).pivot(columns='stock', values='adj_close' , index='cc')
Out[47]:
stock    AAPL  CMCSA  GERN
cc
0      189.63  35.78  3.59
1      189.25  35.46  3.30
2      190.31  35.08  3.34

详细信息

In [38]: df
Out[38]:
      stock  adj_close
0      GERN       3.59
1      GERN       3.30
2      GERN       3.34
4530  CMCSA      35.78
4531  CMCSA      35.46
4532  CMCSA      35.08
9060   AAPL     189.63
9061   AAPL     189.25
9062   AAPL     190.31