所以我有这个dataframe / csv文件:
,stock,adj_close
0,GERN,3.59
1,GERN,3.3
2,GERN,3.34
...
4530,CMCSA,35.78
4531,CMCSA,35.46
4532,CMCSA,35.08
...
9060,AAPL,189.63
9061,AAPL,189.25
9062,AAPL,190.31
还有更多库存和数据点。每只股票有相等的行数,每一行都是一天。我想要实现的是,标题行由所有股票名称组成,其下方的行是adj_close中的值。因此结果将如下所示:
, GERN, CMCSA, AAPL, ............
0, 3.59, 35.78, 189.63 .. .. .. ..
1, 3.3, 35.46, 189.25 .. .. .. ..
2, 3.34, 35.08, 190.31 .. .. .. ..
这可能吗?
我研究了数据透视方法和一些for循环,但无法使其正常工作。
答案 0 :(得分:1)
使用set_index
和unstack
In [37]: (df.set_index(['stock', df.groupby('stock').cumcount()])['adj_close']
.unstack('stock'))
Out[37]:
stock AAPL CMCSA GERN
0 189.63 35.78 3.59
1 189.25 35.46 3.30
2 190.31 35.08 3.34
或者,使用pivot
In [47]: df.assign(cc=df.groupby('stock').cumcount()
).pivot(columns='stock', values='adj_close' , index='cc')
Out[47]:
stock AAPL CMCSA GERN
cc
0 189.63 35.78 3.59
1 189.25 35.46 3.30
2 190.31 35.08 3.34
详细信息
In [38]: df
Out[38]:
stock adj_close
0 GERN 3.59
1 GERN 3.30
2 GERN 3.34
4530 CMCSA 35.78
4531 CMCSA 35.46
4532 CMCSA 35.08
9060 AAPL 189.63
9061 AAPL 189.25
9062 AAPL 190.31