我使用pandas数据框汇总了数据。以下是显示的一些实际数据以及我如何汇总它。
fdf.groupby(['row',col'])['percent'].sum()
我想要做的是创建一个2d numpy数组(rows = row,columns = col)。有什么光滑的方法吗?
我做类似事情的另一种方法是创建一个数据透视表
pivot_table(fdf,values='percent',rows='row',cols='col', aggfunc=np.sum)
在这种情况下,我想将此数据透视表转换为2d numpy数组。有没有办法让我索引到这个表的每个单元格。如果是这样的话,我可能会对表本身好。
答案 0 :(得分:6)
尝试:
result = fdf.groupby(['row',col'])['percent'].sum()
result.unstack('col').values
可替换地:
fdf.pivot_table('percent', rows='row', cols='col', aggfunc='sum').values