Question

我使用pandas数据框汇总了数据。以下是显示的一些实际数据以及我如何汇总它。

fdf.groupby(['row',col'])['percent'].sum()

我想要做的是创建一个2d numpy数组（rows = row，columns = col）。有什么光滑的方法吗？

我做类似事情的另一种方法是创建一个数据透视表

pivot_table(fdf,values='percent',rows='row',cols='col', aggfunc=np.sum)

在这种情况下，我想将此数据透视表转换为2d numpy数组。有没有办法让我索引到这个表的每个单元格。如果是这样的话，我可能会对表本身好。

Answer 1

尝试：

result = fdf.groupby(['row',col'])['percent'].sum()
result.unstack('col').values

可替换地：

fdf.pivot_table('percent', rows='row', cols='col', aggfunc='sum').values