pandas将数据聚合为numpy数组:数据结构转换

时间:2012-04-18 18:04:04

标签: python pandas

我使用pandas数据框汇总了数据。以下是显示的一些实际数据以及我如何汇总它。

fdf.groupby(['row',col'])['percent'].sum()

http://pastebin.com/R8XWpgtU

我想要做的是创建一个2d numpy数组(rows = row,columns = col)。有什么光滑的方法吗?

我做类似事情的另一种方法是创建一个数据透视表

pivot_table(fdf,values='percent',rows='row',cols='col', aggfunc=np.sum)

在这种情况下,我想将此数据透视表转换为2d numpy数组。有没有办法让我索引到这个表的每个单元格。如果是这样的话,我可能会对表本身好。

1 个答案:

答案 0 :(得分:6)

尝试:

result = fdf.groupby(['row',col'])['percent'].sum()
result.unstack('col').values

可替换地:

fdf.pivot_table('percent', rows='row', cols='col', aggfunc='sum').values