我知道我可以使用Pandas在groupby上进行类似SQL的求和
output = pd.read_csv("file.csv").groupby(['cat1', 'cat2']).sum()
我希望此输出作为一个numpy数组,但是当我尝试output.as_matrix()
或output.values
时,它们仅提供汇总列。如何使用cat1,cat2和总和作为一个numpy数组来获取矩阵?
例如,output
可能类似于
Cat1 Cat2 Sum
---- ---- ---
Mon Sunny 25
Tue Rainy 15
Sun Cloudy 32
我想将您在上方看到的内容提取为矩阵,但是as_matrix()
仅提供sum列。
答案 0 :(得分:1)
我认为您需要将Series
和MultiIndex
的{{1}}转换为groupby
或reset_index
的参数DataFrame
的{{1}}:>
as_index=False