我正在尝试通过熊猫数据框中的多个类别来估计商品的平均排名,但不知道该怎么做
让我们说说下一个数据框,它对不同类别的商品进行评分。这些项目已经按照每列中项目得分的降序进行了排序。
Index Safety Performance Capability
0 item_1 item_3 item_1
1 item_3 item_2 item_2
2 item_4 item_1 item_3
3 item_2 item_4 item_4
我需要的是根据项目在所有类别中的索引对项目进行总体评分,因此在这种情况下,总体看起来像这样:
Total
item_1
item_3
item_2
item_4
答案 0 :(得分:1)
如果权重为index
,则使用melt
的{{1}}和索引的groupby
mean
答案 1 :(得分:1)
带有stack
+ groupby
+ sum
的另一个选项(也可以像wen一样使用mean
)
df.set_index('Index').stack().reset_index().groupby(0).Index.sum().sort_values()
输出
item_1 2
item_3 3
item_2 5
item_4 8
Name: Index, dtype: int64