Question

我正在尝试通过熊猫数据框中的多个类别来估计商品的平均排名，但不知道该怎么做

让我们说说下一个数据框，它对不同类别的商品进行评分。这些项目已经按照每列中项目得分的降序进行了排序。

Index Safety Performance Capability

  0   item_1   item_3      item_1
  1   item_3   item_2      item_2
  2   item_4   item_1      item_3
  3   item_2   item_4      item_4

我需要的是根据项目在所有类别中的索引对项目进行总体评分，因此在这种情况下，总体看起来像这样：

Total

item_1
item_3
item_2
item_4

Answer 1

如果权重为index，则使用melt的{{1}}和索引的groupby

mean

Answer 2

带有stack + groupby + sum的另一个选项（也可以像wen一样使用mean）

df.set_index('Index').stack().reset_index().groupby(0).Index.sum().sort_values()

输出

item_1    2
item_3    3
item_2    5
item_4    8
Name: Index, dtype: int64

如何计算每个项目的平均索引位置

2 个答案: