我正在处理类ID的大型矩阵和我想要平均的预测概率。然后我想要返回具有最高概率的每一行中的3个类。
问题是,每行中的类都有所不同。实现这一目标的最有效方法是什么?
这是一个只使用一行的玩具示例:
a = [11, 12, 13]
a_probs = [0.2, 0.1, 0.02]
b = [8, 11, 15]
b_probs = [0.05, 0.4, 0.12]
因此,在这个例子中,只有类11出现在两个矩阵中。因此,每个班级的平均概率为:
[8,11,12,13,15] (0.05 + 0)/ 2(0.2 + 0.4)/ 2 0.1 + 0/2 0.02 + 0/2 0.12 + 0/2
我当前的方法非常慢:在所有矩阵中连接一行的类,唯一的,定位和求和每个类的平均值。