我知道我可以通过输入2D数组并指定一个轴来向量化np.argmax,例如:np.argmax(2Darray,axis=1)
以获取每行的最大索引。
我知道在一个1D向量中两个条目相等的情况,因此我希望返回最大索引,我可以通过np.random.choice(np.flatnonzero(1Dvector == 1Dvector.max())进行平局)
问题是,我怎么能一起做?即:如何将np.argmax向量化,从而使相等的条目随机平局?
答案 0 :(得分:1)
这是一种方法。对于大数据,可以考虑用更便宜的东西代替permutation
。我已经对axis=1
进行了硬编码,但这不应掩盖其原理。
def fair_argmax_2D(a):
y, x = np.where((a.T==a.max(1)).T)
aux = np.random.permutation(len(y))
xa = np.empty_like(x)
xa[aux] = x
return xa[np.maximum.reduceat(aux, np.where(np.diff(y, prepend=-1))[0])]
a = np.random.randint(0,5,(4,5))
a
# array([[2, 2, 2, 2, 1],
# [3, 3, 3, 3, 2],
# [3, 4, 2, 1, 4],
# [3, 2, 4, 2, 1]])
# draw 10000 times
res = np.array([fair_argmax_2D(a) for _ in range(10000)])
# check
np.array([np.bincount(r, None, 5) for r in res.T])
# array([[ 2447, 2567, 2449, 2537, 0],
# [ 2511, 2465, 2536, 2488, 0],
# [ 0, 5048, 0, 0, 4952],
# [ 0, 0, 10000, 0, 0]])