我一直在努力了解softmax,并提出了以下简单示例。
def simpleSoftmax(allValues):
return np.exp(allValues) / np.sum(np.exp(allValues), axis=0)
调用
simpleSoftmax([3,2,4])
array([ 0.24472847, 0.09003057, 0.66524096])
在这种情况下,0.66的可能性更高。了解。
现在,这应该像
一样完成(3/9)*100 = 33.33
(2/9)*100 = 22.22
(4/9)*100 = 44.44
现在,如果我们看到44.44取得更高的值,那么结果与softmax相同。
我确信这个softmax背后有一些有趣的遗留平均值。但是,我不明白这两种方式会有什么区别?