该术语从何而来？在1930年代和40年代，一些人试图使线性回归适应预测概率的问题。但是，线性回归会产生从-infinity到+ infinity的输出，而对于概率，我们所需的输出是0到1。做到这一点的一种方法是通过某种方式将0到1的概率映射到-infinity到+ infinity，然后照常使用线性回归。一种这样的映射是切斯特·伊特纳·布利斯（Chester Ittner Bliss）在1934年使用的累积正态分布，他称这种“概率”模型为“概率单位”的缩写。但是，此函数在计算上很昂贵，同时缺少用于多类分类的某些理想属性。 1944年，约瑟夫·伯克森（Joseph Berkson）使用函数log(p/(1-p))进行了这种映射，并将其称为logit，它是“物流单位”的缩写。逻辑回归一词也由此衍生。

混乱

不幸的是，logits一词在深度学习中被滥用。从纯数学角度看，logit是执行上述映射的功能。在深度学习中，人们开始将输入Logit函数的层称为“ logits层”。然后人们开始将这一层的输出 values 称为“ logit”，从而与logit 函数产生混淆。

TensorFlow代码

不幸的是，TensorFlow代码进一步使诸如tf.nn.softmax_cross_entropy_with_logits之类的名称更加混乱。 logit在这里是什么意思？这只是意味着该函数的输入应该是如上所述的最后一个神经元层的输出。 _with_logits后缀是redundant, confusing and pointless。函数的命名应不考虑此类非常具体的上下文，因为它们只是可以对从许多其他域派生的值执行的数学运算。实际上，TensorFlow还有另一个类似的功能sparse_softmax_cross_entropy，幸运的是，他们忘记添加了_with_logits后缀，从而造成了不一致并增加了混乱。另一方面，PyTorch只是简单地为其功能命名，而没有这些后缀。

参考

Logit/Probit lecture slides是理解logit的最佳资源之一。我还用上述一些信息更新了Wikipedia article。

Answer 6

这里是对未来读者的简要回答。 Tensorflow的{{1}}被定义为不应用激活函数的神经元输出：

logit

x：输入，w：重量，b：偏差。就是这样。

以下与该问题无关。

有关历史讲座，请阅读其他答案。向logit = w*x + b,的“创造性地”令人困惑的命名惯例致敬。在Tensorflow中，只有一个PyTorch，它接受未激活的输出。卷积，矩阵乘法和激活是相同级别的操作。该设计具有更多的模块化和更少的混乱。这是我从CrossEntropyLoss切换到Tensorflow的原因之一。

Answer 7

在TensorFlow中单词logits的含义是什么？

11 个答案:

Logits Layer

琐事

登录