关于激活功能的工作机制的困惑

时间:2019-06-17 17:41:22

标签: machine-learning neural-network classification

对于二进制分类,无论使用哪种模型,S型函数都是输出层的不错选择,因为实际输出值'Y'为0或1,因此预测输出值为0到0之间的数字是有意义的1.

我的困惑是输出层中是否存在一个二进制阶跃函数,将权重和输入的线性组合的值压缩为0或1?分类是否总是意味着要在隐藏层中的线性或非线性函数之上应用阈值函数?

假设预测输出值为0.75,而实际Y为0。那么,如何将0.75转换为1?损失函数会计算出实际的误差-预测= 0-0.75 = -0.75

有人可以解释一下数学原理或指出一些显示工作步骤的链接吗?谢谢。

1 个答案:

答案 0 :(得分:0)

思考结果的一种方法是概率。对于二项分类器,将其看到的所有内容都存储为spamnot_spam,则结果可以解释为相关数据为垃圾邮件的可能性。 以贝叶斯方式表示:

P(email=spam|words)

如果我们有二进制分类任务,则可以在输出层中使用阈值函数。 激活功能的选择由您自己决定,每个激活功能都有不同的阈值。 因此,如果将其设置为0.5(通过选择S型),则低于它的任何内容都是0输出(spam),高于它的任何内容都是1输出(not_spam)。

在多类别分类的情况下,我们可以使用One-vs-All / one-hot编码的概括。

来源here