作为概念的基本证明,在网络中使用输入x,偏差b,输出y,S样本,权重v和t教师信号对K类进行分类,其中如果匹配样本在下,则t(k)等于1 k class。
令x_(是)表示s_(th)样本中的第i_(th)输入特征。 v_(ks)表示保持与s_(th)样本内的所有输入的k_(th)输出的连接权重的向量。 t_(s)代表s_(th)样本的教师信号。
如果我们扩展上述变量以考虑多个样本,则必须应用以下更改,同时声明变量z_(k),激活函数f(。)并使用corss entropy作为成本函数: Derivation
通常在学习规则中,delta(t_(k) - y_(k))总是包含在内,为什么Delta不会出现在这个等式中?我错过了什么或者delta规则出现不是必须的吗?
答案 0 :(得分:0)
我设法找到了解决方案,当我们考虑Kronecker delta时,很明显,其中Where(如果一个类与分类器匹配则δck= 1,否则为δck)。这意味着推导采用了这种形式:
导致delta规则。