用于训练“一级神经网络”的反向传播KL-发散

时间:2015-02-27 06:44:58

标签: python machine-learning artificial-intelligence neural-network stanford-nlp

我是机器学习和python的新手,我读过论文http://nlp.stanford.edu/~socherr/EMNLP2013_RNTN.pdf, 我应该使用反向传播KL-发散来训练“一级神经网络”,每个人都说它是标准的技术任务,但我不知道该怎么做。

我希望有人可以帮助我。我有一个L矩阵(25x1000)(我有10000个单词,每个单词由25位表示)我将每个单词映射到5个类中的一个{变化负,负,中性,正,变正}我需要训练矩阵Ws( 5x25)使用KL-divergence进行以下结果

Cy = softmax(Ws * y)

  • y L中的一个向量(25x1),代表ex的一个词:(010001011..0)
  • Cy vector(5x1),如果" y"属于类i(i = 1..5)然后向量Cy中的位i是1而所有其他位都是0.因为前工作是正的,那么向量是(00010)

我知道在训练过程结束后,两个矩阵(Ws和L)都会改变。

如果有人能给我一个教程链接(或解释)如何使用反向传播KL分歧进行训练,我将不胜感激。

感谢。

0 个答案:

没有答案