我是机器学习和python的新手,我读过论文http://nlp.stanford.edu/~socherr/EMNLP2013_RNTN.pdf, 我应该使用反向传播KL-发散来训练“一级神经网络”,每个人都说它是标准的技术任务,但我不知道该怎么做。
我希望有人可以帮助我。我有一个L矩阵(25x1000)(我有10000个单词,每个单词由25位表示)我将每个单词映射到5个类中的一个{变化负,负,中性,正,变正}我需要训练矩阵Ws( 5x25)使用KL-divergence进行以下结果
Cy = softmax(Ws * y)
我知道在训练过程结束后,两个矩阵(Ws和L)都会改变。
如果有人能给我一个教程链接(或解释)如何使用反向传播KL分歧进行训练,我将不胜感激。
感谢。