应用错误收集

我是机器学习和python的新手，我读过论文http://nlp.stanford.edu/~socherr/EMNLP2013_RNTN.pdf，我应该使用反向传播KL-发散来训练“一级神经网络”，每个人都说它是标准的技术任务，但我不知道该怎么做。

我希望有人可以帮助我。我有一个L矩阵（25x1000）（我有10000个单词，每个单词由25位表示）我将每个单词映射到5个类中的一个{变化负，负，中性，正，变正}我需要训练矩阵Ws（ 5x25）使用KL-divergence进行以下结果

Cy = softmax（Ws * y）

y L中的一个向量（25x1），代表ex的一个词：（010001011..0）
Cy vector（5x1），如果＆＃34; y＆＃34;属于类i（i = 1..5）然后向量Cy中的位i是1而所有其他位都是0.因为前工作是正的，那么向量是（00010）

我知道在训练过程结束后，两个矩阵（Ws和L）都会改变。

如果有人能给我一个教程链接（或解释）如何使用反向传播KL分歧进行训练，我将不胜感激。

感谢。