MLP的输出始终为0

时间:2016-04-21 07:40:09

标签: nlp tensorflow deep-learning

我正在使用CNN进行匹配句子,主要算法描述如下(详细算法为here):

  1. 从句子A中获取m个单词,也从句子B中获取m个单词。然后将它们组合,从而得到形状为2m * word_embedding_dim的矩阵M1。接下来,对我们得到的矩阵进行卷积,从而获得单个值。
  2. 重复步骤1,直到我们得到句子A和B中所有单词的成分。同时,通过卷积合成所有单个值,形成一个新的矩阵M2。
  3. 将M2视为图像,执行下一步:M2-> conv_1-> pool_1-> conv_2-> pool_2-> fully_connect-> MLP_1->单个值(相似度,值在[0, 1])
  4. 代码为here

    在我的训练集中,标签为0(不相似)或1(相似),但输出始终为' 0'。我不知道哪里出错了。这个问题让我很生气。网络太深了吗?或者,网络是错误的。可以请别人帮帮我吗?任何建议表示赞赏。

0 个答案:

没有答案