Question

我是LSTM和深度学习的新手。我有3000条评论，我正尝试通过词嵌入在gensim预训练模型上进行训练。我有以下模型，其中max_sequence_size = 564和vocab的大小是4000。

max_sequence_size = max_features
classes_num = 1
my_model=Sequential()

my_model.add(Embedding(max_sequence_size,300,input_length=trainDataVecs.shape[1],weights=[embedding_matrix]))
my_model.add(Bidirectional(LSTM(100,activation='tanh',recurrent_dropout = 0.2, dropout = 0.2,trainable=True)))

my_model.add(Dense(50,activation='sigmoid'))
my_model.add(Dropout(0.2))


my_model.add(Dense(classes_num, activation='softmax'))

print "Compiling..."
my_model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])

print my_model.summary()

我看到他说要更改优化器的链接，但无济于事。我也将LR更改为0.1和0.001，但这也无济于事。

https://stats.stackexchange.com/questions/201129/training-loss-goes-down-and-up-again-what-is-happening

此外，数据不平衡，其中80％的标签为1和20％的0。作为我的指标，准确度约为80％。我应该将标签0的指标更改为f1_score吗？如果是，我该怎么做？我找不到任何直接的文档。

我应该添加更多的图层，因为这可能很浅吗？有什么方法可以打印渐变？

LSTM损失不会收敛

0 个答案: