我正在使用keras(后端tensorflow)对亚马逊评论中的情绪进行分类。
首先是嵌入层(使用GloVe),然后是LSTM层,最后是Dense层作为输出。模型摘要如下:
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
embedding_1 (Embedding) (None, None, 100) 2258700
_________________________________________________________________
lstm_1 (LSTM) (None, 16) 7488
_________________________________________________________________
dense_1 (Dense) (None, 5) 85
=================================================================
Total params: 2,266,273
Trainable params: 2,266,273
Non-trainable params: 0
_________________________________________________________________
Train on 454728 samples, validate on 113683 samples
训练火车和评估时的准确率约为74%,损失(火车和评估)约为0.6。
我尝试过改变LSTM层中的元素数量,以及包括丢失,重复丢失,正则化和GRU(而不是LSTM)。然后准确度增加了一点(~76%)。
我还可以尝试哪些方法来改善我的成绩?
答案 0 :(得分:0)
我使用双向LSTM进行情绪分析取得了更大的成功,双向LSTM也垂直堆叠两层,即2 LSTMS一起形成一个深层网络也有助于并尝试将lstm元素的数量增加到128左右。