Keras:验证准确性保持不变,但验证损失减少

时间:2020-05-03 01:18:33

标签: tensorflow machine-learning keras training-data loss

我知道问题不会出在数据集中,因为我已经看到其他项目使用相同的数据集。 这是我的数据预处理代码:

import pandas as pd
dataset = pd.read_csv('political_tweets.csv')
dataset.head()
dataset = pd.read_csv('political_tweets.csv')["tweet"].values
y_train = pd.read_csv('political_tweets.csv')["dem_or_rep"].values

from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(dataset, y_train, test_size=0.1)

max_words = 10000
print(max_words)
max_len = 25

tokenizer = Tokenizer(num_words = max_words, filters='!"#$%&()*+,-./:;<=>?@[\\]^_`{|}~\t\n1234567890', lower=False,oov_token="<OOV>")

tokenizer.fit_on_texts(x_train)
x_train = tokenizer.texts_to_sequences(x_train)
x_train = pad_sequences(x_train, max_len, padding='post', truncating='post')

tokenizer.fit_on_texts(x_test)
x_test = tokenizer.texts_to_sequences(x_test)
x_test = pad_sequences(x_test, max_len, padding='post', truncating='post')

我的模特:

model = Sequential([
    Embedding(max_words+1,64,input_length=max_len),
    Bidirectional(GRU(64, return_sequences = True), merge_mode='concat'),
    GlobalMaxPooling1D(),
    Dense(64,kernel_regularizer=regularizers.l2(0.02)),
    Dropout(0.5),
    Dense(1, activation='sigmoid'),

])
model.summary()

model.compile(loss='binary_crossentropy', optimizer=RMSprop(learning_rate=0.0001), metrics=['accuracy'])
model.fit(x_train,y_train, batch_size=128, epochs=500, verbose=1, shuffle=True, validation_data=(x_test, y_test))

我的损失都减少了,我的训练精度提高了,但是验证的准确性却保持在50%(考虑到我正在做一个二元分类模型,这真是太糟糕了)。

Epoch 1/500
546/546 [==============================] - 35s 64ms/step - loss: 1.7385 - accuracy: 0.5102 - val_loss: 1.2458 - val_accuracy: 0.5102
Epoch 2/500
546/546 [==============================] - 34s 62ms/step - loss: 0.9746 - accuracy: 0.5137 - val_loss: 0.7886 - val_accuracy: 0.5102
Epoch 3/500
546/546 [==============================] - 34s 62ms/step - loss: 0.7235 - accuracy: 0.5135 - val_loss: 0.6943 - val_accuracy: 0.5102
Epoch 4/500
546/546 [==============================] - 34s 62ms/step - loss: 0.6929 - accuracy: 0.5135 - val_loss: 0.6930 - val_accuracy: 0.5102
Epoch 5/500
546/546 [==============================] - 34s 62ms/step - loss: 0.6928 - accuracy: 0.5135 - val_loss: 0.6931 - val_accuracy: 0.5102
Epoch 6/500
546/546 [==============================] - 34s 62ms/step - loss: 0.6927 - accuracy: 0.5135 - val_loss: 0.6931 - val_accuracy: 0.5102
Epoch 7/500
546/546 [==============================] - 37s 68ms/step - loss: 0.6925 - accuracy: 0.5136 - val_loss: 0.6932 - val_accuracy: 0.5106
Epoch 8/500
546/546 [==============================] - 34s 63ms/step - loss: 0.6892 - accuracy: 0.5403 - val_loss: 0.6958 - val_accuracy: 0.5097
Epoch 9/500
546/546 [==============================] - 35s 63ms/step - loss: 0.6815 - accuracy: 0.5633 - val_loss: 0.7013 - val_accuracy: 0.5116
Epoch 10/500
546/546 [==============================] - 34s 63ms/step - loss: 0.6747 - accuracy: 0.5799 - val_loss: 0.7096 - val_accuracy: 0.5055

我看过有关此主题的其他文章,他们说要增加辍学率,交叉熵,降低学习率等。我已经完成了所有这些工作,但都无济于事。 任何帮助是极大的赞赏。 预先感谢!

1 个答案:

答案 0 :(得分:3)

针对您的问题的一些观察结果:

  1. 尽管对数据集不是特别熟悉,但我相信它在很多情况下都不会出现问题。但是,您可以尝试检查其余额。在train_test_split()中,有一个名为stratify的参数,如果输入了y,它将确保每个类别的相同数量的样本按比例在训练集中和测试集中。
  2. 您的带有验证损失和验证准确性的现象并非与众不同。想象一下,在第一个时期,神经网络以55%的置信度考虑一些GT == 1的地面真理正例(ys)。随着训练的进行,神经网络会更好地学习,现在对于GT == 1的地面真理正例(ys),它有90%的信心。由于计算准确性的阈值为50% ,在两种情况下,您具有相同的精度。不过,损失已经发生了很大的变化,因为90%>> 55%。
  3. 您的培训似乎在进步(缓慢但肯定)。您是否考虑过将ADAM用作现成的优化器?
  4. 如果在某个时期仍保持较低的准确性,则您很可能会遭受称为 underfitting 的众所​​周知的现象,在这种现象下,您的模型无法捕获数据之间的依赖关系。为了完全缓解/避免拟合不足,您可能需要使用更复杂的模型(2个LSTM / 2个GRU)。
  5. 重申数据集预处理步骤。确保句子正确转换。