如何根据经过训练的模型测试新数据?

时间:2020-08-30 15:30:24

标签: python pandas numpy tensorflow keras

我是机器学习的初学者。起初,我的模型给我的准确度是85.82%,这是很好的。但是,现在我想再次测试模型中的所有新数据,但是我无法弄清楚要添加到代码中的内容,因为只有在使用验证数据测试模型时,我才能获得测试准确性。

以下是我的代码:

1 个答案:

答案 0 :(得分:0)

以与创建原始测试集完全相同的方式创建新数据集。术语“精确”很重要,如果您预处理了训练和验证数据,则必须对新数据进行相同的预处理。 另一种方法是将训练数据分为3组,即训练,验证和测试。您可以按照以下方式进行火车测试拆分。

X_train, X_temp, Y_train, Y_temp = train_test_split(X, Y,train_size=.8 random_state = 1)
X_valid, X_test, Y_valid, Y_test = train_test_split(X_temp, Y_temp, train_size=.5, shuffle=False)

这将使用您的输入集,并将其中的80%用于训练,将10%用于验证,将10%用于测试。在您的代码中,您所谓的测试集实际上就是验证集,因此在进行建模时,评估与验证准确性相同。因此,现在在model.fit中,使validation_data =(X_valid,Y_valid)。现在,您的测试集独立于验证集,因此在运行模型时,评估应获得与验证精度稍有不同的准确性。