我正在尝试使用keras顺序模型将文档分类为15个受过训练的课程。
x_tokenized = tokenizer.texts_to_matrix(x_data_series, mode='tfidf')
model = load_model('top15_model_epoch30_batch100.h5')
for x_t in x_tokenized:
prediction = model.predict(np.array([x_t]))
predicted_label = labels[np.argmax(prediction[0])]
最后,以上代码尝试将每个文档分类为预定义的类。 如果我预测文档的类别不同于受过训练的课程,则模型会尝试将其适合这些受过训练的15个课程之一。 是否有任何方法可以将其标记为未分类或任何度量标准,以将这些离群文档标记为未分类?