我训练了一个具有特征矩阵维度(200,716)的模型,其中200是文档的数量,716是总特征的数量。现在我想用具有特征词的输入测试数据来测试模型(7)。如何我可以将此特征映射到我们的模型训练的完全相同的特征数量,这样我可以使用 model.predict(test_data) 函数来检查模型的预测关于新数据。
答案 0 :(得分:0)
答案对您来说不会太好,但是......您必须使用与您首先使用的方法相同的方法。没有一般的,“神奇的”实现方式,您以原始格式获得了培训文档,并通过某种转换f
将其映射到功能,并且必须存储转换本身(函数,它的字典等)。如果你删除它,你什么都做不了。通常,您将在pickle文件或您选择的任何其他格式中保存模型(分类器)和预处理管道(f,从数据到功能的转换)。然后,在预测时间内,您只需加载两个部分并再次应用于新数据。