将输入测试数据更改为特征矩阵的维数

时间:2016-09-30 08:06:19

标签: machine-learning classification svm naivebayes

我训练了一个具有特征矩阵维度(200,716)的模型,其中200是文档的数量,716是总特征的数量。现在我想用具有特征词的输入测试数据来测试模型(7)。如何我可以将此特征映射到我们的模型训练的完全相同的特征数量,这样我可以使用 model.predict(test_data) 函数来检查模型的预测关于新数据。

1 个答案:

答案 0 :(得分:0)

答案对您来说不会太好,但是......您必须使用与您首先使用的方法相同的方法。没有一般的,“神奇的”实现方式,您以原始格式获得了培训文档,并通过某种转换f将其映射到功能,并且必须存储转换本身(函数,它的字典等)。如果你删除它,你什么都做不了。通常,您将在pickle文件或您选择的任何其他格式中保存模型(分类器)和预处理管道(f,从数据到功能的转换)。然后,在预测时间内,您只需加载两个部分并再次应用于新数据。