应用错误收集

将输入测试数据更改为特征矩阵的维数

时间：2016-09-30 08:06:19

标签： machine-learning classification svm naivebayes

我训练了一个具有特征矩阵维度（200,716）的模型，其中200是文档的数量，716是总特征的数量。现在我想用具有特征词的输入测试数据来测试模型（7）。如何我可以将此特征映射到我们的模型训练的完全相同的特征数量，这样我可以使用 model.predict（test_data） 函数来检查模型的预测关于新数据。

1 个答案:

答案 0 :(得分：0)

答案对您来说不会太好，但是......您必须使用与您首先使用的方法相同的方法。没有一般的，“神奇的”实现方式，您以原始格式获得了培训文档，并通过某种转换f将其映射到功能，并且必须存储转换本身（函数，它的字典等）。如果你删除它，你什么都做不了。通常，您将在pickle文件或您选择的任何其他格式中保存模型（分类器）和预处理管道（f，从数据到功能的转换）。然后，在预测时间内，您只需加载两个部分并再次应用于新数据。