尝试新数据集时功能不匹配。模型功能胜于输入功能

时间:2018-07-05 07:27:16

标签: python-3.x

我创建了一个随机森林分类模型。当我在测试仪上进行测试时,它工作正常。

然后我腌了模型。 现在,我正在使用另一组让我们调用“生产设置”。 我正在加载模型pickle文件,并将生产集数据传递给模型进行预测

我遇到错误:

  

ValueError:模型的特征数量必须与输入匹配。模型n_features为87,输入n_features为63

在生产集中,我将只有一行/行的数据,最多只能有10行。因此,特征的数量将少于模型中的特征,但仍将是模型中特征的子集。下面是我的代码:

from DataPreparationv3 import Data_Preprocess # custom function for datapreprocess
import numpy as np
import pandas as pd
import pickle

pd.options.mode.chained_assignment = None

Base_Data = pd.read_csv('Validate2.csv')
DataReady = Data_Preprocess(Base_Data)
del Base_Data

# load the model from disk
filename = 'Genralized_CTA_Predictions.pkl'
loaded_model = pickle.load(open(filename, 'rb'))
result = loaded_model.predict(DataReady)

如何解决此问题。请帮忙。

致谢

Sudhir

0 个答案:

没有答案