我创建了一个随机森林分类模型。当我在测试仪上进行测试时,它工作正常。
然后我腌了模型。 现在,我正在使用另一组让我们调用“生产设置”。 我正在加载模型pickle文件,并将生产集数据传递给模型进行预测
我遇到错误:
ValueError:模型的特征数量必须与输入匹配。模型n_features为87,输入n_features为63
在生产集中,我将只有一行/行的数据,最多只能有10行。因此,特征的数量将少于模型中的特征,但仍将是模型中特征的子集。下面是我的代码:
from DataPreparationv3 import Data_Preprocess # custom function for datapreprocess
import numpy as np
import pandas as pd
import pickle
pd.options.mode.chained_assignment = None
Base_Data = pd.read_csv('Validate2.csv')
DataReady = Data_Preprocess(Base_Data)
del Base_Data
# load the model from disk
filename = 'Genralized_CTA_Predictions.pkl'
loaded_model = pickle.load(open(filename, 'rb'))
result = loaded_model.predict(DataReady)
如何解决此问题。请帮忙。
致谢
Sudhir