Question

我创建了一个随机森林分类模型。当我在测试仪上进行测试时，它工作正常。

然后我腌了模型。现在，我正在使用另一组让我们调用“生产设置”。我正在加载模型pickle文件，并将生产集数据传递给模型进行预测

我遇到错误：

ValueError：模型的特征数量必须与输入匹配。模型n_features为87，输入n_features为63

在生产集中，我将只有一行/行的数据，最多只能有10行。因此，特征的数量将少于模型中的特征，但仍将是模型中特征的子集。下面是我的代码：

from DataPreparationv3 import Data_Preprocess # custom function for datapreprocess
import numpy as np
import pandas as pd
import pickle

pd.options.mode.chained_assignment = None

Base_Data = pd.read_csv('Validate2.csv')
DataReady = Data_Preprocess(Base_Data)
del Base_Data

# load the model from disk
filename = 'Genralized_CTA_Predictions.pkl'
loaded_model = pickle.load(open(filename, 'rb'))
result = loaded_model.predict(DataReady)

如何解决此问题。请帮忙。

致谢

Sudhir

尝试新数据集时功能不匹配。模型功能胜于输入功能

0 个答案: