我在sklearn
中建立了一个模型,我以泡菜形式保存了这个模型。但是,为了获得最佳结果,我必须删除功能,创建另一个功能,使用单热编码,e.t.c。
现在,我在初始形式中获得了一个新的数据点,我需要进行预测。有没有简单的方法来转换数据点,这样我的构建模型可以进行预测?
答案 0 :(得分:1)
您需要像训练集一样对测试集应用相同的变换。其中一种方法是编写一个处理数据并使用它的函数。所以你会有这样的事情:
def process_data(x):
# process data, remove features and so on
return processed_data
X_train_processed = process(X_train)
X_test_processed = process(X_test)