如何在sklearn中转换数据点以进行预测

时间:2018-03-04 01:32:15

标签: python-2.7 machine-learning scikit-learn

我在sklearn中建立了一个模型,我以泡菜形式保存了这个模型。但是,为了获得最佳结果,我必须删除功能,创建另一个功能,使用单热编码,e.t.c。

现在,我在初始形式中获得了一个新的数据点,我需要进行预测。有没有简单的方法来转换数据点,这样我的构建模型可以进行预测?

1 个答案:

答案 0 :(得分:1)

您需要像训练集一样对测试集应用相同的变换。其中一种方法是编写一个处理数据并使用它的函数。所以你会有这样的事情:

def process_data(x):
    # process data, remove features and so on

     return processed_data

X_train_processed = process(X_train)
X_test_processed = process(X_test)