在sklearn中序列化Labelencoder

时间:2017-03-06 09:56:14

标签: serialization encoding machine-learning scikit-learn

我有一个庞大的数据集,我有一个列,其中有一些我要标记编码的分类数据。在所有预处理之后,我可以训练我的模型并使用sklearn序列化模型。

现在我遇到一个问题,如果输入预测向量由标签组成,我该如何编码那个点。因为我不想在每次输入新的输入预测向量时进行预处理和重新训练模型。有没有办法在sklearn中序列化labelencoder?这个问题的正确方法是什么?

1 个答案:

答案 0 :(得分:0)

正如ncfirth在他的评论中提到的 - 正确的方法是序列化它,就像序列化分类器一样(通常是pickle / joblib)。