在建模期间保存编码信息

时间:2018-06-14 10:00:34

标签: python encoding preprocessor

我们正在生成模型,其他团队将使用此模型进行预测。另一个团队不了解我们在建模过程中使用的预处理方法。因为它必须是自动化的,所以它们不会手动对预测数据执行任何预处理。他们只选择一个模型和一个预测数据集,它应该做预测。

我们对归责和规范化很好。但保存编码信息有点困难。由于用户可能使用了不同类型的编码方法,这些方法可能创建了许多列或在单个列中编码,因此预测数据中可能不存在很少的值,或者另一方面。如何保留所有这些信息并在进行预测时使用它。 这方面的任何指示都会有很大的帮助。

感谢。

0 个答案:

没有答案