在Python中进行批量评分时处理分类变量中缺失的级别

时间:2019-12-03 21:03:58

标签: python encoding categorical-data one-hot-encoding

我遇到了一个独特的问题。我的模型在DNN框架上进行了训练,并保存了模型参数,我现在使用它们对数据进行评分。由于我的数据非常庞大,因此我要对数据进行成批评分。我在创建批次之前不对分类变量进行热编码,因为当我将其应用于完整数据集时,Onehotencode函数会遇到内存错误。这使我探索了批处理中热编码的选项,但是由于所有批处理在分类变量中均未包含所有级别的值,因此该方法失败了。如果有人遇到类似问题,您能推荐还是建议解决方法?

0 个答案:

没有答案