标签: python machine-learning missing-data preprocessor
我目前正在从事机器学习项目。这是一个二进制分类(必须预测1或0)。我的班级偏斜,我的0级班级大约有25,000行,而第1级班级只有2k行(异常检测)
我的问题是:对于我的1类(异常类),我有很多值,但是对于我的0类,相应的值是缺失值。我的意思是我有1的值,但没有0的值。
我是否必须删除班级0缺少值的特征?
非常感谢您的回答!