标签: machine-learning
我想训练ML中多分类器的线性回归模型。但数据非常稀少。对于字符串的某些功能,如果我将那些错过的数据标记为“NA”,这是一个好习惯吗?对于用于训练的数据,我可以删除那些记录错过的数据。但是,做预测的最终数据如何仍然稀少?如何使用模型预测稀疏数据?
答案 0 :(得分:0)
据我所知,通过将该值设为NA,您应该将其设为异常值,并且使用异常值并非坏习惯。 再次,如果您删除记录,您的训练集中可能会得到的数据非常少,我认为您的问题在这里没有很好地形成,请您详细说明您尝试应用分类的数据类型?