应用错误收集

我可以在多元分类器的线性回归中将错过的数据标记为“NA”吗？

时间：2017-03-27 12:52:50

标签： machine-learning

我想训练ML中多分类器的线性回归模型。但数据非常稀少。对于字符串的某些功能，如果我将那些错过的数据标记为“NA”，这是一个好习惯吗？对于用于训练的数据，我可以删除那些记录错过的数据。但是，做预测的最终数据如何仍然稀少？如何使用模型预测稀疏数据？

1 个答案:

答案 0 :(得分：0)

据我所知，通过将该值设为NA，您应该将其设为异常值，并且使用异常值并非坏习惯。再次，如果您删除记录，您的训练集中可能会得到的数据非常少，我认为您的问题在这里没有很好地形成，请您详细说明您尝试应用分类的数据类型？