当我与NULL功能约会时,我该怎么办?

时间:2013-08-08 21:09:31

标签: machine-learning svm scikit-learn

我有大量数据,缺少一些信息(NULL)。我应该在学习过程中跳过这个例子还是做其他事情?

1 个答案:

答案 0 :(得分:3)

这实际上取决于数据以及您认为有意义的内容。如果您认为NULL信息可能有意义,则可以选择创建一个表示具有NULL数据的条目的新变量。例如,如果您有具有NULL值的真/假分类数据,如

1, 0, 1, NULL, NULL, 1, 1, NULL

您可以将其转换为:

1  0  1  0  0  1  1  0  <- true
0  1  0  0  0  0  0  0  <- false
0  0  0  1  1  0  0  1  <- NULL

使用浮点值可以做类似的事情。

当然,你也可以抛出NULL值,或者用一个有根据的猜测(可能是平均值)替换它们,如果你不认为它们是NULL的事实会有帮助。