标签: null missing-data
我有一个数据集,其中包含一个变量,表明在某个事件发生之前已经过了多少天(在一段有限的时间内)。
某些记录具有空值,因为该事件从未发生过(在该段时间内)。
在处理缺失值时,有时我们会使用一些算法或均值,中位数等来估算。但是,在处理这种空值时,我的直觉是我们应该用大量数字替换那些空值并使用建模中的那些记录因为那些空值也提供了信息。
我的直觉是否正确?