以后添加新功能时处理“丢失”数据

时间:2018-09-09 12:06:50

标签: data-mining

条件:

我的数据集具有2个特征

我每天都收集新数据。这样行就增加了

我已经收集了1000天的数据,所以我有1000行

我在第900天添加了新功能(功能3)

我无法获取过去的数据。

问题是我有不同的行:

功能1和功能2具有1000行

功能3有100行

什么是最佳解决方案?我应该估算吗?我应该制作多个子集吗?

我认为情况会再次发生,因为我计划在将来再次添加新功能(功能4,功能5等)

1 个答案:

答案 0 :(得分:0)

没有最适合所有人的解决方案。

在某些情况下,只丢弃旧数据可能会很好。

处决不是一个好主意。我宁愿使用只能忽略缺失值的算法。