条件:
我的数据集具有2个特征
我每天都收集新数据。这样行就增加了
我已经收集了1000天的数据,所以我有1000行
我在第900天添加了新功能(功能3)
我无法获取过去的数据。
问题是我有不同的行:
功能1和功能2具有1000行
功能3有100行
什么是最佳解决方案?我应该估算吗?我应该制作多个子集吗?
我认为情况会再次发生,因为我计划在将来再次添加新功能(功能4,功能5等)
答案 0 :(得分:0)
没有最适合所有人的解决方案。
在某些情况下,只丢弃旧数据可能会很好。
处决不是一个好主意。我宁愿使用只能忽略缺失值的算法。