所以我有2个数据集。
在第一个我有一天每小时的价值观。例如:
Date Value
05/07/2017 01:00 5
05/07/2017 02:00 10
05/07/2017 03:00 5
在第二个数据集中,我只有每天的总数
Date Value
05/07/2017 40
所以我想通过第一个数据集的相同分布来分配第二个数据集的总和。像这样:
Date Value
05/07/2017 01:00 10
05/07/2017 02:00 20
05/07/2017 03:00 10
我该怎么做?我使用R并为第一个数据集创建了时间序列。
答案 0 :(得分:1)
您可能需要检查专用于缺少数据插补的R的mice
包。在你的情况下,通过考虑类似(时间)属性方面的样本可能会有一个knn方法可以解决缺失值。
再看看,可能会有一些更复杂的程序可以在不同时间引导值,然后填充缺失值,你必须找到一个随机(时间)组合(假设你使用随机每次特定时间池或分配的样本,这些将总计为你所拥有的总和。