通过分配填充缺失值

时间:2017-07-05 15:35:37

标签: time-series missing-data

所以我有2个数据集。

在第一个我有一天每小时的价值观。例如:

Date                 Value
05/07/2017 01:00     5
05/07/2017 02:00     10
05/07/2017 03:00     5

在第二个数据集中,我只有每天的总数

Date                 Value
05/07/2017           40

所以我想通过第一个数据集的相同分布来分配第二个数据集的总和。像这样:

Date                 Value
05/07/2017 01:00     10
05/07/2017 02:00     20
05/07/2017 03:00     10

我该怎么做?我使用R并为第一个数据集创建了时间序列。

1 个答案:

答案 0 :(得分:1)

您可能需要检查专用于缺少数据插补的R的mice包。在你的情况下,通过考虑类似(时间)属性方面的样本可能会有一个knn方法可以解决缺失值。

再看看,可能会有一些更复杂的程序可以在不同时间引导值,然后填充缺失值,你必须找到一个随机(时间)组合(假设你使用随机每次特定时间池或分配的样本,这些将总计为你所拥有的总和。