如果丢失数据的位置未知,如何在R中为丢失数据插入行?

时间:2019-04-03 14:16:48

标签: r insert rows na missing-data

我正在尝试更正我的数据集以进行统计分析。我发现缺少数据点,并且数据集中的时间戳通常不正确,这导致校正数据集很困难。 我的数据集(应)包含20个数据点,其中包含相同时间戳(20Hz)的x,y,z值,但是由于处理错误,它可能是24或12(有些例外)。 问题在于它实际上是20Hz,数据显示是错误的,而不是数据点的数量,除了我错过点的地方。总之,这成为一个复杂的问题。 我发现是正确的,因为每六秒钟始终需要120个数据点,如果不正确,则将丢失数据点,所有其他丢失点都是由于时间戳不正确造成的。 简而言之,问题是:

- Incorrect timestamps with 20Hz (x, y, z) recordings
- Missing data points with unknown location
- Only known factor: ever 6 seconds of data MUST contain 120 data points

下表显示了数据集的一小部分(频率:UTC_time)

UTC_date    UTC_time       x       y       z    Freq
11/04/2018  11:02:58    -133    918     319     24
11/04/2018  11:02:58    -194    1030    203     24
11/04/2018  11:02:58    -192    1002    127     24
11/04/2018  11:02:58    -154    905     36      24
11/04/2018  11:02:58    -71     938     31      24
11/04/2018  11:02:58    -206    1071    -43     24
11/04/2018  11:02:58    -381    1127    -65     24
11/04/2018  11:02:58    -373    927     -25     24
11/04/2018  11:02:58    -457    951     -113    24
11/04/2018  11:02:58    -436    1023    -189    24
11/04/2018  11:02:58    -294    1068    -113    24
11/04/2018  11:02:58    -257    943     -92     24
11/04/2018  11:02:58    -291    981     -145    24
11/04/2018  11:02:58    -46     927     -8      24
11/04/2018  11:02:58    -82     932     79      24
11/04/2018  11:02:58    -122    812     355     24
11/04/2018  11:02:58    -708    806     175     24
11/04/2018  11:02:58    -776    800     197     24
11/04/2018  11:02:58    -807    748     351     24
11/04/2018  11:02:58    -836    790     478     24
11/04/2018  11:02:58    -597    502     943     24
11/04/2018  11:02:58    -863    852     59      24
11/04/2018  11:02:58    -485    732     319     24
11/04/2018  11:02:58    -447    766     117     24
11/04/2018  11:02:59    -497    997     -49     12
11/04/2018  11:02:59    -582    991     -63     12

我已经尝试过的和目前正在尝试的: 我试图制作另一个包含空单元格的df,可以用可用数据填充该空单元格,但这不起作用,因为我不知道实际上缺少了哪些单元格。 我一直在尝试使用多个if(loop)函数编写某种修复程序。但是,由于我是R的新手,所以运行速度很慢,并且给了我很多错误。

我想拥有的是:带有正确时间戳记的数据集,其中包括缺少的点作为“ NA”,这样,每秒钟就有20个数据点(即使有些是“ NA”)。

0 个答案:

没有答案