我正在尝试更正我的数据集以进行统计分析。我发现缺少数据点,并且数据集中的时间戳通常不正确,这导致校正数据集很困难。 我的数据集(应)包含20个数据点,其中包含相同时间戳(20Hz)的x,y,z值,但是由于处理错误,它可能是24或12(有些例外)。 问题在于它实际上是20Hz,数据显示是错误的,而不是数据点的数量,除了我错过点的地方。总之,这成为一个复杂的问题。 我发现是正确的,因为每六秒钟始终需要120个数据点,如果不正确,则将丢失数据点,所有其他丢失点都是由于时间戳不正确造成的。 简而言之,问题是:
- Incorrect timestamps with 20Hz (x, y, z) recordings
- Missing data points with unknown location
- Only known factor: ever 6 seconds of data MUST contain 120 data points
下表显示了数据集的一小部分(频率:UTC_time)
UTC_date UTC_time x y z Freq
11/04/2018 11:02:58 -133 918 319 24
11/04/2018 11:02:58 -194 1030 203 24
11/04/2018 11:02:58 -192 1002 127 24
11/04/2018 11:02:58 -154 905 36 24
11/04/2018 11:02:58 -71 938 31 24
11/04/2018 11:02:58 -206 1071 -43 24
11/04/2018 11:02:58 -381 1127 -65 24
11/04/2018 11:02:58 -373 927 -25 24
11/04/2018 11:02:58 -457 951 -113 24
11/04/2018 11:02:58 -436 1023 -189 24
11/04/2018 11:02:58 -294 1068 -113 24
11/04/2018 11:02:58 -257 943 -92 24
11/04/2018 11:02:58 -291 981 -145 24
11/04/2018 11:02:58 -46 927 -8 24
11/04/2018 11:02:58 -82 932 79 24
11/04/2018 11:02:58 -122 812 355 24
11/04/2018 11:02:58 -708 806 175 24
11/04/2018 11:02:58 -776 800 197 24
11/04/2018 11:02:58 -807 748 351 24
11/04/2018 11:02:58 -836 790 478 24
11/04/2018 11:02:58 -597 502 943 24
11/04/2018 11:02:58 -863 852 59 24
11/04/2018 11:02:58 -485 732 319 24
11/04/2018 11:02:58 -447 766 117 24
11/04/2018 11:02:59 -497 997 -49 12
11/04/2018 11:02:59 -582 991 -63 12
我已经尝试过的和目前正在尝试的: 我试图制作另一个包含空单元格的df,可以用可用数据填充该空单元格,但这不起作用,因为我不知道实际上缺少了哪些单元格。 我一直在尝试使用多个if(loop)函数编写某种修复程序。但是,由于我是R的新手,所以运行速度很慢,并且给了我很多错误。
我想拥有的是:带有正确时间戳记的数据集,其中包括缺少的点作为“ NA”,这样,每秒钟就有20个数据点(即使有些是“ NA”)。