假设我有一个panda.DatetimeIndexResampler
样本之间的间隔不均匀,我想调整间隔:
ts i
2019-07-18 15:10:52.327 2760
2019-07-18 15:10:52.417 1591
2019-07-18 15:10:52.423 2761
2019-07-18 15:10:52.437 2765
2019-07-18 15:10:52.448 2766
2019-07-18 15:10:52.509 3848
2019-07-18 15:10:52.687 2767
2019-07-18 15:10:53.963 9027
2019-07-18 15:10:53.964 9028
2019-07-18 15:10:53.965 9029
2019-07-18 15:10:53.966 9030
2019-07-18 15:10:53.967 4468
2019-07-18 15:10:53.968 713
2019-07-18 15:10:53.969 2477
2019-07-18 15:10:53.970 2481
2019-07-18 15:10:53.971 3849
2019-07-18 15:10:53.976 2483
2019-07-18 15:10:53.984 2484
2019-07-18 15:10:56.619 3850
2019-07-18 15:10:56.632 172
2019-07-18 15:10:57.096 9031
2019-07-18 15:10:57.097 714
2019-07-18 15:10:57.798 216
2019-07-18 15:11:00.176 3851
2019-07-18 15:11:03.670 3852
2019-07-18 15:11:04.432 9032
2019-07-18 15:11:04.433 9033
Name: i, Length: 11342, dtype: int64
DatetimeIndexResampler [freq=<100 * Millis>, axis=0, closed=left, label=left, convention=start, base=0]
在此示例中,重采样的目标间隔为100ms。如果在一个固定的间隔内有多个样本,则如下所示:
2019-07-18 15:10:52.327 2760
**2019-07-18 15:10:52.417 1591
2019-07-18 15:10:52.423 2761
2019-07-18 15:10:52.437 2765
2019-07-18 15:10:52.448 2766**
2019-07-18 15:10:52.509 3848
可以想象对这4个样本进行线性回归,然后在间隔[.400,.500)中选择一段时间来线性估计重采样。
最好的方法是什么?
还可以想象一个没有样本的规则间隔,如示例的[.700,.800)和[.800,.900)间隔:
2019-07-18 15:10:52.687 2767
2019-07-18 15:10:53.963 9027
这将是线性回归以进行升采样以达到规则的100ms间隔。