如何用熊猫的线性回归对不均匀的时间序列进行重采样

时间:2019-07-18 17:00:14

标签: pandas resampling

假设我有一个panda.DatetimeIndexResampler  样本之间的间隔不均匀,我想调整间隔:

          ts                i
2019-07-18 15:10:52.327    2760
2019-07-18 15:10:52.417    1591
2019-07-18 15:10:52.423    2761
2019-07-18 15:10:52.437    2765
2019-07-18 15:10:52.448    2766
2019-07-18 15:10:52.509    3848
2019-07-18 15:10:52.687    2767
2019-07-18 15:10:53.963    9027
2019-07-18 15:10:53.964    9028
2019-07-18 15:10:53.965    9029
2019-07-18 15:10:53.966    9030
2019-07-18 15:10:53.967    4468
2019-07-18 15:10:53.968     713
2019-07-18 15:10:53.969    2477
2019-07-18 15:10:53.970    2481
2019-07-18 15:10:53.971    3849
2019-07-18 15:10:53.976    2483
2019-07-18 15:10:53.984    2484
2019-07-18 15:10:56.619    3850
2019-07-18 15:10:56.632     172
2019-07-18 15:10:57.096    9031
2019-07-18 15:10:57.097     714
2019-07-18 15:10:57.798     216
2019-07-18 15:11:00.176    3851
2019-07-18 15:11:03.670    3852
2019-07-18 15:11:04.432    9032
2019-07-18 15:11:04.433    9033
Name: i, Length: 11342, dtype: int64
DatetimeIndexResampler [freq=<100 * Millis>, axis=0, closed=left, label=left, convention=start, base=0]

在此示例中,重采样的目标间隔为100ms。如果在一个固定的间隔内有多个样本,则如下所示:

2019-07-18 15:10:52.327    2760
**2019-07-18 15:10:52.417    1591
2019-07-18 15:10:52.423    2761
2019-07-18 15:10:52.437    2765
2019-07-18 15:10:52.448    2766**
2019-07-18 15:10:52.509    3848

可以想象对这4个样本进行线性回归,然后在间隔[.400,.500)中选择一段时间来线性估计重采样。

最好的方法是什么?

还可以想象一个没有样本的规则间隔,如示例的[.700,.800)和[.800,.900)间隔:

2019-07-18 15:10:52.687    2767
2019-07-18 15:10:53.963    9027

这将是线性回归以进行升采样以达到规则的100ms间隔。

0 个答案:

没有答案