tsfresh时间序列缺少值

时间:2020-10-07 06:25:38

标签: python time-series tsfresh

我对tsfresh输入格式感到困惑。是否可以为数据框提供不同ID缺少值的数据框?例如:timeseries1:{t0:1,t2:4,t5:1},timeseries2:{t1:5,t2:2}我应该用0填充缺失值(t1,t3等)吗? 预先感谢

1 个答案:

答案 0 :(得分:2)

tsfresh 不“关心”数据的时间条目。它的大多数功能计算器不需要固定的时间间隔(例如,时间序列的平均值仍然相同,无论我们谈论的是哪个时间戳)。所以是的,从技术上讲,不同的 ID 可以有不同的时间。

话虽如此,一些特征计算器确实依赖于时间戳并具有适当的时间间隔(例如傅立叶变换)。然而,有许多不同的方法来填充这些需要大量领域知识的缺失值。这就是 tsfresh 不会“自动”执行此操作的原因。但是,许多图书馆(例如熊猫)为此提供了许多可能性,例如使用重采样方法。