我对tsfresh输入格式感到困惑。是否可以为数据框提供不同ID缺少值的数据框?例如:timeseries1:{t0:1,t2:4,t5:1},timeseries2:{t1:5,t2:2}我应该用0填充缺失值(t1,t3等)吗? 预先感谢
答案 0 :(得分:2)
tsfresh
不“关心”数据的时间条目。它的大多数功能计算器不需要固定的时间间隔(例如,时间序列的平均值仍然相同,无论我们谈论的是哪个时间戳)。所以是的,从技术上讲,不同的 ID 可以有不同的时间。
话虽如此,一些特征计算器确实依赖于时间戳并具有适当的时间间隔(例如傅立叶变换)。然而,有许多不同的方法来填充这些需要大量领域知识的缺失值。这就是 tsfresh
不会“自动”执行此操作的原因。但是,许多图书馆(例如熊猫)为此提供了许多可能性,例如使用重采样方法。