921rows
x 10166columns
的数据集用于根据水温预测细菌板数。每行是一个观察值(前10080列是水温的时间序列,其余2列是y标签-1表示高细菌数,0表示低细菌数)。
每次激活的温度都有波动。在其余时间中,水温将保持恒定在25°C。由于时间序列中的特征太多,因此我正在考虑从时间序列数据中提取一些相关特征,例如使用fft
或{{1}来提取前3个最低频率值或时间序列的幅度。 } ifft
中的}等,然后适合物流回归模型。但是,由于有关wave / signal的背景知识有限,我对以下几件事感到困惑:
1)在时间序列上应用scipy.fftpack
会产生时间序列数据的频率数字数组吗?如果没有,我应该改用哪个功能?
2)我对时间序列数据进行了fft
处理(即,数据点以固定的时间间隔间隔开),并且每个时间序列的数据数均相同。如果1)是正确的,那么不同时间序列返回的频率数是否相同?
下面是我原始数据的基本可视化。
感谢您的帮助。谢谢。