将数据表示为具有高度的傅里叶变换或多项式?

时间:2018-04-30 22:46:14

标签: python machine-learning cluster-analysis polynomials continuous-fourier

我正在处理stelar light曲线(.fits文件包含4000个数据点的时间与stelar brigthness,有关不同周期的几个示例,请参见图形)。我需要以一种允许我使用机器学习对其进行无监督聚类的方式来表示/拟合这些光曲线。我建议使用高度多项式表示(p = 30 ......最多几百)或在光曲线上使用傅里叶变换。我发现numpy.polyfit与高度p的多项式拟合不能提供良好的拟合,我收到警告“RankWarning:Polyfit可能条件差”。也许我应该尝试傅里叶变换,但我不熟悉,听起来很复杂。

为了机器学习集群,我如何/应该表示/适合这些数据?使用pp> 30的np.polyfit可以获得良好的结果吗? enter image description here

1 个答案:

答案 0 :(得分:0)

对于具有明显“季节性”循环周期的事物,傅里叶变换似乎更加充分。

想象一下你获得更多数据。你希望表示是稳定的,并且有点预测这种明显的时间模式。多项式不能做得很好,它可能一直需要新的术语。

但当然还有其他选择:DCT,小波等 - 有关于处理此类数据的全书。