时间序列DFT信号聚类

时间:2016-12-24 18:16:24

标签: machine-learning cluster-analysis data-mining analysis dft

我有许多时间序列数据集,我想将其转换为dft信号以减少维数。在转换为dft之后,我想使用k-means算法对得到的dft数据集进行聚类。

由于dft信号包含一个虚数,如何将它们聚类?

2 个答案:

答案 0 :(得分:0)

您可以简单地将虚部视为向量中的另一个组件。在其他应用程序中,您将要忽略它!

但是你将面临其他更严峻的挑战。

数据挖掘,特别是聚类,很少像appliyng函数a(dft)和函数b(k-means)一样简单,然后你得到了结果,万岁。对不起 - 这不是探索性数据挖掘的工作方式。

首先,对于许多时间序列,DFT根本没有帮助。在其他情况下,您首先必须进行适当的重新取样或分割,或摆脱季节性等无趣的影响。即使DFT有效,它也可能会强调诸如采样频率或某些干扰之类的伪像。

然后你会遇到一个主要问题:k-means基于所有属性具有相同重要性的假设。 DFT基于完全相反的观点:第一个组件捕获大部分信号,后者只捕获与它的微小偏差(这就是使用它作为降维的动机)。 因此,基于这种直觉,你可能永远不会应该在DFT系数上应用k-means。与此同时,数据挖掘反复表明,这些应用程序是“统计无意义的”。但仍然可以提供有用的结果...所以你可以尝试,但要小心验证你的结果,避免过于热情或乐观。

答案 1 :(得分:0)

借助FFT,它可以将数据集转换为dft信号。它有助于为每个小数据集计算DFT。