如何使用python聚类音节类型?

时间:2015-10-28 14:12:36

标签: python scipy time-series hierarchical-clustering svd

这是我在堆栈溢出中的第二个问题。我没有太多的python经验,但是在我的第一个问题上得到了很好的结果,我能够从答案中实现代码,所以我将再次尝试这个新问题:

我正在尝试从金丝雀歌曲中对音节类型进行分类,以便将每种类型用作模板来查找和分类具有相似行为的大型数据集。我使用歌曲的包络。我的数据是一个采样数组,具有时间和幅度(数据图在http://ceciliajarne.web.unq.edu.ar/envelope-problem/中发布)。 我尝试使用Numpy的奇异值分解算法:

U,s,V = linalg.svd(A) # SVD decomposition of A

我不确定如何使用时间序列数据构建有意义的A矩阵,以便遵循这种方法。如何剪切时间序列以获得矩阵进行分析?

我认为可能采用第二种方法:层次聚类。这可能是一个更好的解决方案,但我不知道如何使用群集标准。我所知道的是:

  • 大约有10种不同的音节类型。
  • 每种类型的微量和相对最大值之间的距离会发生变化。
  • 也是每个音节的长度。 - 相似的音节具有相似的频率行为。

我可以使用哪些信息来提供scipy.cluster.hierarchy。功能?我想将群集中的常用音节类型分组。

我的灵感来自于: Unsupervised clustering with unknown number of clusters

但现在我不知道如何实施第一次测试...任何想法都非常有用,这是我第一次使用模式和时间序列。

0 个答案:

没有答案