这是我在堆栈溢出中的第二个问题。我没有太多的python经验,但是在我的第一个问题上得到了很好的结果,我能够从答案中实现代码,所以我将再次尝试这个新问题:
我正在尝试从金丝雀歌曲中对音节类型进行分类,以便将每种类型用作模板来查找和分类具有相似行为的大型数据集。我使用歌曲的包络。我的数据是一个采样数组,具有时间和幅度(数据图在http://ceciliajarne.web.unq.edu.ar/envelope-problem/中发布)。 我尝试使用Numpy的奇异值分解算法:
U,s,V = linalg.svd(A) # SVD decomposition of A
我不确定如何使用时间序列数据构建有意义的A矩阵,以便遵循这种方法。如何剪切时间序列以获得矩阵进行分析?
我认为可能采用第二种方法:层次聚类。这可能是一个更好的解决方案,但我不知道如何使用群集标准。我所知道的是:
我可以使用哪些信息来提供scipy.cluster.hierarchy。功能?我想将群集中的常用音节类型分组。
我的灵感来自于: Unsupervised clustering with unknown number of clusters
但现在我不知道如何实施第一次测试...任何想法都非常有用,这是我第一次使用模式和时间序列。