Python - 聚类MFCC向量

时间:2014-03-12 17:50:15

标签: vector cluster-analysis quantization mfcc

我目前正在使用隐藏的马尔可夫模型进行扬声器验证项目,但尚未对语音信号进行准确的结果,尽管我已经对各种数据样本(不涉及语音)测试了系统。

我使用scikits talkbox提取了语音信号的MFCC。我假设没有参数必须更改,默认参数已经适合这样的项目。我怀疑我的问题是在mfcc向量的矢量量化内。我使用scipy的kmeans聚类函数选择了kmeans作为我的算法。我想知道这类工作是否有规定数量的集群。我最初将我的设置为32.我的语音文件的采样率是8000和22050.另外,我录制了它们并使用Audacity手动删除了静音。

有什么建议吗?

0 个答案:

没有答案