应用错误收集

我目前正在使用隐藏的马尔可夫模型进行扬声器验证项目，但尚未对语音信号进行准确的结果，尽管我已经对各种数据样本（不涉及语音）测试了系统。

我使用scikits talkbox提取了语音信号的MFCC。我假设没有参数必须更改，默认参数已经适合这样的项目。我怀疑我的问题是在mfcc向量的矢量量化内。我使用scipy的kmeans聚类函数选择了kmeans作为我的算法。我想知道这类工作是否有规定数量的集群。我最初将我的设置为32.我的语音文件的采样率是8000和22050.另外，我录制了它们并使用Audacity手动删除了静音。

有什么建议吗？

Python - 聚类MFCC向量

0 个答案: