我目前正在使用隐藏的马尔可夫模型进行扬声器验证项目,但尚未对语音信号进行准确的结果,尽管我已经对各种数据样本(不涉及语音)测试了系统。
我使用scikits talkbox提取了语音信号的MFCC。我假设没有参数必须更改,默认参数已经适合这样的项目。我怀疑我的问题是在mfcc向量的矢量量化内。我使用scipy的kmeans聚类函数选择了kmeans作为我的算法。我想知道这类工作是否有规定数量的集群。我最初将我的设置为32.我的语音文件的采样率是8000和22050.另外,我录制了它们并使用Audacity手动删除了静音。
有什么建议吗?