我正在尝试实现基于隐马尔可夫模型的语音识别系统。由于语音识别是一个广阔的领域,因此我想首先实现speeker识别。
我想知道,与语音识别相比,语音识别是否更简单。这样一来,我就可以首先实现Speeker识别,一旦掌握了它,就可以完全实现语音识别。
我不想在MATLAB / Python库中使用任何构建。我想写我自己的。但是,首先,我可以使用一些库并了解它的工作概念。请指出您是否有足够的资源来识别尖峰。
谢谢, 阿拉文
答案 0 :(得分:0)
有很多可用的资源,书籍,期刊,资源,程序。但是让我提出一个非常简单的算法。 1.为每个扬声器训练/保存HMM声学模型。如果您有10个扬声器,则您有10个型号。
对于HTK,仅要求进行bash / shell编程。不涉及c / python或matlab