我正在制作我的PC语音识别项目(在Windows 8上工作)以及该领域的新功能。该项目应具有基本功能,如电子邮件,记事本等的准确听写,并应响应PC的本地命令。
我正在使用sphinx4进行语音识别项目。我想知道,有没有比cmu sphinx更好的开源API?我希望在准确性和大量词汇方面更好。 kaldi(基于深度神经网络)是否比cmu sphinx(基于HMM)更好?我想知道哪个更适合什么?
语音API和语音引擎有什么区别,作为开发人员,我需要开发我的软件?
请帮助我对上述问题给出明确的愿景,如果可能的话,请提供一些语音识别开发人员或研究人员社区链接。