使用CMU Sphinx4的语音识别对英国和印度英语口音不准确

时间:2017-04-04 14:12:43

标签: java machine-learning speech-recognition cmusphinx unsupervised-learning

我正在尝试将语音转换为文本转换。尽管不知道用户语言的来源,但用户通过麦克风输入语音输入。

我从CMU Sphinx4语音到文本转换开始。它适用于美国英语.wav文件和美国口音录音。但对英国英语和印度语英语也不那么准确。我开始知道印度英语没有Sphinx库。

  • 如何在不了解用户来源的情况下猜测用于语音识别的模型? (如谷歌语音搜索)

  • 对于不在CMU sphinx库中的语言,是否还有其他方法不使用声学模型?

  • 是否可以使用无监督学习?如果是这样从哪里开始?

任何帮助都将不胜感激。

0 个答案:

没有答案