标签: java machine-learning speech-recognition cmusphinx unsupervised-learning
我正在尝试将语音转换为文本转换。尽管不知道用户语言的来源,但用户通过麦克风输入语音输入。
我从CMU Sphinx4语音到文本转换开始。它适用于美国英语.wav文件和美国口音录音。。但对英国英语和印度语英语也不那么准确。我开始知道印度英语没有Sphinx库。
如何在不了解用户来源的情况下猜测用于语音识别的模型? (如谷歌语音搜索)
对于不在CMU sphinx库中的语言,是否还有其他方法不使用声学模型?
是否可以使用无监督学习?如果是这样从哪里开始?
任何帮助都将不胜感激。