CMU sphinx4是否支持非英语语音识别

时间:2013-11-13 13:59:36

标签: java cmusphinx non-english

我知道sphinx 3(现在称为Pocketsphinx)支持非英语语音识别,如德语,西班牙语和中文。但是,狮身人面像4也支持这些语言吗?

要进行语音识别,需要三个文件:声学模型文件,语言模型文件和字典文件。但是,sphinx 4只能读取ASCII编码文件,而一些非英语语言字典和语言模型则由UTF-8编码。

似乎CMU sphinx 4默认只支持ASCII编码语言。这是真的吗?

任何帮助将不胜感激!!!

1 个答案:

答案 0 :(得分:1)

  

似乎CMU sphinx 4默认只支持ASCII编码语言。这是真的吗?

sphinx4支持utf-8编码文件。要确保java使用utf-8作为输入输出,您可以向java命令行(或IDE中的JVM)添加一个选项:

   -Dfile.encoding=utf-8