我知道sphinx 3(现在称为Pocketsphinx)支持非英语语音识别,如德语,西班牙语和中文。但是,狮身人面像4也支持这些语言吗?
要进行语音识别,需要三个文件:声学模型文件,语言模型文件和字典文件。但是,sphinx 4只能读取ASCII编码文件,而一些非英语语言字典和语言模型则由UTF-8编码。
似乎CMU sphinx 4默认只支持ASCII编码语言。这是真的吗?
任何帮助将不胜感激!!!
答案 0 :(得分:1)
似乎CMU sphinx 4默认只支持ASCII编码语言。这是真的吗?
sphinx4支持utf-8编码文件。要确保java使用utf-8作为输入输出,您可以向java命令行(或IDE中的JVM)添加一个选项:
-Dfile.encoding=utf-8