在java中使用sphinx4的印地语语音文本

时间:2014-05-06 10:05:01

标签: java speech-to-text sphinx4

我使用Sphinx4将语音转换为文本,它适用于英语,但我怎样才能将它用于印地语语音。 例如我说“Mera name amit hai”。 转换为文本后,输出应为“मेरानामअमितहै”

1 个答案:

答案 0 :(得分:1)

你可以在这里下载印地语声学模型与sphinx4一起使用:

https://sourceforge.net/projects/hindiasr/files/Hindiasr/HindiASR-2.0/

然而,它处于一个非常基本的状态,它不太可能具有高精度。为了更好的准确性,您可能希望自己尝试声学模型,请参阅教程了解详细信息

http://cmusphinx.sourceforge.net/wiki/tutorial

Eclipse中模型的设置很简单:

1)按照教程中的描述下载最新代码:

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

2)打开抄录演示并编辑声学模型和字典的路径,指向从hindiasr下载的模型

3)按照lm教程

中的描述创建语法或语言模型

http://cmusphinx.sourceforge.net/wiki/tutoriallm

4)在TranscriberDemo.java中替换文件以进行识别。

5)运行并看到它识别文件