我从官方存储库在Debian机器上安装了Pocketsphinx。我试着用我的声音训练默认声学模型(印度英语)。结果非常不准确。
答案 0 :(得分:0)
根据上周三的Google Next conference,他们开始发表演讲,向公众发布Apis文章,支持80种语言,并且可以在任何实时流媒体或批处理模式下使用。check this article,i建议它使用它返回比Pocketsphinx更准确的结果。或检查Microsoft Oxford project另一个非常好的解决方案
答案 1 :(得分:0)
Pocketsphinx精度调整在tutorial中进行了解释。对于印度英语,你必须建立一个模型,模型训练在other part of the tutorial中解释。
你需要收集印度英语样本,越多越好。对于单个发言者来说,像1小时的演讲就足够了。对于许多扬声器,您需要更多时间。有人必须为印度语言做这件事,我不希望外面的人会免费实现它。