扩展Sphinx以支持本地语言

时间:2012-12-12 16:21:37

标签: speech-recognition voice-recognition cmusphinx sphinx4

最初我想从头开始编写语音识别引擎(支持50-100个单词)以支持我的母语。

然而,经过一些研究后,很明显,即使在1。5年内支持非常有限,也无法制作语音识别引擎。

现在我正在考虑扩展sphinx引擎以支持我的语言。是否有可能在1。5年内完成,甚至这对于最后一年的项目来说太过分了。

我正焦急地等待你对此事的经历。

2 个答案:

答案 0 :(得分:2)

进行语音识别的时间取决于您的申请。

您将需要:

  1. 定义您想要识别的单词;
  2. 为这些单词写一个拼音字典;
  3. 与几位母语人士一起录制文字;
  4. 验证记录的数据;
  5. 准备数据以训练声学模型;
  6. 制作语法或语言模型(在这种情况下,有必要记录拼音平衡的单词/句子);
  7. 训练声学模型;
  8. 测试您的系统;
  9. 对语法和声学模型进行调整和调整(演讲者改编);
  10. 了解如何制作上述所有9个主题。 :)
  11. 第10项是最耗时的任务!!!

    答案:是的,可以在3个月内进行商业申请。

    Sphinx是一种可能性,HTK是一个优秀的开源语音识别系统,用于训练和测试一个完整的系统。 Julius是一个开源语音识别器(引擎),它使用由HTK构建的声学和语言模型。

    Luis Uebel

    ASR Labs - www.asrlabs.com.br

答案 1 :(得分:2)

是的,这当然是可能的。我为Chatino做了类似的识别器,用于我的高级论文。 (Chatino是墨西哥南部瓦哈卡的一种土着语言)。识别器包括一个隔离字识别器和一个使用Sphinx4构建的连续语音识别器。

有关详细信息,请参阅http://www.jaimalayalam.com/papers/chatinoVoiceRecognition09.pdf

相关问题