我有一个单词或句子,是否有任何方法/开源软件包可以查找用户说出该单词的可能性

时间:2019-03-21 06:36:09

标签: speech-recognition speech-to-text speech kaldi

我有一个单词/句子,有没有办法/开源软件包来查找用户说出这个单词/句子的可能性

1 个答案:

答案 0 :(得分:2)

最常用的免费语音识别工具包是:

  1. Kaldi
  2. CMU狮身人面像

使用Python,使用pocketsphinx-python建立基本的语音识别系统非常简单。有点棘手,但以我的经验来看,更好的结果是使用例如kaldi-gstreamer-server的Kaldi建立系统。

另一种选择是使用如下API:

  • 微软必应演讲
  • Google Cloud语音
  • IBM语音转文本

这个SpeechRecognition python库是检查它们的一个不错的入口。但是,请记住,对于这些服务,您将需要一个API密钥。

在您的情况下,您说您有一个给定的句子,并且想获得准确说出这句话的可能性。这与一般的语音识别任务有些不同,因为您拥有更多的先验信息,可以使您的估计更加准确。对于此问题,常用的术语是关键字检测,您可以尝试将Keyword Lists与CMU Sphinx结合使用。