在iOS中同时管理文本到语音和语音识别

时间:2016-05-06 07:14:44

标签: ios speech-recognition text-to-speech voice-recognition

我希望我的iOS应用使用文字转语音向用户读取从服务器收到的一些信息,并且我也希望允许用户通过语音命令停止这样的讲话。我已经尝试了像OpenEars这样的iOS语音识别框架,我发现它正在监听并检测应用程序本身的信息,并且说#34;它会识别用户的语音命令。

有人在iOS处理过这个场景,并为此找到了解决方案吗?提前致谢

1 个答案:

答案 0 :(得分:1)

实施并非易事。不幸的是iOS和其他人记录了通过扬声器播放的声音。您唯一的选择是使用耳机。在那种情况下,语音识别可以继续收听输入。在Openears中,除非插入耳机,否则在TTS期间禁用识别。

如果你仍然想要实现这个名为" barge-in"你必须做到以下几点:

  1. 存储您通过麦克风播放的音频
  2. 实施噪声消除算法,有效地从记录中删除音频。您可以使用互相关在记录和谱减法中找到适当的偏移量以删除音频。
  3. 在剩余信号中识别语音。
  4. 如果不对开球源进行重大修改,就无法做到这一点。

    相关问题是Android Speech Recognition while music is playing