应用错误收集

时间：2019-03-11 16:54:53

标签： python speech-recognition

我想构建一个脚本，该脚本使用语音识别来记录所说的内容，并在说出关键字后将其转换为文本。

我看过Uberi的语音识别程序包，它提供了记录所有语音并将其转换为文本方面的几乎所有我需要的东西。

是否有一种方法可以在每次触发关键字时触发类似于Alexa的记录？例如，A人谈论经济市场30分钟。在演讲中，他提到诸如“危机”，“经济衰退”和“市场崩溃”之类的词。

是否可以记录并转换为文本-可能是关键字被触发后所说的接下来的10秒钟？

答案 0 :(得分：2)

我做类似的事情。您可能要考虑使用：

snowboy关键字检测库https://snowboy.kitt.ai/docs 检测关键字。您可以有几个关键字。您需要定义首先是模型。
在第一次静音时将句子切掉，并将其存储在音频文件中
使用先前生成的音频文件作为输入来调用翻译服务API（例如Google）。我已经尝试过以下方法：https://cloud.google.com/speech-to-text/docs/

您可以使用麦克风或音频文件作为snowboy的输入。

希望有帮助