使用Google Cloud STT API从流中提取单词时间戳

时间:2019-07-12 17:54:32

标签: python google-cloud-speech

我在我的Python项目中使用Google Cloud STT API。我有一个数据流,我想将单词分割(或单词时间戳记在docs中)作为输出,但是我只有在结果是最终的(即在演讲结束时或当演讲者时)才得到它停顿一下。

在演讲过程中有什么方法可以取得结果吗?诸如部分结果之类的东西。

我已经阅读了所有Google Docs,但没有关于是否有可能的说法。

我的配置如下:

stream_config = speech.types.StreamingRecognitionConfig(
            config=speech.types.RecognitionConfig(
                encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
                sample_rate_hertz=16000,
                language_code='en-US',
                enable_word_time_offsets=True,
                max_alternatives=1
            ),
            interim_results=True
        )

实际上,只有当语音作为最后的结果完成时,我才能得到想要的响应。

我想一直在有人说话的时候得到结果。

0 个答案:

没有答案