Question

我在我的Python项目中使用Google Cloud STT API。我有一个数据流，我想将单词分割（或单词时间戳记在docs中）作为输出，但是我只有在结果是最终的（即在演讲结束时或当演讲者时）才得到它停顿一下。

在演讲过程中有什么方法可以取得结果吗？诸如部分结果之类的东西。

我已经阅读了所有Google Docs，但没有关于是否有可能的说法。

我的配置如下：

stream_config = speech.types.StreamingRecognitionConfig(
            config=speech.types.RecognitionConfig(
                encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
                sample_rate_hertz=16000,
                language_code='en-US',
                enable_word_time_offsets=True,
                max_alternatives=1
            ),
            interim_results=True
        )

实际上，只有当语音作为最后的结果完成时，我才能得到想要的响应。

我想一直在有人说话的时候得到结果。

使用Google Cloud STT API从流中提取单词时间戳

0 个答案: