我在我的Python项目中使用Google Cloud STT API。我有一个数据流,我想将单词分割(或单词时间戳记在docs中)作为输出,但是我只有在结果是最终的(即在演讲结束时或当演讲者时)才得到它停顿一下。
在演讲过程中有什么方法可以取得结果吗?诸如部分结果之类的东西。
我已经阅读了所有Google Docs,但没有关于是否有可能的说法。
我的配置如下:
stream_config = speech.types.StreamingRecognitionConfig(
config=speech.types.RecognitionConfig(
encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
sample_rate_hertz=16000,
language_code='en-US',
enable_word_time_offsets=True,
max_alternatives=1
),
interim_results=True
)
实际上,只有当语音作为最后的结果完成时,我才能得到想要的响应。
我想一直在有人说话的时候得到结果。