我的代码非常简单。它在单通道FLAC音频文件上运行long_running_recognize
,并使用Google Cloud Speech API存储结果。我试图找到一种方法来获取long_running_recognize
操作的当前进度。我找到了一些关于这个主题的文档,但是我对它没有任何意义。
client = speech.SpeechClient()
operation = client.long_running_recognize(
audio = speech.types.RecognitionAudio(
uri = str('gs://speech-clips/'+self.audio_fqid),
),
config = speech.types.RecognitionConfig(
encoding = enums.RecognitionConfig.AudioEncoding.FLAC,
sample_rate_hertz = sample_rate,
enable_word_time_offsets = True,
language_code = 'en-US',
),
)
response = operation.result()
以下是我发现的一些文档:
任何帮助将不胜感激。
答案 0 :(得分:1)
由于长时间的音频识别是一个漫长的过程,因此API会在操作响应中为您提供一个<div>
的标记,一旦完成,name
操作将转向{{1 }}。
我使用RESTful API来执行请求,希望它可以为您工作:
这是伪代码:
done