此刻,我正在测试不同的语音到文本提供程序,而当测试Google的语音到文本提供程序时,我发现他们的抄写员会跳过句子。例如,这可能是一个音频文件,其中一个人从1到10数次计数,并且可能会说继续走下去或在这之间进行计数。然后,谷歌不会抄录这些句子,我认为声音的质量也不差。
我的配置是:
config = types.RecognitionConfig(
encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
sample_rate_hertz=48000,
language_code='en-US',
audio_channel_count=2)
我希望google-speech-to-text能够抄录所有内容。