标签: google-cloud-speech
因此,我需要做的是将文本与音频匹配,基本上获得每个单词在音频中出现的时间戳,并且转录与我现有的文本匹配非常重要,是否可以提交此文本连同音频一起获得更准确的转录?