我目前正在Mac OS计算机上从网页上录制音频,并通过云语音API运行该音频以生成笔录。但是,结果的准确性不高,结果中缺少大量单词。
是否有任何步骤可以帮助我获得更准确的结果?
以下是我将音频转换为文本的步骤:
答案 0 :(得分:4)
从语音到文本API 方面,我建议您验证自己是否遵循Best Practices建议,例如避免背景噪音过大和多个人同时讲话这些方面会影响服务识别。
我认为您具有良好的采样率和轻松的编解码器;但是,请记住,音频pre-processing可能会影响音频质量。在这种情况下,最好避免重新采样,不过,您可以尝试使用不同的音频格式来验证哪种格式可获得最准确的结果。
此外,您可以使用languageCode和phrase hints API属性,这些属性通常用于提高识别精度。