有没有办法禁用Google Cloud Speech to Text API的自动更正功能?对我来说,获取用户演讲的准确记录非常重要,而不是纠正的版本。
答案 0 :(得分:0)
很难区分扬声器(语法/发音错误)在音频内容中所犯的错误以及Speech API所犯的错误。但是,您可以借助API的 maxAlternatives 属性检查场景背后模型预测的不同版本的文本输出。
您尚未提供此类用例的示例,但如果您已经预料到异常发音或缩略语,则可以使用 phraseHint 属性提供请求提示。
如果它没有回答您的问题,请提供进一步的详细信息。