我正在使用谷歌云语音发送 api,效果很好!
至于响应,我需要获取数字(1、2、3)而不是文本(一、二、三)。
我注意到如果数字放在句子中,它是文本格式。
有这个参数吗?
谢谢!
答案 0 :(得分:0)
根据您输入的上下文,您绝对可以将文本格式的数字转换为实际数字。您可以在配置中包含 speechContexts
。可以将类标记分配给 phrases
字段。为了更好地解释这一点,这里是一个取自 speech context documentation 的示例。
例如,为了改进地址号码的转录 源音频,在您的 SpeechContext 中提供值 $ADDRESSNUM 对象。
带有语音上下文的配置将如下所示。
"config": {
"encoding":"LINEAR16",
"sampleRateHertz": 8000,
"languageCode":"en-US",
"speechContexts": [{
"phrases": ["$ADDRESSNUM"]
}]
}
$ADDRESSNUM
是类标记的示例。它的作用是当语音的上下文与地址有关时,它将单词中的数字转换为实际数字。
还有很多其他可用的类令牌。您可以进一步查看此 document 中的类标记。