谷歌云语音到文本 - 如何获取数字

时间:2021-02-15 10:07:09

标签: google-cloud-speech

我正在使用谷歌云语音发送 api,效果很好!

至于响应,我需要获取数字(1、2、3)而不是文本(一、二、三)。

我注意到如果数字放在句子中,它是文本格式。

有这个参数吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

根据您输入的上下文,您绝对可以将文本格式的数字转换为实际数字。您可以在配置中包含 speechContexts。可以将类标记分配给 phrases 字段。为了更好地解释这一点,这里是一个取自 speech context documentation 的示例。

<块引用>

例如,为了改进地址号码的转录 源音频,在您的 SpeechContext 中提供值 $ADDRESSNUM 对象。

带有语音上下文的配置将如下所示。

  "config": {
    "encoding":"LINEAR16",
    "sampleRateHertz": 8000,
    "languageCode":"en-US",
    "speechContexts": [{
      "phrases": ["$ADDRESSNUM"]
     }]
  }

$ADDRESSNUM 是类标记的示例。它的作用是当语音的上下文与地址有关时,它将单词中的数字转换为实际数字。

enter image description here

还有很多其他可用的类令牌。您可以进一步查看此 document 中的类标记。