如何获取Google Cloud Speech(语音到文本)以识别字母和声音

时间:2018-09-20 07:28:18

标签: google-cloud-speech

有没有办法让Google Cloud Speech API识别字母和字母声音?

作为一个示例用例,如果我想构建一个拼写游戏,其中语音会说“ Spell restaurant”,并且识别器将侦听每个字母并将其识别出来。

类似地,有一种方法可以识别特定的字母发音,例如:“ oo”,“ ew”,“ k”(在cat中)或“ s”(在圆圈中)。

1 个答案:

答案 0 :(得分:2)

至少在某些情况下,它似乎已经做了合理的工作。例如,当我拼出“ cee ay tee”时,它识别为“ c a t”。也可以按照这篇文章中的描述提供“单词提示”:

Google Cloud Speech API word Hints

提供一个单字母“单词”列表作为提示,即

phrases = ['a', 'b', 'c', 'd' ... ]

在该区域似乎可以提供更好的结果。