有没有办法让Google Cloud Speech API识别字母和字母声音?
作为一个示例用例,如果我想构建一个拼写游戏,其中语音会说“ Spell restaurant”,并且识别器将侦听每个字母并将其识别出来。
类似地,有一种方法可以识别特定的字母发音,例如:“ oo”,“ ew”,“ k”(在cat中)或“ s”(在圆圈中)。
答案 0 :(得分:2)
至少在某些情况下,它似乎已经做了合理的工作。例如,当我拼出“ cee ay tee”时,它识别为“ c a t”。也可以按照这篇文章中的描述提供“单词提示”:
Google Cloud Speech API word Hints
提供一个单字母“单词”列表作为提示,即
phrases = ['a', 'b', 'c', 'd' ... ]
在该区域似乎可以提供更好的结果。