我们还需要识别DTMF的可能性。 场景: 在电话交谈中,我们询问用户“请输入ID号”。 我们将音频流传输到Google Cloud语音文本。 我们希望同时支持这两个选项:(a)用户说ID编号(b)用户使用电话键(DTMf)按下ID号。
答案 0 :(得分:0)
似乎无法使用Cloud Speech-to-Text检测到DTMF。我已代表您打开public issue,请求此功能。您可以为问题加注星标并关注进度。
作为解决方法,您可以使用scipy.signal库的spectogram方法来检测唯一的DTMF frequencies。