IBM Speech to Text字母数字字符串识别?

时间:2017-06-14 14:24:55

标签: speech-to-text voice-recognition ibm-watson watson ibm-voice-gateway

在尝试使用Speech to Text(IBM Voice Gateway IVR应用程序)识别字母数字字符串时,我想知道是否可以创建一个自定义语法或实体来限制STT识别单个字母和数字,不包括一句话。例如,这是一个典型的字符串:20Y0H8C。 Watson带着单词和数字回来,比如" two"而不是" 2"。数字字符串工作正常。我意识到字母识别对于典型的ASR来说是有问题的,但是我希望Watson能够胜任这项任务。我注意到没有用于字母数字字符的系统实体。任何建议都非常感谢。

1 个答案:

答案 0 :(得分:2)

在这种情况下,请将smart_formatting设为true

smart_formatting参数将日期,时间,数字和数字系列,电话号码,货币值和互联网地址转换为识别请求的最终记录中更常规的表示形式。转换使得转录本更具可读性并且能够更好地对转录结果进行后处理。您将参数设置为true以启用智能格式设置,如以下示例所示;默认情况下,参数为false,不执行智能格式化。

检查:

curl -X POST -u {username}:{password}
--header "Content-Type: audio/flac"
--data-binary @{path}audio-file.flac
"https://stream.watsonplatform.net/speech-to-text/api/v1/recognize?smart_formatting=true"

<强>结果:

语音:数量是一百一百一个

结果:数量为1000101

检查IBM官方documentation

注意:智能格式化功能目前仅适用于美国英语的测试版功能。