新的Twilio语音识别(强制字母数字,"非单词"输入?)

时间:2017-06-02 16:27:39

标签: twilio voice-recognition

我希望构建一个应用程序,根据调用者的特定产品请求获取产品的库存信息。所有这些产品都是字母数字,并且不使用任何单词,这是问题的一部分。

在测试通话期间,我要求" DBN5009K "

在日志中,您可以看到它解释如下:

SpeechResult    BBN 5009 okay

我没有寻找完美的结果,并计划擦除空白的输入,然后运行Levenshtein算法来匹配最近的项目。如果结果是 B BN5009 K ,我相信我能够将其与 D BN5009K相匹配,没有太多麻烦。 (它的Levenshtein距离为1.) B BN5009 好的可能永远不会正确匹配,长度仅为11个字符的字符串距离为5。 / p>

Twilio可以被迫不使用"单词"?是否可以使用适当选项的特定数据集进行培训?他们不需要像市场营销一样进行培训,这几乎总是如此,但在这种情况下,这是一个问题。有什么建议?感谢。

赛斯

2 个答案:

答案 0 :(得分:2)

Twilio开发者传道者在这里。

Twilio's speech recognition有助于解析一般语音,因为它是受过训练的。正如您所发现的那样,解析特定的事情并不是那么好。

在Twilio平台中,您希望能够训练引擎识别您的产品ID。这是即将到来的natural language understanding

与此同时,您可能希望使用<Record>和您可以自行训练的识别引擎。另外,sign up to get updates on Understand

答案 1 :(得分:-1)

我相信如果SpeechResult包含'okay',你可以通过'k'替换SpeechResult的子串'okay'来以编程方式处理它。