在我的Android应用中,我要求用户说“何时”应触发某个动作。我得到了他的字词,即:
我想知道是否有一个API可以将这些字符串解码为类似的内容:
我能想象的唯一方法是让用户一次说一个值。 “说年”->解码,“说月”->解码等,但这将是糟糕的用户体验。
因为日期和时间是常见信息,所以我想有一个可用的API。 我进行了Google搜索,但一无所获-也许我使用了错误的关键字。
答案 0 :(得分:4)
训练语音识别系统时,其输入除其他外,是文本,其中所有数字,日期,首字母缩写等都被强制转换为文本表示形式。例如,
“下午6:00在Ocean Dr”
将成为
“远洋航行下午六点”
此过程称为文本规范化。一些复杂的ASR系统(例如Google Cloud Speech-to-Text)将逆过程作为识别的最后一步,并提供您请求的功能,但是结果通常不稳定,并且高度依赖于上下文(无论好坏)同时)。我个人还没有听说过独立的反规范化 API或云服务。
相反,我建议看一下Dialogflow和Wit.ai之类的实体识别服务。这些功能可以将语音或文本转换为结构化形式,其中日期,时间,货币等可以被识别并以机器可读形式返回给用户。