是否有使用cmusphinx捕获口语号码的方法?
在cmudict-en-us.dict文件中浏览,我发现以下内容,
forty F AO R T IY
forty-five F AO R T IY F AY V
fifty F IH F T IY
eighty EY T IY
不是像Sphinx那样回答“四十,四十五,五十,八十”,而是可以创建像这样的字典,
40 F AO R T IY
45 F AO R T IY F AY V
50 F IH F T IY
80 EY T IY
因此返回阿拉伯数字...即40、45、50、80?已经有这样的字典了吗?谢谢。
答案 0 :(得分:1)
可以创建这样的字典,但不建议这样做。您最好将数字识别为单词,然后创建后处理代码以将其转换为实际数字。原因是用户可以通过以下各种方式来拼写数字:
在识别器中有太多变体无法处理它们。识别字符串后,可以使用类似Duckling的字符串将其转换为动作。如果Duckling对您来说太复杂了,您可以使用简单的正则表达式或python代码,例如此处Is there a way to convert number words to Integers?