语音到文本号码捕获

时间:2019-05-10 03:05:29

标签: speech-to-text cmusphinx

是否有使用cmusphinx捕获口语号码的方法?

在cmudict-en-us.dict文件中浏览,我发现以下内容,

forty F AO R T IY
forty-five F AO R T IY F AY V
fifty F IH F T IY
eighty EY T IY

不是像Sphinx那样回答“四十,四十五,五十,八十”,而是可以创建像这样的字典,

40 F AO R T IY
45 F AO R T IY F AY V
50 F IH F T IY
80 EY T IY

因此返回阿拉伯数字...即40、45、50、80?已经有这样的字典了吗?谢谢。

1 个答案:

答案 0 :(得分:1)

可以创建这样的字典,但不建议这样做。您最好将数字识别为单词,然后创建后处理代码以将其转换为实际数字。原因是用户可以通过以下各种方式来拼写数字:

  • 八十七
  • 八十七
  • 一百三十五
  • 一三五
  • 三十个[大停顿]五个

在识别器中有太多变体无法处理它们。识别字符串后,可以使用类似Duckling的字符串将其转换为动作。如果Duckling对您来说太复杂了,您可以使用简单的正则表达式或python代码,例如此处Is there a way to convert number words to Integers?