谷歌语音识别弱日期转录

时间:2021-03-25 12:26:43

标签: google-cloud-platform speech-recognition google-speech-api

我目前正在使用带有德语语音模型 (de-DE) 的 google asr/tts,并且在日期提取的某些使用场景中遇到错误的结果。

我真的很想知道其他人是否也有类似的结果。

让我给你举几个例子:

我是说:

"der 1.10.1905" -> "1. 10195 11095"

“9.5.78”-> 90587

“22.11.98” -> 22.11 89

但是:

“98 年 11 月 22 日”->“98 年 11 月 22 日”

当我完全限定月份词时,它一切正常。

我还通过使用提示检查了建议的优化方法,但没有任何改进

"speechContexts": [
            {
              "phrases": [
                "$FULLDATE"
              ]
            }
          ]

这是人们必须接受的东西还是我可以尝试的任何东西?

干杯安德烈

1 个答案:

答案 0 :(得分:0)

在使用您的示例时,我的结果与您的结果相同。但如果说话者说 ein tausend neun hundert acht und neunzig,它确实可以正确转录。

似乎出于某种原因,在德语中,API 无法识别说话者何时使用数百来表示数千(即 nineteen hundred ninety eight 而不是 one thousand nine hundred ninety eight)。

我不会德语,无法确认这种表示数字/日期的方式是否是官方的,但如果您确定德语是官方接受的,那么我建议您在 {{3 }} 有一些参考资料来确认。