我目前正在使用带有德语语音模型 (de-DE) 的 google asr/tts,并且在日期提取的某些使用场景中遇到错误的结果。
我真的很想知道其他人是否也有类似的结果。
让我给你举几个例子:
我是说:
"der 1.10.1905" -> "1. 10195 11095"
“9.5.78”-> 90587
“22.11.98” -> 22.11 89
但是:
“98 年 11 月 22 日”->“98 年 11 月 22 日”
当我完全限定月份词时,它一切正常。
我还通过使用提示检查了建议的优化方法,但没有任何改进
"speechContexts": [
{
"phrases": [
"$FULLDATE"
]
}
]
这是人们必须接受的东西还是我可以尝试的任何东西?
干杯安德烈
答案 0 :(得分:0)
在使用您的示例时,我的结果与您的结果相同。但如果说话者说 ein tausend neun hundert acht und neunzig
,它确实可以正确转录。
似乎出于某种原因,在德语中,API 无法识别说话者何时使用数百来表示数千(即 nineteen hundred ninety eight
而不是 one thousand nine hundred ninety eight
)。
我不会德语,无法确认这种表示数字/日期的方式是否是官方的,但如果您确定德语是官方接受的,那么我建议您在 {{3 }} 有一些参考资料来确认。