我想使我的Microsoft自定义语音模型能够识别包含数字,字符和破折号的指示符,例如:12-34 A-56 B78
。
语音模型可以正确识别数字和字符。有没有一种方法可以训练它,使其在我说“十二点三十四点五十六点七十七点”时输出字符串12-34 A-56 B78
?我需要这个用于德语语音模型。
我已经尝试过使用10000
这样的随机生成的字符串来训练模型。然后,我使用相关文本对模型进行了训练。
预先感谢
答案 0 :(得分:0)
这些是非常具体的格式要求。不幸的是,当前不可能从语音服务中获得完全像这样的结果。我建议对结果进行一些后处理,以这种方式格式化它们。