我喜欢Google Speech to Text API,它具有出色的准确性,根据我的经验,它比Azure API更好。原因是,我能够在我的请求中向Google API发送预期单词列表,从而增加这些术语/短语发生的可能性。使用Azure,我只能制作语音模型。这个问题是,我必须为每个请求创建一个新模型,因为每个请求将与其余请求具有不同的词汇表等。这些请求不是行业特定的,它们是完全随机的。
所以,我的问题是,我可以将我的请求的预期单词列表发送到Azure API吗?
干杯
答案 0 :(得分:0)
您解决了问题吗?
关于Azure,您需要首先收集与您的问题和行业相关的培训数据。然后,您可以在此数据集中训练一个模型,在生产中,可以使用该模型来转录音频。
您不会在每次有新请求时都训练一个模型。