应用错误收集

时间：2019-11-12 09:51:09

标签： amazon-web-services amazon-s3 aws-lambda aws-transcribe

我有一些音频文件，它们是成功存储在S3中的客户与代理之间的对话。我尝试使用AWS transcribe将音频文件转换为文本，并且转换成功。

但是很奇怪的一点是，它的准确度甚至不到60％，这是我为AWS Transcribe进行的配置

1）语言代码-英文（印度）
2）音频-8000HZ
3）格式-WAV

按照本指南（https://docs.aws.amazon.com/transcribe/latest/dg/limits-guidelines.html），
我将音频频率和格式设置为8KHZ，并将格式设置为WAV 我是否需要更改任何其他参数以改善音频质量？

感谢您的帮助。

谢谢，
哈里

答案 0 :(得分：0)

许多因素都会影响笔录的质量，例如音频中的背景噪音，说话者重叠，说话者的口音。高质量的音频通常会带来更好的效果。

答案 1 :(得分：0)

的说明创建这些自定义词汇表

此自定义词汇表应包含一些该领域特定的先前关键词。但是，根据我的经验，这些自定义词汇有时会过拟合（错误地从自定义词汇中输出成绩单中的单词）。