我正在开展一个需要将体育评论转换成文字的项目。为此,我已经使用了Microsoft系统语音库。没有背景噪音,它工作正常。任何人都可以通过使用类似ffmpeg的工具或其他一些编程方式告诉我从给定音频文件中删除此背景噪音的方法。
答案 0 :(得分:1)
为了在这种情况下获得更好的准确性,最好使用更专业的解决方案,如CMUSphinx。
它可以帮助您完成不同的事情:您可以配置解码器词汇表,以便正确识别运动术语和表达
您可以充分利用噪声强大的语音识别来处理背景噪音。外部噪声清理实际上对语音识别准确性非常有害,因此不推荐使用。即使像Vuvuzella denoising with Matlab这样的简单处理算法也可以在解码器中使用,而不是在处理之前。