一点背景:我面临着为新的PBX转换3000个IVR脚本的问题。 IVR。
目前语音脚本以.VOX格式存在 - 并且......它们没有“写出”/记录。
我谦卑地问,是否有人知道某个程序,这样,我可以将.vox文件转储到程序中并让它生成一个文本文档。如果.vox格式存在问题,我可能会将它们全部转换为.wav或其他任何内容。
是的,有大量的应用程序/程序可以实时对文本进行语音处理,但我希望能够将录制内容“上传/转储”到程序中,并获取文本。
有人能指出我正确的方向吗?
提前感谢您提供任何评论/帮助。 SF
答案 0 :(得分:1)
问题在于您希望在低质量音频文件上执行通用的自然语言处理。低质量的音频数据显着降低了自然语言处理软件的可靠性。对音频文件进行上采样不会改善其内容,这意味着即使您可以访问自然语言引擎也会导致结果不佳。
您最好的选择是与执行混合机器/人类转录的公司合作,并为每次转录支付费用。或者,您可以考虑与亚马逊机械土耳其人合作并购买一些通用的人工努力来获得这些转录。在这两种情况下,VOX文件可能无法正常工作,您首先需要将它们转换为WAV或MP3文件,以便第三方更容易使用现成的软件来收听提示。