标签: audio wav
我有数千个由手机录音系统生成的GSM wav文件。我需要通过语音到文本引擎(Nuance)运行这些,这似乎只适用于PCM文件。 我对这些格式一无所知,但需要一种程序化(脚本)方式将GSM转换为PCM。 有什么想法吗?
答案 0 :(得分:0)
Sox可以做到。您需要提供gsm文件的采样率和通道数,因为它不包含任何标头信息。像这样:
sox input.gsm -r 8000 -c 1 -w -s ouput.wav