深语音训练音频文件长度

时间:2018-08-02 10:25:36

标签: wav transcription mozilla-deepspeech

必须训练并推断音频文件长度等于5秒吗? 我有这个问题,因为我有大量的训练数据,其中包含音频(每个音频超过30秒)和相应的成绩单。如果我无法按原样使用这些数据进行训练,那么我需要对音频文件进行分块(可以使用一些python脚本轻松完成),但是我发现很难对各个分块的音频文件的成绩单进行分块。我现在手动进行操作,但是有什么方法可以自动化?

有什么建议吗?

谢谢:)

0 个答案:

没有答案