wav - 深语音训练音频文件长度

必须训练并推断音频文件长度等于5秒吗？我有这个问题，因为我有大量的训练数据，其中包含音频（每个音频超过30秒）和相应的成绩单。如果我无法按原样使用这些数据进行训练，那么我需要对音频文件进行分块（可以使用一些python脚本轻松完成），但是我发现很难对各个分块的音频文件的成绩单进行分块。我现在手动进行操作，但是有什么方法可以自动化？

有什么建议吗？

谢谢：）

深语音训练音频文件长度

0 个答案: