我想使用cmusphinx为中国14岁以下儿童建立一个英语声学模型,词汇量大约800字。
我做了一些研究,一些商业语音引擎需要花费数千小时的语音记录来训练他们的声学模型:(细微差别和谷歌花费2000+和1000+小时)。
因为我需要达到约95%的准确率,语音语料库需要多少小时?
语音语料库的时间越长,它的准确率就越高吗?
答案 0 :(得分:0)
300-400小时是一个很好的数据量。少于100将无效。
随着数据量的增加,如果训练数据本身存在系统性问题,则无需提高准确度,但是,如果您正确分析训练数据中的问题,结果可能会有所改善。
如果您一般学习机器学习,该课程将涵盖数据准备问题。