我已在sphinxbase
中安装了sphinxtrain
,pocketsphinx
和Linux (Ubuntu)
。现在我正在尝试使用从 VOXFORGE 获得的speechcorps,转录,字典等来训练数据。 (我的etc和wav文件夹的数据来自 VOXFORGE )
因为我是新手,所以我只想训练数据并获得一些结果,只需很少的成绩单和几个wav文件。让10个wav文件和10个成绩单行共同发起。就像这个人在这里做video
但是当我运行sphinxtrain
时,我就会收到错误。
Estimated Total Hours Training: 0.07021431623931
This is a small amount of data, no comment at this time
如果我CFG_CD_TRAIN= no
我不知道这意味着什么。
我需要做出哪些改变?所以我可以删除此错误。
PS:我无法添加更多数据,因为我希望首先看到一些结果,以便更好地理解整个场景。
答案 0 :(得分:1)
培训数据不足,我们只能培训CI模型
您需要至少30分钟的音频数据来训练CI模型。或者,您可以将CFG_CD_TRAIN设置为“no”。