CMU Sphinx中的小型数据培训

时间:2017-02-06 11:06:03

标签: cmusphinx sphinx4 pocketsphinx

我已在sphinxbase中安装了sphinxtrainpocketsphinxLinux (Ubuntu)。现在我正在尝试使用从 VOXFORGE 获得的speechcorps,转录,字典等来训练数据。 (我的etc和wav文件夹的数据来自 VOXFORGE

因为我是新手,所以我只想训练数据并获得一些结果,只需很少的成绩单和几个wav文件。让10个wav文件和10个成绩单行共同发起。就像这个人在这里做video 但是当我运行sphinxtrain时,我就会收到错误。

Estimated Total Hours Training: 0.07021431623931
    This is a small amount of data, no comment at this time

enter image description here

如果我CFG_CD_TRAIN= no我不知道这意味着什么。

我需要做出哪些改变?所以我可以删除此错误。

PS:我无法添加更多数据,因为我希望首先看到一些结果,以便更好地理解整个场景。

1 个答案:

答案 0 :(得分:1)

  

培训数据不足,我们只能培训CI模型

您需要至少30分钟的音频数据来训练CI模型。或者,您可以将CFG_CD_TRAIN设置为“no”。