为MarryTTS训练新的声音时观察序列太少

时间:2018-01-15 13:36:22

标签: text-to-speech speech-synthesis festival marytts

我现在试图用德语为MaryTTS建立一个新的声音,但到目前为止还没有成功。我按照教程(https://github.com/marytts/marytts/wiki/HMMVoiceCreation)并尝试了解每一步。无论我做什么,我都会陷入第14步(HMMVoiceMakeVoice),错误是:

  

错误[+2121] HInit:观察序列太少

通常意味着在我的数据集中找不到测试的手机(本例中为en9)。

更改语言环境后,手机上发生同样的错误" de27"正如Nikolay Shmyrev指出的那样。

我怀疑这一点,因为我使用了大约500个音频文件,其长度至少为5秒,所以总共超过一个小时的镜头。

事实上,我跳过了" en9"电话,因为我不知道它究竟代表什么。下一个失败的是" oI",我在前几个音频文件中手动定位了大约十次。

我认为这与自动贴标无法正常工作(步骤2-4),但我不知道,我能做些什么,以获得更好的结果?

修改:我上传了此步骤之前的所有文件,可以在此共享google drive上进行检查。请注意,出于版权原因,我无法上传wav文件夹。在logs目录中,您可以在每个步骤后找到日志。我在那里找不到任何问题,但也许有人愿意。

我并不完全理解生成数据的结构,但我认为更改MARYBASE/mary/trickyPhones.txt并再次运行make工具就足以改变地图名称来自" tS"到" Z"在德语中听起来大致相同。但是HMMVoiceMakeVoice仍然会产生相同的输出。

0 个答案:

没有答案