我正在开发一个项目,我需要为我的应用程序创建一个自定义语音引擎。我见过像TTS Builder这样的东西,但有人知道如何开发TTS Builder本身的应用程序吗? SAPI引擎背后的东西是什么?他们是如何工作的?如何构建他/她自己的?我可以开发自己的算法吗?如果可能的话,我宁愿在C#中这样做
答案 0 :(得分:3)
从我看来,它看起来像TTS Builder采用现有的声音,并允许您调整次要参数,使声音略有不同。但是我认为创造一种具有不同口音或发音的声音会更复杂。
创造高品质的声音需要良好的配音天赋,隔音室,专业的音频设备,数小时的书面材料以及语言中音素组合的全面覆盖,以及将这些录音变成体面的时间和专业知识合成声音。由于涉及费用,自定义语音构建通常是为希望计算现有演员声音的公司完成的,例如继续提供品牌形象。
...
构建转换模型所需的材料远比从头构建TTS语音要少得多。