在问问题时,应该将整个问题分解为较小的问题并逐一解决。 但我问这是不好的方式,以便完全解释我的需求和技术限制,希望有人建议完善的技术组合。
我要设计的内容会接受文字作为输入转换为语音 此演讲由实时中的 3D模型演绎。
在这里你可以看到所有这些事情都应该是实时的,因此我想在一些游戏引擎中做这件事, 但我不确定我在这里做什么是可能的。
我需要指导,一条路,我应该如何开始。
答案 0 :(得分:0)
你没有指定一个平台,即Windows / Linux等,虽然它可能并不重要。
我最初的想法是将PICO tts库与Blender Game Engine(BGE)结合起来。 虽然我不确定是否有Pico引擎的python绑定。
espeak项目(espeak.sourceforge.net/)将普通文本转换为音素,然后可以用它来驱动形状键(或混合键,我忘记了Blender的名字,它已经过了5年多了最后一次使用Blender / Maya / 3DSMax)。
据推测,你可以在python中实现espeak引擎(或者创建一个可以通过python访问的模块)并使用它来生成所需的音素,然后再将它们传递给你的形状/混合键控制器和Pico。 / p>
快速浏览后,似乎libttspico-dev是支持pico启用应用程序开发的软件包,虽然它似乎只包含c / c ++文件 - 我想应该可以创建一个利用了c / c ++文件的python模块引擎,但我真的不熟悉任何关于Pico的东西,而不是它的名字和基本功能。这可能是一个愚蠢而无知的建议。
无论如何,这肯定是一个有趣的项目。也许更简单的方法是使用OGRE和Pico在C / C ++中创建应用程序。重要的因素是OGRE能够将1个形状键混合到下一个形状键,也可能是Pico在内部执行所有操作,使得您无法获得回调或监听其在演奏中的当前位置。 / p>
书签。