实时3D模型渲染和实时文本到语音

时间:2013-02-19 06:07:30

标签: c++ opengl text-to-speech blender ogre

在问问题时,应该将整个问题分解为较小的问题并逐一解决。 但我问这是不好的方式,以便完全解释我的需求和技术限制,希望有人建议完善的技术组合。

我要设计的内容会接受文字作为输入转换为语音 此演讲由实时中的 3D模型演绎。

在这里你可以看到所有这些事情都应该是实时的,因此我想在一些游戏引擎中做这件事, 但我不确定我在这里做什么是可能的。

我需要指导,一条路,我应该如何开始。

1 个答案:

答案 0 :(得分:0)

你没有指定一个平台,即Windows / Linux等,虽然它可能并不重要。

我最初的想法是将PICO tts库与Blender Game Engine(BGE)结合起来。 虽然我不确定是否有Pico引擎的python绑定。

espeak项目(espeak.sourceforge.net/)将普通文本转换为音素,然后可以用它来驱动形状键(或混合键,我忘记了Blender的名字,它已经过了5年多了最后一次使用Blender / Maya / 3DSMax)。

据推测,你可以在python中实现espeak引擎(或者创建一个可以通过python访问的模块)并使用它来生成所需的音素,然后再将它们传递给你的形状/混合键控制器和Pico。 / p>

快速浏览后,似乎libttspico-dev是支持pico启用应用程序开发的软件包,虽然它似乎只包含c / c ++文件 - 我想应该可以创建一个利用了c / c ++文件的python模块引擎,但我真的不熟悉任何关于Pico的东西,而不是它的名字和基本功能。这可能是一个愚蠢而无知的建议。

无论如何,这肯定是一个有趣的项目。也许更简单的方法是使用OGRE和Pico在C / C ++中创建应用程序。重要的因素是OGRE能够将1个形状键混合到下一个形状键,也可能是Pico在内部执行所有操作,使得您无法获得回调或监听其在演奏中的当前位置。 / p>

书签。