Text to Audio软件的工作原理

时间:2013-08-08 13:17:19

标签: text audio

我想创建一个可以将可读文本(非英语)转换为音频声音输出的软件。

经过一些搜索,我发现大多数现有的音频阅读器都是机器人太多而且没有类似人类语音的效果。

我正在寻找一些算法/文书工作,这可以让我对如何继续/实施这样的事情有所了解。

有谁知道,世界上一些最好的文本阅读器软件是如何工作的?

我的期望是:

  1. 减少类似机器人的声音,以及更多类似人类的声音

  2. 高质量输出

  3. 重量轻,但处理速度快

    **如果有人认为这方面缺少一些观点,请编辑此问题。

3 个答案:

答案 0 :(得分:2)

一些小步骤可能会帮助您对发生的事情提供一些基本的想法 -

  1. 您需要创建一个单词词典,每个单词都有其名称和声音。
  2. 创建自己的信号处理器,这将帮助您为声音添加效果,就像您可能需要机器人,或女性版本或其他东西。
  3. 以数组格式解析要读取的文本文件,将每个单词和标点符号分开,形成一个数组和。例如。 “我想死,这不是一种正确的生活方式。”这将形成一个数组{I:want:to:die:,:this:is not:a:correct:way:to:live:。}
  4. 使用标点符号实现生命周期等参数,例如小暂停和。在音频阅读器中暂停更长时间。
  5. 使用单词从第1点的数据库(字典)列表中取出音频。
  6. 在每个数组元素之间暂停播放整个数组,将类似于空格
  7. 我认为这些是实现这一目标的主要方式。为了加快速度,您可以使用高级声音处理工具,在调制声音信号时缓存小型声音数据并在飞行中添加数据。

    这可以帮到你。

答案 1 :(得分:0)

如果您可以告诉我们您将创建哪种应用程序(Movil,Web,桌面)以及您将开发它的代码(Php,Java,C ++等),那可能会很好。因为如果你在谷歌搜索,你会发现很多网站插件,可以将文本转换为音频,你可以下载它们并查看代码。

此外,很难找到听起来不像机器人的应用程序,如果你发现它可能会付出代价。

答案 2 :(得分:0)

您关注的文本到语音的“机器人”方面是“韵律”质量的问题。这是一个活跃的研究领域。您可能会获得博士学位,以改善TTS系统中的韵律。如果您想了解当前的研究,您可以尝试搜索“改进文本到语音的韵律”。

问题的一个主要部分是在给定语言中准确的语音韵律模型。 thesis "MeLos: Analysis and Modelling of Speech Prosody and Speaking Style" by Nicolas Obin(2012)包含对语音韵律建模技术发展水平的调查。或尝试搜索“文本到语音韵律调查的最新技术”。