我想创建一个可以将可读文本(非英语)转换为音频声音输出的软件。
经过一些搜索,我发现大多数现有的音频阅读器都是机器人太多而且没有类似人类语音的效果。
我正在寻找一些算法/文书工作,这可以让我对如何继续/实施这样的事情有所了解。
或
有谁知道,世界上一些最好的文本阅读器软件是如何工作的?
我的期望是:
减少类似机器人的声音,以及更多类似人类的声音
高质量输出
重量轻,但处理速度快
**如果有人认为这方面缺少一些观点,请编辑此问题。
答案 0 :(得分:2)
一些小步骤可能会帮助您对发生的事情提供一些基本的想法 -
我认为这些是实现这一目标的主要方式。为了加快速度,您可以使用高级声音处理工具,在调制声音信号时缓存小型声音数据并在飞行中添加数据。
这可以帮到你。
答案 1 :(得分:0)
如果您可以告诉我们您将创建哪种应用程序(Movil,Web,桌面)以及您将开发它的代码(Php,Java,C ++等),那可能会很好。因为如果你在谷歌搜索,你会发现很多网站插件,可以将文本转换为音频,你可以下载它们并查看代码。
此外,很难找到听起来不像机器人的应用程序,如果你发现它可能会付出代价。
答案 2 :(得分:0)
您关注的文本到语音的“机器人”方面是“韵律”质量的问题。这是一个活跃的研究领域。您可能会获得博士学位,以改善TTS系统中的韵律。如果您想了解当前的研究,您可以尝试搜索“改进文本到语音的韵律”。
问题的一个主要部分是在给定语言中准确的语音韵律模型。 thesis "MeLos: Analysis and Modelling of Speech Prosody and Speaking Style" by Nicolas Obin(2012)包含对语音韵律建模技术发展水平的调查。或尝试搜索“文本到语音韵律调查的最新技术”。