我正在开发使用XNA构建的桌面应用程序。它有一个Text-To-Speech应用程序,我正在使用Microsoft Translator V2 api来完成这项工作。更具体地说,我使用的是Speak方法(http://msdn.microsoft.com/en-us/library/ff512420.aspx),我使用SoundEffect和SoundEffectInstance类播放音频。
该服务工作正常,但我在音频方面遇到了一些问题。质量不是很好,音量不够大。
我需要一种以编程方式改进音量的方法(我已经在CodeProject中尝试了一些基本的解决方案,但算法不是很好,结果音频的质量非常低),或者可能使用其他API。
是否有一些好的算法可以通过编程方式改善音频?是否有其他良好的文本到语音转换器具有更好的音频质量和支持wav?
提前致谢
答案 0 :(得分:0)
如果要对音频进行离线处理,可以尝试使用Audacity。它具有离线处理音频的非常好的工具。如果您正在处理实时流媒体音频,可以尝试使用SoliCall Pro。它创建虚拟音频设备并过滤其捕获的所有音频。