我正在尝试创建一个轻量级双音素语音合成器。一切似乎都很简单,因为我的母语有非常简单的发音和文本处理规则。我偶然发现的唯一问题是音高控制。
据我所知,为了控制语音的音调,大多数语音合成器都使用LPC(线性预测编码),它基本上将音调信息与录制的语音样本分开,然后在合成期间我可以提供我的根据需要自己投球。
问题在于我不是DSP专家。我使用了一个Ooura FFT库来提取AFR信息,我对使用Hann和Hamming窗口(我自己实现了C ++代码)有点了解,但我主要将DSP算法视为黑盒子。
我希望找到一些开源库,它只是带有使用示例的LPC代码,但我找不到任何东西。大多数可用的代码(如Festival引擎)都紧密集成在合成器中,分离它并学习如何使用它将是一项非常艰巨的任务。
是否有任何C / C ++ / C#/ Java开源DSP库带有“黑盒子”式LPC算法和用法示例,因此我可以在其上抛出PCM样本数据并获得LPC编码输出,然后抛出编码数据并合成解码后的语音数据?