我正在寻找一种提高英语口语的算法。用于加快音乐播放速度的算法会以两倍的速度生成许多伪像,我正在寻找一种即使在3倍或4倍的速度下也可以正常工作的东西。
语音,语调,暂停都需要尽可能多地保留,因此语音到文本+文本到语音的方法将无效。
传统的声码器方法似乎还不够(显然我并不了解所有方法)。我对某些新的程序或机器学习类型的方法感兴趣。我要为每个讲者提供数百小时的讲课本,因此培训不会成为问题。
用例:讲师只是以不可能的慢节奏说话。例如。我通常在Lynda上以2倍的速度收听录音,而这些家伙甚至都不是很慢。