对于PIC和/或ARM嵌入式系统,是否有任何易于使用的免费或廉价语音合成库,其中代码大小比语音质量更重要?现在似乎1兆的封装被认为是“紧凑的”,但许多微控制器都比这个小。早在20世纪80年代,Apple聘请了一家承包商来生产Macintalk,该产品以26K的速度提供合理品质的语音,运行频率为7.16MHz 68000,而一个名为SAM的程序可以产生不太好但仍然可用的语音,使用16K封装,在1MHz 6502上运行.SpeakJet在某种类型的PIC上运行语音合成算法。
我可能不会特别需要发表语音,但希望能够说出由多个预先设定的单词组成的信息。显然,可以简单地预先记录所有消息,但是具有例如词汇表。 100字,我认为存储16K值的代码加上可能1K的语音字符串将比存储100字的音频更紧凑。
或者,如果我想存储100个单词的音频,那么生成一组自然流动的单词的最佳方法是什么?在老式语音合成器中,任何给定的单词都可以用三种方式说出:中性变形,下降变形(好像后面是一段时间),或者上升变形(后面跟一个问号)。具有中性变形的单词可以按任何顺序拼接在一起并且听起来很好。然而,我发现的文本到波形工具似乎想要添加更精细的变形细节,如果单词被分割并重新排序,则会发出“关闭”的声音。是否有任何工具可用于产生可以连接和拼接的波浪?如果我使用这样的工具,什么音频格式最适合存储波,以便在小型微控制器上进行高效解码?
答案 0 :(得分:0)
上次我这样做时,我可以添加以下硬件:http://www.sparkfun.com/products/9578。您的环境中可能存在专利责任,例如我遇到的强制商业软件堆栈或OTS芯片。
否则,我已经将http://www.speech.cs.cmu.edu/flite/用于更宽松的项目,并且效果很好。